JP2000315096A

JP2000315096A - 音声認識装置を備えたマンマシンシステム

Info

Publication number: JP2000315096A
Application number: JP11161474A
Authority: JP
Inventors: Takahiro Iwata; 孝洋岩田
Original assignee: Pioneer Electronic Corp
Current assignee: Pioneer Corp
Priority date: 1999-05-03
Filing date: 1999-05-03
Publication date: 2000-11-14
Anticipated expiration: 2019-05-03
Also published as: DE60032193T2; EP1050872A2; JP3980791B2; EP1050872A3; US6385582B1; DE60032193T8; EP1050872B1; DE60032193D1

Abstract

(57)【要約】【課題】誤認識または入力した音声情報を簡易に訂正す
る。【解決手段】認識結果記領域ＭＲに、音声認識結果であ
る認識結果語彙Ｄｃを属性毎に分類してファイリングす
る。ユーザーから訂正のコマンド操作がなされると、そ
の指令を制御語ＷＷの形態で受付けて、その制御語ＷＷ
に基いて訂正の際に照合すべき認識語記憶部１１中の認
識辞書を選択設定する。ユーザーが訂正の為に発話した
声の分析データＤａをその選択設定した認識辞書中の認
識対象語彙と照合して音声認識することで訂正を行う。
制御語ＷＷには、ファイリングされている認識結果語彙
Ｄｃを指定して訂正する制御命令語、単に「訂正」のコ
マンド操作をすると直近に認識された認識対象語彙Ｄｃ
を訂正する制御命令語、次候補の認識対象語彙Ｄｃを直
接選択する次候補の命令語と、次候補の認識対象語彙Ｄ
ｃを指定して選択する次候補の制御命令語が備えられて
おり、これらの制御命令語に該当するコマンド操作を行
うと簡易に訂正の操作を行うことができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、音声認識機能を有
するマンマシンシステム（ｍａｎ−ｍａｃｈｉｎｅｓ
ｙｓｔｅｍ）に関し、特に、ユーザーにとっては意志を
容易に指示することができ、マンマシンシステム側では
ユーザーの意志に従って的確な処理を行うことを可能に
するマンマシンシステムに関するものである。

【０００２】

【従来の技術】マンマシンシステムの初期の概念は、人
間と電子計算機との長所を生かすべく構成されたシステ
ム（装置）というものであったが、今では、この概念は
電子計算機のみならず、更に一般的な機械（広義の機
械）と人間との間での関係を円滑にすることを可能にし
たシステムについても言われるようになっている。

【０００３】このようなマンマシンシステムとして、話
者（ユーザー）が音声入力することで自分の意志を指示
（命令）することを可能にする音声認識装置を備えたも
のが知られている。一例として、音声入力によりユーザ
ーが目的地等を指示することを可能にした、ＧＰＳ（Ｇ
ｌｏｂａｌＰｏｓｉｔｉｏｎｉｎｇＳｙｓｔｅｍ）
航法を用いた車載用ナビゲーションシステムが知られて
いる。

【０００４】このナビゲーションシステムは、ユーザー
が所望の目的地を発話すると、その目的地を音声認識
し、現在地から目的地までの走行経路を探索して、表示
装置にその走行経路を地図表示する機能を有している。

【０００５】例えば、ナビゲーションシステムは、図１
３に示すような所定ステップの処理を行うことで、ユー
ザーの指示する目的地を認識する。ユーザーが目的地で
ある「目黒駅」までの走行経路を調べたい場合を例示す
れば、まず、第１ステップにおいて、音声認識装置に組
み合わされた音声合成装置が、『名称をどうぞ』という
合成音を発声し、ユーザーに対して具体的な目的地の名
称を音声入力（発話）するように示唆する。

【０００６】これに対し、ユーザーが「目黒駅」と発話
すると、音声認識装置が、この「目黒駅」の声の特徴を
抽出し、抽出した特徴パラメータＤ１を記憶部等に一時
的に保持する。すなわち、第１ステップでは、音声認識
装置は、ユーザーの発話した「目黒駅」という声の特徴
抽出を行うだけに止めておき、最終的な認識までは行わ
ない。

【０００７】次に、第２ステップにおいて、再び音声合
成装置が『ジャンルをどうぞ』という合成音を発声する
ことにより、ユーザーの欲する具体的な目的地よりも上
位概念であるジャンルを発話するように示唆する。

【０００８】これに対し、ユーザーが「駅名」と発話す
ると、音声認識装置は、この「駅名」の声の特徴を抽出
することにより、その特徴パラメータＤ２を生成する。
更に、音声認識装置に予め備えられている認識語辞書中
の認識対象語彙と、特徴パラメータＤ２とを照合し、特
徴パラメータＤ２に最も類似した認識対象語彙ＬＤ２を
選択することで、ユーザーの発話した「駅名」の声につ
いての音声認識を行う。

【０００９】次に、ステップ３において、音声合成装置
が『県名をどうぞ』という合成音を発声することによ
り、ユーザーに対して地域名を発話するように示唆す
る。

【００１０】これに対して、ユーザーが「東京都」と発
話すると、音声認識装置は、この「東京都」の声の特徴
を抽出することにより、その特徴パラメータＤ３を生成
する。更に、上記認識語辞書中の認識対象語彙と、特徴
パラメータＤ３とを照合し、特徴パラメータＤ３に最も
類似した認識対象語彙ＬＤ３を選択することで、ユーザ
ーの発話した「東京都」の声についての音声認識を行
う。

【００１１】次に、ステップ４において、音声認識装置
は、認識語辞書中の認識対象語彙のうち、認識対象語彙
ＬＤ２及びＬＤ３の範疇に属する認識対象語彙を絞り込
む。更に、その絞り込んだ認識対象語彙と上記の特徴パ
ラメータＤ１とを照合し、特徴パラメータＤ１に最も類
似した認識対象語彙ＬＤ１を選択することにより、第１
ステップで発話された「目黒駅」の声についての音声認
識を行う。

【００１２】すなわち、上記の第１ステップにおいて下
位概念の名称「目黒駅」が発話された時点では、認識語
辞書中に格納されている膨大な数の認識対象語彙の中か
ら、ユーザーの所望する地域内に存在する「目黒駅」の
認識対象語彙ＬＤ１を特定することは一般的には困難で
ある。

【００１３】このため、発話された「目黒駅」の声の特
徴パラメータＤ１を記憶部等に保持しておき、第２〜第
４ステップにおいてユーザーからのジャンルと地域名に
関する発話を受けて、認識語辞書中の認識対象語彙の検
索範囲を絞り込んだ後、その絞り込んだ認識対象語彙と
特徴パラメータＤ１とを照合することで、「目黒駅」の
認識対象語彙ＬＤ１を特定し易くしている。

【００１４】そして、選択した認識対象語彙ＬＤ３とＬ
Ｄ１に基づいて『△△△内の○○○ですね』という合成
音を発声することにより、認識結果をユーザーに提示す
る。すなわち、認識対象語彙ＬＤ３とＬＤ１が適切に
「東京都」「目黒駅」と認識された場合には、『△△△
内の○○○ですね』は『東京都内の目黒駅ですね』とい
う合成音となってユーザーに提示される。

【００１５】つまり、音声認識装置はあくまでも認識語
辞書の中から最も類似した認識対象語彙ＬＤ１〜ＬＤ３
を選択するに過ぎないため、ユーザーの発話した声が不
明瞭であった場合等では、「目黒駅」を「目白駅」と誤
認識したり、「東京都」を「京都府」と誤認識する場合
が可能性としてあり得る。このように誤認識した場合に
は、『京都府内の目白駅ですね』という合成音をユーザ
ーに提示することになる。したがって、認識結果をユー
ザーに提示し確認を仰ぐために、認識対象語前ＬＤ３と
ＬＤ１に基づいて合成音を発声することとしている。

【００１６】そして、ユーザーがこの提示された合成音
を聴き、正確な音声認識がなされたと判断して、例えば
「検索開始」等と発話すると、音声認識装置がこれを認
識し、更にナビゲーションシステムがその確認の指示を
受けて現在地から東京都内の目黒駅までの走行経路を探
索し、その探索した走行経路の地図を表示装置に表示す
る。

【００１７】一方、ユーザーが誤認識と判断した場合に
は、「戻れ」と発話して指示すると、音声認識装置は、
その指示を受けて再び音声認識を開始し、再び提示した
認識結果についてユーザーからの「検索開始」の指示を
受けるまで、その音声認識を繰り返すようになってい
る。

【００１８】このように、上記のナビゲーションシステ
ムは、音声認識装置と音声合成装置との組み合わせによ
り、ユーザーに対して対話操作を可能にしたものである
点で優れた機能を有している。

【００１９】また、ユーザーの思考特性に合わせた順番
でキーワードとなる言葉を発話させるようにしているの
で、ユーザーに対して優れた利便性を提供するものであ
る。つまり、ユーザーは所望の目的地を指示する際に、
最も具体的な目的地（上記例で言えば、目黒駅）を最初
に指示し、次にその目的地の存在するジャンルや地域名
を指示するという思考特性を有していることから、ユー
ザーの思考特性に合わせたマンマシンシステムとなって
いる。

【００２０】具体例を述べれば、情報検索システムで
は、合理的な情報管理手法として、最も上位概念のカテ
ゴリを決めておき、その上位概念のカテゴリに関連する
中位概念と下位概念の情報を階層化して管理するという
手法が採られている。こうした階層化構造を採用するこ
とで、ユーザーが膨大な下位概念の情報の中から特定情
報を検索する場合に、上位概念と中位概念の情報を利用
して所謂情報の絞り込みを行い、所望の特定情報にいち
早く到達できるようにしている。

【００２１】ところが、かかる情報検索システムと同様
の検索手法を用いてマンマシンシステムを構築すること
とすると、ユーザーの思考特性とは合わなくなる場合が
ある。すなわち、上記のナビゲーションシステムを引用
して例示すれば、最初に上位概念のカテゴリ『ジャン
ル』を質問し、それに対してユーザーに「駅名」と発声
してもらうことにし、次に、中位概念の『県名』を質問
して、それに対してユーザーに「東京都」と発声しても
らうことにし、最後に、下位概念の『具体的な駅の名
称』を質問して、それに対して「目黒駅」と発声しても
らうことにした場合には、ユーザーの思考特性とは異な
った順序で質問することになるため、ユーザーに対して
違和感を与える場合がある。

【００２２】このような観点からして、上記従来のナビ
ゲーションシステムは、ユーザーの所望する事項を違和
感のない順序で入力させるので、ユーザーに対して優れ
た利便性を提供するものであるということができる。

【００２３】

【発明が解決しようとする課題】しかしながら、上記従
来のナビゲーションシステムは、ユーザーの思考特性に
合わせた音声認識手法を講じたことで、次のような不具
合を生じる場合があった。

【００２４】例えば図１３の場合には、上記したよう
に、第１ステップで発話された「目黒駅」の音を音声認
識せず、第２〜第４ステップで上記の絞り込みを行った
後に初めて「目黒駅」の音を音声認識して、その認識結
果を提示することとしている。

【００２５】そして、誤認識があった場合には、「戻
れ」の指示を受けて再度の音声認識を行うことによって
対応することとしている。

【００２６】ところが、この「戻れ」の意味は、「１ス
テップ前の処理に戻ってから再度処理を開始しろ」とい
う命令を意味している。このため、目的地「目黒駅」が
誤認識であった場合には、ユーザーは第４ステップから
第１ステップに処理を戻すために、３回「戻れ」と発話
し、更に図１３に示した第１〜第４ステップの操作を繰
り返さなければならないため、ユーザーに対して煩雑な
操作を強いるという問題があった。また、ジャンル「駅
名」が誤認識であった場合にも同様に、ユーザーは第４
ステップから第２ステップに処理を戻すために、２回
「戻れ」と発話し、更に図１３に示した第２〜第４ステ
ップの操作を繰り返さなければならないため、ユーザー
に対して煩雑な操作を強いるという問題があった。

【００２７】このように、従来のナビゲーションシステ
ムは、「戻れ」という発話がなされた場合に、先に音声
入力された情報を新たに音声入力された情報に書き換え
る（置き換える）という機能を用意しておくことで、誤
認識に対応することとしているが、この機能は再度の音
声認識を行うためのもの過ぎないため、ユーザーが簡単
な操作で訂正の指示を行うことを可能にする機能ではな
かった。このため、ユーザーに対し煩雑な操作を強いる
ことになるという問題があった。

【００２８】本発明は上記従来の問題点を克服するため
になされたものであり、ユーザーにとって容易な対話操
作（例えば、訂正操作等）を行うことができる音声認識
装置を備えたマンマシンシステムを提供することを目的
とする。

【００２９】

【課題を解決するための手段】上記目的を達成するため
本発明は、１又は２以上の処理機能を有し、音声を情報
伝達媒体として対話的に前記一の処理機能の動作を行う
音声認識装置を備えたマンマシンシステムにおいて、前
記各処理機能毎に対応付けられた制御語を予め備え、前
記一の処理機能を提示した後、前記提示に応じて前記一
の処理機能を指定する指令情報を有する音声入力情報が
外部より入力されると、前記音声入力情報を認識し、前
記指令情報に対応する前記制御語に基づいて、前記一の
処理機能の動作を行う制御部を具備する構成とした。

【００３０】また前記制御語を、前記処理機能の動作を
起動させる制御命令語と、前記制御命令語の被処理対象
を示す制御対象語との組み合わせで構成し、前記制御部
が、前記制御対象語と制御命令語を示した前記指令情報
を有する前記音声入力情報が外部より入力されると、前
記指令情報に対応する前記制御対象語と制御命令語から
成る前記制御語に基づいて、前記処理機能の動作を行う
構成とした。

【００３１】また、前制御語を、前記処理機能の動作を
起動させる制御命令語と、前記制御命令語の被処理対象
であって前記音声入力情報に含まれた前記指令情報によ
って設定される制御対象語との組み合わせで構成し、前
記制御部が、前記制御対象語の指令情報を有する前記音
声入力情報が入力された後、前記制御命令語の指令情報
を有する前記音声入力情報が入力されると、前記制御対
象語と前記制御対象語から成る前記制御語に基づいて、
前記処理機能の動作を行う構成とした。

【００３２】これらの構成によると、制御部は、音声入
力情報に含まれた指令情報を、制御語と対応付けて受け
付け、この制御語に基づいて、指令情報で指令された処
理機能の動作を実行する。この制御語に各処理機能を制
御する種々の制御命令語を登録しておくことで、指令情
報に対応した多様な処理が可能となる。

【００３３】また、１又は２以上の処理機能を有し、音
声を情報伝達媒体として対話的に前記一の処理機能の動
作を行う音声認識装置を備えたマンマシンシステムにお
いて、予め複数の照合情報を記憶した記憶部と、前記音
声にて入力される音声入力情報と前記記憶部に記憶され
ている前記照合情報とを照合して、所定の類似度基準よ
り類似度の高い１又は複数の照合情報を認識情報として
保持する認識結果保持領域と、前記各処理機能毎に対応
付けられた制御語とを有する制御部とを具備し、前記制
御部が、前記一の処理機能を提示した後、前記提示に応
じて前記一の処理機能を指定する指令情報を有する音声
入力情報が外部より入力されると、前記指令情報に対応
する前記制御語に基づいて、前記認識結果保持領域中に
保持している前記認識情報に対して前記一の処理機能の
動作を行う構成とした。

【００３４】かかる構成によっても、上記同様に制御語
に各処理機能を制御する種々の制御命令語を登録してお
くことで、指令情報に対応した多様な処理が可能とな
る。

【００３５】また、前記認識情報を、話者の発話した語
彙から成る前記音声入力情報を前記照合情報との照合に
より得られる１又は複数の語彙情報とし、前記制御語
を、前記語彙情報を訂正する指令情報とした。

【００３６】また、前記語彙情報を訂正する制御情報
を、前記１又は複数の語彙情報の一を指定して訂正する
制御情報とした。

【００３７】また、前記語彙情報を訂正する指令情報
を、前記１又は複数の語彙情報を順次に次候補選択して
訂正する制御情報とした。

【００３８】また、前制御語を、前記処理機能に相当す
る訂正の動作を起動させる制御命令語と、前記制御命令
語の被処理対象となる前記語彙情報に相当する制御対象
語との組み合わせで構成される前記指令情報とし、前記
制御部を、前記指令情報を有する前記音声入力情報が外
部より入力されると、前記指令情報に対応する前記制御
対象語と制御命令語から成る前記制御語に基づいて、前
記訂正の動作を行う構成とした。

【００３９】また、前記記憶部に、前記複数の照合情報
を上位概念の属性から下位概念の属性の範疇に複数の分
類した階層化構造に基づいて記憶すると共に、前記話者
の発話した語彙から成る前記音声入力情報を保持する情
報保持部を備え、前記制御部が、前記２以上の属性に対
応する前記処理機能を提示して、前記提示に応じて前記
２以上の属性に該当する前記語彙を各属性毎の前記認識
情報として前記認識結果保持領域に記憶した後、前記指
令情報により上位概念の属性の前記認識情報の訂正が指
令されると、前記上位概念の属性の前記認識情報の訂正
処理を行うと共に、前記情報保持部に保持されている前
記上位概念より下位概念の属性の前記音声入力情報を、
前記記憶部に記憶されている前記上位概念に従属する下
位概念の属性の前記照合情報と照合して、所定の類似度
基準より類似度の高い１又は複数の照合情報を認識情報
として再度前記認識結果保持領域に保持する構成とし
た。

【００４０】前記制御部は、前記音声入力情報を再度照
合させる際に、前記音声入力情報を、前記下位概念の認
識情報の属性に属する照合情報であって前記下位概念の
認識情報と同一の照合情報を除外した照合情報とを照合
させる構成とした。

【００４１】また、前記記憶部に、前記複数の照合情報
を上位概念の属性から下位概念の属性の範疇に複数の分
類した階層化構造に基づいて記憶すると共に、前記話者
の発話した語前から成る前記音声入力情報を保持する情
報保持部を備え、前記制御部が、前記２以上の属性に対
応する前記処理機能を提示して、前記提示に応じて前記
２以上の属性に該当する前記語彙を各属性毎の前記認識
情報として前記認識結果保持領域に記憶した後、前記指
令情報により下位概念の属性の前記認識情報を順次に次
候補選択して訂正する訂正が指令されると、次候補選択
した認識情報を新たな認識情報として提示する構成とし
た。

【００４２】これらの構成によると、外部入力される訂
正の指令情報を、種々の訂正処理に関する情報を有する
制御語を介して受け付ける。そして、その制御語に基づ
いて各種の訂正処理が行われる。特に、認識情報が階層
化されて初めて意味をなす情報である場合に、上位概念
の属性の認識情報を訂正すると、下位概念の属性に属す
る認識情報に影響を及ぼし、逆に、下位概念の属性の認
識情報を訂正すると、上位概念の属性に属する認識情報
に影響を及ぼすといった相互に影響を及ぼすことにな
り、適切な訂正処理を行う必要が生じる。このような場
合に、制御語に予め適切な訂正処理を可能にする機能を
設定しておくことで、迅速且つ適切な訂正処理が可能と
なる。

【００４３】例えば、ナビゲーションシステムに目的地
を入力する際に、認識結果である認識情報に誤りがあっ
たり、別の目的地に変更するような場合には、迅速な訂
正処理が望まれるが、このような場合に制御語を用いる
ことで対話形式の操作を迅速に行うことが可能となる。

【００４４】

【発明の実施の形態】以下本発明の実施の形態を図面を
参照して説明する。尚、一実施形態として、音声認識機
能を有する車載用ナビゲーションシステムについて説明
する。

【００４５】図１は、本実施形態の車載用ナビゲーショ
ンシステムに備えられた音声認識装置の構成を示すブロ
ック図である。より厳密に言えば、車載用ナビゲーショ
ンシステムにマンマシンインターフェース（ｍａｎ−ｍ
ａｃｈｉｎｅｉｎｔｅｒｆａｃｅ）装置として設けら
れた音声認識装置の部分の構成を示している。

【００４６】図１において、本音声認識装置は、マイク
ロフォンを有する音声入力部１と、信号処理部２と、記
憶部３と、マイクロプロセッサ（ＭＰＵ）を備えた制御
部４、キーボード等の操作部５、音声合成用集積回路装
置を有する音声出力部６、液晶ディスプレイ等で形成さ
れた表示部７とを備えて構成されている。

【００４７】ただし、操作部５と音声出力部６及び表示
部７は、ナビゲーションシステムに備えられている構成
要素を供用したり、外部装置として別途接続してもよ
い。

【００４８】記憶部３は、分析データ記憶部１０と認識
語記憶部１１を備えて構成されている。信号処理部２
は、ディジタルシグナルプロセッサ（Ｄｉｇｉｔａｌ
ＳｉｇｎａｌＰｒｏｃｅｓｓｏｒ：ＤＳＰ）等で形成
され、制御部４からの制御信号に従って動作する音声分
析部８及び類似度演算部９が備えられている。

【００４９】音声入力部１は、ユーザーが発話した音声
を集音し、ディジタルデータの音声データＤｉｎに変換
して音声分析部８に供給する。

【００５０】音声分析部８は、音声データＤｉｎに基づ
いてユーザーの発話した音声の特徴抽出を行い、その特
徴抽出結果である特徴パラメータのデータ（以下、分析
データという）Ｄａを出力する。

【００５１】分析データ記憶部１０は、再記憶可能なメ
モリ（ＲＡＭ）で形成され、音声分析部８より出力され
る分析データＤａを記憶する。また、記憶した分析デー
タＤａ’を制御部４からの制御信号に応じて類似度演算
部９に供給する。

【００５２】ここで、本音声認識装置は、ユーザーに対
して発話してもらうための語彙の範疇を示唆し、その範
疇内の語彙をユーザーが発話するという対話形式を採用
している。そこで、分析データ記憶部１０には、示唆し
た範疇に対応付けて分析データＤａを記憶するようにし
ている。

【００５３】認識語記憶部１１は、読出し専用メモリ
（ＲＯＭ）で形成され、ユーザーの発話した語彙を認識
する際に分析データＤａ，Ｄａ’と照合される多数の参
照データ（以下、認識対象語彙という）が記憶されてい
る。これらの認識対象語彙は、複数の認識辞書中に分類
して格納されている。認識辞書として、図２に示すよう
に、階層化されたジャンル辞書ＭＪと地域名辞書ＭＫと
施設名称辞書ＭＬが備えられている。

【００５４】最上層に位置付けられたジャンル辞書ＭＪ
には、「駅名」「病院名」「遊園地名」等の認識対象語
彙が割り当てられている。ジャンル辞書ＭＪに従属され
た地域名辞書ＭＫには、「北海道」「東京都」等の地域
名の認識対象語彙が割り当てられている。地域名辞書Ｍ
Ｋに従属された施設名称辞書ＭＬには、具体的な「目黒
駅」「東京駅」等の施設名称の認識対象語彙が割り当て
られている。

【００５５】つまり、ジャンル辞書ＭＪ中の「駅名」の
認識対象語前には、「北海道」「東京都」等の全国の地
域名の認識対象語彙がツリー構造で従属され、各地域名
の認識対象語彙には、各地域に存在する多数の駅の施設
名称がツリー構造で従属されている。また、ジャンル辞
書ＭＪ中の「病院名」の認識対象語彙にも、全国の地域
名が従属し、それぞれの地域名には多数の病院の施設名
称が従属している。「遊園地名」の認識対象語彙につい
ても同様に全国の地域名と多数の遊園地の施設名称が従
属している。

【００５６】更に、本音声認識装置には、ユーザーが音
声入力により、又は操作部５から訂正等の命令をするた
め複数の命令情報（以下、命令語彙という）が準備され
ており、これらの命令語彙Ｗも命令語辞書ＭＣとして認
識語記憶部１１に記憶されている。

【００５７】尚、ジャンル辞書ＭＪの範疇に属する「駅
名」「病院名」「遊園地」等の認識対象語彙はジャンル
認識対象語彙、地域名辞書ＭＫの範疇に属する「北海
道」「東京都」等の認識対象語彙は地域名認識対象語
彙、施設名称辞書ＭＬの範疇に属する認識対象語彙は施
設名称認識対象語彙と呼ばれ、ユーザーが命令語彙Ｗを
用いて本音声認識装置に命令する操作はコマンド操作と
呼ばれている。

【００５８】類似度演算部９は、音声分析部８より供給
される分析データＤａを辞書ＭＪ，ＭＫ，ＭＬ，ＭＣ中
の認識対象語彙Ｄｂと照合し、分析データＤａに最も類
似している認識対象語彙Ｄｂと、所定の類似度判定基準
より高い類似度の認識対象語彙（１又は複数個の認識対
象語彙）Ｄｂとを選択し、その選択した認識対象語彙Ｄ
ｂを認識結果語彙Ｄｃとして制御部４へ出力する。ま
た、分析データ記憶部１０から供給された分析データＤ
ａ’についても同様に処理して、分析データＤａ’に対
応する認識結果語彙Ｄｃを制御部４へ出力する。

【００５９】これにより、ユーザーが発話した「駅名」
「東京都」「目黒駅」等の声や、コマンド操作により発
話された「訂正」等の声を認識した結果が、認識結果語
彙Ｄｃとして制御部４に供給される。

【００６０】尚、分析データＤａ，Ｄａ’を照合するた
めの辞書ＭＪ，ＭＫ，ＭＬ，ＭＣは、制御部４から供給
される制御信号Ｃによって選択的に切り替えられる。例
えば、ユーザーに対してジャンルの範疇に属する語彙を
発話してもらうように示唆するときは、制御信号Ｃによ
ってジャンル辞書ＭＪを選択する。そして、示唆に応じ
てユーザーが発話し、それによって得られる分析データ
Ｄａ（又はＤａ’）を類似度演算部９がジャンル辞書Ｍ
Ｊ中の認識対象語彙Ｄｂと照合する。このように、ユー
ザーに対して示唆する内容と辞書ＭＪ，ＭＫ，ＭＬ，Ｍ
Ｃの選択との関係が対応付けるられている。また、分析
データ記憶部１０から分析データＤａ’を読み出すとき
も、辞書ＭＪ，ＭＫ，ＭＬ，ＭＣの選択と関連付けて行
われる。

【００６１】制御部４は、予め設定されたシステムプロ
グラムを実行することにより、本音声認識装置全体の動
作を制御するための上記制御信号を出力すると共に、音
声認識した結果を制御出力としてナビゲーションシステ
ム内の中央制御部（図示省略）へ転送する。

【００６２】更に、制御部４は、操作部５からユーザー
の指示を受けたり、ユーザーに提示すべきデータや音声
認識した結果を音声出力部６又は表示部７に供給して、
合成音や表示を提示させることにより、聴覚的・視覚的
な対話を行うようになっている。

【００６３】また、制御部４には、類似度演算部９から
供給される認識結果語彙Ｄｃを記憶するための認識結果
記憶領域ＭＲが備えられている。図３に示すように、認
識結果記憶領域ＭＲには、ジャンルファイルＦＪ、地域
名ファイルＦＫ、施設名称ファイルＦＬが備えられ、こ
れらのファイルＦＪ，ＦＫ，ＦＬに認識結果語彙Ｄｃを
分類して格納する。

【００６４】すなわち、上述したように、本音声認識装
置は、語彙の範疇をユーザーに示唆し、それに応じてユ
ーザーがその範疇内の語彙を発話するという対話形式を
採用していることから、『ジャンルをどうぞ』と示唆し
それに応じて発話されたときに得られ認識結果語彙Ｄｃ
をジャンルファイルＦＪに格納する。『地域名をどう
ぞ』『県名をどうぞ』等と示唆しそれに応じて発話され
たときに得られ認識結果語彙Ｄｃを地域名ファイルＦＫ
に格納する。『名称をどうぞ』と示唆しそれに応じて発
話されたときに得られ認識結果語彙Ｄｃを施設名称ファ
イルＦＬに格納する。

【００６５】更に、類似度演算部９から制御部４に類似
度の高い順に複数個の認識結果語前Ｄｃが転送されてく
る。そこで、図３に示すように、ファイルＦＪ，ＦＫ，
ＦＬには、複数個ずつ転送されてくる認識結果語彙Ｄｃ
１１，Ｄｃ１２〜、Ｄｃ２１，Ｄｃ２２〜、Ｄｃ３１，
Ｄｃ３２〜を類似の高い順に揃えて格納する。

【００６６】そして、制御部４は、基本的に、これらの
ファイルＦＪ，ＦＫ，ＭＬ中に記憶した最も類似度の高
い認識結果語彙Ｄｃ１１，Ｄｃ２１，Ｄｃ３１を調べる
ことで、ユーザーの指示した目的地（施設名称）等を特
定する。ただし、次候補に関するコマンド操作がなされ
た場合には、次候補となる認識結果語彙に基づいて、ユ
ーザーの指示した目的地（施設名称）等を特定する。

【００６７】更に、制御部４には、複数の制御語ＷＷが
予めファイリングされて格納されている。これらの制御
語ＷＷは、コマンド操作により指令された命令の内容
（意味）を判定して迅速な対応を行うために設けられて
いる。この制御語ＷＷは、２つの基本的な形態を有して
いる。

【００６８】第１の基本型の制御語ＷＷは、図４（ａ）
に模式的に示すように、制御対象語Ｘと制御命令語Ｙの
対で構成されている。制御命令語Ｙは、ユーザーの指令
に応じて処理すべき作業事項、制御対象語Ｘは、制御命
令語Ｙに従って処理すべき対象事項である。例えば、本
音声認識装置が音声認識した結果を『東京都内の駅名で
すね』と提示し、ユーザーが「駅名を訂正」と発話した
場合には、（Ｘ＋Ｙ）＝（駅名＋訂正）の構成からなる
制御語ＷＷに基づいて、駅名を訂正するための処理を開
始する。そして、新たに音声入力された結果が「病院
名」となった場合には、訂正結果を『東京都内の病院名
ですね』という合成音声等で再提示する。

【００６９】つまり、被制御対象である制御対象語Ｘ
は、上記のジャンルと地域名と施設名称の各属性（範
疇）を表す認識対象語彙等と同じ内容となっており、こ
れらの認識対象語彙等に制御命令語Ｙが予め付加されて
制御語ＷＷが構成されている。

【００７０】上記の例は、制御命令語Ｙが「訂正」にな
っている場合であり、その他にも、図５に示すような各
種形態の制御語ＷＷが予め準備されている。図５中の左
欄に命令語の形態、右欄に命令語の意味、中欄に制御命
令語Ｙの識別子を示し、「〜」の部分が制御対象語Ｘ、
それに続く語彙が制御命令語Ｙである。

【００７１】次に、第２の基本型の制御語ＷＷは、図４
（ｂ）に模式的に示すように、制御命令語Ｙだけを予め
ファイリングして記憶しておき、ユーザーのコマンド操
作で指摘された認識結果語彙Ｄｃに、指令された制御命
令語Ｙを後から付加することで、制御語ＷＷを形成する
という構成になっている。つまり、図４（ａ）に示した
制御語ＷＷは、制御対象語Ｘが予め定められているのに
対し、図４（ｂ）に示した制御語ＷＷは、制御対象語Ｘ
の部分に融通性を持たせたものである。

【００７２】本音声認識装置が、ジャンルに属する「駅
名」、地域名に属する「東京都」の順に音声認識した結
果を『東京都内の駅名ですね』と提示し、ユーザーが
「訂正」と発話した場合には、最後（直近）に認識した
地域名に属する「東京都」を訂正すべきと判断する。

【００７３】例えば、最後に認識した結果が地域名ファ
イルＦＫ中の認識結果語彙Ｄｃ２１であった場合であっ
て、認識結果語彙Ｄｃ２１に基づいて「東京都」の提示
をした場合に、訂正の指示がなされたときには、最後の
認識結果である認識結果語彙Ｄｃ２１を図４（ｂ）の認
識結果語彙Ｄｃとする。この認識結果語彙Ｄｃ２１に、
図５中に示す「訂正（ＣＷ）」の制御命令語Ｙを付加す
ることで、図４（ｂ）の制御語ＷＷを生成する。この
（Ｄｃ２１＋Ｙ）の制御語ＷＷに基づいて、地域名を訂
正するための処理を開始する。そして、新たに音声入力
された結果が「神奈川県」となった場合には、訂正結果
を『神奈川県内の駅名ですね』という合成音声等で再提
示する。

【００７４】したがって、第２の基本構成の制御語ＷＷ
は、ユーザーが音声入力した結果を直ぐに訂正したいよ
うな場合に、迅速な対応ができるようにしたものであ
る。例えば、ユーザーが目的地等を頻繁に切り替えたい
と欲した場合等に、目的地等の音声入力と、「訂正」の
コマンド操作を交互に繰り返すだけで、最終的に指定し
たい目的地等を簡単且つ迅速に指令することができるよ
うになっている。つまり、ユーザーにとっては、制御命
令語Ｙに該当する「訂正」の語彙を発話するだけで、直
近の認識対象語彙を指定したことになるため、簡単な訂
正が可能となり、優れた操作性が実現されている。

【００７５】一方、上記第１の基本構成の制御語ＷＷ
は、最後に音声認識された認識結果語彙だけでなくそれ
より前に音声認識された認識結果語彙を訂正しようとす
る場合に、適切な対応処理が可能となる。

【００７６】図４（ｃ）〜（ｅ）は、制御語ＷＷの発展
型の具体例を示している。ユーザーのコマンド操作の仕
方に応じて、様々な長さや組み合わせの制御語ＷＷが形
成されることを示している。これらの発展型によれば、
複数の認識結果語彙を一括して訂正したり（図４（ｄ）
（ｅ））、訂正の指令を行っても即座に訂正を行わせる
のでなく、何らかの処理を行った後に、実質的な訂正を
指示することができる（図４（ｃ）〜（ｅ））。

【００７７】特に、ユーザーが複数の語彙や命令語彙を
連続した音声として入力する場合に、この発展型の制御
語ＷＷに基づいてユーザーの意志を反映した処理を行う
ことが可能である。

【００７８】このように、本音声認識装置は、固定の又
は融通性を持たせた制御対象語Ｘと制御命令語Ｙとを組
み合わせた制御語ＷＷを介して、ユーザーの指示と指令
を受け付けるようにしたので、優れた対話操作を可能に
している。

【００７９】次に、かかる構成を有する本音声認識装置
の動作例を図６ないし図９に示すフローチャートを参照
して説明する。尚、代表例として、ユーザーが既に音声
入力した語彙を訂正する場合、すなわち図５に示した
「〜を訂正」、「訂正」、「〜の次候補」、「次候補」
のコマンド操作した場合の動作例について説明する。

【００８０】図６は、本音声認識装置における音声認識
処理の基本動作を示している。同図において、本音声認
識装は、基本的には、施設名称の語彙→ジャンルの語彙
→地域名の語彙の順でユーザーに発話してもらい、ジャ
ンルと地域名の語彙に基づいて認識語記憶部１１中の照
合すべき認識対象語彙を絞り込んだ後、分析データ記憶
部１０に保存しておいた施設名称の分析データＤａ’と
絞り込んだ認識対象語彙Ｄｂとを照合することで、ユー
ザーの発話した施設名称の語彙を特定する。これを直接
発話方式と呼び、ユーザーの思考特性に合わせた対話操
作を可能にしている。

【００８１】尚、ジャンルの語彙を音声認識し、その認
識結果に基づいて施設名称の語彙を特定できる場合に
は、地域名の語彙を発話してもらう必要がないので、地
域名の語彙を発話してもらうための示唆を行わない。

【００８２】すなわち、図６において、まず本音声認識
装置が、施設名称の語前を音声入力するようにユーザー
に対して示唆し、これに応じて、ユーザーが所望の目的
地である施設名称の語彙を音声入力すると、この分析デ
ータＤａを分析データ記憶部１０に記憶（保存）する。

【００８３】次に、上位概念であるジャンルの範疇に属
する語彙を音声入力するように示唆し、これに対してユ
ーザーがジャンルの範疇に属する語彙（例えば、「駅
名」等の語彙）を音声入力すると、その音声の分析デー
タＤａを生成して、ジャンル辞書ＭＪ中の認識対象語彙
Ｄｂと照合し、照合結果の認識結果語彙Ｄｃを記憶結果
記憶領域ＭＲ中の該当ファイルＦＪに記憶する。そし
て、分析データ記憶部１０に保存されている分析データ
（ユーザーが発話した施設名称の分析データ）Ｄａ’を
音声認識できる条件が揃った場合には、分析データＤ
ａ’を該当する施設名称辞書ＭＬ中の認識対象語彙Ｄｂ
と照合し、照合結果の認識結果語彙Ｄｃを施設名称ファ
イルＦＬに記憶する。

【００８４】そして、認識結果である施設名称の認識結
果語彙Ｄｃをユーザーに提示して誤認識等の有無を確認
させる。それに応じて目的地までの走行経路の探索を開
始すべきコマンド操作が行われると、制御語ＷＷに基づ
いて施設名称の目的地までの走行経路を探索して、探索
した走行経路を表示する。

【００８５】ただし、上位概念の語彙が１回入力された
だけでは、目的地である施設名称を特定（絞り込み）で
きなかった場合には、更に中位概念の地域名を音声入力
すべき趣旨の示唆をし、地域名の範疇に属する語彙（例
えば、「東京都」等の語彙）を発話してもらい、ジャン
ルの場合と同様の処理を繰り返す。

【００８６】図７は、本音声認識装置が音声入力された
語彙を音声認識し、その認識結果をユーザーに提示した
ときに、ユーザーから訂正等のコマンド操作がなされた
場合の基本動作を示している。

【００８７】まず、ユーザーに対して訂正等のコマンド
操作をするか否か示唆し、それに応じて音声入力により
又は操作部５から訂正等のコマンド操作がなされると、
その指令された内容を認識する。そして、制御語ＷＷに
基づいて、例えば訂正対象を訂正するための処理を行う
ようになっている。尚、図７に示した処理は、図６に示
した音声認識処理の各ステップにおいて適宜に行われ
る。

【００８８】次に、より具体的な動作例を図８及び図９
を参照して説明する。図８において、ユーザーが音声入
力により又は操作部５によって音声認識開始のコマンド
操作をすると、制御部５の制御下でステップ１００以降
の処理を開始する。

【００８９】ステップ１００では、制御部４の指示に従
って音声出力部６が『名称をどうぞ』という合成音を発
声することにより、ユーザーに対して所望の目的地の名
称（施設名称）を音声入力するように示唆（質問）す
る。

【００９０】これに対して、ユーザーが施設名称である
例えば「目黒駅」と発話すると（ステップＳ１０２）、
この「目黒駅」の音声を集音して音声分析部８が音声分
析し、「目黒駅」の音声の分析データＤａを生成する
（ステップＳ１０４）。

【００９１】次に、分析データ記憶部１０が、施設名称
「目黒駅」の分析データＤａを記憶する（ステップＳ１
０６）。すなわち、施設名称に該当する認識対象語彙は
膨大な数に上るため、後述する絞り込み処理を完了して
認識辞書の照合範囲が絞られるまで、施設名称の分析デ
ータＤａを分析データ記憶部１０に記憶する。

【００９２】次に、ステップＳ１０８において、認識語
記憶部１１中のジャンル辞書ＭＪを選択（設定）し、ジ
ャンルに関する音声入力可能状態にする。

【００９３】次に、ステップＳ１１０において、類似度
演算部９がジャンル辞書ＭＪ中の認識対象語彙Ｄｂに基
づいて入力音声の認識を開始する。更に、音声出力部６
が『ジャンルをどうぞ』という合成音を発声することに
より、ユーザーに対してジャンルの範疇に属する語彙を
発話するように示唆する。

【００９４】この示唆に応じてユーザーがジャンルに属
する語彙（例えば、「駅名」）と発声すると（ステップ
Ｓ１１２）、この「駅名」の音声を集音して音声分析部
８が音声の特徴抽出を行うことにより、「駅名」の音声
の分析データＤａを生成して、類似度演算部９へ供給す
る（ステップＳ１１４）。また、この分析データＤａを
分析データ記憶部１０に記憶する。

【００９５】次に、ステップＳ１１６において、類似度
演算部９が「駅名」の音声の分析データＤａをジャンル
辞書ＭＪ中の認識対象語童Ｄｂと照合し、類似度判断基
準より高い類似度の１又は複数個の認識対象語彙を選択
する。そして、選択した認識対象語彙を類似度の高い順
番に配列して、認識結果語彙Ｄｃとして制御部４へ供給
し、図３に示したジャンルファイルＦＪに記憶させる。

【００９６】次に、ステップＳ１１８において、ジャン
ルファイルＦＪに記憶した認識結果語彙Ｄｃのうち最も
類似度が高いもの（図３中のＤｃ１１が該当する）を音
声出力部６と表示部７に供給し、合成音声と文字表示等
によって認識結果を提示する。例えば、認識結果語彙Ｄ
ｃ１１が「駅名」であれば、『駅名ですね』等の合成音
を提示する。

【００９７】次に、この提示に対応して、ユーザーが発
話によって「駅名を訂正」とコマンド操作すると、ステ
ップＳ１２０において訂正指令を認識して「ＹＥＳ」と
判断し、ステップＳ１２２へ移行する。

【００９８】ここで、ステップＳ１２０では、「駅名を
訂正」とのコマンド操作がなされたので、図４（ａ）に
示した第１の基本型の制御語ＷＷに基づいて、訂正の判
断をする。つまり、制御対象語Ｘが「駅名」の認識結果
語彙であり、且つ制御命令語Ｙが「訂正」になっている
制御語ＷＷを調べて、「駅名」をそれと同じ階層に在る
他の認識対象語彙（すなわち、ジャンルの範疇に属する
他の認識対象語彙）で訂正すべきと判断する。

【００９９】そして、ステップＳ１２２において、制御
語ＷＷに基づいて制御信号Ｃを認識語記憶部１１に供給
して、ジャンル辞書ＭＪを設定する。ただし、制御対象
語Ｘが「駅名」となっているに応じてジャンル辞書ＭＪ
中の「駅名」の認識対象語彙は除外し、残りの認識対象
語彙を設定する。

【０１００】次に、ステップＳ１１０−Ｓ１１８の処理
を繰り返す。これにより、ステップＳ１１０において
『ジャンルをどうぞ』という合成音声でユーザーに示唆
し、ステップＳ１１２においてユーザーが「駅名」以外
の音声入力をすると、ステップＳ１１４，Ｓ１１６でこ
れを分析且つ認識して、新たに指示されたジャンルの認
識結果語彙Ｄｃが制御部４に供給される。

【０１０１】そして、ステップＳ１１８において制御部
４が、ジャンルファイルＦＪ中の旧い認識結巣語彙Ｄｃ
１１，Ｄｃ１２〜を、新たな認識結果語彙Ｄｃ１１，Ｄ
ｃ１２〜によって訂正する。例えば、ユーザーが「病院
名」を音声入力すると、「病院名」に類似した認識結果
語彙ＤｃがジャンルファイルＦＪに記憶されることにな
り、ユーザーの指令した訂正処理がなされることとなる
（ステップＳ１１２〜Ｓ１１８）。

【０１０２】また、上記のステップＳ１２０において、
単に「訂正」のコマンド操作がなされた場合には、図４
（ｂ）に示した第２の基本型の制御語ＷＷに基づいて、
訂正の判断をする。つまり、ジャンルファイルＦＪ中の
最も類似度の高い認識対象語彙Ｄｃ１１に、「訂正」の
命令制御語Ｙを付加した制御語ＷＷに基づいて、「駅
名」をそれと同じ階層に在る他の認識対象語彙（すなわ
ち、ジャンルの範疇に属する他の認識対象語彙）で訂正
すべきと判断する。

【０１０３】そして、ステップＳ１２２を通って上記ス
テップＳ１１０〜Ｓ１１８の処理を繰り返すことで、ジ
ャンルファイルＦＪ中の旧い認識結果語彙Ｄｃ１１，Ｄ
ｃ１２〜を、新たな認識結果語彙Ｄｃ１１，Ｄｃ１２〜
によって訂正する。

【０１０４】尚、ステップＳ１２０において、上記の第
１，第２の基本型の制御語ＷＷに対応する訂正コマンド
操作が繰り返し行われた場合には、今までに訂正の指示
がなされた複数の制御対象語Ｘ（又は制御結果語Ｄｃ）
の全てを、ジャンル辞書ＭＪから除外して、ジャンル辞
書ＭＪ中の残余の認識対象語彙Ｄｂに基づいて類似度の
判定が行われる。つまり、訂正のコマンド操作がなされ
る度に、除外する認識対象語彙を広げていって、照合す
べき認識対象語彙Ｄｂの範囲を絞り込んでいく。このた
め、照合範囲が絞られて迅速な訂正処理が可能となる。

【０１０５】更にまた、ステップＳ１２０において、図
５中に示されている「〜の次候補」の制御語（第１の基
本型の制御語）ＷＷに該当する例えば「駅名の次候補」
のコマンド操作がなされた場合には、ジャンルファイル
ＦＪに記憶されている次の認識結果語彙Ｄｃ１２を、ス
テップＳ１１８において提示する。例えば、認識結果語
彙Ｄｃ１２が「病院名」であった場合には、『病院名で
すね』と提示する。

【０１０６】すなわち、「駅名の訂正」や「訂正」のコ
マンド操作がなされた場合とは異なり、上記したステッ
プＳ１２２及びステップＳ１１０〜Ｓ１１６における再
度の処理では実質的に訂正処理は行わずに、ステップＳ
１１８において認識結果語彙Ｄｃ１２を最も類似度の高
い認識結果語彙として提示する。

【０１０７】その提示に対してユーザーが再び「〜の次
候補」のコマンド操作をすると、ジャンルファイルＦＪ
中の更に次候補である認識結果語彙Ｄｃ１３を提示す
る。また、再び次候補のコマンド操作がなされた場合に
は、ジャンルファイルＦＪ中の更に次候補である認識結
果語彙Ｄｃ１４を提示する。したがって、ジャンルファ
イルＦＪ中に存在する認識結果語彙Ｄｃの個数分だけ、
ユーザーは次候補のコマンド操作を行うことができるよ
うになっている。

【０１０８】かかる次候補のコマンド操作を行うこと
で、ユーザーはジャンルの語彙を再度音声入力する手間
を省くことができる。更に、本音声認識装置における訂
正処理が高速化する。

【０１０９】更にまた、ステップＳ１２０において、図
５中に示されている「次候補」の制御語（第２の基本形
の制御語）ＷＷに該当するコマンド操作がなされた場合
にも、「〜の次候補」と同様の訂正処理を行う。つま
り、ユーザーが単に「次候補」と発話すると、ジャンル
ファイルＦＪ中に記憶されている次候補の認識結果語彙
Ｄｃ１２が制御対象語となり、この認識結果語彙Ｄｃ１
２を提示する。そして、再び次候補のコマンド操作がな
された場合には、ジャンルファイルＦＪ中に記憶されて
いる更に次候補の認識結果語彙Ｄｃ１３が制御対象語と
なり、この認識結果語彙Ｄｃ１３を提示する。したがっ
て、ジャンルファイルＦＪ中に存在する認識結果語彙Ｄ
ｃの個数分だけ、ユーザーは次候補のコマンド操作を行
うことができるようになっている。

【０１１０】この「次候補」とのみ発話するコマンド操
作によれば、ユーザーは制御対象語Ｘに該当する語彙を
発話しなくて済むので、「〜の次候補」のコマンド操作
に比してより迅速な訂正が可能となる。

【０１１１】ただし、いずれの次候補コマンド操作を行
うかはユーザーが適宜に選択することができるので、本
音声認識装置は、融通性の高いシステムとなっている。

【０１１２】このように、ステップＳ１２０において、
「〜を訂正」「訂正」「〜の次候補」「次候補」のコマ
ンド操作を行うことで、ユーザーは簡単に訂正を行うこ
とができ、所望のジャンルを確定することができる。ま
た、説明をするまでもなく、これらのコマンド操作を混
在して行うことも当然に可能である。

【０１１３】次に、ステップＳ１１８で提示した認識結
果に対して、ユーザーがジャンルの語彙が確定したと判
断すると、ステップＳ１２０からステップＳ１２４の処
理に移行することになる。

【０１１４】ステップＳ１２４では、ファイルＦＪ，Ｆ
Ｋを調べ、記憶されている認識結果語彙に基づいて施設
名称を確定するのに十分な絞り込み条件が揃ったか否か
判断する。ここで、未だ十分な絞り込み条件が揃ってい
なければ、ステップＳ１２６に移行して、次の地域名辞
書ＭＫを設定して、ステップＳ１１０からの処理を繰り
返す。

【０１１５】例えば、ジャンルファイルＦＪ中に、既に
認識結果語彙Ｄｃ１１，Ｄｃ１２〜が記憶されていて
も、地域名ファイルＦＫ中には末だ認識結果語彙が記憶
されていないために絞り込みができない場合には、ステ
ップＳ１２４において、未だ絞り込み条件が揃っていな
いと判断し、更にステップＳ１２６において、地域名辞
書ＭＫを設定してから、ステップＳ１１０の処理へ移行
する。

【０１１６】このようにステップＳ１１０からの処理を
繰り返すと、ステップＳ１１０では、ユーザーに対して
地域名の範疇に属する語彙を発話してもらうために例え
ば『県名をどうぞ』という合成音を発声する。

【０１１７】これに応じてユーザーが「東京都」等の地
域名を音声入力すると（ステップＳ１１２）、上記した
ステップＳ１１４〜Ｓ１１８の処理により、地域名ファ
イルＦＫに、類似度の高い１又は複数の認識結果語彙Ｄ
ｃ２１，Ｄｃ２２〜を記憶する。

【０１１８】更に、ステップＳ１１８において、ジャン
ルファイルＦＪと地域名ファイルＦＫに記憶された認識
結果語彙に基づいて例えば『東京都の駅名ですね』とい
う合成音を提示する。

【０１１９】これに対してユーザーが、音声で「東京都
を訂正」とコマンド操作すると（Ｓ１２０）、前述した
のと同様に、「〜を訂正」の制御語ＷＷに基づいて地域
名ファイルＦＫ中の認識結果語彙を訂正する。

【０１２０】尚、地域名に関する訂正処理も上記したジ
ャンルに関する訂正処理と同様に行われるので、詳細な
説明は割愛するが、ステップＳ１２０においてユーザー
が単に「訂正」と発話すれば、直近の認識結果である認
識結果語彙Ｄｃ２１を訂正するための処理が行われる。

【０１２１】また、「東京都の次候補」と発話すれば、
地域名ファイルＦＫ中の次の候補である認識結果語前Ｄ
ｃ２２を提示して、提示結果に対して再度「〜の次候
補」のコマンド操作がなされる度に、更に次の次候補を
提示する。このように、「〜の次候補」のコマンド操作
がなされた場合には、ユーザーは訂正のための語彙を発
話する必要がなく簡単な訂正が可能となる。

【０１２２】また、単に「次候補」と発話された場合に
も「〜の次候補」の場合と同様に、次候補の認識結果語
彙を提示しつつ訂正処理を行う。よって、「次候補」の
コマンド操作によっても、ユーザーは訂正のための語彙
を発話する必要がなく、簡単な訂正が可能となる。

【０１２３】ただし、ジャンルと地域名に関する認識結
果語彙ＤｃがジャンルファイルＦＪ及び地域名ファイル
ＦＫに記憶された後、ジャンルファイルＦＪ中の認識結
果語彙を訂正すべきコマンド操作がなされた場合には、
次に述べる訂正処理が行われる。

【０１２４】まず、上記の「〜を訂正」、「〜の次候
補」のいずれかのコマンド操作に応じて、ジャンルファ
イルＦＪ中の認識結果語彙Ｄｃ１１，Ｄｃ１２〜を訂正
することになる。次に、ジャンルファイルＦＪ中の最も
類似度の高い認識結果語彙（訂正後の認識結果語彙）Ｄ
ｃ１１に従属する地域名辞書ＭＪ中の認識対象語彙Ｄｂ
を選択設定する。そして、分析データ記憶部１０に既に
記憶されているジャンルの分析データＤａ’と選択設定
した認識対象語彙Ｄｂとを照合することにより、新たな
認識結果語彙Ｄｃを求めて地域名ファイルＦＫに記憶す
る。

【０１２５】したがって、地域名より上位概念のジャン
ルを訂正すべきコマンド操作がなされた場合には、既に
記憶されている上記分析データＤａ’を利用して再度の
音声認識を自動的に行うので、ユーザーは地域名の語彙
を発話しなくとも、地域名ファイルＦＫ中の認識結果語
彙Ｄｃ２１，Ｄｃ２２〜を訂正することができる。

【０１２６】尚、このように自動的に地域名ファイルＦ
Ｋ中の認識結果語彙を訂正した場合でも誤認識等が生じ
る場合が可能性としては存在するが、地域名の範疇に属
する語彙をユーザーが発話した時に得られた分桁データ
Ｄａ’に基づいて上記再度の音声認識を行うので、ユー
ザーの所望する地域名を高確率で音声認識することがで
きる。

【０１２７】この結果、既に音声入力された分析データ
Ｄａ’を有効利用することで、訂正処理の高速化が実現
されると共に、ユーザーに対して操作性の向上を図るこ
とができる。

【０１２８】このようにして認識結果記憶領域ＭＲ中に
絞り込み条件を満足する認識結果語彙Ｄｃが揃うと、ス
テップＳ１２４における判断が「ＹＥＳ」となり、図９
に示すステップＳ１２７の処理へ移行する。

【０１２９】ステップＳ１２７では、図３に示したジャ
ンルファイルＦＪと地域名ファイルＦＫ中に記憶されて
いる絞り込み条件に適合した認識結果語彙Ｄｃに該当す
る施設名称辞書ＭＬを設定する。例えば、絞り込み条件
に適合した認識結果語彙Ｄｃ１１とＤｃ２１が、それぞ
れ「駅名」と「東京都」であった場合には、図２に示し
た「東京都内の駅名」に従属する「駅名称の一覧」の施
設名称辞書ＭＬが絞り込まれて設定されることになる。
また、「〜の次候補」のコマンド操作がなされた場合に
は、次候補で確定した認識結果語彙に基づいて絞り込み
が行われることになる。

【０１３０】次に、ステップＳ１２８において、分析デ
ータ記憶部１０に既に記憶されていた、施設名称（例え
ば、「目黒駅」）の分析データＤａ’を類似度演算部９
に導入し、この分析データＤａ’と、上記の「駅名称の
一覧」の施設名称辞書ＭＬ中の認識対象語彙Ｄｄとの類
似度を判定する。そレて、類似度の高い認識結果語彙Ｄ
ｃを施設名称ファイルＦＬに記憶（格納）する。

【０１３１】次に、ステップＳ１３０において、施設名
称ファイルＦＬに記憶した最も類似度の高い認識結果語
彙（図３中に示すＤｃ３１）を音声出力部６から合成音
声によって提示したり表示部７で表示する。例えば、認
識結果語彙Ｄｃ３１が「目黒駅」となった場合には、最
終的な判定結果を『目黒駅ですね』という合成音声等で
提示する。

【０１３２】そして、ステップＳ１３２以降の処理に移
行して、最終的な判定結果をユーザーに確認させるため
の確認ルーチンとなる。

【０１３３】まず、ステップＳ１３２において、最終的
な認識結果を更に訂正すべきか否かを示唆するために、
『コマンドをどうぞ』という合成音を発声する。

【０１３４】これに対してユーザーが、ジャンル又は地
域名の訂正をすべきと判断して、「〜を訂正」、「〜の
次候補」の何れかのコマンド操作を行うと、入力された
音声の分析データＤａを認識し、ステップＳ１３４にお
いて訂正のためのコマンド操作がなされたことを、制御
語ＷＷに基づいて判断（「ＹＥＳ」と判断）して、ステ
ップＳ１３６へ移行する。また、音声入力に代えて操作
部５から「訂正」等の指示がなされた場合にも同様にス
テップＳ１３６へ移行する。

【０１３５】ステップＳ１３６では、ステップＳ１２２
（図８参照）と同様の処理により、訂正命令に該当する
認識語記憶部１１中の認識辞書を選択設定する。ただ
し、この選択設定した認識辞書中、訂正指示のなされた
認識対象語彙は除外して設定する。そして、図８に示し
たステップＳ１１０からの処理を繰り返すことにより、
ジャンルファイルＦＪ又は地域名ファイルＦＫ中の認識
結果語彙を新たな認識結果語彙に訂正する。

【０１３６】尚、ステップＳ１１０からの訂正処理につ
いては、先に説明したので、ここではその説明を割愛す
ることする。

【０１３７】ステップＳ１３４においてジャンル又は地
域名を訂正するためのコマンド操作がなされず、「施設
名称」を訂正するためのコマンド操作がなされた場合に
は、ステップＳ１３８においてこの「施設名称」を訂正
するためのコマンド操作を、制御語ＷＷに基づいて判断
（「ＹＥＳ」と判断）して、ステップＳ１４２へ移行す
る。

【０１３８】一方、ジャンルと地域名及び施設名称のコ
マンド操作がなされない場合、例えば訂正コマンド以外
の「ルート探索」等のコマンド操作がなされた場合に
は、ステップＳ１３８において、制御語ＷＷに基づいて
訂正なしと判断（「ＮＯ」と判断）して、ステップＳ１
４０へ移行する。

【０１３９】ステップＳ１４０に移行すると、コマンド
操作で指令された動作を開始する。上記例の「ルート検
索」のコマンド操作がなされたときは、その「コマン
ド」の意味する制御語ＷＷに基づいてファイルＦＬ中の
確定した認識結果語彙Ｄｃを抽出し、その認識結果語彙
Ｄｃの施設名称に該当する目的地までの走行経路を探索
し、その探索した走行経路を表示部７に地図表示する。
そして、一の音声認識処理を終了し、再び音声認識開始
の指示がなされるまで待機する。

【０１４０】一方、ステップＳ１３８において「施設名
称」の訂正コマンド操作、すなわち、「〜を訂正」又は
「訂正」のコマンド操作がなされると、ステップＳ１４
２へ移行して、『施設名称をどうぞ』という合成音を発
声して、施設名称の範疇に属する新たな語彙を発話する
ように示唆する。

【０１４１】これに応じてユーザーが新たな施設名称の
語前を発話すると（ステップＳ１４４）、その分析デー
タＤａを生成し（ステップＳ１４６）、その分析データ
Ｄａを分析データ記憶部１０に記憶して（ステップＳ１
４８）、ステップＳ１２７の処理に移行する。

【０１４２】ステップＳ１２７では、今までにジャンル
ファイルＦＪと地域名ファイルＦＫに記憶され確定しで
いる認識結果語彙Ｄｃに基づいて絞り込みが行われて、
認識語記憶部１１中の施設名称辞書ＭＬが設定される。
ただし、訂正の指示がなされた認識対象語彙は除外して
設定する。

【０１４３】そして、ステップＳ１２８において、分析
データ記憶部１０に記憶されている施設名称の分析デー
タＤａ’と上記の施設名称辞書ＭＬ中の認識対象語彙Ｄ
ｂを照合して類似度を判定し、類似度の高い認識結果語
彙Ｄｃが施設名称ファイルＦＬに記憶される。

【０１４４】このように、「施設名称」の訂正指示がな
された場合には、ジャンルファイルＦＪと地域名ファイ
ルＦＫ中に既に記憶されている認識結果語彙Ｄｃ、すな
わち、絞り込み条件を満足している認識結果語彙Ｄｃに
基づいて、施設名称辞書ＭＬを選択設定するので、最初
からジャンルや地域名を再設定（訂正や変更）をするの
に比して、迅速な訂正処理が可能となる。この結果、ユ
ーザーに対して煩雑な操作を強いることがなく、操作性
を向上させることができる。

【０１４５】従来の技術では、「施設名称」の訂正を行
う場合に、上位概念のジャンルや地域名を再度音声入力
しなければならなかったのに比べると、大幅な操作性の
向上が図れる。また、絞り込み処理が適切になされるよ
うに訂正処理が行われるので、音声認識率が向上する。

【０１４６】更に、ユーザーが施設名称を訂正する際
に、「次候補」又は「〜の次候補」のコマンド操作をす
ると、ステップＳ１４２〜Ｓ１４８において、施設名称
ファイルＦＬ中に次候補の認識結果語彙が存在するか否
か判断し、存在していればその次候補の認識結果語彙を
認識結果としてステップＳ１２７の処理を行うことで、
上位概念のジャンルや地域名を再度音声入力しなくと
も、絞り込み処理が適切になされるように訂正処理が行
われる。また、ユーザーに対して煩雑な操作を強いるこ
とがなく、操作性を向上させることができる。

【０１４７】以上に説明したように、本実施形態によれ
ば、ユーザーの思考特性に合わせた音声認識を行うこと
ができるのに加えて、ユーザーに対して煩雑な操作を強
いることなく、簡単且つ迅速な訂正操作（訂正コマンド
操作）を提供することができる。

【０１４８】次に、「次候補」又は「〜の次候補」のコ
マンド操作がなされた場合の訂正処理のより具体的な動
作例を、図１０ないし図１２に示すフローチャートを参
照して説明しておく。

【０１４９】尚、図１０ないし図１２において図８及び
図９と同一又は相当する処理については同一のステップ
符号で示している。

【０１５０】ただし、ステップＳ１２０において、ユー
ザーからの訂正指示がなされたと判断（「ＹＥＳ」と判
断）すると、図１２（ａ）の処理を行った後、ノードＤ
又はＥを介して、図１０中のステップＳ１２２又はＳ１
１８の処理を開始する点がより具体的に示されている。
更に、図１１において、ステップＳ１３４でユーザーか
らの訂正指示がなされたと判断（「ＹＥＳ」と判断）す
ると、図１２（ｂ）の処理を行った後、ノードＤ’又は
Ａを介してステップＳ１３６又はＳ１２７の処理を開始
する点がより具体的に示されている。

【０１５１】すなわち、「次候補」又は「〜の次候補」
のコマンド操作に該当する次候補の認識結果語彙の決定
は、図１２（ａ）（ｂ）中のステップＳ２０４とＳ３０
４で行われるようになっている。

【０１５２】まず、図１０中のステップＳ１２０におい
て、訂正をすべきコマンド操作が行われると、図１２
（ａ）に示すステップＳ２００の処理に移行する。

【０１５３】ステップＳ２００では、単に「次候補」と
発話するコマンド操作がなされたか、又は「〜の次候
補」のコマンド操作がなされたか否か判断し、これらい
ずれかの次候補のコマンド操作がなされた場合にはステ
ップＳ２０２において、制御語ＷＷに基づいて、指令さ
れたファイル（ＦＪ，ＦＫ，ＦＬのうちの指令されたフ
ァイル）中に次候補の認識結果語彙が存在するか否か判
断する。

【０１５４】そして、次候補に該当する認識結果語彙が
存在すれば、ステップＳ２０４に移行して、次候補を認
識結果とする。更にノードＥを介して図１０中のステッ
プＳ１１８に移行して、その認識結果とした認識結果語
彙を提示する。

【０１５５】したがって、「次候補」又は「〜の次候
補」のコマンド操作がなされた場合には、ステップＳ１
１０〜Ｓ１１６の処理を行うことなく、ノードＥを通じ
て直接にステップＳ１１８の処理を行う。これにより、
処理の簡素化を実現している。

【０１５６】また、図１２（ａ）中のステップＳ２００
とＳ２０２において「ＮＯ」と判断した場合には、ノー
ドＤを介してステップＳ１２２に処理が移行する。これ
により、ユーザーは、「次候補」又は「〜の次候補」の
コマンド操作以外の訂正コマンド操作、すなわち「訂
正」又は「〜を訂正」のコマンド操作によって、訂正の
指令を行うことになる。

【０１５７】次に、図１１中のステップＳ１３８におい
て、施設名称を訂正するための「次候補」又は「〜の次
候補」のコマンド操作がなされたと判断（「ＹＥＳ」と
判断）すると、ステップＳ１４２〜Ｓ１４８の処理を行
ってステップＳ１２７以降の処理を繰り返す。ただし、
施設名称の訂正指令が「次候補」又は「〜の次候補」の
コマンド操作によってなされた場合には、ステップＳ１
４２〜Ｓ１４８の処理において、図１２（ｂ）の処理を
行って、ステップＳ１２７以降の処理を繰り返す。

【０１５８】このように、図１２（ａ）又は（ｂ）の処
理を行うことで、「次候補」又は「〜の次候補」のコマ
ンド操作がなされた場合に、次候補の認識結果語彙を決
定するようになっている。

【０１５９】以上説明したように本実施形態によれば、
特に、「次候補」と「〜の次候補」のコマンド操作を備
えたことで、ユーザーにとって極めて簡単且つ迅速な訂
正指令の操作をすることができるという優れた機能を有
している。つまり、認識結果記憶領域ＭＲに記憶されて
いる複数の認識結果語彙Ｄｃは、ユーザーが発話した施
設名称やジャンルや地域名の範疇に属する語彙と同一又
は類似した認識結果語彙であるため、最も類似度の高い
認識結果語彙が誤認識であったとしても、残余の（次候
補の）認識結果語彙の中に、ユーザーの発話した語彙と
同一の認識結果語彙が存在する可能性が極めて高い。こ
のため、ユーザーが「次候補」又は「〜の次候補」のコ
マンド操作により訂正の指令をすれば、高確率で所望の
認識結果語彙を設定することができ、ひいては簡単に訂
正の操作を行うことができる。

【０１６０】尚、以上に説明した本実施形態では、典型
例として、本音声認識装置がユーザーに対して発話すべ
き語前を示唆し、それに従って、ユーザーが語前を１つ
１つ音声入力する場合を説明した。しかし、本発明はこ
れに限定されるものではない。本音声認識装置がユーザ
ーに対して発話すべき複数の語彙を示唆し、それに従っ
て、ユーザーが複数の語彙を連続音声で音声入力するこ
とが可能である。

【０１６１】すなわち、複数の語彙を示唆する際に、認
識語記憶部１１中の認識辞書のうち、それらの語彙の属
性（範疇）に該当する認識辞書を設定しておき、その設
定した認識辞書中の認識対象語彙Ｄｂと複数の分析デー
タＤａを照合して、図４に例示した制御語ＷＷを用いて
ユーザーからの指示や指令を受けることにより、複数の
語彙を制御語ＷＷによって一括して受け付けることがで
きる。

【０１６２】つまり、制御語ＷＷは、図４（ｃ）〜
（ｅ）に示したように、基本型を複数個繋げることによ
っても実現できるので、複数の語彙が音声入力された場
合に、これら複数の語彙を一括して制御語ＷＷとするこ
とができ、ユーザーから指令された処理をその制御語Ｗ
Ｗに基づいて一括処理したり、分割処理することが可能
である。このように、制御語ＷＷを用いてユーザーの音
声入力を受け付けるようにしたことによって、極めて融
通性の高い処理が可能となっている。

【０１６３】また、以上に説明した制御命令語Ｙの語彙
は便法として示したものである。よって、他の語彙でも
よい。例えぱ、「訂正」の語彙は、「違う」「直せ」等
の語彙でもよいし、「次候補」の語彙は、「次ぎ」「候
補」「候補変更」等の語彙でもよい。

【０１６４】

【発明の効果】以上説明したように本発明によれば、各
処理機能毎に対応付けられた制御語を予め備え、前記一
の処理機能を提示した後、前記提示に応じて前記一の処
理機能を指定する指令情報を有する音声入力情報が外部
より入力されると、前記音声入力情報を認識し、前記指
令情報に対応する前記制御語に基づいて、前記一の処理
機能の動作を行うようにしたので、予め制御語に多様な
処理機能を設定しておくことで、多様な処理を迅速・適
切に実施することが可能となる。この結果、対話型操作
を行うのに優れた効果が得られる。

【図面の簡単な説明】

【図１】本実施形態に係る音声認識装置の構成を示すブ
ロック図である。

【図２】認識辞書の階層化構造を示す説明図である。

【図３】認識結果記憶領域中のファイル構造を示す説明
図である。

【図４】制御語の構造を示す説明図である。

【図５】制御語の種類を例示した説明図である。

【図６】本音声認識装置の基本的な動作例を説明するた
めのフローチャートである。

【図７】本音声認識装置の訂正処理の際の基本的な動作
例を説明するためのフローチャートである。

【図８】本音声認識装置のより具体的な動作例を説明す
るためのフローチャートである。

【図９】本音声認識装置のより具体的な動作例を更に説
明するためのフローチャートである。

【図１０】本音声認識装置のより具体的な動作例を更に
説明するためのフローチャートである。

【図１１】本音声認識装置のより具体的な動作例を更に
説明するためのフローチャートである。

【図１２】本音声認識装置のより具体的な動作例を更に
説明するためのフローチャートである。

【図１３】従来の音声認識装置の動作を説明するための
説明図である。

【符号の説明】

１…音声入力部２…信号処理部３…記憶部４…制御部５…操作部６…音声出力部７…表示部８…音声分析部９…類似度演算部１０…分析データ記憶部１１…認識語記憶部ＭＲ…認識結果記憶領域ＭＪ…ジャンル辞書ＭＫ…地域名辞書ＭＬ…施設名称辞書ＭＣ…制御語辞書ＦＪ…ジャンルファイルＦＫ…地域名ファイルＦＬ…施設名称ファイル

Claims

【特許請求の範囲】

【請求項１】１又は２以上の処理機能を有し、音声を
情報伝達媒体として対話的に前記一の処理機能の動作を
行う音声認識装置を備えたマンマシンシステムにおい
て、前記各処理機能毎に対応付けられた制御語を予め備え、
前記一の処理機能を提示した後、前記提示に応じて前記
一の処理機能を指定する指令情報を有する音声入力情報
が外部より入力されると、前記音声入力情報を認識し、
前記指令情報に対応する前記制御語に基づいて、前記一
の処理機能の動作を行う制御部を具備することを音声認
識装置を備えたマンマシンシステム。
【請求項２】前記制御語は、前記処理機能の動作を起
動させる制御命令語と、前記制御命令語の被処理対象を
示す制御対象語との組み合わせで構成され、前記制御部は、前記制御対象語と制御命令語を示した前
記指令情報を有する前記音声入力情報が外部より入力さ
れると、前記指令情報に対応する前記制御対象語と制御
命令語から成る前記制御語に基づいて、前記処理機能の
動作を行うことを特徴とする請求項１に記載の音声認識
装置を備えたマンマシンシステム。
【請求項３】前記制御語は、前記処理機能の動作を起
動させる制御命令語と、前記制御命令語の被処理対象で
あって前記音声入力情報に含まれた前記指令情報によっ
て設定される制御対象語との組み合わせで構成され、前記制御部は、前記制御対象語の指令情報を有する前記
音声入力情報が入力された後、前記制御命令語の指令情
報を有する前記音声入力情報が入力されると、前記制御
対象語と前記制御対象語から成る前記制御語に基づい
て、前記処理機能の動作を行うことを特徴とする請求項
１に記載の音声認識装置を備えたマンマシンシステム。
【請求項４】前記制御対象語は、前記音声入力情報に
より外部入力された語彙であり、前記制御命令語は、前
記語彙を少なくとも訂正するための命令語彙であること
を特徴とする請求項２又は３に記載の音声認識装置を備
えたマンマシンシステム。
【請求項５】１又は２以上の処理機能を有し、音声を
情報伝達媒体として対話的に前記一の処理機能の動作を
行う音声認識装置を備えたマンマシンシステムにおい
て、予め複数の照合情報を記憶した記憶部と、前記音声にて入力される音声入力情報と前記記憶部に記
憶されている前記照合情報とを照合して、所定の類似度
基準より類似度の高い１又は複数の照合情報を認識情報
として保持する認識結果保持領域と、前記各処理機能毎
に対応付けられた制御語とを有する制御部とを具備し、前記制御部は、前記一の処理機能を提示した後、前記提
示に応じて前記一の処理機能を指定する指令情報を有す
る音声入力情報が外部より入力されると、前記指令情報
に対応する前記制御語に基づいて、前記認識結果保持領
域中に保持している前記認識情報に対して前記一の処理
機能の動作を行うことを特徴とする音声認識装置を備え
たマンマシンシステム。
【請求項６】前記認識情報は、話者の発話した語彙か
ら成る前記音声入力情報を前記照合情報との照合により
得られる１又は複数の語彙情報であり、前記制御語は、前記語彙情報を訂正する指令情報である
ことを特徴とする請求項５に記載の音声認識装置を備え
たマンマシンシステム。
【請求項７】前記語彙情報を訂正する制御情報は、前
記１又は複数の語彙情報の一を指定して訂正する制御情
報であることを特徴とする請求項６に記載の音声認識装
置を備えたマンマシンシステム。
【請求項８】前記語彙情報を訂正する指令情報は、前
記１又は複数の語彙情報を順次に次候補選択して訂正す
る制御情報であることを特徴とする請求項６に記載の音
声認識装置を備えたマンマシンシステム。
【請求項９】前制御語は、前記処理機能に相当する訂
正の動作を起動させる制御命令語と、前記制御命令語の
被処理対象となる前記語彙情報に相当する制御対象語と
の組み合わせで構成される前記指令情報であり、前記制御部は、前記指令情報を有する前記音声入力情報
が外部より入力されると、前記指令情報に対応する前記
制御対象語と制御命令語から成る前記制御語に基づい
て、前記訂正の動作を行うことを特徴とする請求項６〜
８のいずれか１項に記載の音声認識装置を備えたマンマ
シンシステム。
【請求項１０】前記記憶部は、前記複数の照合情報を上
位概念の属性から下位概念の属性の範疇に複数の分類し
た階層化構造に基づいて記憶すると共に、前記話者の発
話した語彙から成る前記音声入力情報を保持する情報保
持部を備え、前記制御部は、前記２以上の属性に対応する前記処理機
能を提示して、前記提示に応じて前記２以上の属性に該
当する前記語彙を各属性毎の前記認識情報として前記認
識結果保持領域に記憶した後、前記指令情報により上位
概念の属性の前記認識情報の訂正が指令されると、前記
上位概念の属性の前記認識情報の訂正処理を行うと共
に、前記情報保持部に保持されている前記上位概念より
下位概念の属性の前記音声入力情報を、前記記憶部に記
憶されている前記上位概念に従属する下位概念の属性の
前記照合情報と照合して、所定の類似度基準より類似度
の高い１又は複数の照合情報を認識情報として再度前記
認識結果保持領域に保持することを特徴とする請求項６
〜１０のいずれか１項に記載の音声認識装置を備えたマ
ンマシンシステム。
【請求項１１】前記制御部は、前記音声入力情報を再度
照合させる際に、前記音声入力情報を、前記下位概念の
認識情報の属性に属する照合情報であって、前記下位概
念の認識情報と同一の照合情報を除外した照合情報とを
照合させることを特徴とする請求項１０に記載の音声認
識装置を備えたマンマシンシステム。
【請求項１２】前記記憶部は、前記複数の照合情報を上
位概念の属性から下位概念の属性の範疇に複数の分類し
た階層化構造に基づいて記憶すると共に、前記話者の発
話した語彙から成る前記音声入力情報を保持する情報保
持部を備え、前記制御部は、前記２以上の属性に対応する前記処理機
能を提示して、前記提示に応じて前記２以上の属性に該
当する前記語彙を各属性毎の前記認識情報として前記認
識結果保持領域に記憶した後、前記指令情報により下位
概念の属性の前記認識情報を順次に次候補選択して訂正
する訂正が指令されると、次候補選択した認識情報を新
たな認識情報として提示することを特徴とする請求項８
に記載の音声認識装置を備えたマンマシンシステム。
【請求項１３】前記音声認識装置を備えたマンマシンシ
ステムは、ナビゲーションシステムであることを特徴と
する請求項１〜１２のいずれか１項に記載の音声認識装
置を備えたマンマシンシステム。