JP2807241B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2807241B2
JP2807241B2 JP63285504A JP28550488A JP2807241B2 JP 2807241 B2 JP2807241 B2 JP 2807241B2 JP 63285504 A JP63285504 A JP 63285504A JP 28550488 A JP28550488 A JP 28550488A JP 2807241 B2 JP2807241 B2 JP 2807241B2
Authority
JP
Japan
Prior art keywords
speaker
voice
recognition
proximity sensor
microphone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP63285504A
Other languages
English (en)
Other versions
JPH02131300A (ja
Inventor
伸夫 杉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP63285504A priority Critical patent/JP2807241B2/ja
Publication of JPH02131300A publication Critical patent/JPH02131300A/ja
Application granted granted Critical
Publication of JP2807241B2 publication Critical patent/JP2807241B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 [発明の目的] (産業上の利用分野) 本発明は発話者の音声を確実に収集して音声認識する
ことのできる音声認識装置に関する。
(従来の技術) 近時、種々の機器に音声認識装置を組込み、発話者が
発声した命令等の音声をマイクロホンを介して取込んで
の入力音声を認識処理し、その認識結果に従って種々の
情報処理を実行することが種々試みられている。例えば
ワードプロセッサにおける文書情報入力手段や、プラン
ト等における制御命令入力手段、更には種々の券売機で
における情報入力手段等として音声認識装置の利用が注
目されている。
ところでこの種の音声入力装置にあっては、周囲雑音
等の悪影響を受けることなしに情報入力目的とする音声
だけを確実に入力し、これを音声認識することがその認
識性能を高める上で重要な課題となる。しかして音声認
識処理は、一般にその制御部(ホスト計算機)からの認
識開始コマンドを受けて開始されるが、実際のシステム
では音声認識処理の開始のタイミングを適正に設定する
ことが非常に難しい。そこで従来では、一般的に発話者
が発声した音声を入力する為のマイクロフォンの近傍位
置に超音波センサ等の近接センサを設け、この近接セン
サにより発話者の顔(口元)とマイクロフォンとの近接
状態を検出し、例えば発話者の顔がマイクロフォンに十
分に近付いたことが検出されたときに認識開始コマンド
を発し、その後、音声の入力開始を指示する旨のメッセ
ージを出力するようにしている。またこの近接センサに
て発話者の顔がマイクロフォンから離れていることが検
出されたときには、顔(口)をマイクロフォンに近付け
て発声する旨をメッセージ出力し、良好な音声入力状態
を確保するものとなっている。
ところがこのようにして近接センサを用いてマイクロ
フォンと発話者の顔との近接状態を検出して音声認識処
理の動作を制御し、発話者に対して音声入力に関するメ
ッセージを出力して音声入力のタイミングやその入力姿
勢を指示するにも拘らず、発話者によってはマイクロフ
ォンに十分に近付かない状態で、或いはマイクロフォン
に十分に近付いたとしても音声入力開始のメッセージが
出力される前に発話を開始してしまうことが多々ある。
このような場合には、音声認識の開始コマンドが与えら
れて音声認識処理が開始される以前に音声入力がなされ
ることになるので、音声認識装置にはその先頭部分が欠
落した状態で音声が入力されることになる。この結果、
誤認識や認識リジェクトが発生し、発話者に音声の再入
力を促すことが必要となり、発話者のみならず音声認識
装置にとっても徒に負担が増える。
特に発話の開始が発生要求のタイミングより僅かに早
いだけの場合には、発話者自身に発声タイミングが早い
と云う意識がない為、音声の再入力時にも同様にしてそ
の先頭部分が欠落してしまうことが多いと云う問題があ
る。
このような不具合を解消する為に、近接センサの感度
を高めておき、発話者がマイクロフォンに近付いてくる
途中のタイミングで認識開始コマンドを与えることが考
えられている。しかしこのような対策を講じた場合、発
話者がマイクロフォンに十分に近付かない状態で発話開
始することについての対策を講じることができなくな
り、誤認識や認識リジェクトが増える原因となる。また
上述した感度の高い近接センサを用い、発話者が近付く
ことを検出した後、一定時間を経て発話要求を発するこ
とも考えられているが、そのタイミング設定が非常に難
しく、また発話者がマイクロフォンに十分近付いたか否
かを検出することができないと云う問題がある。
(発明が解決しようとする課題) このように従来にあっては、発話者がマイクロフォン
に十分に近付いたことを検出し、先頭部分の欠落を生じ
ることなく上記発話者からの音声を取込んで認識する等
で、認識処理開始のタイミング等を適切に設定すること
が非常に困難であった。
本発明はこのような事情を考慮してなされたもので、
その目的とするところは、発話者が発声する音声をその
先頭部分の欠落を生じることなく確実に入力して音声認
識することのできる音声認識装置を提供することにあ
る。
(課題を解決するための手段) 本発明は、筐体に設けられたマイクロフォンにより発
話者が発声した音声を入力して音声認識する際、上記マ
イクロフォンの近傍位置に設けられた近接センサにより
前記発話者の顔と上記マイクロフォンとの近接状態を検
出し、この近接状態に応じて発話者に音声入力に関する
メッセージを出力するようにした音声認識装置に係り、 前記近接センサとは別に前記筐体に発話者が近付いた
ことを検出する為の補助近接センサを設け、この補助近
接センサにより発話者の近接状態が検出されたとき、前
記マイクロフォンから入力される音声に対する音声認識
処理を開始させるようにしたことを特徴とするものであ
る。
つまり近接センサによる検出結果に従って音声入力の
タイミング等を促すに先立って、補助近接センサによる
検出結果に従って音声認識処理を開始させておくように
したことを特徴とするものである。
(作 用) 本発明によれば、近接センサによる検出結果に従って
音声入力のタイミング等を促すに先立って補助近接セン
サにより発話者の近接を検出し、この検出結果に従って
音声認識処理を開始させておくので、発話者の音声開始
タイミングが早い場合であっても、その先頭部分の欠落
を生じることなく発話音声を確実に取込んで音声認識す
ることが可能となる。
この結果、非常に簡易にして効果的に誤認識や認識リ
ジェクトの発声を抑えてその認識効率を高めることが可
能となる。
(実施例) 以下、図面を参照して本発明の一実施例に係る音声認
識装置につき説明する。
第1図は実施例装置の要部概略構成図であり、第2図
はその制御処理シーケンスを示す図である。
第1図において1は各種認識方式を採用して構成され
る音声認識部である。この音声認識部1は制御部2から
の認識開始コマンドを受けて音声認識処理を開始し、マ
イクロフォン3から入力される音声を認識処理し、その
認識結果を出力する。
しかしてこれらの音声認識部1および制御部2は、一
般的には各種情報処理装置本体の筐体4内に組込まれて
設けられ、前記マイクロフォン3は上記筐体4の所謂操
作パネル面に設けられる。
このマイクロフォン3を設けた操作パネル面には、発
話者Aに対して音声入力に関する種々のメッセージを表
示する表示器5や、上記マイクロフォン3への発話者A
の顔(口元)の近接を検出する為の近接センサ(第1近
接センサ)6が上記マイクロフォン3の近傍位置に設け
られている。前記制御部2は、基本的にはこの近接セン
サ(第1の近接センサ)6により発話者Aの顔(口元)
のマイクロフォン3に対する近接状態を検出し、この検
出結果(近接状態)に応じて前記表示器5を用いて音声
入力に関する種々のメッセージを提示出力する。この表
示器5に表示されるメッセージは、例えば、 『音声入力を開始して下さい。』 『もっとマイクロフォンに近付いて発声して下さい。』 等のメッセージからなる。尚、音声合成装置等を用いて
これらのメッセージを音声出力することも勿論可能であ
る。
しかして本装置が特徴とするところは、上述した構成
を加えて前記筐体4に補助近接センサ(第2の近接セン
サ)7を設け、前記近接センサ(第1の近接センサ)6
により発話者Aの顔(口元)がマイクロフォン3に近付
いたことが検出される以前に、その発話者Aが本装置
(筐体4)に近接したことを検出するようにした点にあ
る。そしてこの補助近接センサ(第2の近接センサ)7
による検出結果に従い、近接センサ(第1の近接セン
サ)6により発話者Aの顔(口元)がマイクロフォン3
に近付いたことが検出されるに先立って、前記制御部2
から音声認識部1に対して認識開始コマンドを与え、認
識処理を開始させるようにした点にある。
このような本装置の特徴ある動作を第2図を参照して
説明すると、先ず補助近接センサ(第2の近接センサ)
7にて発話者Aが本装置(筐体4)に所定の距離範囲内
に近接したか否かを検出し、その近接状態を監視する
(ステップa)。そして発話者Aが本装置(筐体4)に
所定の距離範囲内(例えば30cm程度)に近接したことが
上記補助近接センサ(第2の近接センサ)7にて検出さ
れたとき、制御部2から音声認識部1に対して認識開始
コマンドを出力し(ステップb)、音声認識部1にその
音声認識処理動作を開始させる(ステップc)。
この状態で次に前記近接センサ(第1の近接センサ)
6にて発話者Aの顔(口元)がマイクロフォン3に対し
て所定の距離範囲内(例えば10cm程度)にて近接したか
否かを調べる(ステップd)。尚、この近接センサ(第
1の近接センサ)6による発話者Aの顔(口元)のマイ
クロフォン3に対する近接検出は、前記補助近接センサ
(第2の近接センサ)7による発話者Aの近接検出タイ
ミングから所定時間内に発話者Aの顔(口元)がマイク
ロフォン3に近接したか否かを監視しながら行なわれ
(ステップe)、所定時間内にその近接が検出されない
場合には(タイムアウト時)、前記表示器5を用いてマ
イクロフォンに対して顔を近付ける旨のメッセージを出
力する(ステップf)。この所定時間は、一般的には2
〜3秒程度に設定すれば十分である。
このような制御手続きを経て発話者Aの顔がマイクロ
フォン3に十分に近付いたことが検出されたとき(ステ
ップd)、前記表示器5を用いて音声入力を開始を促す
旨をメッセージを出力する(ステップg)。そしてこの
メッセージに従って発声される音声を入力処理し(ステ
ップh)、その入力音声について前記音声認識部1にて
認識処理を実行させる(ステップi)。そしてその認識
結果を前記音声認識部1から制御部2に対して転送し
(ステップj)、適宜発話者に対してその認識結果の確
認表示を行なう等して、一連の音声認識処理制御を終了
する。
かくしてこのように構成され、且つ上述したように制
御処理動作する本装置によれば、発話者Aが近付いた時
点で音声認識部1における認識処理を開始させ、その
後、発話者Aがマイクロフォン3に近付いた時点で音声
入力の開始を促す旨をメッセージ出力するので、仮に発
話者Aの発声開始タイミングがそのメッセージ表示のタ
イミングよりも僅かに早くても、その先頭部分の欠落を
招くことなく入力音声を音声認識部1に取込んで認識出
力を行なわせることが可能となり、発話者Aが発声した
音声を確実に認識することが可能となる。従って先頭部
分の欠落に起因する誤認識や認識リジェクトの発生をな
くし、その認識効率を高めることが可能となる。また先
頭部分の欠落に起因する誤認識や認識リジェクトがない
分だけ発話者Aに対して音声の再入力を促す頻度が減る
ので、発話者に対する負担の軽減を図り得ると共に、装
置自体にとってもその処理負担の軽減を図ることが可能
となる。
また実施例装置によれば、発話者Aがマイクロフォン
3に近接していない状態が検出されたとき、適宜注意を
促すメッセージを出力することができるので、これによ
って安定な音声入力状況を効果的に確保することが可能
となる。
つまり2つの近接センサ6,7によりその機能を分担し
て担わせ、これらの近接センサ6,7による状態検出結果
に従って音声認識処理を制御するので、発話者Aが発生
した音声を確実に認識することが可能となる。
尚、本発明は上述した実施例に限定されるものではな
い。例えば発話者の近接距離をアナログ的に段階を以て
検出し得る近接センサ(距離測定器)を用いることによ
り、上述した2つの機能を実質的に1つのセンサに担わ
せることも可能である。またここでは音声認識部1とそ
の制御部2とを筐体4内に収容した構造のものについて
説明したが、マイクロフォン3や近接センサ6,7とその
筐体を分離して設けることも勿論可能である。またここ
で採用される音声認識方式自体については特に限定され
ないことも云うまでもなく、要はその要旨を逸脱しない
範囲で種々変形して実施することができる。
[発明の効果] 以上説明したように本発明によれば、発話者がマイク
ロフォンに近付くことが検出される先立って音声認識処
理を開始させるようにその制御が行なわれるので、発話
者の発声タイミングが早い場合であってもその先頭部分
の欠落を生じることなく、その発話音声を確実に認識す
ることができる等の実用上多大なる効果が奏せられる。
【図面の簡単な説明】
図は本発明の一実施例に係る音声認識装置につき示すも
ので、第1図は実施例装置の要部概略構成図、第2図は
その制御処理シーケンスを示す図である。 1……音声認識部、2……制御部、3……マイクロフォ
ン、4……筺体、5……表示器、6……近接センサ(第
1の近接センサ)、7……補助近接センサ(第2の近接
センサ)、A……発話者。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】筐体に設けられたマイクロフォンにより発
    話者が発声した音声を取り込んで、その入力音声を認識
    する音声認識装置において、 前記発話者が第1の距離に近接したことを検出する第1
    の近接センサと、 前記発話者が第2の距離に近接したことを検出する第2
    の近接センサと、 前記第1の近接センサにて、前記発話者の顔が、第1の
    距離に近接したことが検出された時、前記発話者に対し
    て音声入力に関するメッセージを出力する手段と、 前記第2の近接センサにて、前記発話者が、第2の距離
    に近接したことが検出された時、前記マイクロフォンか
    ら入力される音声に対する音声認識を開始する手段とを
    具備したことを特徴とする音声認識装置。
JP63285504A 1988-11-11 1988-11-11 音声認識装置 Expired - Fee Related JP2807241B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63285504A JP2807241B2 (ja) 1988-11-11 1988-11-11 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63285504A JP2807241B2 (ja) 1988-11-11 1988-11-11 音声認識装置

Publications (2)

Publication Number Publication Date
JPH02131300A JPH02131300A (ja) 1990-05-21
JP2807241B2 true JP2807241B2 (ja) 1998-10-08

Family

ID=17692386

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63285504A Expired - Fee Related JP2807241B2 (ja) 1988-11-11 1988-11-11 音声認識装置

Country Status (1)

Country Link
JP (1) JP2807241B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH08185196A (ja) * 1994-12-28 1996-07-16 Sony Corp 音声区間検出装置
JPH11249692A (ja) * 1998-02-27 1999-09-17 Nec Saitama Ltd 音声認識装置
US6594632B1 (en) * 1998-11-02 2003-07-15 Ncr Corporation Methods and apparatus for hands-free operation of a voice recognition system
JP2002108390A (ja) * 2000-09-27 2002-04-10 Sharp Corp 音声認識装置及びコンピュータ読み取り可能な記録媒体
US20020077830A1 (en) * 2000-12-19 2002-06-20 Nokia Corporation Method for activating context sensitive speech recognition in a terminal
JP6591217B2 (ja) * 2014-07-16 2019-10-16 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 音声認識テキスト化システムの制御方法
JP7442331B2 (ja) 2020-02-05 2024-03-04 キヤノン株式会社 音声入力装置およびその制御方法ならびにプログラム
JP7442330B2 (ja) 2020-02-05 2024-03-04 キヤノン株式会社 音声入力装置およびその制御方法ならびにプログラム

Also Published As

Publication number Publication date
JPH02131300A (ja) 1990-05-21

Similar Documents

Publication Publication Date Title
JP3674990B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP5601419B2 (ja) エレベーターの呼び登録装置
JPH03206521A (ja) 音声認識システム
JP2015107867A (ja) エレベータの音声呼び登録装置
JP2807241B2 (ja) 音声認識装置
JP7330066B2 (ja) 音声認識装置、音声認識方法及びそのプログラム
JP6459330B2 (ja) 音声認識装置、音声認識方法、及び音声認識プログラム
JPH0831021B2 (ja) 音声ガイダンス出力制御方法
JP2647207B2 (ja) エレベータの呼び登録装置
JPH0635497A (ja) 音声入力装置
JP2018144534A (ja) 運転支援システムおよび運転支援方法並びに運転支援プログラム
US20190114405A1 (en) Information acquisition device, information acquisition system, and information acquisition method
JPH02184915A (ja) 音声認識装置及び方法
JP2010206365A (ja) 対話装置
JP2878712B2 (ja) 音声認識装置
JPS62150295A (ja) 音声認識方法
KR20170029390A (ko) 음성 명령 모드 진입 방법
JP2007171637A (ja) 音声処理装置
JP2825272B2 (ja) エレベータ装置
US20200312333A1 (en) Speech input device, speech input method, and recording medium
JP2003241794A (ja) 音声認識装置及び方法
JP3846500B2 (ja) 音声認識対話装置および音声認識対話処理方法
JP7449070B2 (ja) 音声入力装置、音声入力方法及びそのプログラム
JP3360978B2 (ja) 音声認識装置
JPH02103599A (ja) 音声認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees