JP3069150B2 - 音声ダイヤル装置 - Google Patents

音声ダイヤル装置

Info

Publication number
JP3069150B2
JP3069150B2 JP3154007A JP15400791A JP3069150B2 JP 3069150 B2 JP3069150 B2 JP 3069150B2 JP 3154007 A JP3154007 A JP 3154007A JP 15400791 A JP15400791 A JP 15400791A JP 3069150 B2 JP3069150 B2 JP 3069150B2
Authority
JP
Japan
Prior art keywords
input
voice
speech
mode
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3154007A
Other languages
English (en)
Other versions
JPH04306037A (ja
Inventor
章次 栗木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3154007A priority Critical patent/JP3069150B2/ja
Publication of JPH04306037A publication Critical patent/JPH04306037A/ja
Application granted granted Critical
Publication of JP3069150B2 publication Critical patent/JP3069150B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【技術分野】本発明は、音声ダイヤル装置、より詳細に
は、音声認識装置を使用した自動ダイヤル電話に関す
る。
【0002】
【従来技術】音声認識装置を使用して自動的に目的のダ
イヤル番号を送出する電話に関しては、例えば、特開昭
61−144157号公報に示される様に、相手の名前
を発声し、それに対応する電話番号を送出する電話があ
る。また、電話番号を発声し、その番号通りにダイヤル
番号を送出する電話に関してはすでに一部のメーカーか
ら発売されており、また、特開昭63−303550号
公報にも示されている。後者の電話の場合、使用者が
“イチ”“ニ”“サン”“キュー”“ハチ”“ナナ”
“ロク”と発声した場合、この数字を認識して「123
9876」というダイヤル番号を送出する。その際に使
用者への番号確認として各単語発声毎に確認音声を使用
者へ出力するか全ての発声が終了してから(“終了”な
どの発声によるかキー入力によって)入力された発声の
認識結果の確認音声を連続して出力していた(例えば、
特開昭60−088656号公報)。または、音声出力
のかわりに結果の確認手段として表示器を使用してい
た。この場合も音声出力と同様のタイミングで出力され
る。
【0003】而して、単語音声認識装置を使用して使用
者が発声した電話番号を認識し、その番号通りにダイヤ
ル番号を送出する電話器の場合、使用者への認識結果の
確認法が問題となる。一般に、単語音声認識装置の認識
結果の確認は1つの発声に対して直後に1つの出力があ
る。つまり「イチ」と発声し、認識結果が出た直後に
「イチ」と出力する。次の発声は前発声の音声確認出力
を聞いてから行なう。しかし、この方法では1つ1つの
発声の間が長くなり電話番号の様に数字の列で番号を覚
えている場合発声しずらい。そこで発声だけ先に行な
い、一連の電話番号の発声終了後に一連の入力音声の結
果を出力する方法がある。こちらの場合は電話番号の列
をとぎれる事なくリズミカルに入力し、また確認も電話
番号全体で行なえるため使用者の負担が少ない。
【0004】しかし、音声認識装置には一般に誤認識を
さけるためにリジェクトと呼ばれる機能がある。さらに
数字は発声長が短かいため一位の類似度があまり高くな
らずにリジェクトされる場合が多い。発声がリジェクト
された場合は認識結果を出力しない事になる。前記の確
認出力についてリジェクトの影響を考えると、1発声の
直後に1結果出力を行なう場合、発声がリジェクトされ
た事を出力されれば使用者はもう一度同じ番号を発声す
れば良いので問題はない。しかし、一連の電話番号を入
力した後で一連の結果を出力するタイプではリジェクト
された発声の結果出力が無くなるため入力された番号の
ケタと出力された番号のケタが合わなくなる。例えば
「1239876」という7ケタの番号を入力した場合
3と7がリジェクトされると「12986」という5ケ
タの番号となり元の番号に比べてどこが異なるのか判断
がしずらくなり訂正しにくい。それに対してリジェクト
を行なわない場合には誤認識となるが、上記の場合、リ
ジェクトのかわりに誤認識となり、例えば、「1259
836」となりケタが同じため直感的に5→3,3→7
に訂正しなければならない事が分かる。なお、上記に関
しては音声出力で確認を行なっているが、表示器等で行
なっても良い。
【0005】そのため、数字による番号入力モードにな
った場合に、入力音声をリジェクトしないようにリジェ
クト値を変更して、入力された番号の桁数を確保する必
要がある。更には、リジェクトされた結果出力を何らか
の方法で表示することにより使用者がどの数字がリジェ
クトされたのか分かる様にする必要がある。特に、音声
応答出力の様にシーケンシャルな出力の場合、前の数字
が忘れられやすく、数字列のどの数字がリジェクトされ
たのか分かりにくい。そのため、何らかの音をリジェク
トされた結果出力の数字音声のかわりに出力することに
より使用者が数字列のどの数字がリジェクトされたのか
分かる様にする必要がある。
【0006】また、一般の単語音声認識装置の場合、単
語と単語を切り分けるために休止区間を設けなければな
らない。日本語の場合「サッポロ」の様に促音が存在す
ることを考えて単語と単語の離散時間は300〜350
msぐらいに設定されている。この離散時間を短かくす
ると「サッポロ」ならば「サ」と「ポロ」の2単語に切
り分けられてしまうため上述の値の離散時間が必要とな
る。しかし、この休止区間は連続して数字音声を発声す
る場合には障害となる。一般に数字は2音節程度であり
発声長が短かい。それにもかかわらず350msの離散
時間を数字と数字の間に作ると電話番号列がリズミカル
に入力しにくくなり、使用者の負担となる。さらに、離
散時間が大きいと電話番号列を全部入力する時間が長く
必要となり、入力スピードの面でも不利である。従っ
て、この離散時間を短かくし、かつ、ひとつの単語を2
つの単語に切り分けない様にすることが必要である。
【0007】更に、数字の列を考えた場合、例えば「×
××−××××」の様な電話番号の場合、7つの数字が
入力され認識される。一連の列で出力された数字列の全
体の正答率は、 X個の数字列正答率=(1個の数字の正答率)のX乗 となるため、1単語の正答率が98%であっても7個の
列の正答率は87%になってしまう。数字が他の単語に
比べて特徴的なこととして、単語長が短かく発声に含ま
れる特徴量が少ないことが上げられる。数字は2音節程
度であり一般の単語の音節数より少ない。そのため、数
字発声についてより多くの特徴量を得ることが必要であ
る。入力音声の情報を多く得るためには、入力を行なう
フレーム周期を短かくする必要があるが、数字の様に、
2音節程度になると子音部分で変化する特徴量も必要と
なり、他の単語よりも短かいフレームでのデータが有効
である。このフレーム周期を短かくすることにより正答
率の向上が得られる。
【0008】
【目的】本発明は、上述のごとき実情に鑑みてなされた
もので、第1に、数字による番号入力モードになった場
合に、入力音声をリジェクトしないようにリジェクト値
を変更して、入力された番号の桁数を確保することを目
的としてなされたものであり、更には、リジェクトされ
たことが表示又は音声にて分るようにすることを目的と
してなされたものである。また、単語間の離散時間を短
くして、入力スピードを上げることを目的としてなされ
たものである。更には、フレーム周期を短くして、正答
率を向上させることを目的としてなされたものである。
【0009】
【構成】本発明は、上記目的を達成するために、(1)
ハンドセットよりの入力音声を特徴抽出した入力パター
ンと辞書パターンとを比較して入力音声を認識する音声
認識部と、認識結果をリジェクトする割合を変更するリ
ジェクト値変更部と、前記ハンドセットより音声入力さ
れた電話番号を記憶する番号バッファとを有し、数字に
よる番号入力モードになった時、前記リジェクト値変更
部のリジェクト値を変更して入力音声をリジェクトしな
いようにして入力された番号の桁数を確保するようにし
たこと、或いは、(2)ハンドセットよりの入力音声を
特徴抽出した入力パターンと辞書パターンとを比較して
入力音声を認識する音声認識部と、認識結果を出力する
音声応答部と、前記ハンドセットより音声入力された電
話番号を記憶する番号バッファとを有し、数字による番
号入力モードの場合、入力された数字音声がリジェクト
された場合に、前記音声応答部より結果出力としてリジ
ェクトされたことを示す音(例えばビープ音,0〜9の
固定の数字,0〜9以外の音)を出力することにより、
入力された電話番号の桁数を確保するようにしたこと、
或いは、(3)ハンドセットよりの入力音声を特徴抽出
した入力パターンと辞書パターンとを比較して入力音声
を認識する音声認識部と、認識結果を表示する結果表示
器と、前記ハンドセットより音声入力された電話番号を
記憶する番号バッファとを有し、数字による番号入力モ
ードの場合、入力された数字音声がリジェクトされた場
合に、前記結果表示器にリジェクトされたことを示すキ
ャラクタ(例えば、固定の数字,0〜9以外のキャラク
タ)を表示することにより、入力された電話番号の桁数
を確保するようにしたこと、或いは、(4)ハンドセッ
トよりの入力音声を特徴抽出した入力パターンと辞書パ
ターンとを比較して入力音声を認識する音声認識部と、
離散時間設定可能な音声区間検出部と、離散時間変更部
とを有し、数字による番号入力モードになった場合に、
単語の離散時間を短く設定するようにしたこと、或い
は、(5)ハンドセットよりの入力音声を特徴抽出した
入力パターンと辞書パターンとを比較して入力音声を認
識する音声認識部と、フレーム周期変更部とを有し、数
字による番号入力モードになった場合に、前記フレーム
周期を短く設定するようにしたことを特徴としたもので
ある。以下、本発明の実施例に基いて説明する。
【0010】図1は、請求項1に記載した音声ダイヤル
装置の一実施例を説明するためのブロック図、図2は、
その動作説明をするためのフローチャートで、具体的に
は、図1に示すように、ハンドセット1と、特徴抽出部
2と、音声区間検出部3と、入力パタン記憶部4と、辞
書5と、認識部6と、制御部7と、リジェクト値変更部
8と、キー入力部9と、番号バッファ10と、結果出力
部11と、自動発呼部12を有する音声ダイヤル電話に
おいて、数字による番号入力モードになった場合に、入
力音声をリジェクトしない様にリジェクト値変更部8の
リジェクト値を変更して入力された番号のケタ数を確保
するようにしたものである。
【0011】最初に、図2のフローに従って説明する。
通常音声ダイヤル電話には色々なモードがあり、例え
ば、登録モード、検索モードがある。また、認識モード
にも名義による認識モードと番号による認識モードが考
えられる。音声入力かキー入力により番号入力モードに
入る。音声入力の場合“番号”と言って番号入力モード
に入っても良いし、いきなり数字を発声する事により番
号入力モードに入っても良い。もちろん、番号入力キー
なるキーを用意しても良い。番号モードに入ると発声が
リジェクトされないようにリジェクト効果を減少する。
全くリジェクトされない様にしてもかまわないし、少し
リジェクトをかけてノイズのみリジェクトする事も可能
である。その後に数字の発声が行なわれる。連続して発
声されるためその認識結果は番号バッファ10に記憶さ
れる。数字の入力が終了したならば“終了”と言って入
力しても良いし、終了キーを使用しても良いがいずれに
しても番号の終了を行なう。電話器は番号バッファ10
に記憶された番号を連続的に出力して使用者の確認を待
つ。使用者はこの結果出力からもし誤った番号であれば
訂正を行なってダイヤルを送出する。ダイヤル送出後は
リジェクト値が番号入力モード以前の状態に戻って初期
状態となる。以上の説明から明らかなように、請求項1
に記載の発明によると、結果出力の電話番号のケタ数が
確保されるため、誤認識した場合の訂正がやりやすくな
る。
【0012】図1は、上記フローを実行するためのブロ
ック図で、ハンドセット1からの音声が特徴抽出部2に
供給され、ここで入力パターンが作られ入力パターン記
憶部4に入力される。制御部7ではモードにより番号入
力モードの場合はリジェクト値変更部8のリジェクト値
を変更してリジェクトの効果を弱くする。前記入力パタ
ーン記憶部4に記憶された入力パターンと辞書5からの
パターンが比較認識され、その認識結果が番号バッファ
10に記憶される。番号入力終了の場合には番号バッフ
ァ10の出力を結果出力部11へ出力し、使用者が確認
を行なった後自動発呼される。
【0013】図3,4,5は、請求項2に記載した発明
の実施例を説明するためのフローチャート、図6は、そ
の構成例を示すブロック図で、図6において、21は認
識結果出力部、22はリジェクトフラグ出力部、23は
音声応答部、24は数字音声データ部、25はビープ音
データ部、26は結果を音声で出力する音声出力部で、
その他、図1に示した装置と同様の作用をする部分に
は、図1の場合と同一の参照番号が付してある。
【0014】最初に、主として、図3のフローに従って
説明する。前述のように、通常音声ダイヤル電話には色
々なモードがあり、例えば、登録モード、検索モードが
ある。また、認識モードにも名義による認識モードと番
号による認識モードが考えられる。音声入力かキー入力
により番号入力モードに入る。音声入力の場合“番号”
と言ってモードに入っても良し、いきなり数字を発声す
ることにより番号入力モードに入っても良い。もちろ
ん、番号入力キーなるキーを用意しても良い。番号モー
ドに入ると数字の発声が行なわれる。連続して発声され
る(数字入力と数字入力の間に応答が入らないことを示
す)ため、その結果がバッファに記憶される。この時に
認識結果がリジェクトであった場合は結果を記憶するバ
ッファに数字結果のかわりに、図7に示すように、リジ
ェクトフラグを記憶する。図7では、発声が“イチ”
“ニ”“サン”“ヨン”“ゴ”…である場合に“ヨン”
がリジェクトされた結果のかわりに、図7に(R)にて
示すように、リジェクトフラグが記憶される。数字の入
力が終了したならば、“終了”と言って入力しても良い
し終了キーを使用しても良いが番号入力の終了を行な
う。電話器は番号バッファに記憶された番号を順時出力
する。数字結果に対しては対応する数字を出力する。こ
こでリジェクトフラグがある場合には数字結果音声のか
わりにビープ音を出力する。ここがリジェクトであるこ
とを示すと共に番号のケタ数を保持する機能である。ビ
ープ音のかわりに一定の数字出力を行なう(例えば“ゼ
ロ”)ことによりケタ数の保持が可能である(図4)。
また、例えば0〜9以外の音声出力(“ジュウ”や“バ
ツ”)などを用いることも可能である(図5)。一連の
応答出力の後で使用者が番号の確認を行ない、この結果
出力が誤っていたりリジェクトがあった場合には訂正を
行ないダイヤルを送出する。ダイヤル送出後はモード入
力に戻る。
【0015】図6は、上記フローを実行するためのブロ
ック図で、ハンドセット1から入力パターンが作られ、
記憶部4に入力される。認識部4の結果が出力されたら
認識結果出力部21のデータが番号バッファ10に記憶
される。リジェクトならばリジェクトフラグ出力部22
よりフラグが番号バッファ10に記憶される。全番号が
入力されると音声応答部23から数字音声もしくはビー
プ音が出力される。このビープ音データは“ジュウ”や
“バツ”というデータにも変えることができる。使用者
がこの番号出力を聞き、訂正した後に自動発呼される。
応答部のデータは、例えば、“イチ、ニ、サン、ビー、
ブ”と出力される。
【0016】図8,9は、請求項3に記載した発明の実
施例を説明するためのフローチャート、図10はその構
成例を示すブロック図で、図中、27は結果表示部、2
8は数字キャラクタ部、29はバーキャラクタ部、30
は結果表示部で、その他、図6と同様の作用をする部分
には、図6と同じ参照番号が付してある。最初に、図8
のフローに従って説明する。図3〜7に関して説明した
ようにして、電話器は番号バッファに記憶された番号を
順時出力する。数字結果に対しては対応する数字を出力
する。ここでリジェクトフラグがある場合には数字結果
表示のかわりにバー(−)を表示する。ここがリジェク
トであることを示すと共に番号のケタ数を保持するため
である。バー(−)表示のかわりに一定の数字を表示す
る(例えば0)ことによりケタ数の保持が可能である
(図9)。もちろんバー(−)は0〜9以外のキャラク
タならば他のキャラクタに変えることは可能である。一
連の表示出力の後で使用者が番号の確認を行ない、この
結果出力が誤っていたりリジェクトがあった場合には訂
正を行ないダイヤルを送出する。ダイヤル送出後はモー
ド入力に戻る。
【0017】図10は、上記フローを実行するためのブ
ロック図で、ハンドセット1から入力パターンが作られ
記憶部4に入力される。認識部46の結果が出力された
ら認識結果出力部11のデータが番号バッファ10に記
憶される。リジェクトならばリジェクトフラグ出力部2
2よりフラグが番号バッファ10に記憶される。全番号
が入力されると、表示器30に数字もしくはバー(−)
が出力される。このバーは他の0〜9以外のキャラクタ
に変えることができる。例えば、(1)(2)(3)
(×)(5)などである。使用者がこの番号表示を見て
訂正した後に自動発呼される。
【0018】図12は、請求項4に記載した発明の実施
例を説明するためのフローチャート、図13は、その構
成例を示すブロック図で、図中、31は離散時間変更
部、32は通常離散時間発生部、33は数字用離散時間
発生部で、この発明は、数字による番号入力モードにな
った場合、単語の離散時間を短かく設定するようにした
ものであり、数字による番号入力が終了した時点で離散
時間を通常の値に設定を戻す。
【0019】例えば、図13に示すように、「サッポ
ロ」の様な促音を持つ単語はひとつの単語として切り分
けるためには離散時間が300〜350ms必要であ
る。実際に次の単語が入力できる様になるのは最後の音
声区間(図13では「ポロ」)終了後300〜350m
s無音区間を作る必要がある。しかし対照認識単語を日
本語数字に限れば0〜9の間に促音を持つ単語は無い。
これは離散時間が300〜350msという長い時間が
必要でないことを示す。離散時間は単語内の無音区間の
時間によって決められる。0〜9数字では子音「k」
「t」の前に数10ms程度の無音区間が存在する。逆
に言えばこの値以上の無音区間があればそこは単語の区
切りとなる。図14に数字6「ロク」の場合を示す。
「7」の前に数10msの無音区間があるため、離散時
間が50〜100msに変えることが可能である。つま
り認識対照単語を0〜9に限定することにより単語離散
時間を50〜100msに変えることが可能である。
【0020】最初に図11のフローチャートにそって説
明する。前述のように通常音声ダイヤル電話には色々な
モードがある。例えば登録モード検索モードである。ま
た認識モードにも名義による認識モードと番号による認
識モードが考えられる。音声入力かキー入力により番号
入力モードに入る。音声入力の場合“番号”と言ってモ
ードに入っても良いし、いきなり数字を発声することに
より番号入力モードに入っても良い。もちろん、番号入
力キーなるキーを用意しても良い。番号モードに入ると
離散時間を短かく設定する。具体的には50ms〜10
0msであるが実験等により最適値を決める。その後に
数字の発声が行なわれる。連続して発声されるためその
認識結果はバッファに記憶される。数字の入力が終了し
たならば“終了”と言って入力しても良いし、終了キー
を使用しても良いが番号の終了を行なう。電話器はバッ
ファに記憶された番号を連続的に出力し使用者の確認を
行なう。使用者はこの結果出力からもし誤った番号であ
れば訂正を行ない、ダイヤルを送出する。ダイヤル送出
後は離散時間を通常の値に戻し、初期状態とする。
【0021】図12は、上記フローを実行するためのブ
ロック図で、ハンドセット1からの音声から入力パター
ンが作られる。この時、制御部7は通常モードか数字モ
ードかを判断し、離散時間変更部31によってそれぞれ
のモードに適した離散時間を音声区間検出部3に与え
る。この離散時間によって切り分けられた入力パターン
は記憶部4に入力される。数字入力モードの場合は入力
パターンは辞書5と比較され最も類似度の高い数字が番
号バッファ10に記憶される。番号入力終了の場合には
番号バッファ10の出力を結果出力し、使用者の確認を
行ない自動発呼させる。
【0022】図14は、請求項5に記載した発明の実施
例を説明するためのフローチャート、図15は、その構
成例を示すブロック図で、図中、34はフレーム周期変
更部で、その他、図1に示した実施例と同様の作用をす
る部分には、図1の場合と同じ参照番号が付してある。
而して、この実施例は、数字による番号入力モードにな
った場合、フレーム周期を短かく設定するようにしたも
のであり、数字による番号入力が終了した時点で、フレ
ーム周期を通常の値の設定に戻す。
【0023】最初に、図14のフローチャートにそって
説明する。前述のように、通常音声ダイヤル電話には色
々なモードがある。例えば登録モード、検索モードであ
る。また、認識モードにも名義による認識モードと番号
による認識モードが考えられる。音声入力かキー入力に
より番号入力モードに入る。音声入力の場合“番号”と
言ってモードに入っても良いし、いきなり数字を発声す
ることにより番号入力モードに入っても良い。もちろ
ん、番号入力キーなるキーを用意しても良い。番号モー
ドに入ると、フレーム周期を変更して短かい周期での取
り込みを行なう。その後に数字の発声が行なわれる。連
続して発声されるためその認識結果はバッファに記憶さ
れる。数字の入力が終了したならば、“終了”と言って
入力しても良いし、終了キーを使用しても良いが番号の
終了を行なう。電話器はバッファに記憶された番号を連
続的に出力し使用者の確認を行なう。使用者はこの結果
出力からもし誤った番号であれば訂正を行ない、ダイヤ
ルを送出する。ダイヤル送出後はフレーム周期を番号入
力モード以前の状態に戻す。数字は発声長が短かいため
に短周期のフレームでも入力がオーバーフローしない
が、一般の入力できる単語長を確保するためには、短、
長2つのフレーム周期を使い分けなければならない。そ
のため数字入力モード後ではフレーム周期の初期化が必
要である。
【0024】図15は、上記フローを実行するためのブ
ロック図で、ハンドセット1からの音声により入力パタ
ーンが作られる。この時、制御部7は通常モードか数字
モートがを判断しフレーム周期変更部34によりそれぞ
れのモードに適したフレーム周期を選ぶ。このフレーム
周期により得られた入力パターンは記憶部4に入力され
る。数字入力モードの場合は、入力パータンは辞書5と
比較され、最も類似度の高い数字が番号バッファ10に
記憶される。番号入力終了の場合には番号バッファの出
力を結果出力部11に出力し使用者の確認を行ない自動
発呼させる。
【0025】
【効果】請求項1〜3に記載の発明によると結果出力の
電話番号のケタ数が確保されるため、誤認識した場合の
訂正がやりやすくなる。請求項4に記載の発明による
と、数字入力モードの離散時間を短かくすることによ
り、数字の入力がリズミカルにかつ短時間で行うことが
できる。請求項5に記載の発明によると、数字入力モー
ドのデータ入力量を増すことにより、数字認識の正答率
を高く保持することができ、電話番号の様な数字列の正
答率を高く保持でき、使用者に番号の訂正をする手間を
取らせることなく音声ダイヤルができる。
【図面の簡単な説明】
【図1】 請求項1に記載の発明の一実施例を説明する
ためのブロック図である。
【図2】 図1の動作説明をするためのフローチャート
である。
【図3】 請求項2に記載の発明の一実施例を説明する
ためのフローチャートである。
【図4】 請求項2に記載の発明の他の実施例を説明す
るためのフローチャートである。
【図5】 請求項2に記載の発明の他の実施例を説明す
るためのフローチャートである。
【図6】 請求項2に記載の発明の構成例を示すブロッ
ク図である。
【図7】 図6の番号バッファ10の記憶の様子を説明
するための図である。
【図8】 請求項3に記載した発明の一実施例を説明す
るためのフローチャートである。
【図9】 請求項3に記載した発明の他の実施例を説明
するためのフローチャートである。
【図10】 請求項3に記載した発明の構成例を説明す
るためのブロック図である。
【図11】 請求項4に記載した発明の一実施例を説明
するためのフローチャートである。
【図12】 請求項4に記載した発明の構成例を示すブ
ロック図である。
【図13】 請求項4に記載した発明の普通音声入力時
の動作を説明するための図である。
【図14】 請求項4に記載した発明の数字音声入力時
の動作を説明するための図である。
【図15】 請求項5に記載した発明の実施例を説明す
るためのフローチャートである。
【図16】 請求項5に記載した発明の構成例を示すブ
ロック図である。
【符号の説明】
1…ハンドセット、2…特徴抽出部、3…音声区間検出
部、4…入力パターン記憶部、5…辞書、6…認識部、
7…制御部、8…リジェクト値変更部、9…キー、10
…番号バッファ、11…結果出力部、12…自動発呼
部、21…認識結果出力部、22…リジェクトフラグ出
力部、23…音声応答部、24…数字音声データ部、2
5…ビープ音データ部、26…音声出力部、27…結果
表示部、28…数字キャラクター部、29…バーキャラ
クタ部、30…結果表示部、31…離散時間変更部、3
2…通常離散時間設定部、33…数字用離散時間設定
部、34…フレーム周期変更部。

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】 ハンドセットよりの入力音声を特徴抽出
    した入力パターンと辞書パターンとを比較して入力音声
    を認識する音声認識部と、認識結果をリジェクトする割
    合を変更するリジェクト値変更部と、前記ハンドセット
    より音声入力された電話番号を記憶する番号バッファと
    を有し、数字による番号入力モードになった時、前記リ
    ジェクト値変更部のリジェクト値を変更して入力音声を
    リジェクトしないようにして入力された番号の桁数を確
    保するようにしたことを特徴とする音声ダイヤル装置。
  2. 【請求項2】 ハンドセットよりの入力音声を特徴抽出
    した入力パターンと辞書パターンとを比較して入力音声
    を認識する音声認識部と、認識結果を出力する音声応答
    部と、前記ハンドセットより音声入力された電話番号を
    記憶する番号バッファとを有し、数字による番号入力モ
    ードの場合、入力された数字音声がリジェクトされた場
    合に、前記音声応答部より結果出力としてリジェクトさ
    れたことを示す音を出力することにより、入力された電
    話番号の桁数を確保するようにしたことを特徴とする音
    声ダイヤル装置。
  3. 【請求項3】 ハンドセットよりの入力音声を特徴抽出
    した入力パターンと辞書パターンとを比較して入力音声
    を認識する音声認識部と、認識結果を表示する結果表示
    器と、前記ハンドセットより音声入力された電話番号を
    記憶する番号バッファとを有し、数字による番号入力モ
    ードの場合、入力された数字音声がリジェクトされた場
    合に、前記結果表示器にリジェクトされたことを示すキ
    ャラクタを表示することにより、入力された電話番号の
    桁数を確保するようにしたことを特徴とする音声ダイヤ
    ル装置。
  4. 【請求項4】 ハンドセットよりの入力音声を特徴抽出
    した入力パターンと辞書パターンとを比較して入力音声
    を認識する音声認識部と、離散時間設定可能な音声区間
    検出部と、離散時間変更部とを有し、数字による番号入
    力モードになった場合に、単語の離散時間を短く設定す
    るようにしたことを特徴とする音声ダイヤル装置。
  5. 【請求項5】 ハンドセットよりの入力音声を特徴抽出
    した入力パターンと辞書パターンとを比較して入力音声
    を認識する音声認識部と、フレーム周期変更部とを有
    し、数字による番号入力モードになった場合に、前記フ
    レーム周期を短く設定するようにしたことを特徴とする
    音声ダイヤル装置。
JP3154007A 1991-02-14 1991-05-29 音声ダイヤル装置 Expired - Fee Related JP3069150B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3154007A JP3069150B2 (ja) 1991-02-14 1991-05-29 音声ダイヤル装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP4249891 1991-02-14
JP3-42498 1991-02-14
JP3154007A JP3069150B2 (ja) 1991-02-14 1991-05-29 音声ダイヤル装置

Publications (2)

Publication Number Publication Date
JPH04306037A JPH04306037A (ja) 1992-10-28
JP3069150B2 true JP3069150B2 (ja) 2000-07-24

Family

ID=26382203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3154007A Expired - Fee Related JP3069150B2 (ja) 1991-02-14 1991-05-29 音声ダイヤル装置

Country Status (1)

Country Link
JP (1) JP3069150B2 (ja)

Also Published As

Publication number Publication date
JPH04306037A (ja) 1992-10-28

Similar Documents

Publication Publication Date Title
ES2295025T3 (es) Interfaz de usuario hablada para dispositivos habilitados mediante la voz.
JP2927891B2 (ja) 音声ダイヤル装置
US5892813A (en) Multimodal voice dialing digital key telephone with dialog manager
EP1047046A2 (en) Distributed architecture for training a speech recognition system
US20020091522A1 (en) System and method for hybrid voice recognition
WO2007000698A1 (en) Error correction for speech recognition systems
US7035800B2 (en) Method for entering characters
KR20080107376A (ko) 화자 독립 음성 인식을 구비한 통신 장치
KR100567828B1 (ko) 향상된 음성인식 장치 및 방법
JP2006058390A (ja) 音声認識装置
EP1213706B1 (en) Method for online adaptation of pronunciation dictionaries
JPH1138863A (ja) 言語情報装置
JP3069150B2 (ja) 音声ダイヤル装置
KR100848148B1 (ko) 음절 단위의 음성 인식 장치, 음절 단위의 음성 인식을이용한 문자 입력 장치, 그 방법 및 기록 매체
JP4525376B2 (ja) 音声−数字変換装置および音声−数字変換プログラム
JP4486235B2 (ja) 音声認識装置
KR20040008990A (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
JPH08190398A (ja) 音声認識装置
JP2005283797A (ja) 音声認識装置および音声認識方法
EP1617635A2 (en) Speech recognition by a portable terminal for voice dialing
JP2656234B2 (ja) 会話音声理解方法
JP4622106B2 (ja) 人物特定システム
KR20010000595A (ko) 대화식 음성 제어가 가능한 이동전화단말기 및 그 제어 방법
KR200219909Y1 (ko) 대화식 음성 제어가 가능한 이동전화단말기
KR100277472B1 (ko) 음성인식 무선전화기에서의 화자종속 이름 및 전화번호 저장 방법

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees