JPS63305396A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS63305396A
JPS63305396A JP62141265A JP14126587A JPS63305396A JP S63305396 A JPS63305396 A JP S63305396A JP 62141265 A JP62141265 A JP 62141265A JP 14126587 A JP14126587 A JP 14126587A JP S63305396 A JPS63305396 A JP S63305396A
Authority
JP
Japan
Prior art keywords
memory
pattern
recognition
voice
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP62141265A
Other languages
English (en)
Inventor
雅男 渡
正照 赤羽
幸 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP62141265A priority Critical patent/JPS63305396A/ja
Publication of JPS63305396A publication Critical patent/JPS63305396A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 この発明は音声認識装置に関し、特に認識結果の確認の
技術に関する。
〔発明の概要〕
この発明は認識対象語の標準パターンの登録時に、各認
識対象語の発声音声をメモリに書き込んでおき、音声認
識時、認識結果の確認をこのメモリから読み出した音声
により行なうようにしたもので、認識結果の確認のため
の操作を簡易化できるようにしたものである。
〔従来の技術〕
音声認識装置が実用化されているが、その音声認識の方
式の殆どは、一定の使用条件の下で、認識対象単語の標
準パターンと入カバターンとのパターンマツチングを行
なうことによりなす方法である。
第4図はこの音声認識装置の概要を説明するための図で
、マイクロホン(1)よりの音声入力が音響分析回路(
2)に供給される。この音響分析回路(2)では入力音
声パターンの特徴を表わす音響パラメータが抽出される
。この音響パラメータを抽出する音響分析の方法は種に
考えられるが、例えばその−例としてバンドパスフィル
タと整流回路を1チヤンネルとし、このようなチャンネ
ルを通過帯域を変えて複数個並べ、このバンドパスフィ
ルタ群の出力としてスペクトラム・パターンの時間変化
を抽出する方法が知られている。この場合、音響パラメ
ータはその時系列Pi(n) (i=1. 2・・・・
I;■は例えばバンドパスフィルタのチャンネル数、n
=1.2・・・・NUNは音声区間判定により判定され
た区間において認識に利用されるフレーム数)で表わす
ことができる。
この音響分析回路(2)よりの音響パラメータ時系列P
i(n)は、例えばスイッチからなるモード切換回路(
3)に供給される。この回路(3)のスイッチが端子A
側に切り換えられるときは登録モード時で、音響パラメ
ータ時系列Pi(n)が認識パラメータとして標準パタ
ーンメモリ(4)にストアされる。つまり、音声認識に
先だって話者の音声パターンが標準パターンとしてこの
メモリ(4)に記憶される。
一方、このスイッチ(3)が端子B側に切り換えられる
ときは認識モード時である。そして、この認識モード時
は、音響分析回路(2)からのそのときの入力音声の音
響パラメータ時系列が入力音声パターンメモリ(5)に
供給されて一時スドアされる。そしてこの入カバターン
と標準パターンメモリ(4)から読み出された複数のm
vh対象単語の標準パターンのそれぞれとの違いの大き
さが距離算出回路(6)にて計算され、そのうち入カバ
ターンと標準パターンとの差が最小の1m対対象語が最
小値判定回路(7)にて検出され、これにて入力された
単語が認識される。
ところで、mm結果が正しいか否かを知るためにこの認
識結果を確認する必要がある。従来、この認識結果の確
認法としては、陰極線管や液晶ディスプレイ等に文字、
図形等により表示する方法が主流である。
ところが、このような認識結果の確認方法では、予め表
示用キャラクタをキー人力しておく必要がある。また、
自動車電話等に音声認識を利用した場合には、表示画面
に視線を移す必要性が生じることから安全性に問題があ
る。
そこで、認識結果の確認法として音声合成を利用して音
声出力によって行なう方法が提供されている。
この音声合成出力による認識法は、予めキー人力された
キャラクタ系列に従って、例えば単音節音声出力をする
等の方法や、限られた言葉(例えば数字)を予め、合成
データとしてROMに記憶させておく等の方法が行なわ
れていた。
〔発明が解決しようとする問題点〕
以上のように、従来の音声出力による認識結果の確認法
は、音声合成を利用したものであるので、音声認識にお
ける認識対象語の標準パターンの登録作業時に、確認の
ためのキー人力作業が余分に必要であったり、言葉を限
定する等の制約があったりする等の欠点があった。
この発明はこの欠点を改善したものである。
〔問題点を解決するための手段〕
第1図はこの発明の一例を示すもので、第4図と同一部
分には同一符号を付しである。
すなわち、第1図において、(4)は認識対象語の標準
パターンを記憶するための第1のメモリとしての標準パ
ターンメモリ、(5)は入力音声パターンを記憶するた
めの第2のメモリとしての入力音声パターンメモリ、(
11)は音声信号を記憶するための音声記憶手段として
のRAM、(8)は第1のメモリ(4)からの標準パタ
ーンと、第2のメモリ(5)からの入力音声パターンと
のパターンマツチングを行なうパターンマツチング手段
、(15)はスピーカである。
パターンマツチング手段〈8)は第4図例の距離算出回
路(6)と最小値判定回路(7)の部分に相当する。
(10)はシステムコントロール回路(以下シスコンと
称す)、(16)は第1、第2のメモリ(4) (5)
及ヒRAM (11)のアドレスをシスコン(10)か
らの制御に応じてコントロールするアドレスコントロー
ル回路である。
また、(12)はA/Dコンバータ、(13)はD/A
コンバータ、(14)はオーディオアンプである。
〔作用〕
認識対象語の登録時、シスコン(10)からの切換信号
によりモード切換回路(3)は標準パターンメモリ(3
)側に切り換えられ、発声された音声はマイクロホン(
1)にて収音され、これが音響分析回路(2)において
音響パラメータに変換される。つまり認識用標準パター
ンに変換される。この標準パターンはメモ1月4)にア
ドレスコントローラ(16)からのアドレス信号により
書き込まれる。
同時にマイクロホン(1)からの音声信号はA/Dコン
バータ(12)によりデジタル信号に変換され、RAM
(11)にアドレスコントローラ(16)からのアドレ
ス信号により書き込まれる。このとき、メモリ(4)と
RAM(11)のアドレスは関連付けられる。
次に、音声vg!!i!1時は、シスコン(10)から
の切換信号によりモード切換回路(3)は入力音声パタ
ーンメモリ(5)側に切換えられる。したがって、この
ときは、メモリ(5)から読み出された入力音声パター
ンと、メモリ(4)から読み出される標準パターンとが
パターンマツチング手段(8)で比較される。そして、
両パターンが一致とこの手段(8)で認識されると、こ
の手段(8)よりその検知出力が得られ、こレカシスコ
ン(10)に供給される。シスコン(1o)は制御信号
をアドレスコントロール回路(16)ニ供給し、その一
致と認識された標準パターンのメモリ(4)のアドレス
と対応関係にあるアドレスがRAM(11)にアドレス
コントロール回路(16)より供給される。したがって
、一致と認識された認識対象語のデジタル音声信号がR
AM(11)より読み出され、このデジタル音声信号が
D/Aコンバータ(13)によりアナログ音声信号に戻
され、これがオーディオアンプ(14)を介してスピー
カ(15)に供給され、認識結果が登録時の音声として
このスピーカ(15)より放音される。
音声記憶手段としてはテープレコーダやディスク装置を
使用することもでき、アナログ音声信号の状態で記憶し
ておくことも可能である。
〔実施例〕
第2図はこの発明の一実施例で、自動車電話として好適
な電話装置にこの発明を通用した場合の例である。
第2図において、(20)は電話回路部で、この例では
送話器のマイクロホン(21)は音声認識用の音声入力
手段も兼ねている。また、受話器のスピーカ(22)は
認識確認用も兼ねている。
(23)はマイクロホン(21)からの入力音声信号を
音響パラメータ時系列に変換する音響分析回路、(24
)はモード切換回路、(25)は標準パターンメモリ、
(26)は入カバターンメモリ、(27)はパターンマ
ツチング回路である。
(33)は音声データメモリで、この例では音声データ
は適応差分P CM (ADPCM )信号とされ、圧
縮されてメモリ(33)に書き込まれ、またこれより読
み出される。
すなわち、電話回路(20)のマイクロホン(21)か
らの音声信号はA/Dコンバータ(31)においてデジ
タル信号に変換され、このデジタル信号がADPCM 
:r−7コーグ(32) ニ供給されて、ADPCM信
号にされ、そして、このADPCM信号が音声データメ
モリ (33)に書き込まれる。そして、このメモリ(
33)から読み出されたADPCM信号GtADPCM
 テコーダ(35)において元の音声データに復元され
た後、D/Aコンバータ(36)によりアナログ音声信
号に戻され、オーディオアンプ(37)を介しT、2.
ヒー4 (22)に供給されて放音される。
(38)は応答メツセージのメモリで、このメモリ (
38)には予め、ユーザにより応答メツセージの音声デ
ータが登録されてストアされている。
(40)は装置全体をコントロールするシスコンであり
、また、(41)はメモリ (25)  (26)及び
(33)に書き込み及び読み出しアドレスを供給するア
ドレスコントローラである。また、(42)はレジスタ
であり、後述するようにダイヤルNo、を音声入力した
とき、そのNo、に応じたダイヤル信号を一時貯えてお
くためのものである。
この装置において認識対象単語の登録時は、例えば登録
モードキーのオンによりシスコン(40)は登録モード
となり、モード切換回路(24)が標準パターンメモリ
 (25)側に切り換えられる。
そして、電話機の送受話器のマイクロホン(21)に向
けて発声された認識対象単語の音声信号は音響分析回路
(23)で音響パラメータ系列に変換され、これが、そ
の認識対象nil!1の標準パターンとしてモード切換
回路(24)を介してメモリ (25)に書き込まれる
。このときのメモリ (25)の書き込みアドレスはア
ドレスコントローラ(41)から与えられ、認識対象単
語毎に異なるアドレスに順次書き込まれる。このとき、
同時に、[f!%対象単語の音声信号はA/Dコンバー
タ(31) 、ADPCMエンコーダ(32)によりA
DPCM信号にされ、アドレスコントローラ(41)か
らの書き込みアドレス信号により、認識対象語毎にメモ
リ (25)のアドレスと対応関係をもって、メモリ 
(33)に書き込まれる。
ここで、登録される!!!li対象単語の例としては、
“ダイヤル”、“ダイヤルレス”、“確認”。
“はい”、“訂正“等の単語の他に、“1”2”・・・
・“9”0”の数字が掲げられる。
この場合、シスコン(40)はメモリ (25)のどの
アドレスにどの認識対象単語の標準パターンがストアさ
れているかを知っている。
この認識対象単語の登録とは別個に、応答メツセージが
同様にADPCM音声としてメモリ (38)に登録さ
れる。このメツセージの例としては、1ですね”、“も
う一度”どうぞ”番号を″等が掲げられる。
次に音声認識時について以下、説明するが、以下の例は
、ユーザが指でダイヤル操作をする代わりに、音声によ
り電話番号を入力することによりダイヤルをすることが
できるようにした場合である。
第3図はこの場合のフローチャートである。
なお、同図において、 をそれぞれ示している。
先ず、ステップ(101)で電話機のフックスイッチが
オフされる。すると、装置は音声vg識モードになる。
次に、ステップ(102)でこのときのコマンド名であ
る“ダイヤルレス”がユーザにより発声される。すると
、前述と同様にしてパターンマツチング回路(27)に
おいてメモリ (25)から読み出された標準パターン
と、この“ダイヤルレス”の発声音の入カバターンとが
比較され、一致と検知されたときその検知出力がシスコ
ン(40)に供給される。
すると、メモリ (33)に対しアドレスコントローラ
(41)より、その一致と検知された認識対象語のAD
PCM音声データのアドレスが与えられ、このメモリ 
(33)より読み出され、合成回路(34)に供給され
る。一方、アドレスコントロール回路(41)からは応
答メツセージメモリ (38)にアドレスが付与されて
このメモリ (38)から“ですね”の音声データが読
み出され、これが合成回路(34)に供給されて、メモ
リ (33)から読み出さた音声データに続くように合
成される。この合成回路(34)の出力はADPCMデ
コーダ(35)でデコードされ、そのデコード信号がD
/Aコンバータ(36)にてアドレス音声にされ、これ
がオーディオアンプ(37)を介してスピーカ(22)
に供給される。
したがって、スピーカ(22)からは“○○ですね”と
いう応答メツセージが放音される。ここで認識が正しく
なされていれば、“ダイヤルレスですね”という応答メ
ツセージになる(ステップ(103) ”)。
ユーザはこの応答メツセージを聞いて、認識が正しいか
どうか確認する(ステップ(104) ) 。
そして、認識が正しければ、ユーザは“はい”と発声し
くステップ(107) ) 、誤1mであれば“訂正”
と発声する(ステップ(105))、このとき、シスコ
ン(40)では、ステップ(104)の後(正しくはス
テップ(103)の後)は、“はい”か“訂正”の発声
がなされることが予想できるので、標準パターンメモリ
 (25)には両単語のアドレスのみがアドレスコント
ローラ(26)より与えられ、いずれが発声されたが判
別できる。
そして、“訂正”と発声されたと認識したときは、応答
メツセージメモリ (38)より“もう一度”。
“どうぞ”の音声データが読み出され、これがスピーカ
(22)より放音される(ステップ(106) ) 。
そこで、ユーザは再びステップ(102)よりやり直す
一方、“はい”と発声されたと[1識されたときは、メ
モリ (38)より1番号を″“どうぞ”の音声データ
が順次読み出され、これがスピーカ(22)より放音さ
れ(ステップ(108))、ダイヤルレスコールのモー
ドに入る。
ユーザはステップ(108)の“番号をどうぞ”の応答
メツセージにより、電話番号の初めの1桁を発声する(
ステップ(109) ) 、すると、この数字音声がパ
ターンマツチング処理されて音声認識され、認識結果の
確認として、メモリ (33)より対応する数字の音声
データが読み出され、スピーカ(22)により放音され
る(ステップ(110) ) 。
もし、この確認数字が誤っていると判断すると(ステッ
プ(111) ) 、ユーザは“訂正”と発声する(ス
テップ(112) ) 、すると、ステップ(106)
と同様にして“もう一度どうぞ”という応答メツセージ
音声が発せられる(ステップ(113))から、ユーザ
は数字入力のやり直しを行なう、このとき、電話番号の
各桁はレジスタ(42)に順次ストアされる。そして、
電話番号の入力が間違いなく全桁行なわれたとユーザが
判断(ステップ(114) ) したとき、ユーザは1
確認”と発声する(ステップ(115) ) 、この1
確認”の発声入力がない間は番号入力のステップがくり
返される。この“確認”の音声認識がなされると、レジ
スタ(42)にストアした番号情報に基づいて、メモリ
 (33)よりこれに対応する数字の音声データが読み
出され、スピーカ(22)により音声出力される(ステ
ップ(116) ”) 。
ユーザはこの電話番号の全桁音声出力が正しいか否か判
断しくステップ(117) ’) 、正しくなければ“
訂正”と発声する(ステップ(118) ) 。
すると、装置側は“もう一度どうぞ”と応答メツセージ
がステップ(106)及び(113)と同様にしてスピ
ーカ(22)より発せられ(ステップ(119) ”)
 、再度、電話番号の1桁目からの入力がなされるよう
にステップ(109)に戻る。
また、電話番号の全桁音声出力が正しければ、ユーザは
1ダイヤル”と、ダイヤラーを起動するための発声を行
なう(ステップ(120) ) 、この入力音声を認識
すると、シスコン(40)はレジスタ(42)に貯えら
れた番号データにより発信を行なわせる(ステップ(1
21) ) 。
なお、ステップ(115)〜(117)での電話番号の
全桁確認は、ステップ(109)〜(111)において
1桁毎の確認を行なっているので、省略してもよい。
なお、認識対象語の音声信号を記憶しておく手段として
は、図の例のようなメモリではなく、テープレコーダ、
ディスク装置、その他の手段を用いることも可能である
。また、音声信号はアナログ信号の状態で記憶しておく
ことも可能である。
〔発明の効果〕
この発明によれば、標準パターンの登録時に、発声音声
が標準パターンメモリと関連付けられて別のメモリに記
憶され、m1時、この別のメモリから読み出した音声に
より確認を行なうものであるから、従来の表示用キャラ
クタをキー人力しておく場合に比べて余分なキー人力作
業が不要になり、操作が簡易化される。特に、自動車電
話等では表示画面を確認のため視ることは安全対策上好
ましくないが、この発明は音声による確認であるから、
安全性の上で非常に有益である。
また、この発明は、ユーザが登録した語をオーム返し的
に確認のために再生するものであるから、音声合成を用
いる場合に比べて言葉の限定等の制約がなく、良好な確
認作業ができる。
【図面の簡単な説明】
第1図はこの発明の基本的構成の一例のブロック図、第
2図はこの発明の一実施例のブロック図、第3図はこの
発明の詳細な説明のためのフローチャート、第4図は音
声認識装置の基本構成を示す図である。 (1)はマイクロホン、(4)は標準パターンメモリ、
(5)は入力音声パターンメモリ、(8)はパターンマ
ツチング回路、(10)はシステムコントローラ、(1
1)はRAM、(15)はスピーカである。

Claims (1)

  1. 【特許請求の範囲】 認識対象語の標準パターンを記憶するための第1のメモ
    リと、 入力音声パターンを記憶するための第2のメモリと、 音声信号を記憶するための音声記憶手段と、上記第1の
    メモリからの標準パターンと、上記第2のメモリからの
    入力音声パターンとのパターンマッチングを行なうパタ
    ーンマッチング手段と、スピーカとを具備し、 認識対象語の登録時、発声された音声が認識用標準パタ
    ーンに変換されて上記第1のメモリに書き込まれるとと
    もに、上記発声された音声が上記音声記憶手段に上記第
    1のメモリと関連付けて書き込まれ、 音声認識時、上記パターンマッチング手段で入力音声パ
    ターンと一致と認識された標準パターンの認識対象語の
    音声信号が上記音声記憶手段から読み出され、この音声
    信号が上記スピーカに供給されて、認識結果として放音
    されるようにした音声認識装置。
JP62141265A 1987-06-05 1987-06-05 音声認識装置 Pending JPS63305396A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP62141265A JPS63305396A (ja) 1987-06-05 1987-06-05 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP62141265A JPS63305396A (ja) 1987-06-05 1987-06-05 音声認識装置

Publications (1)

Publication Number Publication Date
JPS63305396A true JPS63305396A (ja) 1988-12-13

Family

ID=15287879

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62141265A Pending JPS63305396A (ja) 1987-06-05 1987-06-05 音声認識装置

Country Status (1)

Country Link
JP (1) JPS63305396A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5561722A (en) * 1992-03-04 1996-10-01 Sony Corporation Pattern matching method and pattern recognition apparatus
JP2002287794A (ja) * 2001-03-23 2002-10-04 Kenwood Corp 音声認識装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5955499A (ja) * 1982-09-25 1984-03-30 株式会社東芝 音声入力装置
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置
JPS613241A (ja) * 1984-06-15 1986-01-09 Nippon Telegr & Teleph Corp <Ntt> 音声確認方式
JPS6287998A (ja) * 1985-10-14 1987-04-22 株式会社リコー 音声認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5955499A (ja) * 1982-09-25 1984-03-30 株式会社東芝 音声入力装置
JPS6060698A (ja) * 1983-09-13 1985-04-08 富士通株式会社 音声標準特徴パターン作成処理装置
JPS613241A (ja) * 1984-06-15 1986-01-09 Nippon Telegr & Teleph Corp <Ntt> 音声確認方式
JPS6287998A (ja) * 1985-10-14 1987-04-22 株式会社リコー 音声認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5561722A (en) * 1992-03-04 1996-10-01 Sony Corporation Pattern matching method and pattern recognition apparatus
JP2002287794A (ja) * 2001-03-23 2002-10-04 Kenwood Corp 音声認識装置

Similar Documents

Publication Publication Date Title
US5222121A (en) Voice recognition dialing unit
US5042063A (en) Telephone apparatus with voice activated dialing function
US5031113A (en) Text-processing system
US6639979B1 (en) Automatic dialing method using caller identification
US5752230A (en) Method and apparatus for identifying names with a speech recognition program
CN101385073A (zh) 具有不依赖于说话者的语音识别的通信设备
EP1008137B1 (en) Method and apparatus for managing voice registration entries of voice recognition apparatus for use in both handset and hands-free kit
US7130387B2 (en) Communication terminal, communication method and program thereof
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
JPS63305396A (ja) 音声認識装置
KR19990011023A (ko) 기능모드의 음성 인식이 가능한 디지털 휴대용 전화기 및 그 인식방법
JPS61144157A (ja) 音声ダイヤル装置
JPH11261683A (ja) 電話装置、プログラムを記録した記録媒体及びデータを記録した記録媒体
JP3018759B2 (ja) 特定話者方式音声認識装置
JP3278595B2 (ja) 携帯電話
JPH06303320A (ja) Pbx装置
KR940011237B1 (ko) 음성 다이얼링 장치 및 방법
KR930011198B1 (ko) 음성인식 및 디스플레이기능을 갖는 전화기
JPH098894A (ja) 音声認識コードレス電話機
JPS59176797A (ja) 音声認識装置
JPS6314547A (ja) 音声認識型電話ダイヤル方式
JP2002290536A (ja) 携帯端末での電話番号登録方法
JPS63115448A (ja) 音声認識電話機
JPS6173998A (ja) 音声認識装置
JPS59201141A (ja) 音声情報入力装置