JP2647234B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP2647234B2
JP2647234B2 JP2155848A JP15584890A JP2647234B2 JP 2647234 B2 JP2647234 B2 JP 2647234B2 JP 2155848 A JP2155848 A JP 2155848A JP 15584890 A JP15584890 A JP 15584890A JP 2647234 B2 JP2647234 B2 JP 2647234B2
Authority
JP
Japan
Prior art keywords
recognition
syllable
unit
word
phrase
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2155848A
Other languages
English (en)
Other versions
JPH0446398A (ja
Inventor
充宏 斗谷
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Consejo Superior de Investigaciones Cientificas CSIC
Original Assignee
Consejo Superior de Investigaciones Cientificas CSIC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Consejo Superior de Investigaciones Cientificas CSIC filed Critical Consejo Superior de Investigaciones Cientificas CSIC
Priority to JP2155848A priority Critical patent/JP2647234B2/ja
Publication of JPH0446398A publication Critical patent/JPH0446398A/ja
Application granted granted Critical
Publication of JP2647234B2 publication Critical patent/JP2647234B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】 【産業上の利用分野】
この発明は、入力された音声を単語および文節単位で
認識する音声認識装置に関する。
【従来の技術】
従来、音声認識装置として、音韻を識別単位とする音
声認識装置がある。この音韻を識別単位とする音声認識
装置においては、音韻の識別結果を組み合わせて音声の
認識処理(ボトムアップ処理)を行うので、文節等のよ
うに活用を含む超大語彙の認識が可能であり、文章入力
に適している。 ところが、上記音韻を識別単位とする音声認識装置に
よって文節の単位で認識処理を行う場合には、文節認識
の精度をある程度以上高くすることは困難である。そこ
で、音韻を識別単位とする識別動作に平行して単語を識
別単位とする識別動作を行って、両識別結果に基づいて
文節を認識することが試みられている(例えば、「連続
音声認識における頻出単語スポッティング」日本音響学
会昭和61年度秋期研究発表会講演論文集2−3−10、特
開昭63−153595等)。 上記音韻単位による識別と単語単位による識別とを平
行して行う音声認識装置においては、単語を識別単位と
する識別動作を実行しなければならない。ところが、単
語を識別単位とした場合には、識別に時間を要するにも
拘わらず識別できる単語は高々1,000語程度である。し
かも、その識別の対象となる総ての単語を一度発声し
て、その単語の特徴パラメータから成る単語標準パター
ンを辞書に登録しておかなければならず効率が悪いとい
う欠点がある。 上述のような欠点に対処するために、先に本発明者ら
は二つの認識手法を併用する音声認識装置を提案してい
る(特願平1−173630)。この音声認識装置において
は、入力された音声信号を音韻単位で識別し、この識別
結果に基づいて入力音声を単語単位および文節単位で認
識するのである。つまり、単語単位でトップダウン処理
によって識別することによって単語認識用辞書に登録さ
れている単語を精度良く認識する。一方、単語認識用辞
書に登録されていない単語や文節は文節単位でボトムア
ップ処理によって認識するのである。こうすることによ
って、精度と効率とをバランスさせて超大語彙の音声を
認識でき、殆どあらゆる文章に対応できるのである。 以下、単語単位による認識を単語認識処理と言い、文
節単位による認識を文節認識処理と言う。
【発明が解決しようとする課題】
上述のように、単語認識処理と文節認識処理との二つ
の認識手法を併用する音声認識装置においては、単語認
識用辞書に予め登録されている単語は、単語認識処理に
よって精度よく認識できる。しかしながら、単語認識用
辞書に登録されていない単語はいつまで経っても単語認
識処理によって精度よく認識されず、認識率が限定され
てしまうという問題がある。 そこで、この発明の目的は、単語認識用辞書の内容を
自ら拡張して、音韻を識別単位として超大語彙の音声を
更に高認識率で効率良く認識できる音声認識装置を提供
することにある。
【課題を解決するための手段】
上記目的を達成するため、請求項1に係る発明は、入
力された音声信号を音響分析して特徴パラメータに変換
し,この特徴パラメータを所定の手法によって音節単位
で識別し,この識別結果に基づいて音声を認識する音声
認識装置において、上記音節単位の識別結果に基づい
て,単語認識用辞書を照合して入力音声を単語単位で認
識する単語認識部と、上記音節単位の識別結果に基づい
て,文節認識用辞書を照合して入力音声を文節単位で認
識する文節認識部と、上記単語認識部および文節認識部
による認識結果を表示する表示手段と、上記表示手段に
表示された上記単語認識部および文節認識部による認識
結果の中から一つの認識結果を,上記入力された音声信
号に係る音声の最適な認識結果として確定する認識結果
確定手段と、上記文節認識部による認識結果を上記単語
認識用辞書に登録すべきか否かを判定するための基準音
節数を含む判定ルールを格納する判定ルール格納部と、
上記認識結果確定手段によって確定された上記文節認識
部による認識結果が上記判定ルールを満たす場合に,上
記文節認識部による認識結果を上記単語認識用辞書に登
録する辞書登録手段を備えたことを特徴としている。
【作用】
音声信号が入力されると、この入力された音声信号が
音響分析されて特徴パラメータに変換され、この特徴パ
ラメータがパターンマッチング等によって音節単位で識
別される。そして、この音節単位で識別された識別結果
が単語認識部および文節認識部に入力され、上記識別結
果に基づいて、単語認識用辞書および文節認識用辞書を
照合して入力音声が単語単位および文節単位で認識され
る。そして、各認識部における認識結果が表示手段に表
示される。そうすると、オペレータによって認識結果確
定手段が操作され、上記表示手段に表示された上記単語
認識部および文節認識部による認識結果の中から一つの
認識結果が、上記入力された音声信号に係る音声の最適
な認識結果として確定される。 さらに、このようにして上記認識結果確定手段によっ
て確定された上記文節認識部による認識結果が、上記単
語認識用辞書に登録すべきか否かを判定するための基準
音節数を含む判定ルールの条件を満たしている場合に
は、辞書登録手段によって、上記文節認識部による認識
結果が上記単語認識用辞書に登録される。 したがって、得られた認識結果が上記単語認識用辞書
に登録されていない場合には、その認識結果が上記辞書
に新たに登録されて上記辞書の登録語数が増加される。 また、その場合に、上記単語認識用辞書の容量がむや
みに増加しないように、上記判定ルールの条件を満たす
認識結果のみが辞書に登録される。
【実施例】
以下、この発明を図示の実施例により詳細に説明す
る。 この実施例は、連続発声された音声を音節単位にセグ
メテーションして識別し、得られた音節ラティスに基づ
いて単語認識処理および文節認識処理による認識処理を
実施する。そして、文節認識処理に基づく認識結果を単
語認識用辞書に登録することによって単語認識用辞書の
登録語数を増加して、精度良く超大語彙の音声を認識す
るものである。 第1図はこの発明の音声認識装置の一実施例を示すブ
ロック図である。アナログ入力部1に連続して入力され
るアナログ音声信号は、増幅器(AMP)31によって増幅
され、A/D変換器32によってディジタル音声信号に変換
されて音声分析部2に出力される。A/D変換器32から音
声分析部2に入力されたディジタル音声信号は8msの周
期で16msをフレームの単位としてスペクトル分析が行わ
れ、音響的特徴パラメータが生成される。そして、この
生成された特徴パラメータは音節区間の抽出に必要な情
報(パワーおよび零交差数等)と共に音節区間抽出部3
出力される。 そうすると、音声分析部2から音節区間抽出部3に入
力された特徴パラメータは、音節区間の抽出に必要な情
報に基づいて音節単位に切り出される。そして、音節単
位に切り出された音節特徴パターンは、音節区間情報
(音節長,直前/直後の音節との間の無音時間長等)と
共にパターンメモリ7の特徴パターンメモリ71に格納さ
れる。上記パターンメモリ7は、上述のようにして音節
区間抽出部3によって切り出された1音節分の音節特徴
パターンを1個だけ格納する上記特徴パターンメモリ71
と、予め作成された標準となる音節の音響的特徴パラメ
ータから成る標準パターンを複数個記憶している標準パ
ターンメモリ72とから構成されている。 上記特徴パターンメモリ71に格納された1音節の音節
特徴パターンと標準パターンメモリ72に記憶された標準
パターンとの間の類似度計算が単音節認識部6によって
行われ、演算結果に基づいて音節区間抽出部3で切り出
された単音節が識別される。そして、連続した音節認識
結果(音節ラティス)内の音節候補の組み合わせと文節
認識用辞書9の内容との照合が文節認識部8によって行
われ、入力音声が文節単位で認識される。一方、単語認
識用辞書11の辞書項目と連続した音節認識結果(音節ラ
ティス)内の音節候補群との照合が単語認識部10によっ
て行われ、入力音声が単語単位で認識される。すなわ
ち、文節等の超大語彙の単位で音声が認識されるのであ
る。そして、文節認識部8による認識結果(文節候補)
および単語認識部10による認識結果(単語候補)が表示
部12に表示される。そうすると、オペレータによってキ
ーボード13が操作され、表示部12に表示された文節候補
および単語候補の中から正しい認識候補が選択されて確
定される。 このようにして、オペレータによって確定された認識
候補が上記文節認識部8によって認識された文節候補で
ある場合には、その確定された認識候補は単語認識用辞
書11に登録されていないことを意味する。したがって、
上記確定された認識候補が判定ルール格納部14に格納さ
れた登録判定ルールの条件を満たしている場合には、そ
の認識候補が単語認識用辞書11に登録される。 CPU(中央処理装置)5は上記アナログ入力部1,音声
分析部2,音節区間抽出部3,単音節認識部6,パターンメモ
リ7,文節認識部8,単語認識部10,表示部12,キーボード13
および判定ルール格納部14を制御して、音声認識処理動
作を実行する。また、CPUメモリ4には、CPU5用のプロ
グラムおよび音声認識処理に必要な情報等が格納されて
いる。 第2図は上記CPU5の制御に基づいて実施される音声認
識処理動作のフローチャートである。以下、第2図に従
って音声認識処理動作について詳細に説明する。 ステップS1で、上記音声分析部2によって生成された
特徴パラメータが、音節区間抽出部3によって音節単位
に切り出される。その際に、複数の音節区間候補が存在
すれば複数の音節区間候補で切り出される。 上記音節区間の切り出しには種々の方法があるが、例
えば次のようにして行われる。すなわち、パワーの増大
もしくは減少を伴うスペクトルの変化点とパワーディッ
プとから音節境界を検出する。そして、検出された音節
境界によって挟まれる区間に含まれる音節数が推定平均
フレーム長の最小値の2倍以上ある場合には、上記区間
を複数の音節区間と見なして区間内のスペクトルの変化
点に基づいて複数の音節区間候補が切り出される(第3
図)。 ステップS2で、上記ステップS1において切り出された
音節区間候補が展開されて複数の音節区間列が生成され
る(第4図)。その際に、各音節区間列には、各音節境
界候補の確からしさに基づく信頼度が付加される。 ステップS3で、上記ステップS2において生成された複
数の音節区間列の一つの音節区間の特徴パターンが特徴
パターンメモリ71に格納され、上述のようにして単音節
認識部6によって単音節認識が行われて音節候補が出力
される。こうして、上記複数の音節区間列が各音節区間
毎に識別されるのである。 ステップS4で、上記ステップS3における単音節認識の
認識結果として各音節区間列毎に音節ラティスが生成さ
れる。その際に、音節ラティスの各音節候補には標準パ
ターンとの類似度に基づく信頼度が付加され、その信頼
度の高い順に音節候補が配列されるのである(第5
図)。 ステップS5で、上記ステップS4において生成された各
音節区間列毎の複数の音節ラティスに基づいて、信頼度
が第1位の音節区間列に対応する音節ラティス(以下、
第1位の音節ラティスと言う)が文節認識部8に送出さ
れる。それと同時に文節処理の実行が指示される。 そうすると、文節認識部8においては、入力された第
1位の音節ラティスを構成する音節候補を組み合わせて
文字列が作成され、文節認識用辞書9の照合等の言語処
理が行われて、文法的に成立する文字列のみが認識結果
(文節候補)として累積信頼度と共に、累積信頼度の順
に出力される(第6図)。すなわち、文節認識処理はボ
トムアップ処理であると言うことができる。 ステップS6で、上記ステップS4において生成された複
数の音節ラティスの総てが単語認識部10に送出される。
そして、単語認識用辞書11が照合されて単語候補が出力
される。 上記辞書照合は次のように行われる。すなわち、単語
認識用辞書11における辞書項目(単語)を構成する総て
の音節が、音節ラティスを構成する音節候補群の中に存
在するような音節ラティスが在るか否かが各辞書項目毎
に判定される。その結果、そのような音節ラティスが存
在する場合にはその辞書項目(単語)が累積信頼度と共
に累積信頼度の順に認識結果(単語候補)として出力さ
れる(第7図)。すなわち、単語処理はトップダウン処
理であると言うことができる。 ステップS7で、上記ステップS5において出力された文
節候補およびステップS6において出力された単語候補が
表示部12に表示される(第8図)。 ステップS8で、上記ステップS7における表示内容を参
照して、文節候補および単語候補の中から入力音声に対
応する正しい認識候補が、オペレータによるキーボード
13操作によって選択される。 ステップS9で、上記ステップS8において選択された認
識候補がオペレータによって確定される。 この認識候補の確定は、例えばワープロの場合には
“変換キー”の押圧や“無変換キー”の押圧によって実
施される。 ステップS10で、上記ステップS9において確定された
認識候補が文節認識部8によって文節単位で認識された
文節候補である場合には、後に詳述する登録判定ルール
の内容を参照して、上記確定された認識候補が単語認識
用辞書11に追加すべき単語であるか否かが判定される。
その結果、登録判定ルールを満たしていれば、確定され
た認識候補は単語認識用辞書11に登録すべき単語である
として単語認識用辞書11に自動的に登録される。 したがって、次に同じ語が音声入力された場合には、
その入力音声に係る単語等が単語認識用辞書11に登録さ
れているので、入力音声は単語認識部10によって単語単
位で精度よく認識されるのである こうして、新たに単語等が単語認識用辞書11に追加さ
れた後、音声認識処理動作が終了する。 次に、例えば単語「はいけい」がアナログ入力部1に
入力された場合を例に、第1図〜第9図に従って上述の
音声認識処理動作をより具体的に説明する。 第3図は音節区間抽出部3において切り出された音節
区間候補を発声内容と音素記号と併せて示す。上記音素
記号は音声の変化を分かり易く示すために添記したもの
であり、この発明とは直接関係はない。この場合、入力
音声「はい」の部分においては音節/は/が音節区間候
補S0に、音節/い/が音節区間候補S1に一意に決定され
ている。ところが、入力音声「けい」の部分においては
音節/け/が音節区間候補S2に決定されると共に音節/
い/が音節区間候補S3に決定される場合と、音節列/け
い/が音節区間候補S4に決定される場合との2通りの音
節区間候補が作成されている。 …第2図のステップS1 上述のように作成された音節区間候補が展開されて第
4図に示すような音節区間列が生成される。この場合、
音節区間候補列S0−S1−S2−S3から成る音節区間列0と
音節区間候補列S0−S1−S4から成る音節区間列1との2
通りの音節区間列が生成される。その際に、上述のよう
に音節区間列には信頼度が付加されており、音節区間列
0に付加された信頼度の方が音節区間列1に付加された
信頼度よりも高いものとする。 …第2図のステップS2 第4図に示す音節区間列0の各音節区間候補S0,S1,S
2,S3が単音認識部6で単音節認識され、その単音節認識
結果に基づいて第5図(a)に示すような音節ラティス
が生成される。同様にして、音節区間列1の各音節区間
候補S0,S1,S4が単音節認識され、その単音節認識結果に
基づいて第5図(b)に示すような音節ラティスが生成
される。この場合、音節区間列0に基づく音節ラティス
を音節ラティス0とし、音節区間列1に基づく音節ラテ
ィスを音節ラティス1とする。 …第2図のステップS3,ステップS4 第1位の音節ラティスである音節ラティス0が文節認
識部8に送出されて、音節ラティス0を構成する各音節
区間候補S0,S1,S2,S3に対応する音節候補が後に詳述す
るようにして選択されて文字列が作成される。すなわ
ち、まず各音節区間候補S0,S1,S2,S3における信頼度が
第1位の音節候補が選択されて累積信頼度が最も高い文
字列「はいてい」が作成される。以下、作成された文字
列の各文字が順次他の音節候補と取り替えられて文字列
が作成される。そして、文節認識用辞書9を照合して文
節認識用辞書9にない文字列や文法的に成立しない文字
列が除去されて、第6図に示すような文節候補が得られ
る。 ここで、第6図における候補順位は、その文節候補を
構成する音節候補列の累積信頼度の大きい順である。ま
た、第6図においては、累積信頼度が最も高い文字列
「はいてい」が文節認識用辞書9にはないので、文字列
「はいてい」における音節区間候補S0に対応する文字
「は」が信頼度が第2位の音節候補の文字「か」と取り
替えられて作成された文字列「かいてい」が、候補順位
1位の文節候補として得られている。 …第2図のステップS5 さらに、生成された総ての音節ラティス、すなわち、
音節ラティス0および音節ラティス1が単語認識部10に
送出され、単語認識用辞書11が上述のようにして照合さ
れて単語認識が実行される。この場合には、単語認識用
辞書11の辞書項目「かいて」を構成する音節/か/,/い
/および/て/の総てが音節ラティス1の音節候補群の
中に在るので、単語候補として「かいて」が音節ラティ
ス番号“1"と対応付けて得られる。同様にして、辞書項
目「かいけい」を構成する音節の総てが音節ラティス0
の音節候補群の中に在るので単語候補「かいけい」が音
節ラティス番号“0"と対応付けて得られる。 以下同様にして、単語候補の文字列と音節ラティス番
号とが対応付けて得られ、第7図に示すような単語候補
が得られるのである。第7図における候補順位は、その
単語候補を構成する音節候補列の累積信頼度の大きい順
である。 …第2図のステップS6 こうして得られた、文節候補および単語候補の認識候
補が表示部12に表示される。第8図は、その際における
表示方法の一例を示す。表示部12に2つのウインドウ2
1,22をオープンし、その一方のウインドウ21に単語認識
結果(単語候補)を表示する一方、他方のウインドウ22
に文節認識結果(文節候補)を表示するのである。 …第2図のステップS7 そして、第8図の表示内容に従って、認識候補を選択
する場合には例えば次のようにして行う。すなわち、1
つのウインドウ内の認識候補の選択にはキーボード13の
「↓」,「↑」等のキーを用い、ウインドウの選択の場
合には「→」,「←」等のキーを用いる。 このように、文節認識処理と単語認識処理とを併用す
ることによって、文節等の超大語彙での認識が可能とな
ると共に、その際に単語認識用辞書11に登録されていな
いために単語認識部10において認識できなかった単語
「はいけい」が文節認識部8で認識されるので、キーボ
ード13による選択と確定によって所望の認識結果を得る
ことができるのである。 …第2図のステップS8,ステップS9 次に、上記確定された単語「はいけい」は、上述のよ
うに文節認識部8による認識によって得られたものであ
る。すなわち、単語「はいけい」は単語認識用辞書11に
登録されてはいないのである。そこで、次に単語「はい
けい」が音声入力された場合には単語認識部10による単
語認識によって精度よく認識できるように、単語「はい
けい」を単語認識用辞書11に登録するのである。 その際に、認識結果を総て単語認識用辞書11に登録す
るメモリにおける辞書容量が膨大なものとなってしま
う。そこで、第9図に例示するような登録判定ルールに
おける各条件を満たすような認識困難な単語等のみを登
録するのである。本実施例における上記条件は、認識が
困難であると考えられる母音連鎖や母音−半母音(w:わ
行の子音、j:や行の子音)連鎖を含む文節等が選出され
るように設定してある。 上記単語「はいけい」の場合には、音節数が“4"であ
り、有声音連鎖を含み、文節認識結果における候補順位
が2位以下であるので、登録判定ルールにおける条件
,,を満たす。したがって、単語「はいけい」は
単語認識用辞書11に自動的に登録されるのである。 すなわち、次に単語「はいけい」が音声入力された場
合には単語認識部10による単語認識によって精度よく認
識されるのである。 …第2図のステップS10 上述のように、本実施例においては、入力された音声
の音声信号に基づいて音節区間抽出部3によって音節区
間列を生成する。そして、この生成された音節区間列毎
に、単音節認識部6によって単音節認識を行って各音節
区間列に対応する音節ラティスを生成する。その後、信
頼度が第1位の音節ラティスに対しては文節認識部8に
よって文節認識処理を実行すると共に、総ての音節ラテ
ィスに対して単語認識処理を実行する。そして、表示部
12に上記文節認識処理によって得られた文節候補および
単語認識処理によって得られた単語候補を表示し、この
表示結果を参照してキーボード13によって所望の認識結
果を選択して確定する。 そして、こうして確定された認識結果が文節認識処理
によって得られた文節候補であって、かつ、その認識結
果が登録判定ルールの各条件を満たす場合には、その認
識結果を単語認識用辞書11に自動的に登録するのであ
る。 このように、文節認識部8による文節認識処理と単語
認識部10による単語認識処理とを併用し、文節認識処理
によって認識結果が得られた場合にはその認識結果を単
語認識用辞書11に自動的に登録することによって、以下
に述べるような効果が得られる。 すなわち、予め頻度の高い単語を単語認識用辞書11に
登録しておくことによって、単語認識用辞書11に登録さ
れた頻度の高い単語は単語認識処理によって精度よく認
識できる。また、入力されて確定された単語認識用辞書
11に登録されていない認識結果(単語等)を新たに単語
認識用辞書11に追加登録することによって単語認識用辞
書11の登録語数が増加し、更に多くの単語等を精度良く
認識できるのである。 一方、初めて入力された単語あるいは文節等は、単語
認識用辞書11に登録されていなくとも文節認識処理によ
って効率良く認識できるのである。 換言すれば、認識されて確定された認識結果を用いて
単語認識用辞書11の登録語数を自動的に増すことによっ
て、トップダウン処理で精度良く音声認識ができる単語
認識処理の充実を図る。そして、ボトムアップ処理によ
る文節認識処理との併用によって、超大語彙の音声を更
に高い認識率で認識するのである。 また、上記実施例においては、確定された認識結果を
単語認識用辞書11に登録する際に、判定ルール格納部14
に格納された登録判定ルールにおける各条件を満たすよ
うな認識結果のみを登録するようにしている。したがっ
て、例えば上記登録判定ルールを認識困難な認識結果を
選出するように設定しておけば、認識困難な単語等のみ
が単語認識用辞書11に登録されて、辞書の容量増加を必
要最小限に押さえることができるのである。 上記実施例においては、表示部12に文節候補および単
語候補を表示する際に仮名文字によって表示するように
しているが、単語認識用辞書11の登録内容に漢字表記を
追加しておき、漢字によって表示するようにしてもよ
い。
【発明の効果】
以上より明らかなように、請求項1に係る発明の音声
認識装置は、入力された音声を音節単位で識別し、この
識別結果に基づいて単語認識部および文節認識部で単語
認識用辞書および文節認識用辞書を照合して単語単位お
よび文節単位で音声を認識し、その認識結果を上記表示
手段に表示してその中の一つを最適な認識結果として認
識結果確定手段によって確定する。そして、上記認識結
果確定手段によって確定された上記文節認識部による認
識結果が、判定ルール格納部に格納された判定ルールの
条件を満たす場合に、上記文節認識部による認識結果を
上記単語認識用辞書に登録するので、認識結果に基づい
て上記辞書の内容を自ら拡張できる。 したがって、この発明によれば、音節を識別単位とし
て超大語彙の音声を更に高認識率で効率良く認識でき
る。 また、上記単語認識用辞書の容量がむやみに増加する
のを防止できる。すなわち、上記判定ルールとして認識
困難な認識結果を選出するようなルールを用いれば、認
識困難な単語等のみが単語認識用辞書に登録されて、最
小限の辞書容量で高認識率が得られる。
【図面の簡単な説明】
第1図はこの発明の音声認識装置における一実施例のブ
ロック図、第2図は音声認識処理動作のフローチャー
ト、第3図は切り出された音節区間候補の例を示す図、
第4図は生成された音節区間列の例を示す図、第5図は
生成された音節ラティスの例を示す図、第6図は得られ
た文節候補の例を示す図、第7図は得られた単語候補の
例を示す図、第8図は認識候補表示の一例を示す図、第
9図は登録判定ルールの一例を示す図である。 1……アナログ入力部、2……音声分析部、 3……音節区間抽出部、5……CPU、 6……単音節認識部、7……パターンメモリ、 8……文節認識部、9……文節認識用辞書、 10……単語認識部、11……単語認識用辞書、 12……表示部、13……キーボード、 14……判定ルール格納部。

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】入力された音声信号を音響分析して特徴パ
    ラメータに変換し、この特徴パラメータを所定の手法に
    よって音節単位で識別し、この識別結果に基づいて音声
    を認識する音声認識装置において、 上記音節単位の識別結果に基づいて、単語認識用辞書を
    照合して入力音声を単語単位で認識する単語認識部と、 上記音節単位の識別結果に基づいて、文節認識用辞書を
    照合して入力音声を文節単位で認識する文節認識部と、 上記単語認識部および文節認識部による認識結果を表示
    する表示手段と、 上記表示手段に表示された上記単語認識部および文節認
    識部による認識結果の中から一つの認識結果を、上記入
    力された音声信号に係る音声の最適な認識結果として確
    定する認識結果確定手段と、 上記文節認識部による認識結果を上記単語認識用辞書に
    登録すべきか否かを判定するための基準音節数を含む判
    定ルールを格納する判定ルール格納部と、 上記認識結果確定手段によって確定された上記文節認識
    部による認識結果が上記判定ルールを満たす場合に、上
    記文節認識部による認識結果を上記単語認識用辞書に登
    録する辞書登録手段を備えたことを特徴とする音声認識
    装置。
JP2155848A 1990-06-14 1990-06-14 音声認識装置 Expired - Fee Related JP2647234B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2155848A JP2647234B2 (ja) 1990-06-14 1990-06-14 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2155848A JP2647234B2 (ja) 1990-06-14 1990-06-14 音声認識装置

Publications (2)

Publication Number Publication Date
JPH0446398A JPH0446398A (ja) 1992-02-17
JP2647234B2 true JP2647234B2 (ja) 1997-08-27

Family

ID=15614826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2155848A Expired - Fee Related JP2647234B2 (ja) 1990-06-14 1990-06-14 音声認識装置

Country Status (1)

Country Link
JP (1) JP2647234B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TR200102364T2 (tr) * 1999-02-19 2002-06-21 Custom Speech Usa, Inc. Otomatikleştirilmiş transkripsiyon sistemi ve iki konuşma dönüştürme seferini ve bilgisayar-yardımlı düzeltme kullanan yöntem.
JP5277704B2 (ja) * 2008-04-24 2013-08-28 トヨタ自動車株式会社 音声認識装置及びこれを用いる車両システム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63153595A (ja) * 1986-12-17 1988-06-25 松下電器産業株式会社 音声文章入力装置
JP2955297B2 (ja) * 1988-05-27 1999-10-04 株式会社東芝 音声認識システム

Also Published As

Publication number Publication date
JPH0446398A (ja) 1992-02-17

Similar Documents

Publication Publication Date Title
US8185376B2 (en) Identifying language origin of words
JP2815579B2 (ja) 音声認識における単語候補削減装置
JP4269625B2 (ja) 音声認識辞書作成方法及びその装置と音声認識装置
JP2647234B2 (ja) 音声認識装置
JP2002278579A (ja) 音声データ検索装置
JPH0338699A (ja) 音声認識装置
JP4987530B2 (ja) 音声認識辞書作成装置および音声認識装置
JP3378547B2 (ja) 音声認識方法及び装置
JPS61122781A (ja) 音声ワ−ドプロセツサ
JPS6211731B2 (ja)
JP2755792B2 (ja) 音声認識装置
JPH049320B2 (ja)
WO2009147745A1 (ja) 検索装置
KR100404852B1 (ko) 언어모델적응기능을가진음성인식장치및그제어방법
JPH10232693A (ja) 音声認識装置
JPH11338498A (ja) 音声合成装置
JP2000099084A (ja) 音声認識方法及びその装置
JPS6325366B2 (ja)
JPH0632021B2 (ja) 日本語音声認識装置
JPS6211732B2 (ja)
JPS61121167A (ja) 区切り発声に基づく音声ワ−ドプロセツサ
JPH04232997A (ja) 音声認識装置における認識結果表示方式
KR20010077041A (ko) 트리구조의 언어모델을 갖는 연속 음성 인식 장치
JPH0573039B2 (ja)
JP2721341B2 (ja) 音声認識方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees