JP3473704B2 - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JP3473704B2
JP3473704B2 JP02738093A JP2738093A JP3473704B2 JP 3473704 B2 JP3473704 B2 JP 3473704B2 JP 02738093 A JP02738093 A JP 02738093A JP 2738093 A JP2738093 A JP 2738093A JP 3473704 B2 JP3473704 B2 JP 3473704B2
Authority
JP
Japan
Prior art keywords
word
voice
unit
recognition
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP02738093A
Other languages
English (en)
Other versions
JPH06222790A (ja
Inventor
浩明 小川
和夫 石井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP02738093A priority Critical patent/JP3473704B2/ja
Publication of JPH06222790A publication Critical patent/JPH06222790A/ja
Application granted granted Critical
Publication of JP3473704B2 publication Critical patent/JP3473704B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声を認識する場合に
用いて好適な音声認識装置に関する。
【0002】
【従来の技術】従来の音声認識装置は、大きく分けて、
発話者が発声した音声から、例えば単語(語彙)をワー
ドスポッティングする音声認識部と、音声認識部におけ
るワードスポッティングの結果得られた単語候補列を、
あらかじめ用意された、例えば構文情報などを用いて、
文単位で構文解析する解析部とから構成される。
【0003】このように構成される音声認識装置におい
ては、解析部が音声認識部にワードスポッティングする
単語を要求すると、音声認識部において、発話者が発声
した音声から、その単語がワードスポッティングされ、
解析部に出力される。解析部においては、構文情報を用
いて、音声認識部におけるワードスポッティングの結果
得られた単語候補列が文単位で構文解析される。
【0004】そして、その構文解析結果に基づいて、ワ
ードスポッティング結果としての単語候補列から、誤っ
た単語候補を除き、正しい文(文章)が得られるように
なされている。
【0005】
【発明が解決しようとする課題】ところで、従来の音声
認識装置では、解析部より音声認識部にワードスポッテ
ィング処理要求された単語数が多い場合、音声認識部
が、発話者の発話終了時までに、その単語すべてのスポ
ッティング処理を行うことができないときがあった。
【0006】従って、この場合、入力された音声に対す
る応答が遅れる課題があった。
【0007】そこで、音声認識部に、解析部よりワード
スポッティング処理要求のあった単語のうちの一部の単
語のスポッティング処理を保留させる方法がある。
【0008】しかしながら、この方法では、解析部が必
要とする単語のスポッティング処理が行われず、やはり
入力された音声に対する応答が遅れる場合があった。
【0009】本発明は、このような状況に鑑みてなされ
たものであり、装置の応答速度を向上させるものであ
る。
【0010】
【課題を解決するための手段】本発明の音声認識装置
は、音声を認識する認識手段としてのワードスポッティ
ング処理部4と、ワードスポッティング処理部4に、音
声中からの単語の音声認識処理を依頼するとともに、ワ
ードスポッティング処理部4の認識結果を解析し、音声
を理解する解析手段としての構文解析部5とを備え、構
文解析部5は、音声認識処理する優先度を単語に付加し
て、ワードスポッティング処理部4に供給し、ワードス
ポッティング処理部4は、音声認識処理する単語の単語
数を、単語の優先度または自身の音声認識処理能力に基
づいて変更し、単語の優先度に基づいて、音声中からの
単語の音声認識処理を行うことを特徴とする。
【0011】この音声認識装置は、音声の音声区間を検
出する検出手段としての音声区間検出部3をさらに備え
ることができ、ワードスポッティング処理部4に、音声
区間中と音声区間終了後とで、単語の優先度に基づい
て、音声中から音声認識する単語を変更させることがで
きる。
【0012】さらに、この音声認識装置は、構文解析部
5に、ワードスポッティング処理部4の認識結果の解析
結果に基づいて、単語の優先度を変更させることができ
る。
【0013】
【0014】
【作用】上記構成の音声認識装置においては、ワードス
ポッティング処理部4が、音声認識処理する単語の単語
数を、構文解析部5により付加された単語の優先度また
は自身の音声認識処理能力に基づいて変更し、さらに、
単語優先度に基づいて、音声中からの単語の音声認識
処理を行う。従って、入力された音声に対する応答処理
の迅速化を図ることができる。
【0015】ワードスポッティング処理部4に、音声区
間中と音声区間終了後とで、単語の優先度に基づいて、
音声中から音声認識する単語を変更させることができる
場合においては、例えば音声区間終了後には、優先度の
最も高い単語だけの音声認識処理を行うようにすること
ができるので、装置のリアルタイム性を向上させること
ができる。
【0016】構文解析部5に、ワードスポッティング処
理部4の認識結果の解析結果に基づいて、単語の優先度
を変更させることができる場合においては、入力された
音声に対する応答処理の迅速化をさらに図ることができ
る。
【0017】
【0018】
【実施例】図1は、本発明の音声認識装置を応用した外
部機器コントローラの一実施例の構成を示すブロック図
である。この外部機器コントローラにおいては、外部機
器操作部6に接続された、例えばAV機器などの外部機
器(図示せず)に対する操作を音声により行うことがで
きるようになされている。
【0019】即ち、音声入力部1は、入力された音声を
電気信号としての音声信号に変換し、さらにA/D変換
して、音声分析部2に出力する。音声分析部2は、音声
入力部1からの音声信号から、例えば線形予測係数など
の音声の特徴パラメータを1フレームごとに抽出し、音
声区間検出部3およびワードスポッティング処理部4に
時系列に出力する。
【0020】音声区間検出部3は、音声分析部2からの
特徴パラメータに基づいて、発話の開始されたフレーム
およびその終了したフレーム、即ち音声区間を検出し、
ワードスポッティング処理部4および構文解析部5に出
力する。
【0021】ワードスポッティング処理部4は、音声区
間検出部3で発話の開始されたフレームが検出される
と、入力された音声に対して、構文解析部5が単語の優
先度とともに出力した各単語のワードスポッティング
を、その単語の優先度に基づいて順次行い、そのワード
スポッティング結果を構文解析部5に出力する。
【0022】即ち、ワードスポッティング処理部4は、
音声区間検出部3で発話の開始されたフレームが検出さ
れると、まず内蔵する入力バッファ(図示せず)に音声
分析部2からの音声の特徴パラメータを順次記憶し、そ
の入力バッファに記憶された音声の特徴パラメータを1
フレーム分ずつ読み出す。そして、ワードスポッティン
グ処理部4は、構文解析部5が単語の優先度とともに出
力した各単語の標準パターンを、その各単語の優先度に
基づいて、内蔵する入力バッファより順次読み出した入
力パターンとしての特徴パラメータにマッチングさせ、
その結果得られたスコアが所定の閾値以上であった場
合、そのスコアと、マッチングした区間の始点および終
点を構文解析部5に出力する。
【0023】ここで、スコアとは、スポッティングした
単語の尤度を意味し、その値が大きいほど、スポッティ
ングした単語が確からしいものとする。
【0024】構文解析部5は、音声区間検出部3で発話
の開始されたフレームが検出される前までに、入力され
る音声の仮説(文章仮説)をたて、音声の解析の初期段
階で必要となる単語すべてに最も高い優先度を付加し、
ワードスポッティング処理部4に出力するとともに、ワ
ードスポッティング処理を要求する。
【0025】さらに、構文解析部5は、音声区間検出部
3で発話の開始されたフレームが検出された後、ワード
スポッティング処理部4から、ワードスポッティング処
理を要求した各単語のスコア、始点、および終点が供給
されると、そのスコア、もしくは始点から終点までの区
間長、並びに内蔵する構文辞書(図示せず)にあらかじ
め登録された構文情報に基づいて、入力された音声を解
析し、その解析結果に基づいて、新たな文章仮説をたて
る。
【0026】そして、構文解析部5は、新たな文章仮説
を解析するために必要となった単語に優先度を付加し、
ワードスポッティング処理部4に出力する。
【0027】なお、この場合、単語の優先度は、構文解
析部5における文章仮説の検索(選択)方法に基づい
て、単語に付加される。即ち、構文解析部5において、
例えばbest-first法により、構文解析が行われている場
合には、確信度の高い文章仮説に関連する単語ほど、よ
り高い優先度が付加される。
【0028】構文解析部5は、音声区間検出部3で発話
の終了したフレームが検出された後、自身の構文解析結
果に基づいて、ワードスポッティング結果としての単語
候補列から、誤った(誤っていると思われる)単語候補
を除き、正しい(正しいと思われる)文(文章)を得る
と、それを外部機器操作部6に出力する。
【0029】外部機器操作部6は、構文解析部5より出
力された文(文章)の内容に対応して、そこに接続され
た外部機器を操作する。
【0030】次に、その動作について説明する。まず音
声入力部1において、入力された音声が電気信号として
の音声信号に変換されてA/D変換され、音声分析部2
に出力される。音声分析部2において、音声入力部1か
らの音声信号から、1フレームごとの音声の特徴パラメ
ータが抽出され、音声区間検出部3およびワードスポッ
ティング処理部4に出力される。
【0031】音声区間検出部3においては、音声分析部
2からの音声の特徴パラメータに基づいて、発話の開始
されたフレームおよびその終了したフレーム、即ち音声
区間が検出され、ワードスポッティング処理部4および
構文解析部5に出力される。
【0032】同時に、構文解析部5では、音声区間検出
部3で発話の開始されたフレームが検出される前まで
に、入力される音声の文章仮説がたてられ、音声の解析
の初期段階で必要となる単語すべてに最も高い優先度が
付加されて、ワードスポッティング処理部4に出力され
る。
【0033】そして、ワードスポッティング処理部4に
おいては、入力された音声に対して、構文解析部5が単
語の優先度とともに出力した各単語のワードスポッティ
ングが、例えば図2に示すフローチャートにしたがって
行われる。
【0034】即ち、ワードスポッティング処理部4で
は、まずステップS1において、構文解析部5より出力
された(構文解析部5からワードスポッティング処理要
求(検索要求)のあった)単語すべての数を示す変数W
に0がセットされることにより初期化され、ステップS
2に進む。ステップS2において、構文解析部5より出
力された(構文解析部5からワードスポッティング処理
要求(検索要求)のあった)単語すべての数が変数Wに
セットされ、ステップS3に進み、音声区間検出部3で
発話の開始されたフレームが検出されたか否かが判定さ
れる。
【0035】ステップS3において、音声区間検出部3
で発話の開始されたフレームが検出されていないと判定
された場合、ステップS2に戻り、ステップS3で音声
区間検出部3により発話の開始されたフレームが検出さ
れたと判定されるまで、ステップS2およびS3の処理
を繰り返す。
【0036】ステップS3において、音声区間検出部3
で発話の開始されたフレームが検出されたと判定された
場合、即ち音声入力部1に音声の入力が開始された場
合、ステップS4に進み、ワードスポッティング処理部
4がワードスポッティング処理する単語数Nを示す変数
Nに、変数Wに記憶された値(音声区間検出部3で発話
の開始されたフレームが検出される前までに、構文解析
部5よりワードスポッティング処理部4に処理要求のあ
った単語数W)がセットされ、ステップS5に進む。
【0037】ステップS5において、音声分析部2から
出力され、ワードスポッティング処理部4の内蔵する入
力バッファに既に記憶されている音声の特徴パラメータ
が1フレーム分だけ読み出され、ステップS6に進み、
ワードスポッティング処理部4の内蔵する入力バッファ
にデータ(音声分析部2より出力される音声の特徴パラ
メータ)が残っているか否かが判定される。ステップS
6において、ワードスポッティング処理部4の内蔵する
入力バッファにデータが残っていると判定された場合、
ステップS7に進み、ワードスポッティング処理部4が
ワードスポッティング処理する単語数Nを示す変数Nが
1だけデクリメントされ、ステップS8に進む。
【0038】一方、ステップS6において、ワードスポ
ッティング処理部4の内蔵する入力バッファにデータが
残っていないと判定された場合、ステップS7をスキッ
プして、ステップS8に進み、構文解析部5が単語の優
先度とともに出力した単語の標準パターンのうち、優先
度の高い順にN個の単語の標準パターンが、内蔵する入
力バッファより時系列に読み出された入力パターンとし
ての特徴パラメータに順次マッチングされ、その結果得
られたスコアが所定の閾値以上であった場合、スコア、
始点および終点が、ワードスポッティング処理部4の内
蔵する出力バッファ(図示せず)に供給されて記憶され
る。
【0039】即ち、ステップS8においては、構文解析
部5が単語の優先度とともに出力した単語のうち、優先
度の高いN個の単語がワードスポッティングされる。
【0040】ステップS8のワードスポッティング処理
の後、ステップS9に進み、ワードスポッティング処理
部4の内蔵する入力バッファにデータ(音声分析部2よ
り出力される音声の特徴パラメータ)が残っているか否
かが判定される。ステップS9において、ワードスポッ
ティング処理部4の内蔵する入力バッファにデータが残
っていないと判定された場合、ステップS10に進み、
ワードスポッティング処理部4がワードスポッティング
処理する単語数Nを示す変数Nが1だけインクリメント
され、ステップS11に進む。
【0041】一方、ステップS9において、ワードスポ
ッティング処理部4の内蔵する入力バッファにデータが
残っていると判定された場合、ステップS10をスキッ
プして、ステップS11に進み、構文解析部5から新た
なワードスポッティング処理要求(検索要求)があれ
ば、その要求のあった単語の数が変数Wに加算され、ス
テップS12に進む。
【0042】ステップS12において、ワードスポッテ
ィング処理部4の内蔵する出力バッファにワードスポッ
ティング結果としてのスコア、始点、および終点が記憶
されていれば、それが構文解析部5に供給され、ステッ
プS13に進み、音声区間検出部3で発話の終了したフ
レームが検出されたか否かが判定されるとともに、ワー
ドスポッティング処理部4の内蔵する入力バッファが空
であるか否かが判定される。
【0043】ステップS13において、音声区間検出部
3で発話の終了したフレームが検出されていないと判定
されるか、またはワードスポッティング処理部4の内蔵
する入力バッファが空でないと判定された場合、ステッ
プS5に戻り、再びステップS5からの処理を繰り返
す。
【0044】ステップS13において、音声区間検出部
3で発話の終了したフレームが検出されたと判定され、
且つワードスポッティング処理部4の内蔵するバッファ
が空であると判定された場合、図3に示すステップS2
1に進み、今までに構文解析部5からワードスポッティ
ング処理の依頼のあった単語の中で、まだワードスポッ
ティング処理が行われていない単語のうち、優先度の最
も高い単語の数が、変数Nにセットされ、ステップS2
2に進む。
【0045】ステップS22において、入力の終了した
音声全体に対して、構文解析部5から今までにワードス
ポッティング処理の依頼のあった単語の中で、まだワー
ドスポッティング処理が行われていない単語のうち、優
先度の最も高いN個の単語のワードスポッティング処理
が行われ、ステップS23に進み、ステップS22での
ワードスポッティング処理結果(スコア、始点、および
終点)が構文解析部5に出力され、ステップS24に進
む。
【0046】ステップS24において、変数Wから変数
Nが減算され、その減算値が変数Wにセットされ、ステ
ップS25に進む。即ち、ステップS24において、今
までに構文解析部5からワードスポッティング処理の依
頼のあった単語の中で、まだワードスポッティング処理
が行われていない単語の数から、ステップS22でワー
ドスポッティング処理が行われた単語の数が減算され、
ステップS25に進む。
【0047】ステップS25において、構文解析部5か
ら新たなワードスポッティング処理要求(検索要求)が
あれば、その要求のあった単語の数が変数Wに加算さ
れ、ステップS26に進み、構文解析部5からのワード
スポッティング処理要求(検索要求)が終了したか否か
が判定されるとともに、変数Wが0であるか否かが判定
される。
【0048】ステップS26において、構文解析部5か
らのワードスポッティング処理要求(検索要求)が終了
していないと判定されるか、または変数Wが0でないと
判定された場合、ステップS21に戻り、再びステップ
S21からの処理を繰り返す。
【0049】ステップS26において、構文解析部5か
らのワードスポッティング処理要求(検索要求)が終了
したと判定され、且つ変数Wが0であると判定された場
合、処理を終了する。
【0050】一方、構文解析部5では、ワードスポッテ
ィング処理部4から、ワードスポッティング処理を要求
した各単語のスコア、始点、および終点が供給される
と、そのスコア、もしくは始点から終点までの区間長、
並びに内蔵する構文辞書にあらかじめ登録された構文情
報に基づいて、入力された音声が解析され、その解析結
果に基づいて、新たな文章仮説がたてられるとともに、
その新たな文章仮説を解析するために必要となった単語
に、上述したようにして優先度が付加され(以前にワー
ドスポッティング処理の要求をした単語については、そ
の優先度が変更され)、ワードスポッティング処理部4
に出力される。
【0051】そして、構文解析部5においては、音声区
間検出部3で発話の終了したフレームが検出された後、
自身の構文解析結果に基づいて、ワードスポッティング
結果としての単語候補列から、誤った(誤っていると思
われる)単語候補が除かれ、正しい(正しいと思われ
る)文(文章)が得られると、それが外部機器操作部6
に出力される。
【0052】外部機器操作部6においては、構文解析部
5より出力された文(文章)の内容に対応して、そこに
接続された外部機器が操作される。即ち、外部機器操作
部6に接続された外部機器が、例えばAV機器であり、
構文解析部5より出力された文(文章)が、例えば”C
D再生”であった場合、外部機器動作部6において、C
Dの再生が開始されるように、AV機器が操作される。
【0053】以上のように、音声の入力中においては
(ステップS1乃至S13)、ワードスポッティング処
理部4の内蔵する入力バッファにデータ(音声の特徴パ
ラメータ)が残っており、ワードスポッティング処理部
4における処理が遅れている場合、ワードスポッティン
グ処理する単語数Nが減少され(ステップS7)、ま
た、ワードスポッティング処理部4の内蔵する入力バッ
ファが空で、ワードスポッティング処理部4における処
理に余裕がある場合、ワードスポッティング処理する単
語数Nが増加され(ステップS10)、ワードスポッテ
ィング処理部4において、構文解析部5からワードスポ
ッティング処理の依頼のあった単語のうち、優先度の高
い順にN個の単語のワードスポッティング処理が行われ
る(ステップS8)。
【0054】また、音声の入力の終了後においては(ス
テップS21乃至S26)、ワードスポッティング処理
部4において、構文解析部5からワードスポッティング
処理の依頼のあった単語のうち、優先度の最も高い単語
のグループから順次ワードスポッティング処理される。
【0055】従って、ワードスポッティング処理部4に
おいては、優先度の高い単語、即ち構文解析部5で構文
解析を行うのにより必要な単語から、順次ワードスポッ
ティング処理が行われるので、発話者の発話に対するレ
スポンスを向上させることができる。
【0056】さらに、ワードスポッティング処理部4の
処理能力に対応して、ワードスポッティング処理する単
語数を変更するようにしたので、ワードスポッティング
処理部4がリアルタイムで処理することのできる数を越
えた単語が、構文解析部5から与えられても、迅速に処
理を行うことができる。
【0057】以上、本発明の音声認識装置を、外部機器
コントローラに適用した場合について説明したが、本発
明は、外部機器コントローラの他、音声を認識するあら
ゆる装置に適用することができる。
【0058】なお、本実施例では、ワードスポッティン
グ処理部4におけるワードスポッティングの方法につい
ては言及しなかったが、ワードスポッティング処理部4
においては、例えば、例えばDPマッチング法やHMM
法、特開昭60−249198、特開昭60−2491
99、または特開昭60−252396などに開示され
ている音声認識装置の音声認識アルゴリズムなど、あら
ゆる音声認識アルゴリズムに基づいて、ワードスポッテ
ィング処理するようにすることができる。
【0059】さらに、本実施例においては、音声分析部
2で、音声から、線形予測係数を音声の特徴パラメータ
として抽出するようにしたが、これに限られるものでは
ない。即ち、音声分析部2では、音声から、例えば所定
の周波数帯域幅ごとのパワーやケプストラム係数、パー
コール係数、フォルマント、ゼロクロス数などのあらゆ
る特徴パラメータを抽出するようにすることができる。
【0060】
【発明の効果】請求項1に記載の音声認識装置によれ
ば、認識手段が、音声認識処理する単語の単語数を、
析手段により付加された単語の優先度または自身の音声
認識処理能力に基づいて変更し、さらに、単語優先度
に基づいて、音声中からの単語の音声認識処理を行う。
従って、入力された音声に対する応答処理の迅速化を図
ることができる。
【0061】請求項2に記載の音声認識装置によれば、
認識手段に、音声区間中と音声区間終了後とで、単語の
優先度に基づいて、音声中から音声認識する単語を変更
させる。従って、例えば音声区間終了後には、優先度の
最も高い単語だけの音声認識処理を行うようにすること
ができるので、装置のリアルタイム性を向上させること
ができる。
【0062】請求項3に記載の音声認識装置によれば、
解析手段に、認識手段の認識結果の解析結果に基づい
て、単語の優先度を変更させるので、入力された音声に
対する応答処理の迅速化をさらに図ることができる。
【0063】
【図面の簡単な説明】
【図1】本発明の音声認識装置を応用した外部機器コン
トローラの一実施例の構成を示すブロック図である。
【図2】図1の実施例のワードスポッティング処理部4
の動作を説明するフローチャートである。
【図3】図2のフローチャートに続くフローチャートで
ある。
【符号の説明】
1 音声入力部 2 音声分析部 3 音声区間検出部 4 ワードスポッティング処理部 5 構文解析部 6 外部機器操作部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平1−255925(JP,A) 特開 平6−161488(JP,A) 特開 平3−177899(JP,A) 特開 昭63−165900(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 15/28 JICSTファイル(JOIS)

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声を認識する認識手段と、 前記認識手段に、前記音声中からの単語の音声認識処理
    を依頼するとともに、前記認識手段の認識結果を解析
    し、前記音声を理解する解析手段とを備え、 前記解析手段は、音声認識処理する優先度を前記単語に
    付加して、前記認識手段に供給し、 前記認識手段は、音声認識処理する単語の単語数を、前
    記単語の優先度または自身の音声認識処理能力に基づい
    て変更し、前記単語の優先度に基づいて、前記音声中か
    らの前記単語の音声認識処理を行うことを特徴とする音
    声認識装置。
  2. 【請求項2】 前記音声の音声区間を検出する検出手段
    をさらに備え、 前記認識手段は、前記音声区間中と前記音声区間終了後
    とで、前記単語の優先度に基づいて、前記音声中から音
    声認識する単語を変更することを特徴とする請求項1に
    記載の音声認識装置。
  3. 【請求項3】 前記解析手段は、前記認識手段の認識結
    果の解析結果に基づいて、前記単語の優先度を変更する
    ことを特徴とする請求項に記載の音声認識装置。
JP02738093A 1993-01-22 1993-01-22 音声認識装置 Expired - Lifetime JP3473704B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP02738093A JP3473704B2 (ja) 1993-01-22 1993-01-22 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP02738093A JP3473704B2 (ja) 1993-01-22 1993-01-22 音声認識装置

Publications (2)

Publication Number Publication Date
JPH06222790A JPH06222790A (ja) 1994-08-12
JP3473704B2 true JP3473704B2 (ja) 2003-12-08

Family

ID=12219449

Family Applications (1)

Application Number Title Priority Date Filing Date
JP02738093A Expired - Lifetime JP3473704B2 (ja) 1993-01-22 1993-01-22 音声認識装置

Country Status (1)

Country Link
JP (1) JP3473704B2 (ja)

Also Published As

Publication number Publication date
JPH06222790A (ja) 1994-08-12

Similar Documents

Publication Publication Date Title
US6185530B1 (en) Apparatus and methods for identifying potential acoustic confusibility among words in a speech recognition system
JP3004883B2 (ja) 終話検出方法及び装置並びに連続音声認識方法及び装置
JP4414088B2 (ja) 音声認識において無音を使用するシステム
US20050021330A1 (en) Speech recognition apparatus capable of improving recognition rate regardless of average duration of phonemes
US20060009965A1 (en) Method and apparatus for distribution-based language model adaptation
JPH0968994A (ja) パターンマッチングによる単語音声認識方法及びその方法を実施する装置
US20080262843A1 (en) Speech recognition apparatus and method
JP2002215187A (ja) 音声認識方法及びその装置
KR101122591B1 (ko) 핵심어 인식에 의한 음성 인식 장치 및 방법
JP2996019B2 (ja) 音声認識装置
JP3473704B2 (ja) 音声認識装置
CN112820281B (zh) 一种语音识别方法、装置及设备
JP3440840B2 (ja) 音声認識方法及びその装置
JPH06266386A (ja) ワードスポッティング方法
JPH1124693A (ja) 音声認識装置
JPH07230293A (ja) 音声認識装置
JP3114389B2 (ja) 音声認識装置
JP2921059B2 (ja) 連続音声認識装置
JP2880436B2 (ja) 音声認識装置
JP3315565B2 (ja) 音声認識装置
JP2905686B2 (ja) 音声認識装置
JP3061292B2 (ja) アクセント句境界検出装置
JP3063855B2 (ja) 音声認識におけるマッチング距離値の極小値探索方法
JP2731133B2 (ja) 連続音声認識装置
JPH09212190A (ja) 音声認識装置及び文認識装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20030821

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080919

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090919

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090919

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100919

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110919

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120919

Year of fee payment: 9