JP3066920B2 - 音声認識方法及び装置 - Google Patents

音声認識方法及び装置

Info

Publication number
JP3066920B2
JP3066920B2 JP3139092A JP13909291A JP3066920B2 JP 3066920 B2 JP3066920 B2 JP 3066920B2 JP 3139092 A JP3139092 A JP 3139092A JP 13909291 A JP13909291 A JP 13909291A JP 3066920 B2 JP3066920 B2 JP 3066920B2
Authority
JP
Japan
Prior art keywords
voice
standard pattern
difference
word
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP3139092A
Other languages
English (en)
Other versions
JPH04362699A (ja
Inventor
穆 櫻井
純一 田村
哲夫 小坂
広 松尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP3139092A priority Critical patent/JP3066920B2/ja
Publication of JPH04362699A publication Critical patent/JPH04362699A/ja
Priority to US08/371,494 priority patent/US5621849A/en
Application granted granted Critical
Publication of JP3066920B2 publication Critical patent/JP3066920B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L15/12Speech classification or search using dynamic programming techniques, e.g. dynamic time warping [DTW]
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、入力音声と、音声標準
パタンの相違度を求めて入力音声を認識する音声認識方
法及び装置に関するものである。
【0002】
【従来の技術】音声認識の手法として、例えば連続DP
法のような、音声区間の検出と認識処理とを同時に行う
ワードスポッティング法が提唱されている。
【0003】このワードスポッティング法は、スペクト
ル等の音声の特徴からなる単語標準パタンを1フレーム
ずつ入力音声に対してスライドさせながらマッチング処
理を行い、各標準パタンにおいてマッチング処理の演算
結果であるスコアが最小値をとる点により、その単語の
存在すると思われる区間が検出され、あとは全ての標準
パタンのスコアの最小値を比較して認識結果を得る方法
である。
【0004】
【発明が解決しようとしている課題】しかし、この従来
行われていたワードスポッティング法では、ある標準パ
タンを構成する音韻列が、より音韻数の多い他の標準パ
タンの音韻列の一部と完全に一致する場合には、原理的
に誤認識を避けられないという欠点がある。例えば、標
準パタンとして/ku/の他に/roku/がある場
合、入力音声が/roku/ならば、標準パタン/ku
/も標準パタン/roku/も入力音声の一部又は全部
と完全に一致するので、マッチング処理の結果、両パタ
ンは残りの標準パタンよりも高いスコアを示すが、入力
音声が正常に発声されている限り、両パタンの示すスコ
アに明確な差はなく、入力音声の僅かな変動により/r
oku/が第一位になったり、/ku/が第一位になっ
たるする。すなわち、従来例では、ワードスポッティン
グ法の原理的な欠陥により、入力音声が正常に発声され
ていても、誤認識を避けられないという欠点があった。
【0005】
【課題を解決するための手段】上記従来の課題を解決す
るために、本発明の音声認識装置は、音声標準パタンを
記憶する標準パタン記憶手段と、入力した音声情報と前
記標準パタン記憶手段に記憶されている音声標準パタン
とを比較し、正規化した結果に基づいて、前記音声情報
と前記音声標準パタンの相違度を求める演算手段と、前
記音声情報と前記音声標準パタンの相違度を、前記音声
情報の音声区間の長さに応じて修正する相違度修正手段
と、修正された前記相違度に基づいて前記音声情報の認
識候補を出力する認識候補判別手段とを有することを特
徴とする。上記従来の課題を解決するために、本発明の
音声認識方法は、音声標準パタンを記憶し、入力した音
声情報と記憶されている前記音声標準パタンとを比較
し、正規化した結果に基づいて、前記音声情報と前記音
声標準パタンの相違度を求め、前記音声情報と前記音声
標準パタンの相違度を、前記音声情報の音声区間の長さ
に応じて修正し、修正された前記相違度に基づいて前記
音声情報の認識候補を出力することを特徴とする。上記
従来の課題を解決するために、本発明の音声認識装置及
び方法は、音声情報の音声区間の長さが長いほど、相違
度を小さくするように修正することを特徴とする。上記
従来の課題を解決するために、本発明の音声認識装置及
び方法は、相違度をワードスポッティング方式を用いて
演算することを特徴とする。
【0006】上記課題を解決する為に、本発明は、音声
標準パタンを記憶し、音声情報を入力し、前記音声入力
する音声情報と前記音声標準パタンの相違度を演算し、
前記相違度に音声標準パタンの長さの重みを付加するこ
とを特徴とする音声認識方法を提供する。
【0007】上記課題を解決する為に、本発明は好まし
くは前記演算結果に付加する音声標準パタンの長さの重
みは、長さが長いほど相違度が小さくなるようにする。
【0008】上記課題を解決する為に、本発明は好まし
くは前記演算手段はワードスポッティングを用いる。
【0009】
【実施例】図1は本発明の一実施例を示すブロック図
で、1は音声の入力端子、2はA/D変換部、3は特徴
パラメータ分析部、4は認識部、5は認識部4が認識処
理の際使用する単語辞書、6は本発明に係わるスコア修
正部、7は補助記憶装置、8は認識結果の出力端子であ
る。
【0010】入力端子1より入力された音声は、A/D
変換部2でA/D変換された後分析部3においてフレー
ム周期10msで分析され、LPCケプストラム係数ベ
クトルの時系列に変換される。認識部4では、補助記憶
装置7を使いながら上記LPCケプストラム係数ベクト
ルの時系列と、単語辞書5に収納されている単語標準パ
タンとのマッチングを行う。本実施例においては、図2
に示す17個の単語の認識を目的とする例について述べ
るので、単語辞書5には、図2で示す17個の単語の標
準パタンが可変長で収納されている。なお、この単語辞
書5に格納しておけば、本発明の実施は、この17個の
単語に限るものではないとは言うまでもない。本実施例
は不特定話者対象の音声認識装置で、距離尺度としてマ
ハラノビス距離を使用するので、単語辞書5に格納され
る各単語標準パタンは、図3で示すように、複数話者の
発声した単語音声をフレーム周期10msで分析してL
PCケプストラム係数ベクトルに変換し、フレーム数を
正規化した後フレーム毎に平均ベクトルmiと分散共分
散行列Σ-1 jとを求めたものである。
【0011】ここで、従来から行われているワードスポ
ッティング法について説明する。
【0012】分析部3により生成された上記LPCケプ
ストラム係数ベクトルの時系列{xi}と単語辞書5内
の単語標準パタンとのマッチングが、認識部4によって
連続DPを用いた以下の手順で行われる。
【0013】まず、ワードスポッティングに用いる式を
示す。
【0014】
【外1】 但し、i:入力音声のフレーム番号 j:標準パタンのフレーム番号 xi:iフレームにおける入力ベクトル mi:jフレームにおける平均ベクトル Σ-1 j:jフレームにおける分散共分散行列
【0015】上記の式を用いて以下の手順でワードスポ
ッティングが行われる。なお、DPパスの形状は図4に
示すとおりである。1)式(1)に従い入力ベクトルx
iと標準パタンの平均ベクトルmjとのマハラノビス距離
d(i,j)を求める。 2)式(2)に従い、累積距離p(i,j)を求める。 3)式(3)に従い、最適経路長c(i,j)を求め
る。 4)1)から3)までを、単語標準パタンの先頭フレー
ムから最終フレームまで繰り返す。 5)式(4)により、入力ベクトルxiと、単語標準パ
タンとのDP値D(i)を求める。 但しJは、各単語標準パタンの最終フレーム番号を示
す。 6)1)から5)までを、入力音声の先頭フレームから
最終フレームまで繰り返す。 7)各単語標準パタン毎にDP値の最小値を求め、入力
音声に対する各単語標準パタンのスコアとする。
【0016】この単語区間の検出は、図5に示すよう
に、手順の(7)で説明した、各標準パタンのDP値D
(i)が最小値をとったところからバックトラックによ
りDPパスを決定することによって検出される。
【0017】ここまで述べた方法が従来のワードスポッ
ティング法であるが、本実施例ではこの従来の方法の原
理的な欠陥を改善するために、スコア修正部6において
検出された音声区間の長さを利用したスコアの修正を行
う。
【0018】図6は、横軸を時間、縦軸をスコアとし、
入力音声/roku/に対する単語標準パタンのマッチ
ングスコアを、ワードスポッティングにより決定された
単語区間と共に示したものであり、スコアの修正の行わ
れていない従来の方法である。リジェクトするか否かを
決定する閾値は、4.00であり、この値よりも小さな
スコアの単語がない場合は、リジェクトとする。図6に
よれば、単語標準パタン/roku/はワードスポッテ
ィングにより入力音声中から/roku/の音声区間を
正しく検出し、スコアも閾値以下の3.51を示してい
るにもかかわらず、単語標準パタン/ku/が入力音声
/roku/の一部/ku/とマッチングして第1位の
スコア3.34を示しているために、従来例では正解と
して/ku/が選択され、結果は誤認識になる。しか
し、ワードスポッティングの結果切り出された音声区間
に着目すると、音節数の多い単語標準パタン/roku
/の方が1音節の単語標準パタン/ku/より音声区間
長が長い。本実施例ではこの点に着目し、スコア第1位
の音声区間長を基準とし、第2位以下のスコアを各単語
標準パタンの検出した音声区間長に逆比例する方向で修
正する。即ち、検出した音声区間長の長いものほどスコ
アが良くなるように修正する。
【0019】図7のフローチャートにより、スコア修正
部6によるスコア修正処理の手順を説明する。但し、i
は補助変数、aは決定されたスコア修正係数、liは第
i位の音声区間長、cは音声区間長調整係数、diは第
i位の修正前スコア、d′iは第i位の修正後のスコア
を表し、補助記憶装置7を用いて処理が行われる。 S1)補助変数iに、数値2を設定する。 S2)スコア第1位の音声区間長liをスコア第i位の
音声区間長liと音声区間長調整係数cとの乗算結果で
除算し、結果をaに入れる。 S3)第i位のスコアdiに修正係数aを乗じ、結果を
d′iに入れる。 S4)補助係数iに数値1を加える。 S5)補助係数iが数値17より大きいかどうか調べ、
大きくなかったらS2に戻る。大きければ、処理を終了
する。
【0020】図8は、入力音声/roku/に対する認
識部4からの出力に対し、スコア修正部6が図7のフロ
ーチャートに基づき行った修正処理の結果を示してい
る。処理の詳細を図7のフローチャートに基づき説明す
る。ここで音声区間長調整係数cは、十分長い音声区間
を有する単語標準パタンのスコアを改善するために設け
たもので、ここではc=0.60とし、音声区間長がス
コア第1位のものの5/3以上の時スコア改善の効果が
現れるように設定されている。 S1)で、補助変数iに数値2を設定する。 S2)で、a=70/(165×0.60)より、修正
係数としてa=0.71を得る。 S3)で、d′2=3.51×0.71より、第2位に
対する修正スコアd′2を得る。
【0021】以下同様にして第3位以下の修正スコアを
計算すると図8の「修正後のスコア」欄で示す結果とな
り、スコア修正後の順位は、単語標準パタン/roku
/がスコア2.48で第1位である。この結果によりス
コア修正部6は、第1位のスコア2.48で第1位であ
る。この結果によりスコア修正部6は、第1位のスコア
を示す単語標準パタン/roku/の単語番号10を出
力端子9から出力して認識処理は完了する。即ち、従来
例での誤認識は本発明により防ぐことができる。
【0022】次に入力音声の音声区間長が短い例につい
て説明する。図9は、横軸を時間、縦軸をスコアとし、
入力音声/ku/に対する単語標準パタンのマッチング
スコアを、ワードスポッティングにより決定された単語
区間と共に示したものである。リジェクトの閾値はやは
り4.00である。図10によれば、単語標準パタン/
ku/はワードスポッティングにより入力音声中から/
ku/の音声区間を正しく検出し、スコアも閾値以下の
3.84を示している。このマッチング処理の結果に対
し、スコア修正部6が図7に示すフローチャートに従っ
て行ったスコア修正作業の結果を図10に示す。入力音
声の継続時間長が短いので、ワードスポッティングの結
果決定された音声区間長は何れも十分な長さを持たず、
修正後も第1位と第2位以下とのスコアの逆転は生じて
いない。即ち入力音声の音節数が多い場合に限り、音声
区間長を手掛かりとしたスコア修正の効力を発揮するこ
とになる。
【0023】また、ここまでは、不特定話者を対象とし
た音声認識装置について本発明の効果を説明したが、本
発明は特定話者対象の音声認識装置についても同様の効
果を発揮する。すなわち、図1における単語辞書5に収
納する単語標準パタンを図11に示す様に特定話者音声
のスペクトルを表すベクトル時系列とし、距離尺度とし
て(5)式で示すユークリッド距離や(6)式で示す市
街地距離を、(1)式で示すマハラノビス距離の代りに
使用すれば、第一の実施例とまったく同じ手順で特定話
者に対するワードスポッティング法の改善が実現でき
る。
【0024】
【外2】
【0025】また、先の説明では音声の特徴を表すパラ
メータとしてLPCケプストラス係数を使用したが、本
発明の効果は音声の特徴を表すパラメータであれば種類
の如何を問わず有効である事は明らかである。
【0026】
【発明の効果】以上説明したように、本発明によれば、
音声情報と音声標準パタンとを比較し、正規化した結果
に基づいて、音声情報と音声標準パタンの相違度を求
め、更にその相違度を音声情報の音声区間の長さに応じ
て修正し、修正された相違度に基づいて音声情報の認識
候補を出力することにより、正解の音声標準パタンより
も音韻列の短い音声標準パタンの方を認識してしまうと
いう従来のワードスポッティング法等に見られる欠点を
解決し、入力音声の認識率をより一層向上させることが
できる。以上説明したように、本発明によれば、好まし
くは音声区間の長さが長いほど、該音声区間に対応する
音声標準パタンの相違度を小さくするように修正するこ
とにより、単語の長さの違いが相違度に与える悪影響を
排除することができる。以上説明したように、本発明に
よれば、好ましくは相違度をワードスポッティング方式
を用いて演算することにより、音声区間の検出と認識を
同時に行え、効率的であるという利点を持つワードスポ
ッティングの弱点を排除した効率的で認識率の高い音声
認識を可能とする。
【図面の簡単な説明】
【図1】本発明を実施した音声認識装置のブロック図。
【図2】単語辞書に登録してある単語の一覧表例示図。
【図3】単語標準パタンの構成の第2の例示図。
【図4】DPパスの形状例示図。
【図5】音声区間検出を説明する為の図。
【図6】ワードスポッティングによる音声区間検出とス
コアを示す図。
【図7】音声区間長を利用したスコア補正の手順を示す
フローチャート。
【図8】スコア修正の結果を例示する図。
【図9】短い音声入力音声に対する音声区間検出とスコ
アを示す図。
【図10】短い入力音声に対するスコア修正の結果を例
示する図。
【図11】単語標準パタンの構成の第2の例示図。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 松尾 広 東京都大田区下丸子3丁目30番2号キヤ ノン株式会社内 (56)参考文献 特開 平4−281496(JP,A) 特開 平4−362698(JP,A) 特開 平4−115296(JP,A) 特開 昭63−147198(JP,A) 特開 平3−120598(JP,A) 特開 平1−262597(JP,A) 特開 昭61−26095(JP,A) 特許2804265(JP,B2) 特公 昭61−40120(JP,B2) 特公 昭56−823(JP,B2) 特公 昭55−40912(JP,B2) 日本音響学会昭和63年度春季研究発表 会講演論文集▲I▼ 2−2−1「不特 定話者向きの単語音声認識システムの検 討」p.53−54(昭和63年3月発行) 電子情報通信学会技術研究報告[音声 ]Vol.86,No.282,SP86−68, 「最適局所整合を用いた類似単語音声の 認識」p.55−58(1986年12月18日発 行) 日本音響学会誌 Vol.27,No. 9,「動的計画法を利用した音声の時間 正規化に基づく連続単語認識」p.483 −490(昭和46年9月10日発行) 古井「ディジタル音声処理」(1985− 9−25)東海大学出版会 p.176−177 (58)調査した分野(Int.Cl.7,DB名) G10L 15/00 - 17/00 JICSTファイル(JOIS)

Claims (6)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声標準パタンを記憶する標準パタン記
    憶手段と、 入力した音声情報と前記標準パタン記憶手段に記憶され
    ている音声標準パタンとを比較し、正規化した結果に基
    づいて、前記音声情報と前記音声標準パタンの相違度を
    求める演算手段と、 前記音声情報と前記音声標準パタンの相違度を、前記音
    声情報の音声区間の長さに応じて修正する相違度修正手
    段と、 修正された前記相違度に基づいて前記音声情報の認識候
    補を出力する認識候補判別手段とを有することを特徴と
    する音声認識装置。
  2. 【請求項2】 前記相違度修正手段は、前記音声情報の
    音声区間の長さが長いほど、前記相違度を小さくするよ
    うに修正することを特徴とする請求項1に記載の音声認
    識装置。
  3. 【請求項3】 前記演算手段は、前記相違度をワードス
    ポッティング方式を用いて演算することを特徴とする請
    求項1に記載の音声認識装置。
  4. 【請求項4】 音声標準パタンを記憶し、 入力した音声情報と記憶されている前記音声標準パタン
    とを比較し、正規化した結果に基づいて、前記音声情報
    と前記音声標準パタンの相違度を求め、 前記音声情報と前記音声標準パタンの相違度を、前記音
    声情報の音声区間の長さに応じて修正し、 修正された前記相違度に基づいて前記音声情報の認識候
    補を出力することを特徴とする音声認識方法。
  5. 【請求項5】 前記音声認識方法は更に、前記音声情報
    の音声区間の長さが長いほど、前記相違度を小さくする
    ように修正することを特徴とする請求項4に記載の音声
    認識方法。
  6. 【請求項6】 前記音声認識方法は更に、前記相違度を
    ワードスポッティング方式を用いて演算することを特徴
    とする請求項4に記載の音声認識方法。
JP3139092A 1991-06-11 1991-06-11 音声認識方法及び装置 Expired - Fee Related JP3066920B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP3139092A JP3066920B2 (ja) 1991-06-11 1991-06-11 音声認識方法及び装置
US08/371,494 US5621849A (en) 1991-06-11 1995-01-11 Voice recognizing method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3139092A JP3066920B2 (ja) 1991-06-11 1991-06-11 音声認識方法及び装置

Publications (2)

Publication Number Publication Date
JPH04362699A JPH04362699A (ja) 1992-12-15
JP3066920B2 true JP3066920B2 (ja) 2000-07-17

Family

ID=15237308

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3139092A Expired - Fee Related JP3066920B2 (ja) 1991-06-11 1991-06-11 音声認識方法及び装置

Country Status (2)

Country Link
US (1) US5621849A (ja)
JP (1) JP3066920B2 (ja)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3311460B2 (ja) * 1994-01-28 2002-08-05 富士通株式会社 音声認識装置
JP3397568B2 (ja) * 1996-03-25 2003-04-14 キヤノン株式会社 音声認識方法及び装置
JPH1097276A (ja) * 1996-09-20 1998-04-14 Canon Inc 音声認識方法及び装置並びに記憶媒体
JP3625002B2 (ja) * 1996-12-26 2005-03-02 株式会社リコー 音声認識装置
JP3962445B2 (ja) 1997-03-13 2007-08-22 キヤノン株式会社 音声処理方法及び装置
JPH10254486A (ja) 1997-03-13 1998-09-25 Canon Inc 音声認識装置および方法
US6017219A (en) * 1997-06-18 2000-01-25 International Business Machines Corporation System and method for interactive reading and language instruction
US6219407B1 (en) 1998-01-16 2001-04-17 International Business Machines Corporation Apparatus and method for improved digit recognition and caller identification in telephone mail messaging
US6327343B1 (en) 1998-01-16 2001-12-04 International Business Machines Corporation System and methods for automatic call and data transfer processing
JP2000047696A (ja) 1998-07-29 2000-02-18 Canon Inc 情報処理方法及び装置、その記憶媒体
US7447626B2 (en) 1998-09-28 2008-11-04 Udico Holdings Method and apparatus for generating a language independent document abstract
US7263484B1 (en) 2000-03-04 2007-08-28 Georgia Tech Research Corporation Phonetic searching
JP3728177B2 (ja) 2000-05-24 2005-12-21 キヤノン株式会社 音声処理システム、装置、方法及び記憶媒体
CN1272698C (zh) 2000-10-11 2006-08-30 佳能株式会社 信息处理装置、信息处理方法
JP2002268681A (ja) * 2001-03-08 2002-09-20 Canon Inc 音声認識システム及び方法及び該システムに用いる情報処理装置とその方法
JP3542578B2 (ja) * 2001-11-22 2004-07-14 キヤノン株式会社 音声認識装置及びその方法、プログラム
GB0224806D0 (en) * 2002-10-24 2002-12-04 Ibm Method and apparatus for a interactive voice response system
JP4476733B2 (ja) * 2004-07-30 2010-06-09 株式会社東芝 パターン評価方法、プログラムおよびパターン評価装置
US8700399B2 (en) * 2009-07-06 2014-04-15 Sensory, Inc. Systems and methods for hands-free voice control and voice search
CN104751856B (zh) * 2013-12-31 2017-12-22 ***通信集团公司 一种语音语句识别方法及装置
CN109785846B (zh) * 2019-01-07 2024-05-28 平安科技(深圳)有限公司 单声道的语音数据的角色识别方法及装置

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS58102298A (ja) * 1981-12-14 1983-06-17 キヤノン株式会社 電子機器
JPS5945583A (ja) * 1982-09-06 1984-03-14 Nec Corp パタンマッチング装置
JPS5997200A (ja) * 1982-11-26 1984-06-04 株式会社日立製作所 音声認識方式
US4712243A (en) * 1983-05-09 1987-12-08 Casio Computer Co., Ltd. Speech recognition apparatus
US4817159A (en) * 1983-06-02 1989-03-28 Matsushita Electric Industrial Co., Ltd. Method and apparatus for speech recognition
JPS59226400A (ja) * 1983-06-07 1984-12-19 松下電器産業株式会社 音声認識装置
US5131043A (en) * 1983-09-05 1992-07-14 Matsushita Electric Industrial Co., Ltd. Method of and apparatus for speech recognition wherein decisions are made based on phonemes
US4821325A (en) * 1984-11-08 1989-04-11 American Telephone And Telegraph Company, At&T Bell Laboratories Endpoint detector
CA1261472A (en) * 1985-09-26 1989-09-26 Yoshinao Shiraki Reference speech pattern generating method
US4885791A (en) * 1985-10-18 1989-12-05 Matsushita Electric Industrial Co., Ltd. Apparatus for speech recognition
US4856067A (en) * 1986-08-21 1989-08-08 Oki Electric Industry Co., Ltd. Speech recognition system wherein the consonantal characteristics of input utterances are extracted
JPH0760318B2 (ja) * 1986-09-29 1995-06-28 株式会社東芝 連続音声認識方式
JPH07104952B2 (ja) * 1989-12-28 1995-11-13 シャープ株式会社 パターンマッチング装置

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
古井「ディジタル音声処理」(1985−9−25)東海大学出版会 p.176−177
日本音響学会昭和63年度春季研究発表会講演論文集▲I▼ 2−2−1「不特定話者向きの単語音声認識システムの検討」p.53−54(昭和63年3月発行)
日本音響学会誌 Vol.27,No.9,「動的計画法を利用した音声の時間正規化に基づく連続単語認識」p.483−490(昭和46年9月10日発行)
電子情報通信学会技術研究報告[音声]Vol.86,No.282,SP86−68,「最適局所整合を用いた類似単語音声の認識」p.55−58(1986年12月18日発行)

Also Published As

Publication number Publication date
US5621849A (en) 1997-04-15
JPH04362699A (ja) 1992-12-15

Similar Documents

Publication Publication Date Title
JP3066920B2 (ja) 音声認識方法及び装置
US6125345A (en) Method and apparatus for discriminative utterance verification using multiple confidence measures
US5440662A (en) Keyword/non-keyword classification in isolated word speech recognition
US5692097A (en) Voice recognition method for recognizing a word in speech
US5613037A (en) Rejection of non-digit strings for connected digit speech recognition
JP2002507010A (ja) 同時に起こるマルチモード口述のための装置及び方法
JP3001037B2 (ja) 音声認識装置
US7072750B2 (en) Method and apparatus for rejection of speech recognition results in accordance with confidence level
JPH03201079A (ja) パターンマッチング装置
JP2955297B2 (ja) 音声認識システム
JP3119510B2 (ja) 音声認識装置
JP4391179B2 (ja) 話者認識システム及び方法
JP3100180B2 (ja) 音声認識方法
JP2980382B2 (ja) 話者適応音声認識方法および装置
JP3090204B2 (ja) 音声モデル学習装置及び音声認識装置
JPS6147999A (ja) 音声認識装置
JP2979912B2 (ja) 音声認識装置
JP2864506B2 (ja) パターンマッチング回路
JP3009962B2 (ja) 音声認識装置
JP2574242B2 (ja) 音声入力装置
JPH0247758B2 (ja)
JPH01185599A (ja) 音声認識装置
JPH11338492A (ja) 話者認識装置
JPS6247100A (ja) 音声認識装置
JPH0320759B2 (ja)

Legal Events

Date Code Title Description
A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 19991116

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20000418

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090519

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100519

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110519

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees