JP2559031B2 - 音声認識方式 - Google Patents

音声認識方式

Info

Publication number
JP2559031B2
JP2559031B2 JP61205463A JP20546386A JP2559031B2 JP 2559031 B2 JP2559031 B2 JP 2559031B2 JP 61205463 A JP61205463 A JP 61205463A JP 20546386 A JP20546386 A JP 20546386A JP 2559031 B2 JP2559031 B2 JP 2559031B2
Authority
JP
Japan
Prior art keywords
recognition
pattern data
registered
voice
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP61205463A
Other languages
English (en)
Other versions
JPS6361300A (ja
Inventor
敏 奥山
知善 竹林
俊宏 浅見
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP61205463A priority Critical patent/JP2559031B2/ja
Publication of JPS6361300A publication Critical patent/JPS6361300A/ja
Application granted granted Critical
Publication of JP2559031B2 publication Critical patent/JP2559031B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Description

【発明の詳細な説明】 〔概要〕 特定話者、離散単語の音声認識方式において、音声の
特徴のみから認識を行う場合必ずしも高い認識率を得る
ことができないが、各単語を使用頻度に基づく優先度を
付して登録し、認識時、音声の特徴に使用頻度を加味し
て認識を行うことによって、より認識率を向上させる。
〔産業上の利用分野〕
本発明は音声を認識する方式に係り、特に特定話者の
離散単語による音声認識の認識率を向上させることがで
きる音声認識方式に関する。
〔従来の技術〕
音声認識技術の実用化が多くの分野で進められている
が、特に装置の小型化と認識率の向上とが強く要求され
ている。各方式のなかで最も認識率が高く小型化にも適
したものとして実用化が進んでいるのが、特定話者、離
散単語による音声認識方式である。
この音声認識方式はその音声を認識すべき特定の話者
にいくつかの離散単語の音声を発生させ、この音声を分
析して特徴を抽出して登録しておき、認識時、同じ話者
が発声した離散単語の音声の特徴と予め登録してある音
声の特徴とを比較して、最も近いと判定されたものを認
識結果とするものである。
この音声認識方式では一般にかなり高い認識率が得ら
れるが、それでも100%の認識率を得ることは困難であ
り、特に認識装置が実際に使用される環境条件によっ
て、あるいは同じ話者でも音声の変化闘に基づいて認識
率が低下する。この音声認識方式のアルゴリズムで、音
声の特徴だけから認識率を上げることには限界があり、
そのため何等かの別の手段を加味することによって、よ
り高い、100%に近い認識率を得ることができる音声認
識方式が要望されている。
第4図は従来の離散単語、特定話者の音声認識方式を
示したのである。第4図において、1は音声入力端子を
示している。2は特徴抽出部であって、入力音声を多数
の帯域に分割して周波数分析を行う等の周囲の手法で音
声の特徴を抽出して、それぞれの帯域ごとのパラメータ
をパターン化する。音声登録時には抽出された音声の特
徴パターンは、経路aを経て標準パターンデータ格納部
3に送られる。標準パターンデータ格納部3はメモリか
らなり、入力された音声の特徴パターンに例えば番号等
のデータを付して、標準パターンとして格納する。
音声認識時においては、音声入力端子1に入力された
音声入力は特徴抽出部2において同様にして特徴を抽出
され、抽出された特徴パターンは経路bを経て照合部4
に加えられる。照合部4においては、入力された音声の
特徴パターンと標準パターンデータ格納部3から読み出
された標準パターンとについて、周知のDP(Dynamic Pr
ograming)マッチング等の手法でパラメータごとにその
距離を計算し、入力パターンとの距離が最も近い標準パ
ターンについて、これを示す番号等を認識結果出力端子
5において認識結果出力を出力する。
このように従来の特定話者、離散単語による音声認識
方式においては、音声の特徴の情報のみによって認識を
行っていた。そのため、音声認識装置が使用される環境
によっては、音声情報が歪んで正しく特徴抽出が行われ
ないことがあり、そのため音声認識率が低下することを
避けられなかった。例えばオフィス等において使用する
場合には、周囲の騒音等の影響で認識率は大きく低下す
る。また使用環境以外に認識方式自体の原因によって生
じる誤差もあり、これらのため、認識率の向上には限界
があるという問題が生じていた。
〔発明が解決しようとする課題〕
本発明の目的は音声情報の他に使用頻度の情報を補助
的に用いて音声認識結果の判別を行なうことにより音声
認識率の高い音声認識方式を提供することにある。
〔課題を解決するための手段〕
第1図の原理的構成図に示すように、特定話者の離散
単語の特徴パターンを特徴抽出部(2)で抽出し、抽出
された特徴パターンを標準パターンデータ格納部(3)
に登録し、話者の音声から抽出された特徴パターンを標
準パターンデータ格納部(3)の特徴パターンと照合部
(4)で照合して最も距離の近い単語を示す情報を認識
結果として出力する音声認識方式において、標準パター
ンデータ格納部(3)における標準パターンを使用頻度
に応じた優先度を付して登録するとともに、使用頻度判
定部(6)と、認識判定部(7)とを具える。
使用頻度判定部(6)は、照合部(4)において距離
が近いと判定された単語が2つ以上あったとき標準パタ
ーンデータ格納部(3)における優先度の最も高い単語
を判定する。
認識判定部(7)は、照合部(4)において距離が近
いと判定された単語が1つだけのときはこれを示す情報
を認識結果として出力し、2つ以上あったときは使用頻
度判定部(6)において優先度が高いと判定された単語
を示す情報を認識結果として出力する。
また標準パターンデータ格納部(3)における使用頻
度に基づくデータ管理において、最大格納数のパターン
データが登録されていない場合は新たに登録されるパタ
ーンデータを最優先位置に登録し、最大格納数のパター
ンデータが登録されている場合は最下位データを削除し
て新たに登録されるパターンデータを最優先位置に登録
し、登録されているパターンデータが認識に使用された
ときは優先順位を1つ繰り上げた位置に該認識に使用さ
れたパターンデータを登録し直すことを特徴とする。
〔作用〕
音声認識の結果登録されている標準パターンとの距離
が近いと判定された単語が1つだけのときはこれを示す
情報を認識結果として出力するが、このような単語が2
つ以上あったときは、使用頻度が最も高い単語を判定し
てこれを示す情報を認識結果とするので、単語の音声情
報にその単語の使用頻度を加味して音声認識を行うこと
になり、認識率がより向上する。
〔実施例〕
第2図は本発明の一実施例を示し、第4図におけると
同じ部分は同じ番号で示されており、それらの動作もま
た同様である。6は使用頻度判定部、7は認識判定部で
あって、特徴抽出部2、標準パターンデータ格納部3、
照合部4、使用頻度判定部6、認識判定部7は音声認識
部10を構成している。音声認識部10は音声認識によって
ダイヤルを行う電話機における、音声認識装置を例示し
ている。11は処理装置(CPU)、12はセレクタ、13はス
イッチ、14は伝送路である。
音声登録時または音声認識時においては、CPU11はセ
レクタ12を経路a側に設定する。これによって音声登録
モードまたは音声認識モードとなる。
音声登録時においては、発声された音声入力は音声入
力端子1から特徴抽出部2に加えられ、第4図について
説明したのと同様にして特徴を抽出され、抽出された特
徴パターンは後述するような優先順位の指定に基づい
て、cの経路から標準パターンデータ格納部3において
標準パターンとして登録される。
音声認識時には、特徴抽出部2において抽出された音
声の特徴パターンをdの経路を経て照合部4に加え、標
準パターンデータ格納部3に登録されている各特徴パタ
ーンをeの経路で読み出してこれとの距離を求め、最も
距離の小さいパターンに対応する番号等をhの経路で認
識判定部7に送る。認識判定部7では、照合部4におけ
る照合結果得られた候補となるデータが1個だけのとき
は、これを認識結果としてkの経路でCPU11に送り、CPU
11はこのデータを解読して、例えばこの番号等に対応す
る電話番号でダイヤリングを行って相手方と接続された
とき、セレクタ12を経路b側に切り替えてmの経路でセ
レクタ12とスイッチ13を接続して音声入力端子1と伝送
路14とを接続し、音声を直接伝送路14に送って通話でき
るようにする。
また照合部4での照合結果、いずれも距離が小さくて
候補となるべきデータが2個以上あったときは、認識判
定部7はiの経路で使用頻度判定部6にその情報を与
え、使用頻度判定部6はf,gの経路で標準パターンデー
タ格納部3に照会して、標準パターンデータ格納部3に
おける優先順位が最も高いデータ(すなわち使用頻度が
最も高いデータ)を判定して、判定結果をjの経路で認
識判定部7に返す。認識判定部7はこの番号等を認識結
果としてCPU11へ渡し、これによって以後ダイヤリング
等の処理が同様にして行われる。
第3図は標準パターンデータ格納部7における使用頻
度に基づくデータ管理を説明するものであって、(1)
は登録時を示している。(a)はデータ数が最大格納数
に満たないときを示し、データ1〜4が登録されている
とき、新たに登録されるデータAがあったときは、最も
優先順位の高い位置に登録される。
(b)は最大格納数(例えば32個)のデータ1〜デー
タ32が既に格納されているときを示し、新たに登録した
データAは最も優先順位の高い位置に登録され、最下位
のデータ1は削除される。
(2)は認識時を示し、データ1〜データ32が登録さ
れているとき、例えばデータ9が認識に使用されたとき
は、優先順位を1つ繰り上げた位置に登録し直されるこ
とが示されている。
なおこの場合、認識されたものを直ちに優先度を上げ
るようにすると、誤認識が生じたとき優先度が乱れて誤
動作することになるので、認識結果が利用者によって正
しいと判断されるのを待って、すなわちダイヤルが行わ
れて正しく接続が行われたとき、CPU11から経路lを経
て使用頻度判定部6を制御して、データの優先度を上げ
るようにしている。
第2図に示されるような電話機においては、音声認識
ダイヤルが主として使用頻度の高い相手に対して使用さ
れることが多いが、本発明によれば音声情報の他に使用
頻度の情報を用いて認識結果を判定するため、より認識
率の高い音声認識を実現できることになる。
また第3図に説明されたような方法で標準データの管
理を行っているので、利用者にとって必要性の少ない、
あまり使用されないデータを自動的に削除できるという
効果もある。
〔発明の効果〕
以上説明したように本発明によれば、音声情報の他に
使用頻度の情報を補助的に用いて音声認識結果の判別を
行っているので、従来のような音声情報のみを用いて認
識を行う方法と比べて、より高い音声認識率を得ること
ができる。
【図面の簡単な説明】
第1図は本発明の音声認識方式の原理的構成を示す図、 第2図は本発明の一実施例としての音声認識方式のブロ
ック構成図 第3図は本発明の音声認識方式における使用頻度に基づ
くデータ管理を説明する図、 第4図は従来の特定話者、離散単語の音声認識方式を示
す図である。 1……音声入力端子 2……特徴抽出部 3……標準パターンデータ格納部 4……照合部 5……認識結果出力端子 6……使用頻度判定部 7……認識判定部 10……音声認識部 11……処理装置(CPU) 12……セレクタ 13……スイッチ 14……伝送路
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭57−209575(JP,A) 特開 昭60−172100(JP,A) 特開 昭60−8899(JP,A) 特開 昭57−66498(JP,A) 特開 昭62−206693(JP,A) 発明協会公開技報公技番号83−3134

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】特定話者の離散単語の特徴パターンを抽出
    する特徴抽出部と、該抽出された特徴パターンを登録す
    る標準パターンデータ格納部と、該話者の音声から抽出
    された特徴パターンを標準パターンデータ格納部の特徴
    パターンと照合して最も距離の近い単語を示す情報を認
    識結果として出力する照合部とを具えてなる音声認識方
    式において、 前記標準パターンデータ格納部における標準パターンを
    使用頻度に応じた優先度を付して登録するとともに、 前記照合部において距離が近いと判定された単語が2つ
    以上あったとき前記標準パターンデータ格納部における
    優先度の最も高い単語を判定する使用頻度判定部と、 前記照合部において距離が近いと判定された単語が1つ
    だけのときはこれを示す情報を認識結果として出力し、
    2つ以上あったときは前記使用頻度判定部において優先
    度が高いと判定された単語を示す情報を認識結果として
    出力する認識判定部とを具え、 前記標準パターンデータ格納部における使用頻度に基づ
    くデータ管理において、最大格納数のパターンデータが
    登録されていない場合は新たに登録されるパターンデー
    タを最優先位置に登録し、最大格納数のパターンデータ
    が登録されている場合は最下位データを削除して新たに
    登録されるパターンデータを最優先位置に登録し、登録
    されているパターンデータが認識に使用されたときは優
    先順位を1つ繰り上げた位置に該認識に使用されたパタ
    ーンデータを登録し直すことを特徴とする音声認識方
    式。
JP61205463A 1986-09-01 1986-09-01 音声認識方式 Expired - Lifetime JP2559031B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP61205463A JP2559031B2 (ja) 1986-09-01 1986-09-01 音声認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP61205463A JP2559031B2 (ja) 1986-09-01 1986-09-01 音声認識方式

Publications (2)

Publication Number Publication Date
JPS6361300A JPS6361300A (ja) 1988-03-17
JP2559031B2 true JP2559031B2 (ja) 1996-11-27

Family

ID=16507288

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61205463A Expired - Lifetime JP2559031B2 (ja) 1986-09-01 1986-09-01 音声認識方式

Country Status (1)

Country Link
JP (1) JP2559031B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3042585B2 (ja) 1995-01-30 2000-05-15 富士通テン株式会社 音声認識装置

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3613389B2 (ja) * 2000-03-15 2005-01-26 淳司 桑原 音声処理装置
JP3542026B2 (ja) * 2000-05-02 2004-07-14 インターナショナル・ビジネス・マシーンズ・コーポレーション 音声認識システム、音声認識方法およびコンピュータ可読な記録媒体
JP4812928B2 (ja) * 2000-08-09 2011-11-09 株式会社ジャコス 声紋電話システム
JP4601306B2 (ja) * 2003-03-13 2010-12-22 パナソニック株式会社 情報検索装置、情報検索方法、およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57209575A (en) * 1981-06-19 1982-12-22 Fujitsu Ltd Character recognizing device

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
発明協会公開技報公技番号83−3134

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3042585B2 (ja) 1995-01-30 2000-05-15 富士通テン株式会社 音声認識装置

Also Published As

Publication number Publication date
JPS6361300A (ja) 1988-03-17

Similar Documents

Publication Publication Date Title
JP4558074B2 (ja) 電話通信端末
US7409341B2 (en) Speech recognizing apparatus with noise model adapting processing unit, speech recognizing method and computer-readable medium
JP6751658B2 (ja) 音声認識装置、音声認識システム
RU2393549C2 (ru) Способ и устройство для распознавания речи
US20020087306A1 (en) Computer-implemented noise normalization method and system
CN109493850A (zh) 成长型对话装置
EP0788090A3 (en) Transcription of speech data with segments from acoustically dissimilar environments
US20040138877A1 (en) Speech input apparatus and method
JP2005534983A (ja) 自動音声認識の方法
CN112328994A (zh) 声纹数据处理方法、装置、电子设备和存储介质
AU744678B2 (en) Pattern recognition using multiple reference models
JP2559031B2 (ja) 音声認識方式
CN113744742A (zh) 对话场景下的角色识别方法、装置和***
US20030120490A1 (en) Method for creating a speech database for a target vocabulary in order to train a speech recorgnition system
JP2000067005A (ja) 本人確認方法及びその方法を用いた装置及び本人確認装置制御プログラムを記録した記録媒体
CN113724698B (zh) 语音识别模型的训练方法、装置、设备及存储介质
JP3945187B2 (ja) 対話管理装置
WO2000075918A1 (en) Weighted spectral distance calculator
JPH03248199A (ja) 音声認識方式
JP2003177788A (ja) 音声対話システムおよびその方法
US6801890B1 (en) Method for enhancing recognition probability in voice recognition systems
JP4201455B2 (ja) 音声認識システム
CN109559759B (zh) 具备增量注册单元的电子设备及其方法
JP2005300958A (ja) 話者照合装置
CA2176103C (en) Speech recognizer