JPH01319099A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPH01319099A
JPH01319099A JP63150736A JP15073688A JPH01319099A JP H01319099 A JPH01319099 A JP H01319099A JP 63150736 A JP63150736 A JP 63150736A JP 15073688 A JP15073688 A JP 15073688A JP H01319099 A JPH01319099 A JP H01319099A
Authority
JP
Japan
Prior art keywords
correlation
time
memory
speech
series
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP63150736A
Other languages
English (en)
Inventor
Masahiro Hamada
正宏 浜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP63150736A priority Critical patent/JPH01319099A/ja
Publication of JPH01319099A publication Critical patent/JPH01319099A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 産業上の利用分野 本発明は話者の声を予め登録しておく登録型音声認識装
置装置に関する。
従来の技術 近年、登録型音声認識装置は産業界において徐々に利用
されるようになってきた。
以下図面を参照しながら、従来の登録型音声認識装置に
ついて説明する。第2図は従来の登録型音声認識装置を
示すものである。第2図において相関計算部1の出方は
分析部2に接続され、分析部2の出力はスイッチ5を経
てテンプレートメモリ3と照合部4とに接続されている
。またテンプレートメモリ3の出力は照合部4に接続さ
れている。
以下にその動作について説明する。相関計算部1は使用
者の発した音声から時系列相関係数を計算し、この結果
を分析部2に入力する。分析部2はこの入力を受けて線
形予測法に基づく音響分析を行い、所定の音響パラメー
タをスイッチ5に出力する。スイッチ5は、上記発声音
声が登録時のものであれば、上記音響パラメータを第1
の出力としてテンプレートメモリ3に入力し、上記発声
音声が認識時のものであれば、上記音響パラメータを第
2の出力として照合部4に出力する。照合部4は、認識
時にはテンプレートメモリ3の出力とスイッチ5の第2
の出力とを受けてテンプレートマツチング番行い、複数
の登録単語テンプレートの中から最適な認識結果を決定
する。
発明が解決しようとする課題 テンプレートマツチング型の音声認識においては、テン
プレート登録時の背景雑音条件と認識対象音声入力時の
背景雑音条件とが同一であることが望ましい。しかしな
がら上記のような構成では、背景雑音が変動しているよ
うな場合には、テンプレート登録時の背景雑音条件と認
識対象音声入力時の背景雑音条件とが同一でなくなり、
しばしば認識率の大幅な低下を招くという問題点があっ
た。
本発明は上記問題点に鑑み、背景雑音が変動しているよ
うな場合にも、音声登録時にさえ背景雑音が十分に小さ
いことが仮定できさえすれば良好な認識率を確保するこ
とのできる音声認識装置を提供するものである。
課題を解決するための手段 本発明の登録型音声認識装置は、入力信号から時系列相
関係数を求める相関計算部と、前記相関計算部から得ら
れた登録音声の時系列相関係数を記憶する第1の相関メ
モリと、前記相関計算部から得られた雑音の時系列相関
係数を記憶する第2の相関メモリと、前記第1の相関メ
モリの内容と前記第2の相関メモリの内容とを加算する
加算部と、前記加算部から出力された時系列相関係数加
算結果を音響分析して第1の特徴パラメータを抽出し、
或は前記相関計算部から得られた認識対象音声の時系列
相関係数を音響分析して第2の特徴パラメータを抽出す
る分析部と、前記第1の特徴パラメータを記憶するテン
プレートメモリと、前記テンプレートメモリの内容と前
記第2の特徴パラメータとを入力し音声の類似度を算出
する音声照合部とから構成することを特徴とする。
作用 前記第1の相関メモリには背景雑音が十分に小さい時に
登録された登録音声の時系列相関係数を記憶し、前記第
2の相関メモリには認識対象音声入力時点の直前におけ
る雑音の時系列相関係数を記憶し、音声と背景雑音とが
統計的に独立で相関係数の次元で両者の間に加法性が成
立しており、かつ背景雑音が認識対象単語長に比べてよ
り大きな時定数で変動している場合にはこれら二つの時
系列相関係数を加算することによって認識対象音声入力
時点における真の時系列相関係数を模擬し、この様にし
て模擬された時系列相関係数をテンプレートとして使用
することによりテンプレート作成時の背景雑音条件と認
識対象音声入力時の背景雑音条件とを近似させることが
でき、認識率の大幅な低下を防ぐことができる。
実施例 以下本発明の一実施例について、図面を参照しながら説
明する。なお、第1図と共通する要素には同一番号をふ
している。
第1図は本発明の一実施例における登録型音声認識装置
を示すものである。第1図において、1は入力信号から
時系列相関係数を求める相関計算部であり、2は第1の
相関メモリであり、3は第2の相関メモリであり、相関
計算部1の出力は第1の相関メモリ2と第2の相関メモ
リ3とスイッチ8の第1の入力端子とに入力されている
。第1の相関メモリ2の出力と第2の相関メモリ3の出
力とは加算部4に入力され、加算部4から出力された時
系列相関係数加算結果はスイッチ8の第2の入力端子に
入力されている。スイッチ8の出力は分析部5に入力さ
れ、分析部5の出力はスイッチ9の入力となっている。
また、スイッチ9の第1の出力はテンプレートメモリ6
に入力され、テンプレートメモリ6の出力とスイッチ9
の第2の出力とは、いずれも116合部7へ入力されて
いる。
以下にその動作について説明する。背景雑音が十分に小
さいときに発声された登録音声は相関計算部1で時系列
相関係数に変換され、第1の相関メモリ2に記憶される
。音声認識時には、相関計算部1は背景雑音の統計的性
質が変化する毎に背景雑音の時系列相関係数を計算し直
し、第2の相関メモリ3を更新する。加算部4は前記更
新が行われる毎に第1の相関メモリ2の出力と第2の相
関メモリ3の出力とを加算し直して前記登録音声に背景
雑音が重畳した場合を模擬した時系列相関係数(この時
系列相関係数を今後模擬登録時系列相関係数と呼称する
)を算出し、この信号をスイッチ8への第2の入力とす
る。スイッチ8は認識対象音声が入力されるとき以外は
常に第2の入力を出力するように動作し、分析部5はこ
のスイッチ8の・きにより認識対象音声が入力されると
き以外は常に前記模擬登録時系列相関係数を分析する。
スイッチ9では認識対象音声が入力される時以外は常に
第1の出力端子が選択され、スイッチ8およびスイッチ
9(7?働きによりテンプレートメモリ6には認識対象
音声が入力される時以外は常に更新された前記模擬登録
時系列相関係数が入力される。
一方、認識対象音声が入力された時にはスイッチ8では
第1の入力端子が選択されスイッチ9では第2の出力端
子が選択され、この動作によって認識対象音声の時系列
相関係数は照合部7へ入力される。照合部7はスイッチ
9の第2の出力とテンプレートメモリ6の出力とを受け
、認識対象音声の時系列相関係数から分析された特徴パ
ラメータと複数の前記模擬登録時系列相関係数から分析
された複数の特徴パラメータとの間でテンプレートマツ
チングを行い、最適な認識結果を出力する。
以上のように本実施例によれば、入力信号から時系列相
関係数を求める相関計算部1と、相関計算部lから得6
れた登録音声の時系列相関係数を記憶する第1の相関メ
モリ2と、相関計算部1から得られた雑音の時系列相関
係数を記憶する第2の相関メモリ3と、第1の相関メモ
リ2の内容と第2の相関メモリ3の内容とを加算する加
算部4と、相関計算部1の出力を第1の入力とし加算部
4の出力を第2の入力とするスイッチ8と、スイッチ8
の出力を音響分析して特徴パラメータを抽出する分析部
5と、分析gh5の出力を入力とし第1及び第2の出力
をもつスイッチ9と、スイッチ9の第1の出力である模
擬登録時系列相関係数を入力とするテンプレートメモリ
6と、スイッチ9の第2の出力である認識対象音声の時
系列相関係数とテンプレートメモリ6の出力とを入力と
する音声照合部7とを設けることにより、第1の相関メ
モリ2には背景雑音が十分に小さい時に登録された登録
音声の時系列相関係数を記憶し、第2の相関メモリ3に
は認識対象音声入力時点の直前における雑音の時系列相
関係数を記憶し、音声と背景雑音とが統計的に独立で相
関係数の次元で両者の間に加法性が成立しており、かつ
背景雑音が認識対象単語長に比べてより大きな時定数で
変動している場合にはこれら二つの時系列相関係数を加
算することによって認識対象音声入力時点における真の
時系列相関係数を模擬し、この様にして模擬された時系
列相関係数をテンプレートとして使用することによりテ
ンプレート作成時の背景雑音条件と認識対象音声入力時
の背景雑音条件とを近似させることができ、認識率の大
幅な低下を防ぐことができる。
また、登録音声と背景雑音との情報を時間波形でなく相
関係数の次元で保持しているため、分析部5が線形予測
分析を行うには第1の相関メモリ2、第2の相関メモリ
3共に少量で済む。101(Hzで信号を標本化し、2
56標本毎に14次の線形予測分析を行うという平均的
な分析条件を例示すると、時間波形で登録音声あるいは
背景雑音を保持するには一時点当り256語のメモリを
必要とするが、相関係数の場合には15語で済む。
さらに、入力信号から線形予測分析を終了するまでに必
要な計算量のうち相関計算部1における計算量は分析部
5における計算量に比較して多大である為、時間波形で
登録音声を保持すると背景雑音の統計的性質が変動する
毎に複数の登録音声に対してそれぞれ時系列相関係数を
計算し直す必要が生じ、装置全体の動作速度が低下する
。その点、時系列相関係数による保持を行うと、背景雑
音の統計的性質が変動する毎に計算し直す必要のあるも
のは、その時点の背景雑音の時系列相関係数のみであり
、装置全体の動作速度が低下することがない。
発明の効果 以上のように本発明においては、背景雑音の統計的性質
が変動する場合でもテンプレート作成時の背景雑音条件
と認識対象音声入力時の背景雑音条件とを近似させるこ
とができ認識率の大幅な低下を防ぐことができるばかり
でなく、登録音声及び背景雑音の情報を相関係数の形で
保持することにより、これら両者を時間波形で保持する
場合に比較してより少ないメモリ容量とより少ない計算
量とで所望の目的を達成するこ七ができる優れた登録型
音声認識装置を提供することができる。
【図面の簡単な説明】
第1図は本発明の一実施例における音声認識装置の構成
図、第2図は従来例の音声認識装置の構成図である。 1・・相関計算部、2・・第1のそうかんメそり、3・
・第2の相関メモリ、4・・加算部、6・・分析部、6
・・テンプレートメモリ、7・・照合部、8・・スイッ
チ、9・・スイッチ。

Claims (1)

    【特許請求の範囲】
  1. 入力信号から時系列相関係数を求める相関計算部と、前
    記相関計算部から得られた登録音声の時系列相関係数を
    記憶する第1の相関メモリと、前記相関計算部から得ら
    れた雑音の時系列相関係数を記憶する第2の相関メモリ
    と、前記第1の相関メモリの内容と前記第2の相関メモ
    リの内容とを加算する加算部と、前記加算部から出力さ
    れた時系列相関係数加算結果を音響分析して第1の特徴
    パラメータを抽出し、或は前記相関計算部から得られた
    認識対象音声の時系列相関係数を音響分析して第2の特
    徴パラメータを抽出する分析部と、前記第1の特徴パラ
    メータを記憶するテンプレートメモリと、前記テンプレ
    ートメモリの内容と前記第2の特徴パラメータとを入力
    し音声の類似度を算出する音声照合部を具備する音声認
    識装置。
JP63150736A 1988-06-17 1988-06-17 音声認識装置 Pending JPH01319099A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63150736A JPH01319099A (ja) 1988-06-17 1988-06-17 音声認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63150736A JPH01319099A (ja) 1988-06-17 1988-06-17 音声認識装置

Publications (1)

Publication Number Publication Date
JPH01319099A true JPH01319099A (ja) 1989-12-25

Family

ID=15503290

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63150736A Pending JPH01319099A (ja) 1988-06-17 1988-06-17 音声認識装置

Country Status (1)

Country Link
JP (1) JPH01319099A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014076827A1 (en) * 2012-11-13 2014-05-22 Yoshimasa Electronic Inc. Method and device for recognizing speech

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5823098A (ja) * 1981-08-03 1983-02-10 日本電信電話株式会社 音声認識装置
JPS5844500A (ja) * 1981-09-11 1983-03-15 シャープ株式会社 音声認識方式
JPS612960A (ja) * 1984-05-24 1986-01-08 ホエルマン カーゲー アントリープス ウント シユトイエルングステヒニク 回転運動を直線運動に変換するギア装置
JPS6265088A (ja) * 1985-09-17 1987-03-24 株式会社リコー 不特定話者用音声認識装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5823098A (ja) * 1981-08-03 1983-02-10 日本電信電話株式会社 音声認識装置
JPS5844500A (ja) * 1981-09-11 1983-03-15 シャープ株式会社 音声認識方式
JPS612960A (ja) * 1984-05-24 1986-01-08 ホエルマン カーゲー アントリープス ウント シユトイエルングステヒニク 回転運動を直線運動に変換するギア装置
JPS6265088A (ja) * 1985-09-17 1987-03-24 株式会社リコー 不特定話者用音声認識装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014076827A1 (en) * 2012-11-13 2014-05-22 Yoshimasa Electronic Inc. Method and device for recognizing speech
US9514738B2 (en) 2012-11-13 2016-12-06 Yoichi Ando Method and device for recognizing speech

Similar Documents

Publication Publication Date Title
US10074363B2 (en) Method and apparatus for keyword speech recognition
US5995928A (en) Method and apparatus for continuous spelling speech recognition with early identification
US4811399A (en) Apparatus and method for automatic speech recognition
JPH07334184A (ja) 音響カテゴリ平均値計算装置及び適応化装置
KR20210071713A (ko) 스피치 스킬 피드백 시스템
Kamble et al. Emotion recognition for instantaneous Marathi spoken words
JP2003163951A (ja) 音信号認識システムおよび音信号認識方法並びに当該音信号認識システムを用いた対話制御システムおよび対話制御方法
JPH01319099A (ja) 音声認識装置
JPS63502304A (ja) 高雑音環境における言語認識のためのフレ−ム比較法
JPH02232696A (ja) 音声認識装置
JPH0774960B2 (ja) テンプレ−ト連鎖モデルを使用するキ−ワ−ド認識方法およびシステム
JP2980382B2 (ja) 話者適応音声認識方法および装置
JPH04324499A (ja) 音声認識装置
JPH03116100A (ja) 大語彙音声認識装置
JPH06102895A (ja) 音声認識モデル学習装置
JPS61138296A (ja) 音声認識装置
JP2001228890A (ja) 音声認識装置
JPH06337700A (ja) 音声合成装置
JPH06301399A (ja) 音声認識装置
JPH02251999A (ja) 標準パタン作成方式
JP2520392B2 (ja) 単語音声認識装置
JP2017156614A (ja) 対応付け編集装置、対応付け編集方法、及びプログラム
JPS62278597A (ja) 音素標準パタ−ンの切り出し方法
JPS63292199A (ja) 音声認識装置
JPS62119599A (ja) 単語音声認識装置