JPS6026399A - 単語認識装置 - Google Patents

単語認識装置

Info

Publication number
JPS6026399A
JPS6026399A JP58134112A JP13411283A JPS6026399A JP S6026399 A JPS6026399 A JP S6026399A JP 58134112 A JP58134112 A JP 58134112A JP 13411283 A JP13411283 A JP 13411283A JP S6026399 A JPS6026399 A JP S6026399A
Authority
JP
Japan
Prior art keywords
word
section
standard
input
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58134112A
Other languages
English (en)
Inventor
隆夫 渡辺
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58134112A priority Critical patent/JPS6026399A/ja
Publication of JPS6026399A publication Critical patent/JPS6026399A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、単語音声認識装置の改良に関する。
音声認識において認識すべき単語のバタンをあらかじめ
標準パタンとして登録しておき認識時に入力される未知
バタンを標準パタンと比較し最も類似度の高いものを認
識結果として決定するバタンマツチング法は従来から広
く用いられている。
この方法は、特定話者だけでなく不特定話者に対しても
適用できる。すなわち標準パタンを各単語に対して複数
個用意することにより話者によるバタンの変動に対処す
ることができる。これらの標準パタンは多数の話者のサ
ンプルから、これらを代表するものとしてクラスタリン
グの手法によりめることができる。
このような複数個の標準パタンを用いて、ある話者が複
数の単語を入力したものを認識する場合、最初の入力単
語は標準パタンR1と最も類似していて、次の入力単語
は標準バタン馬と最も類似しているが標準バタン鳥とR
3は全く異なったタイプの話者の発声であるというケー
スが起こり得る。このような不合理は誤認識をもたらす
ものであるが、認識すべき複数の単語が同一話者により
発声されたことが既知である場合には、このような不合
理を避けることができる。
本発明の目的は、話者相違による誤認識を避け、認識精
度を向上させることのできる不特定話者の単語認識装置
を提供することにある。
本発明は、入力された音声信号に対し単語区間を検出す
る単語検出手段と、検出された単語区間のバタンを少な
くとも二つの連続する単語分について一時格納する入力
バタン記憶部と、少なくとも二つの連続する単語毎に用
意された標準バタンを格納する標準バタン記憶部と、−
単語検出毎に上記人力バタン記憶部から読み出された人
力バタンと標準バタン記憶部から読み出された標準パタ
ンとのマツチングを行ない認識結果を得る識別部とを含
んで構成される。
以下、本発明における認識の原理について述べる。本発
明においては、入力された単語を連続する複数の単語毎
にまとめた単語連結を単位として認識を行う。標準パタ
ンを作成するため用意された多数話者の単語バタンをA
p (Wlで表わす。ただしここでpは話者、Wは単語
を表わす。これらの単語パタンから二単語連結バタン Ap (W、 、W2) = Ap (Wl )■Ap
 (% )をめる。ここで記号■は2つの単語パタンを
並置することを示す。
各単語連結(w、、w2)の組み合せに対して多数話者
のバタンセット (A−p(Wl 、 Wt ) * p= L2.・・
・ )からクラスタリングにより単語連結の標準バタン
セット (Rk(w、 、 w2) 、 k= 1.2.・・・
 )を得る。クラスタリング法としてはk −mean
s 法等任意の方法が使用できる。
次に第1図を参照して本発明における認識の原理を説明
する。第1図において、(a)は、音声波形、(bjは
単語パターン、fc)は連結した2単語からなる単語連
結パターンを示している。
入力された複数個の単語パタンを”!+・・・S3・・
・。
8、Tとする。これより単語連結バタンS!、・・・、
Sj。
・・・* 5J−1を次のようにして生成する。
S書=8.■52 8j工S」■Sj+を 各単語連結バタンに対して、単語連結標準バタンセット
を用いてマツチングが行われる。すなわち、D(Sj 
、Rk(vl、w2))をに0w2について計算シ、D
が最小となるときのW2が認識結果である。但しここで
D(A、B)は2つのバタンA、Bの間の距離を表わし
v4 は3番目の単語の認識結果を表わす。
標準バタン作成用の単語連結は同一話者の単語の連結と
なっているので、単語連結を単位としたマツチングも単
語連結内の単語は同一話者であると仮定されたマツチン
グとなっている。単語連結は一単語づつ入力単語をずら
して生成されているので全ての入力単語が同一話者であ
ることが仮定されていることになる。
本発明によオフば一連の入力lこ対する話者の同一性が
認識時に仮定されるので精度の高い不特定話者の単語認
識装置を実現することができる。
以下に嬉2図を参照して本発明の一実施例について説明
する。
第2図は本発明による装置の一実施例を示すブロック図
である。入力された音声信号は、単語検出部1により、
単語区間が検出され区間内の信号を分析して入力単語バ
タンか出力される。ここで分析方法としてはバンドパス
フィルタ群、線形予測分析、高速フーリエ変換等任意の
ものが可能であり、また単語区間検出法としてもエネル
ギーを用いる方法等任意のものが可能である。バタンの
形式は分析して得られた特徴ベクトルの時系列であるが
、この他、この時系列を次元圧縮・時間軸圧縮した形式
のものであってよい。入力バタン記憶部2は2つのシフ
トバッファ21 、22より構成さ1する。−単語検出
されるとバッファ21の内容は22に移され、21には
新しく検出された単語のバタンか格納される。記憶部3
は単語連結標準バタンを格納するものである。識別部4
は一単語検出される毎に21 、22からいっしょに読
み出された入力の単語連結バタンと記憶部3から読み出
された標準バタンとのマツチングを行ない認識結果を出
力する。41は入力バタンと標準バタンとのマツチング
を行い類似度を算出するマツチング部である。ここでマ
ツチング方法としては類似度が算出されるものであれば
任意のものでよい。
42はマツチング制御部であり、認識結果出力バッファ
43に保持されている直前の認識結果lこ従って記憶部
3から読み出す標準バタンを指定するとともに、マツチ
ング部を制御する。例えばj番目の入力単語が検出され
たとき43の内容の認識結果がVjであるときは標準パ
タンの単語連結(Wl。
W2 )が(vj、w2)のもののみマツチング対象と
なり、式(1)が計算され、結果が43へ出力される。
以上説明した通り、本発明によ11ば、認識精度の高い
不特定話者用単語認識装置を実現することができる。
また以上の説明においては、2単語連結を単位として認
識を行う場合について述べたが、単語連結を3以上とす
ることも同様に可能である。その場合には、記憶部2に
含まれるシフトバッファの個数が変化する。たとえば3
単語連結の場合には、記憶部2はシフトバッファ3個に
より構成されることとなる。
【図面の簡単な説明】
第1図は認識の原理を説明するための図、第2図は本発
明による装置の一実施例を示すブロック図である。 図において、■・・・単語検出部、2.3−・・記憶部
、21 、22・・・シフトバッファ、4・・・識別部
、41・・・マツチング部、42・・・マツチング制御
部、43・・出力バラ″tl 図 第2図

Claims (1)

    【特許請求の範囲】
  1. 入力された音声信号に対し単語区間を検出する単語検出
    手段と、検出された単語区間のバタンを少なくとも二つ
    の連続する単語分について一時格納する入力バタン記憶
    部と、少なくとも二つの連続する単語毎に用意された標
    準バタンを格納する標準バタン記憶部と、−単語検出毎
    に上記入力バタン記憶部から読み出された入力バタンと
    標準バタン記憶部から読み出された標準パタンとのマツ
    チングを行ない認識結果を得る識別部とを含んで構成さ
    れることを特徴とする単語認識装置。
JP58134112A 1983-07-22 1983-07-22 単語認識装置 Pending JPS6026399A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58134112A JPS6026399A (ja) 1983-07-22 1983-07-22 単語認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58134112A JPS6026399A (ja) 1983-07-22 1983-07-22 単語認識装置

Publications (1)

Publication Number Publication Date
JPS6026399A true JPS6026399A (ja) 1985-02-09

Family

ID=15120735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58134112A Pending JPS6026399A (ja) 1983-07-22 1983-07-22 単語認識装置

Country Status (1)

Country Link
JP (1) JPS6026399A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61215596A (ja) * 1984-12-27 1986-09-25 テキサス インスツルメンツ インコ−ポレイテツド 音声認識方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS61215596A (ja) * 1984-12-27 1986-09-25 テキサス インスツルメンツ インコ−ポレイテツド 音声認識方法

Similar Documents

Publication Publication Date Title
JPS62133500A (ja) 音響信号から導かれた電気信号を区分する方法及び装置
JPH0272397A (ja) 音声認識装置
JPS6026399A (ja) 単語認識装置
JPS6312312B2 (ja)
JPH0252278B2 (ja)
JPS6332596A (ja) 音声認識装置
JPS5915993A (ja) 音声認識装置
JP2707577B2 (ja) ホルマント抽出装置
JPS5934595A (ja) 音声認識処理方式
JPS62159200A (ja) 特定話者用単語音声認識装置
JPS60115996A (ja) 音声認識装置
JPS6073592A (ja) 特定話者用音声認識装置
JPS5915994A (ja) 音声認識装置
JPS6070496A (ja) 音声認識処理方式
JPS59124390A (ja) 候補削減音声認識方式
JPS58190998A (ja) 音声認識装置
JPS59157700A (ja) 音声認識装置
JPS62111295A (ja) 音声認識装置
JPS60237497A (ja) ベクトル分割量子化を用いた音声認識方法及びその装置
JPS63247799A (ja) 音声認識装置
JPS62102292A (ja) 話者識別装置
JPS63118198A (ja) 音声認識装置
JPS63149697A (ja) 音声認識装置
JPS59127098A (ja) 連続単語音声認識装置
JPS63282793A (ja) 音声認識装置