JPS5811998A - 音声認識装置 - Google Patents

音声認識装置

Info

Publication number
JPS5811998A
JPS5811998A JP10926581A JP10926581A JPS5811998A JP S5811998 A JPS5811998 A JP S5811998A JP 10926581 A JP10926581 A JP 10926581A JP 10926581 A JP10926581 A JP 10926581A JP S5811998 A JPS5811998 A JP S5811998A
Authority
JP
Japan
Prior art keywords
data
speech
input
standard pattern
dissimilarity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10926581A
Other languages
English (en)
Other versions
JPS6332400B2 (ja
Inventor
能勢 勇
水野 金儀
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP10926581A priority Critical patent/JPS5811998A/ja
Priority to US06/373,147 priority patent/US4520500A/en
Publication of JPS5811998A publication Critical patent/JPS5811998A/ja
Publication of JPS6332400B2 publication Critical patent/JPS6332400B2/ja
Granted legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、音声認識装置において、認識率の向上を計る
ことができる重み何升類似度演算に関するものである。
従来の音声認識装置のブロック図を第1図に示す。第1
図において、  11は入力端子、  12は周波数分
析部、  13は音声区間検出部、14は音声区間の始
端検出信号、15は音声区間の終端検出信号、16はス
ペクトル変換部、17は非類似度演算部118は判定部
の如く構成されてhv以下谷部の説明をする。
周波数分析部12は第2図に示す如く構成され。
入力音声信号21 [前置増幅器22によって増幅され
約200 Hz〜6000 ’Hzの間で中心周波数が
対数で等間隔となるように設定された帯域p波器群23
−1 、23−2 、・・・、 23−?L、全波整流
器群24−1 、24−2、・・・、 24−n及び低
域沖波器群25−1 、25−2 、・・・。
25−nによって分析され多重化器26ヲ通してアナロ
グ・ディジタル変換器27によってあらかじめ設定され
た時間間隔(以下サンプル周期と記す)毎に量子化され
、対数変換器28全通して出力端子29に出力される。
周波数分析部12で分析された結果は音声区間検出部】
3.及びスペクトル変換部16に送られる。
音声区間検出部]3は音声区間の始端及び終端を検出し
非類似度演算部に始端検出信号14及び終端検出信号1
5ヲ送るものであり、簡易的な検出法としてはサンプル
周期毎の周波数分析部12からのn個の分析データの平
均値全求めその値があらかじめ設定された閾値を最初に
越えた時点を始点とし、最後に閾値以下になった時点全
終端とする検出法がある。
スペクトル変換部16は1話者による音源特性及びパワ
ーの正規化の方法として、論文”非線形スペクトルマツ
チングによる単語音声認識の一方式″小原他(電子通信
学会技術研究報告PRL 79−46)に発表されたも
のでIず計算方法を説明する。
周波数分析部12で、ある時刻に分析されたn個のデー
タ’fr:x、7(i=I〜n)とすると、スベク(3
) れる。
x・−x −(Ai十B)     −−(IJt (1)式に2いてA、Bはそれぞれxi(i=l−n)
の最小2乗近似UNflJの傾き及び切片を意味するも
のでそれぞれ次式によって求められる。
i=t xi2は定数となり従って(2)、(3)式の分母も定
数1=1 (4) (4,) 、 +57式から明らかなように入力データ
力1らりA、Hの値を求めることができ、さらに(1)
式によりスペクトル変換データ2Xi(t−1〜tL)
を求めることができる。
第3図にスペクトル変換部16のフ゛ロック図を示し以
下図にそって説明する。
入力端子31から入力された入力データzi(i−1〜
n)と、入力データと同期して計算するカウンタ32に
よって発生したiとの積を乗算器33によって求めさら
に加算器34とレジスタ35によりi−x・の埴を累積
させることによりレジスタ′f、た。加算器36 とレ
ジスタ37により同様に。
きる。
次にマルチプレクサ38 、39において、それぞれy
、C,の値を選択することにより乗算器40ではAの値
ヲレジスタ43にセットする。同様にマルチプレクサ3
8.39においてそれぞれCI、C2を選択させ乗算器
40.41及び減算除算器44を使用してその結果すな
わちBの値全レジスタ45にセットする。
続いてカウンタ46によりiを発生させ乗算器47によ
f) 、4 e iを求めざらに7Jl]算器48によ
りAi十13’c求めることができる。次に遅延回路4
9により遅延した入カテータxi、l!ニアIl]算器
48で求めたAi十Bの減算全減算器50によって行え
はスペクトル変換データX・が出力端子に出力される。
次に、非類似度演算部17の構成を第4図に示し以下図
にそって説明する。第4図において、101は音声区間
の始端検出信号、102は音声区間の終端検出信号、1
03はスペクトル変換部17からの入力データ、  1
04I/′X、入力メモリ制御回路、105は入力メモ
リ、106は標準パターンメモリ制御回路。
107は標準パターンメモIL108は差分絶対値演算
回路、109は加算器、110はレジスタである。
音声区間の始端検出信号101が発生してから音声区間
の終端検出信号102が発生する1での間入カテータ1
03は入力メモリ制御回路104により入力メモリ−0
5に格納される。音声区間の入力データ103の格納が
終了すると、入力メモリ−O5とあ(7) らかしめ分析され標準パターンメモリ107に格納され
ている所望の標準パターンとの非類似度の演算を順次行
なう。
非類似度の演算方法では動的計画法を用いて入力データ
と標準パターンとを非線形に対応させる方法が一般的に
用いられているが、説明の簡略化の為、以下線形対応を
用いた方法で説明する。しかしながら本発明は非線形対
応に対しても適用できる事は明らかである。
入力メモリ制御回路104及び標準パターンメモリ制御
部1()6を介して入力データ及び標準パターンそれぞ
れの対応する要素を読出し、差分絶対値回路108によ
って両者の差分の絶対値の演X+行い、さらにその結果
とレジスタ110との加算を加算器110で行い加算結
果を再びレジスタ110に入れる。
この演算を対応する要素すべてについて繰υ返丁ことに
より入力データとある標準パターンとの非類似度の演算
ができる。このようにして、標準パターンメモリ107
に格納されている全て又は−(8) 部の標準パターンとの非類似度の演算を行う。
但シ、レジスタll0U、ある標準パターンとの非類似
度演算を始める時の初期値はOとしておく必要がある。
即ち、ある認識語の標準パターンPと入力データQとの
非類似度演算に2いて両者の対応する要素があらかじめ
正規化されているものとして(6)式(6)式にてiは
対応する要素に付された番号でありlu標標準パターン
上入力データQとの音声区間長の正規化後の時系列に付
された番号である。
判定部18では非類似度演算部17の結果によp最も非
類似度の低かった。すなわち類似度の最も高かった標準
パターンと同じ音声が入力されたものと判断して、結果
を出力する。
しかしながら、上記従来の技術では、音声は話者による
変化はもちろんのこと同一話者においても発声毎に変化
するため1分析結果の似ている語間の誤認識が生ずると
いう欠点があった。
従って本発明は従来の技術の上記欠点を改善するもので
、その目的は音声認識装置の認識率を向上させることに
あり、標準パターンメモリに重み領域データを付加し、
さらに、非類似度演算部における重みの大きさを、入カ
バターンと標準パターンの符号を含めたレベルの相互関
係によって判断する機能全付加したものである。
すなわち、短時間スペクトルを目視した場合は明らかに
異なるパターンであると認識できるものであっても、全
体の卵類0!度としては小さな値になり、誤認識される
ことがある。
このように、一定の非類似度の演算のみでは類似してし
1う小数の音声を識別するための一つM力な手法は、ス
ペクトル変換データを要素とする標準パターンの特定領
域に非類似度を増す方向の重みをつけることである。
本発明は、このような重みうけによる非類似度の演算を
、短時間スペクトルにpける山や谷の位置を考慮して行
わせるものであり、特に短時間スベクトルにおける山や
谷が、スペクトル変換データにおける1負の符号及びデ
ータの絶対値の太きさとして現われるの全利用するもの
である。
第5図は本発明の笑怖例のブロック図であり。
11は入力端子、12は周波数分析部、13は音声区間
検出部、  14は音声区間の始端検出信号、15は音
声区間の終端検出信号、]6はスペクトル変換部、55
は重み何升類似度演算部、  18は判定部の如く構成
されている。重み何升類似屁演算部55以外は第1図の
構成と同じであるので、以下重み何升類似肝演算部55
について第6図によって詳細に説明する。
第6図において■旧は音声区間の始端検出信号。
】02は音声区間の終端検出信号、103はスペクトル
変換部16からの入力データ、  104U人カメモリ
制御回路、105は入力メモ1,1,108は差分絶対
値演算回路、203は標準パターンメモリ制御回路。
204は標準パターンメモ!J、201i11人カメモ
リの出力信号線、205は標準パターンメモリのパター
ンデータに関する出力信号線、207は標準パターンメ
モリの重み計算指定に関する出力信号線。
208 、209はレベル変換回路、  2]0,2]
]はレベル変換回路208 、209の出力信号線、2
12はテーブルメモリ、213は乗算器、109は刀0
算器、J10はレジスタの如く構成されている。
音声区間の始端検出信号101が発生してから音声区間
の終端検出信号102が発生する互での間入カテータ1
03は入力メモリ制御回路104により人力メモリ10
5に格納される。
入力データ103の格納が終了すると、入力メモリ10
5とあらかじめ分析され標準パターンメモリ2(J4に
格納されている碑準パターンとの重み何升類似度の演算
を順次行う。
重み何升類似度演算に2いては、標準パターンは、(J
)式で示されるスペクトル変換データZZ と重み演算
部ケ示す重み指定データPi との時系列で記述されて
いて、−万人カテータは(1)式で示されるスペクトル
変換データ(以下標準パターンとの区別の為Ziで記述
する)のみであジ、各々のスペクトル変換データは差分
絶対値演算回路108(11) の入力部とレベル変換器W5209 、208の入力部
へ出力信号線205 、2旧を介して出力されると同時
に重み指定データがテーブルメモリのアドレス入力線の
一部207を介して出力される。
レベル変換回路208 、209は対数変換器27の出
力データのビット数が大きい為(8ビツト以上)。
ビット低減全行いテーブルメモリ212の容量が大きく
ならない様にしている。通常レベル変換回路208 、
209の出力ビツト数は2〜4ビット程度で変換される
。例えば2ビツトの場合入力データを9となる。
レベル変換回路208 、209の変換出力に信号線(
12) 2]、0 、2]1 ’e介してテーブルメモリ212
のアドレス入力の一部となっている。テーブルメモリ2
12には重みが格納されていて1重み指定Pi二〇の場
合は無条件に重みWi−1が出力されるが、Pi=1の
場合は変換量ブ月直の組み合わせで重みが変化する。
前記2ピツトの場合の例を示す。入力データの変換出力
′fr:Xi、標準パターンデータの変換出力kYiと
すると1次のようになる。
但し H’1< W2< Ws 通常WI = 4 、 W2” 2 、 Ws = 1
程度の値をもつ0差分絶対値演算回路108では17)
式の演lI1.を行う。
d、−1工1−Zil        ・・・・・・(
7)を 重みつき非類似度演算は1重みwi と差分絶対値d・
の時系列W・(ll 、 di(1)に対し2乗算器2
13.加Z             Z 算器1o9.レジスタ]、IOによQ (8)式は(6)式に対して重み何升類似度演算を示し
ており1重み指定は標準パターンにpいて特に強調した
い(他の標準パターンとの区別に有効な)部分に設定さ
れ1重みWiはスペクトル変換データの極性の違いが強
調されるようにつけられている。
なお識別ハ(8)式の非類似全全ての標準パターンに対
して求め、最小値を示す認識語を出力する。
以上説明したように標準パターンに重み領域を設定しそ
の領域内でスペクトル概形の山と谷の部分がマツチング
されると重みが大きくなる様に設定されているので、安
定な重み演算ができ誤認識を起し易い語の標準パターン
に特有な領域部に重みを付けることにより1発声毎に変
化する差計よび話者による差の影響を重み付によってさ
ほど増大させることなく誤認識を起し易い語の標準パタ
ーンとの非類似度を増大させることができるという利点
がある。
本発明に重みつき非類似度演算全極性の差、データ値等
を考慮して行っているので安定かつ有効な類似屁演算が
できる利点があり、不特定話者等のバラツキの多い音声
データを取り扱う音声認識装置に利用することができる
【図面の簡単な説明】
第1図は従来の音声認識装置の構成ブロック図。 第2図は第1図に2ける周波数分析部の詳細ブロック図
、第3図は第1図におけるスペクトル変換部の詳細ブロ
ック図、第4図は第1図における非類似度演算部の詳細
ブロック図、第5図は本発明の構成ブロック図、第6図
は本発明の重み付非類似度演算部の詳細ブロック図であ
る。 11・・・入力端子、12・・・周波数分析部、13・
・・音声区間検出部、14・・・始端検出信号、15・
・・終端検出信号。 16・・・スペクトル変換部、17・・・非類似度演算
、18・・・判定部、 21・・・入力音声信号、22
・・・前置増幅器。 2L1+ 23−2i・・23−n・・・帯域F波器群
、24−1゜24−2.・・・24−n・・・全波整流
器群、  25−1.25−2.・・・25−n・・・
低域F波器群、26・・・多重化器、27川アナログテ
イジタル変換器、28・・・対数変換器、29・・出力
端子、31・・・入力端子、  32.46・・・カウ
ンタ、33゜42.44.47・・・乗算器、  34
,36.48・・劾l算器、35゜37.43.45・
・・レジスタ、  38.39・・・マルチプレクサ。 42 、43・・・減算除算器、49・・・遅延回路、
50・・・減算。 51・・・出力端子、55・・・重み付非類似度演算部
。 101・・・始端検出信号、102・・・終端検出信号
、103・・・入カテータ、104・・・入力メモリ制
御N路、】05・・・入力メモリ、106・・・標準パ
ターンメモリ制御回路、107・・・標準パターンメモ
リ、108・・・差分絶対値演算回路、109・・・7
JI]算器、110・・・レジスタ。 203・・・標準パターンメモリ制御回路、204・・
・標準パターンメモリ、201・・・入力メモリ出力信
号線。 205・・・標準パターンデータ出力信号線、207・
・・重み指定データ出力信号線、  208,209・
・・レベル変換回路、  210,211・・・変換出
力信号線、212・・・テーブルメモIJ、213・・
・乗算器。 特許出願人 沖電気工業株式会社 特許出願代理人 弁理士  山 本 恵 − 手続補正書(自発) 昭和57年2月ンタ日 特許庁長官  島 1)春 樹 殿 1、事件の表示 昭和56年 特 許願第109265号2、発明の名称 音声認識装置 3、補正をする者 事件との関係 特許出願人 名 称  (029)沖電気工業株式会社明細書の発明
の詳細な説明の欄 [又(最小値は負数でMIN又最大値は正数でMAXと
すると、M I Nりyi<;:MAX )とすると変
換出力は次表のとおりとなる。 レベル変換回路208,209の変換出力は信号線」以

Claims (2)

    【特許請求の範囲】
  1. (1)入力音声を周波数分析する手段と、その出力に接
    続される音声区間検出手段及びスペクトル変換手段と、
    スペクトル変換手段の出力に接続され音声区間検出手段
    によシ与えられる音声の始端と終端の間で入力音声を標
    準パターンと比較して非類似度を演算する非類似度演算
    手段と、その出力に接続されて音声全認識する判定手段
    とを有する音声認識装置に2いて、あらかじめ設定され
    た重み領域における非類似度演算に重み領域を解釈し、
    かつデータの性質により重みの大きさを判断して非類似
    度の演算を行うことを特徴とする音声g識装置。
  2. (2)重みの大きさを入力データと標準パターンデータ
    の2種のデータの符号の一致、不一致及びデータの絶対
    値の大きさによって判断する特許請求の範囲第1項記載
    の音声認識装置。
JP10926581A 1981-05-07 1981-07-15 音声認識装置 Granted JPS5811998A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP10926581A JPS5811998A (ja) 1981-07-15 1981-07-15 音声認識装置
US06/373,147 US4520500A (en) 1981-05-07 1982-04-29 Speech recognition system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10926581A JPS5811998A (ja) 1981-07-15 1981-07-15 音声認識装置

Publications (2)

Publication Number Publication Date
JPS5811998A true JPS5811998A (ja) 1983-01-22
JPS6332400B2 JPS6332400B2 (ja) 1988-06-29

Family

ID=14505781

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10926581A Granted JPS5811998A (ja) 1981-05-07 1981-07-15 音声認識装置

Country Status (1)

Country Link
JP (1) JPS5811998A (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5525091A (en) * 1978-08-14 1980-02-22 Nippon Electric Co Voice characteristic pattern comparator

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5525091A (en) * 1978-08-14 1980-02-22 Nippon Electric Co Voice characteristic pattern comparator

Also Published As

Publication number Publication date
JPS6332400B2 (ja) 1988-06-29

Similar Documents

Publication Publication Date Title
US7711123B2 (en) Segmenting audio signals into auditory events
EP1393300B1 (en) Segmenting audio signals into auditory events
EP0074822B1 (en) Recognition of speech or speech-like sounds
JPS5811998A (ja) 音声認識装置
JP2992324B2 (ja) 音声区間検出方法
JPH04369698A (ja) 音声認識方式
JPH0556520B2 (ja)
JPS61230199A (ja) 音声認識方法
JPH0738114B2 (ja) フオルマント型パタンマツチングボコ−ダ
JPS63213899A (ja) 話者照合方式
JPH0448400B2 (ja)
JP3298658B2 (ja) 音声認識方式
JPS6126680B2 (ja)
JPH0451840B2 (ja)
JPS60254100A (ja) 音声認識方式
JPS61141500A (ja) 単語音声認識装置
JPS58136097A (ja) 認識パタ−ン照合方式
JPH0311479B2 (ja)
JPS62116997A (ja) 単語音声認識装置
JPS6258515B2 (ja)
JPS6054000A (ja) 音声の有声・無声判定方法
JPH0546558B2 (ja)
JPS5837695A (ja) 音声認識装置
JPS6157995A (ja) 音声認識装置
JPH0316038B2 (ja)