JPS6024597A - 音声登録方式 - Google Patents

音声登録方式

Info

Publication number
JPS6024597A
JPS6024597A JP58133313A JP13331383A JPS6024597A JP S6024597 A JPS6024597 A JP S6024597A JP 58133313 A JP58133313 A JP 58133313A JP 13331383 A JP13331383 A JP 13331383A JP S6024597 A JPS6024597 A JP S6024597A
Authority
JP
Japan
Prior art keywords
voice
matching
registration
distance
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP58133313A
Other languages
English (en)
Inventor
松木 智子
秀夫 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
Nippon Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Electric Co Ltd filed Critical Nippon Electric Co Ltd
Priority to JP58133313A priority Critical patent/JPS6024597A/ja
Priority to US06/632,492 priority patent/US4731845A/en
Priority to EP84108602A priority patent/EP0135046B1/en
Priority to DE8484108602T priority patent/DE3466818D1/de
Publication of JPS6024597A publication Critical patent/JPS6024597A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/87Detection of discrete points within a voice signal
    • GPHYSICS
    • G07CHECKING-DEVICES
    • G07CTIME OR ATTENDANCE REGISTERS; REGISTERING OR INDICATING THE WORKING OF MACHINES; GENERATING RANDOM NUMBERS; VOTING OR LOTTERY APPARATUS; ARRANGEMENTS, SYSTEMS OR APPARATUS FOR CHECKING NOT PROVIDED FOR ELSEWHERE
    • G07C9/00Individual registration on entry or exit
    • G07C9/30Individual registration on entry or exit not involving the use of a pass
    • G07C9/32Individual registration on entry or exit not involving the use of a pass in combination with an identity check
    • G07C9/35Individual registration on entry or exit not involving the use of a pass in combination with an identity check by means of a handwritten signature
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/06Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
    • G10L15/063Training

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Signal Processing (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、音声認識処理における音声登録方式従来、音
声認識処理のrcめには、音声登録、すなわち登録用の
音声データを作成する必要がある。
それには、いろいろな方法があると考えられるが、一般
的に、第1図のアルゴリズムに示すように、一度の発声
によシ登録データを作成し、音声登録を行う。従って、
登録する際の発声に失敗した場合、音声認識のために、
何度発声しても認識できないということが起こる。また
、同一話者が同一音声を発生する際、はとんどの場合音
声データは発声ごとに異なる。そのため、登録のための
発声が普段と全く異なった場合、発声に失敗した時と同
様に認識が困難になると考えられる。これらの場合、認
識が困難になる原因が発声する際の失敗によると断定す
ることは難しい。認識できない原因を発声の失敗による
とした場合、再登録する必要があるが、再度失敗するこ
とも考えられる。
同一話者認識において、発声による失敗をなくすために
予め練習した上で音声登録を行った場合、普段と極端に
異なる発声を避けることができ、良質の登録データを作
成することが可能である。さらに、認識させるための発
声においても、登録のための練習の効果が期待できるた
め、認識が容易になると考えられる。しかし、音声認識
処理を簡単に行えるようにするためには、音声登録にお
いて発声の練習を必要とするのは望ましくないことであ
る。
このように、従来の音声登録方式においては、発声デー
タが発声ごとに異なることに起因する音声認識の困難や
、音声認識の困難を克服するためには発声練習を必要と
するという欠点があった。
本発明の目的は、上記欠点を除去し、音声登録のための
発声が原因となる音声認識処理の失敗を排除し、また発
声の失敗による再登録及び良質な登録音声作成のための
発声練習などを不要とする音声登録方式を提供すること
にある。
本発明の音声登録方式は、同一語として認識されるべき
音声を3回以上発声することによシ得られる3以上の音
声パターン全記憶し、該記憶された音声パターン、+4
1互間でマツチング距離計算を行い、前記3以上の音声
パターンごとにマツチング距離の和をめ、前記3以上の
音声パターンの中から前記マツチング距離の和が最も小
さい音声パターンを選択し、登録音声として採用するこ
とを特徴とする。
音声認識処理におけるマツチング処理とは、2つの音声
パターンの差を絶対値、即ち距離をめることである。マ
ツチング処理によシ得られる距離をマツチング距離とい
う。マツチング距離がゼロになるということは、マツチ
ング処理を行った2つの音声パターンが、全く等しいも
のであることを示す。
マツチング処理にはいくつかの方法があるが、ここでは
DPマツチング・アルゴリズムに基づいたパターンマツ
チング方式について説明する。
(1)音声の分析 マツチング処理を行うためには、まず音声を分析する必
要がある。ここではバンドパスフィルタバンクに異る音
声の分析方法について説明する。入力音tkkいくつか
の周波数帯域に分けたバンドパスフィルタで帯域分割し
、分割された音声データを整流回路、ローパスフィルタ
に通す。こうして得られた値′t−20m5ec程度の
フレーム周期でA/D変換する。その結果、音声パター
ン人は、以下のようにベクトルの時系列で表わされる。
A=a、、a、、・・・・・・・−・、&1.・・・・
・・・・・、 a116チヤネルのフィルタバンクの場
合にはILiは以下のように表わされる。
al =(as、 as、・・−・・・・・・、al・
)(1)DPマツチング マツチング処理を行う2つの音声ノくターンA。
Bを以下のように示す。
A = iL t r a *、・・・・・・−・・、
at、・・・・・・・・・、1LI3=b、、b寡、・
・・・・・・・・、 bj、・・・・・・・・・、bJ
ここで、I、Jはそれぞれのノ(ターンのフレーム数で
ある。2つのベクトルillとbjの間の距離d(+、
j)は以下の計算式を用いる。
d (I、 j )=llat −bj ll=Σ1a
tx−bjIIC=1 (I) DPマツチングアルゴリズムによれば2つの音声パター
ン人、Bの間のマツチング距離g(I。
J)は以下の漸化式を(t、])=(1,i)からCI
、J)tで計算することによシ得られる。
時間軸の整合を行うDPマツチングにおいて、時間軸の
極端な変#を避けるために整合窓を設け、整合窓内での
み(I)の漸化式計算を行う。
第2図にDPマッデングにおける整合窓を示す。
以上のことから二つのパターンの間のマツチング距離が
小さい程2つの音声は似ていることがわかる。音声認識
処理において未知入力音声パターンと登録音声パターン
とのマツチング距離が最も小さい登録音声が認識音声と
して採用される。次に、本発明の、実施例について図面
を用いて説明する。第3図は゛本発明の実施例において
使用する音声−識登録装置のプ四ツク図である。ある音
声全4回発声し、その中から登録する音声を選択する場
合について説明する。まず、第3図の発声回数指定部l
において登録音声選択のための発声の回数を4回と指定
する。次に、音声発声部2において、登録しようとする
音声を、4回発声する。1回目に発声された音声(i−
Axとおき、音声記録部3において、メモリA1に格納
する。この処理を4回繰り返すことにより、同様に2.
3.4回目に発声された音声を、それぞれA2.Aa’
、A4とおき、音声記録部3において、メモリA2.メ
モリAs、メモリA4に格納する。マツチング距離i1
算部4において、4回の発声より得られる音声パターン
について、すべての組合わせでマツチング距離をめる。
即ち、AlとA2、AXとAa。
・・・・・・、A3とA4の間でDPマツチング処理を
行い、それぞれの音声パターン間のマツチング距離D1
2,1)131・・・・・・、Da4を計算する。DP
マツチング処理に関しては、新美1ji永著「音声認識
」(情幸科学講座E、19.3.共立出版(株) ) 
107ページに述べられている。発声が全く等しい場合
には、マツチング距離がゼロになるが、完全に同じ発声
ケすることはほとんど不可能である。従って、各音声パ
ターン間のマツチング距離がゼロになるこ七はほとんど
なく、また、各音声パターン間のマツチング距離が等し
くなることもほとんどない。マツチング距離計算部4に
よシ得られた各音声ハターン間のマツチング距離は、マ
ツチング距離記録部5において、メモリD12.メモリ
Dus。
・・・・・・、メモリD34 に格納する。各音声パタ
ーン間のマツチング距離を第1表に示すよう゛に仮定す
る。マツチング距離加算部6において、各音声パターン
ごとに他の音声パターンとのマツチング距離の和をめる
。即ち、Axについてマツチング距離の和をめる場合、
DI2+013+D14がめる値であJ、Atについて
のマツチング距離の和は、D12+D23+D24であ
る。得られたマツチング距離の和を、:A1.A2.A
a、A4についてそれぞれDI、D2.Da、D4とし
、距離和記録部7において、メモリD1.メモリD2.
メモリDa、メモリD4に格納する。各音声パターンご
とのマツチング距離の和の大きさを、比較選択部8にお
いて比較し、マツチング距離の和の小さいものを選択す
る。第1表に示すように、1)lは第1表 D2.Da、D4と比較して最も小さい。従って、比較
選択部8においてAIを登録音声として選択し、音声登
録部9において、登録音声格納領域に登録する。音声認
識処理において、未知入力音声パターンとのマツチング
距離が最も小さい登録音声kgR音声として採用する。
このことから、同一音声を複数回発声した場合に、各音
声パターン間のマツチング距離が小さいものtlど、よ
シ近い音声、即ち、等しい音声として認識する。従って
、本実施例におけるAI、A2.A3.A4の4回発声
された音声の中で、マツチング距離の和が最も小さい音
声Ali登録音声として採用する。このことは、最も認
識されやすい音声を登録音声として用いることを示して
いる。
以上のことから、本発眠による音声登録方式を用いれば
、発声の失敗による再登録の繁雑さを避け、よい登録の
ための発声練習を不要とし、認識率を向上させる登録音
声データに作成する効果がある。
【図面の簡単な説明】
第1図は従来の音声登録方式を示す流れ図、第2図はマ
ツチング処理における整合窓を示す図、第3図は本発明
の実施例において使用する音声認識登録装置のブロック
図である。 1・・・・・・音声回数指定部、2・・・・・・音声発
声部、3・・・・・・音声記録部、4・・・・・・マツ
チング距離計耳部、5・・・・・・マツチング距離記録
部、6・・・・・・マツチング距離加算部、7・・・・
・・距離和記録部、8・・・・・・比較選択部、9・・
・・・・音声登録部。

Claims (1)

    【特許請求の範囲】
  1. 同一語として認識されるべき音声を3回以上発生するこ
    とによシ得られる3以上の音声パターンを記憶し、該記
    憶された音声パターン相互間でマツチング距離計算ヲ行
    い、前記3以上の音声パターンごとにマツチング距離の
    和をめ、前記3以上の音声パターンの中から前記マツチ
    ング距離の和が最も小さい音声パターンを選択し、登録
    音声として採用すること全特徴とする音声登録方式。
JP58133313A 1983-07-21 1983-07-21 音声登録方式 Pending JPS6024597A (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP58133313A JPS6024597A (ja) 1983-07-21 1983-07-21 音声登録方式
US06/632,492 US4731845A (en) 1983-07-21 1984-07-19 Device for loading a pattern recognizer with a reference pattern selected from similar patterns
EP84108602A EP0135046B1 (en) 1983-07-21 1984-07-20 Device for loading a pattern recognizer with a reference pattern selected from similar patterns
DE8484108602T DE3466818D1 (en) 1983-07-21 1984-07-20 Device for loading a pattern recognizer with a reference pattern selected from similar patterns

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58133313A JPS6024597A (ja) 1983-07-21 1983-07-21 音声登録方式

Publications (1)

Publication Number Publication Date
JPS6024597A true JPS6024597A (ja) 1985-02-07

Family

ID=15101756

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58133313A Pending JPS6024597A (ja) 1983-07-21 1983-07-21 音声登録方式

Country Status (4)

Country Link
US (1) US4731845A (ja)
EP (1) EP0135046B1 (ja)
JP (1) JPS6024597A (ja)
DE (1) DE3466818D1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62201967U (ja) * 1986-06-13 1987-12-23

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2581465B1 (fr) * 1985-05-03 1988-05-20 Telephonie Ind Commerciale Procede et dispositif de commande de processus par voie sonore
GB2196460B (en) * 1986-10-03 1991-05-15 Ricoh Kk Methods for comparing an input voice pattern with a registered voice pattern and voice recognition systems
US4805218A (en) * 1987-04-03 1989-02-14 Dragon Systems, Inc. Method for speech analysis and speech recognition
GB2237135A (en) * 1989-10-16 1991-04-24 Logica Uk Ltd Speaker recognition
JPH03155599A (ja) * 1989-11-13 1991-07-03 Nec Corp 音声認識装置
EP0441176B1 (en) * 1990-01-25 1994-03-30 Mitsubishi Jidosha Kogyo Kabushiki Kaisha System for controlling the output power of motor vehicle
DE69021547T2 (de) * 1990-02-16 1996-01-18 Rolls Royce Plc Vorrichtung und Verfahren zum Feststellen der Echtheit der Handschrift einer Person.
US5293451A (en) * 1990-10-23 1994-03-08 International Business Machines Corporation Method and apparatus for generating models of spoken words based on a small number of utterances
JP2808906B2 (ja) * 1991-02-07 1998-10-08 日本電気株式会社 音声認識装置
US5485621A (en) * 1991-05-10 1996-01-16 Siemens Corporate Research, Inc. Interactive method of using a group similarity measure for providing a decision on which groups to combine
US5317741A (en) * 1991-05-10 1994-05-31 Siemens Corporate Research, Inc. Computer method for identifying a misclassified software object in a cluster of internally similar software objects
EP0513652A2 (en) * 1991-05-10 1992-11-19 Siemens Aktiengesellschaft Method for modelling similarity function using neural network
US5428788A (en) * 1991-05-10 1995-06-27 Siemens Corporate Research, Inc. Feature ratio method for computing software similarity
US5438676A (en) * 1991-05-10 1995-08-01 Siemens Corporate Research, Inc. Method for adapting a similarity function for identifying misclassified software objects
US5440742A (en) * 1991-05-10 1995-08-08 Siemens Corporate Research, Inc. Two-neighborhood method for computing similarity between two groups of objects
US5479531A (en) * 1991-06-21 1995-12-26 Rolls-Royce Plc Apparatus and method for providing a weighted average of time varying characteristic of handwriting
FI97919C (fi) * 1992-06-05 1997-03-10 Nokia Mobile Phones Ltd Puheentunnistusmenetelmä ja -järjestelmä puheella ohjattavaa puhelinta varten
US6073097A (en) * 1992-11-13 2000-06-06 Dragon Systems, Inc. Speech recognition system which selects one of a plurality of vocabulary models
US5428707A (en) * 1992-11-13 1995-06-27 Dragon Systems, Inc. Apparatus and methods for training speech recognition systems and their users and otherwise improving speech recognition performance
US6092043A (en) * 1992-11-13 2000-07-18 Dragon Systems, Inc. Apparatuses and method for training and operating speech recognition systems
JP3611223B2 (ja) * 1996-08-20 2005-01-19 株式会社リコー 音声認識装置及び方法
FR2769118B1 (fr) 1997-09-29 1999-12-03 Matra Communication Procede de reconnaissance de parole

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57102700A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1261385A (en) * 1968-07-24 1972-01-26 Matsushita Electric Ind Co Ltd Speech analyzing apparatus
US3816722A (en) * 1970-09-29 1974-06-11 Nippon Electric Co Computer for calculating the similarity between patterns and pattern recognition system comprising the similarity computer
US3864518A (en) * 1972-03-20 1975-02-04 Meguer V Kalfaian Signal conversion apparatus
JPS50155105A (ja) * 1974-06-04 1975-12-15
US4059725A (en) * 1975-03-12 1977-11-22 Nippon Electric Company, Ltd. Automatic continuous speech recognition system employing dynamic programming
DE2844156A1 (de) * 1978-10-10 1980-04-24 Philips Patentverwaltung Verfahren zum verifizieren eines sprechers
US4297528A (en) * 1979-09-10 1981-10-27 Interstate Electronics Corp. Training circuit for audio signal recognition computer
JPS5722295A (en) * 1980-07-15 1982-02-05 Nippon Electric Co Speaker recognizing system
JPS5879300A (ja) * 1981-11-06 1983-05-13 日本電気株式会社 パタ−ン距離計算方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS57102700A (en) * 1980-12-18 1982-06-25 Matsushita Electric Ind Co Ltd Voice recognizer

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62201967U (ja) * 1986-06-13 1987-12-23

Also Published As

Publication number Publication date
EP0135046A1 (en) 1985-03-27
US4731845A (en) 1988-03-15
DE3466818D1 (en) 1987-11-19
EP0135046B1 (en) 1987-10-14

Similar Documents

Publication Publication Date Title
JPS6024597A (ja) 音声登録方式
US5388183A (en) Speech recognition providing multiple outputs
JPH0743598B2 (ja) 音声認識方法
JPS58192100A (ja) 第1の音声パタ−ンを第2の音声パタ−ンと時間的に整列させる方法とその装置
JPS63259687A (ja) 音声信号認識方法およびその方法を実施する装置
US5765124A (en) Time-varying feature space preprocessing procedure for telephone based speech recognition
JPH04318900A (ja) 多方向同時収音式音声認識方法
US4790017A (en) Speech processing feature generation arrangement
JPS63502304A (ja) 高雑音環境における言語認識のためのフレ−ム比較法
JP3437492B2 (ja) 音声認識方法及び装置
Ramasubramanian et al. Acoustic modeling by phoneme templates and modified one-pass DP decoding for continuous speech recognition
JP3011997B2 (ja) 参照ベクトル更新方法
JP2005091758A (ja) 話者認識システム及び方法
JPS6312000A (ja) 音声認識装置
Rose et al. On the interaction between speaker normalization, environment compensation, and discriminant feature space transformations
JPS616694A (ja) 音声登録方式
JPS6035794A (ja) 音声登録方式
JP3009962B2 (ja) 音声認識装置
Sudirman et al. NN with DTW-FF Coefficients and Pitch Feature for Speaker Recognition Rubita Sudirman1, Sh-Hussain Salleh1, Shaharuddin Salleh2
JPH0311478B2 (ja)
JPS607492A (ja) 単音節音声認識方式
JPH042197B2 (ja)
JPS62111295A (ja) 音声認識装置
JPS6410080B2 (ja)
JPS6183598A (ja) 音声パタ−ンマツチング方式