JPS63500126A - speaker verification device - Google Patents

speaker verification device

Info

Publication number
JPS63500126A
JPS63500126A JP50373286A JP50373286A JPS63500126A JP S63500126 A JPS63500126 A JP S63500126A JP 50373286 A JP50373286 A JP 50373286A JP 50373286 A JP50373286 A JP 50373286A JP S63500126 A JPS63500126 A JP S63500126A
Authority
JP
Japan
Prior art keywords
value
acoustic signal
acoustic
signal source
speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP50373286A
Other languages
Japanese (ja)
Inventor
アバット,ヒューゼイン
デンカー,トーマス・エイ
エルマン,ジェフリー・エル
タオ,バートラム・ピー・エム
Original Assignee
エッコ・インダストリ−ズ・インコ−ポレ−テッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by エッコ・インダストリ−ズ・インコ−ポレ−テッド filed Critical エッコ・インダストリ−ズ・インコ−ポレ−テッド
Publication of JPS63500126A publication Critical patent/JPS63500126A/en
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L17/00Speaker identification or verification techniques
    • G10L17/06Decision making techniques; Pattern matching strategies

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Telephonic Communication Services (AREA)
  • Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるため要約のデータは記録されません。 (57) [Summary] This bulletin contains application data before electronic filing, so abstract data is not recorded.

Description

【発明の詳細な説明】 話者照合装置 発明の背景 この出願は1985年6月1日出願の米国特許継続出願第751.031号であ シ、この出願と同一の本出願人に譲渡されたものである。[Detailed description of the invention] speaker verification device Background of the invention This application is U.S. Patent Continuing Application No. 751.031, filed June 1, 1985. This application is assigned to the same applicant as this application.

この発明は話者検証装置に関し、特に音声入力に基づいて個人を識別する方法及 び装置に関する。The present invention relates to a speaker verification device, and in particular to a method and method for identifying individuals based on voice input. and equipment.

個人の識別をすることを必要とする場合が多数ある。このような場合には、保安 環境に対する物理的なアクセスの制御、データ入力またはデータ転送の検定、自 動テラー・マシンに対するアク毛ス制御、及びクレジット・カードの識別確定が 含まれる。音声による識別は、よシ便利で1、遠方に、例えば電話により伝送す ることができ、しかも信頼性があるので、これらの場合の何れにおいても代替装 置として優れている。There are many situations in which it is necessary to identify an individual. In such cases, security control of physical access to the environment, verification of data entry or data transfer, Accurate control over dynamic terror machines and confirmation of credit card identification included. Voice identification is very convenient1 and can be transmitted over long distances, e.g. by telephone. In both of these cases, alternative equipment is available and reliable. Excellent as a place.

自動化された従来の話者検証装置は、その信頼性に限界からシ、多くの問題を拘 えているので、通常その適用が高い信頼性を必要としない分野に限定されていた 。Traditional automated speaker verification devices suffer from limited reliability and many problems. Its application is usually limited to areas that do not require high reliability. .

このような形式の装置は、連続したピンチ期間からピーク及び谷を選択して用い 、未知の話者の音声入力に関する特徴座標を得ている。これらの座標は前に記憶 した基準座標と選択的に比較される。比較の結果、未知の話者についての同一性 を判断する。このような装置の大きな欠点は、記憶した発声を比較する際に、受 信した発声の総合的な強度レベルの変化により問題が発生することがらるという 点にある。This type of device is used to select peaks and troughs from consecutive pinch periods. , we have obtained the feature coordinates for the unknown speaker's voice input. Remember these coordinates before are selectively compared with reference coordinates. As a result of comparison, identity for unknown speakers to judge. The major drawback of such devices is that they cannot be compared to memorized utterances. It is said that problems can occur due to changes in the overall intensity level of the vocalizations that are being transmitted. At the point.

この技術分野における他の問題は、個人が試験センテンスを発声する特徴方法を 、前に記憶した同一のセンテンスの発声と比較することである。この装置は試験 発声と記憶した基準発声とのスにクトル及び基本周波数の一致に基づいている。Another problem in this technical field is the characteristic way in which an individual pronounces a test sentence. , to compare it with a previously memorized utterance of the same sentence. This device has been tested It is based on the coincidence of the vector and fundamental frequency between the utterance and the memorized reference utterance.

その結果、この装置は話者の音声ピッチにおける変化によシ誤シが発生し易い。As a result, this device is susceptible to errors due to changes in the pitch of the speaker's voice.

また、話者の検証に利用されていた他の形式の構造は、各発声をろ波して、個人 を高度に表わすパラメータを得ているが、発声の定数から独立している。これは 、話者の声道の固有な特性に基づく線形予測分析によシ達成される。話者の声道 の特性を識別する信号を、話者の識別を表わし、かつ話者の物理的な特徴を表わ す一組の信号に変換するために、−組の基準計数信号が採用されている。Other forms of structure that have been used for speaker verification also filter each utterance to We have obtained parameters that are highly representative of , but are independent of the phonation constants. this is , achieved through linear predictive analysis based on the unique characteristics of the speaker's vocal tract. speaker's vocal tract A signal that identifies the characteristics of the speaker, represents the identity of the speaker, and represents physical characteristics of the speaker. A - set of reference count signals is employed to convert into a - set of signals.

その装置において前記の線形予測・ξラメータを用いて未知の話者の仮想識別を 発生した後、識別した話者の物理的な特徴を表わす信号と比較することにより、 未知の話者の同一性を確認する。文献は、その装置において試験発声と基準発声 との間の歪みを比較することができる機構については説明していない。The device uses the linear prediction and ξ parameter described above to perform virtual identification of unknown speakers. Once generated, by comparing it with a signal representing the physical characteristics of the identified speaker. Verify the identity of an unknown speaker. The literature describes the test utterances and reference utterances in the device. It does not explain the mechanism by which the distortions between the two can be compared.

その結果、発声分析の予備ステップに対して、話者検証の段階を実際に実行する ための明確な方法は示されていない。As a result, the speaker verification stage is actually performed for the preliminary steps of utterance analysis. There is no clear method shown.

いくらか異なる解決方法を採用した他の装置は、ユーザが発声した標準的なフレ ーズに対応する波形の瞬時的な不変量を用いた話者検証装置を備えている。即ち 、同一のユーザによる同一フレーズの独立発声数を用いて、発声ベクトルにそれ ぞれに対応する一組の瞬時的な不変量を編集する。次に、平均的な発声はクトル を計算する。平均的な発声ベクトルと後に得た発声ベクトルとを比較して、話者 の検証を得る。異なる年令および性の個人グループの瞬時的な不変量も記憶し、 またユーザーに対して同じような年令及び同性にあるグループ内の複数個人の不 変量グループも、記憶したユーザーの発声ベクトルと比較して重み付はベクトル を得る。ユーザーの重み付はベクトル及び計算した発声ベクトルをカードに記憶 し、濁値を計算する際及びユーザーの発声を後に評価する際に用いる。この装置 は、試験発声と参照番号発声との間の歪みを比較することができる機構について は何も述べていない。更に、平均発声ベクトルに対して新しい発声を比較するこ とに基づいての許可の信頼性には疑問がちる。これは、ユーザーの発声が種々な その特徴に大きな変動が見られるときに、特に疑問がある。例えば、話者が与え られた時間に単語を違えて話すときは、単純平均値はこのように変動する音声の 確認に柔軟性がない。Other devices, with somewhat different solutions, use standard phrases spoken by the user. The system is equipped with a speaker verification device that uses instantaneous invariants of the waveform corresponding to the user's voice. That is, , using the number of independent utterances of the same phrase by the same user, the utterance vector is Edit a corresponding set of instantaneous invariants. Next, the average vocalization is Calculate. By comparing the average utterance vector with the utterance vector obtained later, Get verified. It also remembers instantaneous invariants for groups of individuals of different ages and genders, Users may also be asked to identify multiple individuals within a group who are of similar age and gender. The variable group is also weighted as a vector compared to the user's memorized utterance vector. get. The user's weighting vector and the calculated utterance vector are stored on the card. It is used when calculating the utterance value and later evaluating the user's utterances. this device describes a mechanism by which distortions between test utterances and reference number utterances can be compared. says nothing. Furthermore, it is possible to compare new utterances against the average utterance vector. The reliability of permits based on this is questionable. This is because the user's utterances vary. This is especially questionable when there are large variations in the characteristics. For example, if the speaker gives When speaking different words at a given time, the simple average value There is no flexibility in confirmation.

更に、関連する他の装置では、分類する試験単語と他の標本値との間の「距離; N値」及び「平均値」を計算し、「重み付は係数」を用いて特定の変数の重要性 を測定する。これらの部分が基準標本値の部分の最小距離内に入るときに、また 藏値外の試験単語の複数部分の比較により音声の検証ができることを除き、与え られたユーザーについて固定的な絢値を必要とする。Furthermore, other related devices use the ``distance'' between the test word to be classified and other sample values; Calculate the "N value" and "average value" and use the "weighting coefficient" to determine the importance of a particular variable. Measure. When these parts fall within the minimum distance of the parts of the reference sample value, given, except that speech can be verified by comparing multiple parts of the test word outside the Requires a fixed value for each user.

試験標本値の近傍に基準標本値がないときは、試験標本値が基ン1 準、ダ、値外にあるときに許可を得る手段がない。例えば単語を無意識に正しく 発音しなかったときは、ユーザーを検証することができない。If there is no reference sample value near the test sample value, the test sample value is the base 1. There is no way to get permission when it is outside the range. For example, if you unconsciously pronounce a word correctly, If it is not pronounced, the user cannot be verified.

この技術における更に他の装置では、与えられた基準単語の基準化したテンプレ ートに複数の話者の音響的な特徴の平均値を記憶するものでるる。識別された話 者の発声に応答して、基準単語の特徴テンプレートによシ識別した話者の特徴の 対応性を表わす一組の信号を発生する。未知の話者の発声を、未知の話者の発声 特性、及び確認をした複数の単語について記憶したテンプレートと比較すること によシ分析する。更に、この装置は受信した音声の1標本値とその特定のユーザ ーの1n値とを比較するという問題もある。その結果、単語を発音する1回の試 行が装置に記憶している基準情報から大幅に異なっているときは、ユーザーは( 勾値の設定に従って検証を証明することができない。Still other devices in this art include standardized templates of given reference words. The average value of the acoustic characteristics of multiple speakers is stored in the smart card. identified story In response to the speaker's utterance, the speaker's features identified by the reference word feature template are A set of signals is generated representing the correspondence. Unknown speaker's utterance, unknown speaker's utterance Characteristics and comparison with memorized templates for multiple words checked Analyze it carefully. In addition, this device collects one sample value of the received audio and its specific user. There is also the problem of comparing the 1n value of -. As a result, one trial of pronouncing the word If the row differs significantly from the reference information stored on the device, the user can Verification cannot be proven according to gradient value settings.

多くの従来装置が有する他の問題は、音声の開始及び終了を検出する信頼性のる る制御可能な手段がないことである。これは、更に従来装置の信頼性を低下させ たり、音声の終了点の識別を目的とする精巧な構成により装置のコストを大幅に 増加させるものでちる。多くの従来装置では、このような検出をすることなく、 基準音声と検出が困難な終了点を有する受信音声とを信頼性のある比較をするこ とは、非常に困難である。Another problem with many conventional devices is the unreliability of detecting the start and end of audio. There is no controllable means to control the This further reduces the reliability of conventional equipment. The cost of the device can be significantly reduced by using sophisticated configurations to identify the end point of audio. Chill with something that increases. Many conventional devices do not perform this kind of detection. Reliably compare reference speech and received speech with difficult-to-detect endpoints. That is extremely difficult.

以上で述べた技術のような話者検証の技術における種々の問題に鑑み、話者検証 について装置の信頼性を高めることは、大きな技術上の進歩となる。更に、パラ メータを用いて与えられたユーザーの複数の試行及びユーザー自身の単語テンプ レートによる話者の比較に基づき、合否を評価する場合、かつ与えられたユーザ ーの情報がユーザー検証のために選択した囚値しくルに基づき氏名詐称証者を許 可する可能性を有する場合に、声道に固有な特性を反映する話者従属特性に基づ く強度変動からこのような装置がほぼ独立しているならば、これも重要な改善と なる。更に、これは、装置が合否前にユーザーから抽出する複数の標本値を得る ことができ、従って単語の発音における疑似的な又は偶発的な誤シがユーザーの 識別の妨げとならないならば、改善となる。更に、実行した多数の試験により検 証基準を定め、かつ検証at値の厳密性を変化させるkに監視員による調整又は 変更が容易であれば、これも改善となる。In view of the various problems in speaker verification technology such as the technology described above, speaker verification Increasing the reliability of equipment would be a major technological advance. Furthermore, para User's multiple trials given using meter and user's own word template When evaluating pass/fail based on a comparison of speakers by rate, and given a user The identity of the person is authorized based on the information selected for user verification. based on speaker-dependent characteristics that reflect characteristics specific to the vocal tract. This would also be an important improvement if such a device were to be nearly independent from intensity fluctuations. Become. Additionally, this allows the device to take multiple sample values from the user before passing or failing. Therefore, spurious or accidental mistakes in the pronunciation of words can be avoided by the user. If it does not interfere with identification, it is an improvement. Furthermore, a large number of tests performed Adjustments by monitors or changes in the strictness of verification at values are established. This is also an improvement if it is easy to change.

識別の検証を実行する方法および装置を提供するものである。A method and apparatus for performing identity verification is provided.

特に、この発明は、ユーザー自身及び包括的な発声データの比較により、処理さ れるユーザーからの単語の標本値を有するデータ・ベースを最初に導出し、与え られた単語に基づく検証に関連して氏名詐称証者を誤って許可する確率手段を導 出する装置を提供するものである。生成された前記データ・ベースによシ、装置 は処理をし、複数の試行に基づき、かつ前記データ・ベースの情報に鑑み、話者 の識別を検証する。In particular, this invention uses a comparison of the user's own and comprehensive vocalization data to First derive a database with sample values of words from users We introduce a probability measure that falsely admits a false witness in connection with verification based on The purpose is to provide a device for producing According to the generated database, the device is processed, and based on multiple trials and in view of the information in the database, the speaker Verify the identity of

話者は、検証目的用に装置を使用する前に登録されなければならない。装置は、 ユーザーを登録するために、充分な数の単語のトークン(トークンとは箪語の一 回の発声であシ、本明細書中「証拠」、「合言葉」として記載される。)を得て 、データ・ベースに記憶するまで、一連の基準単語のトークンのためにユーザー を繰シ返して促す。トークンを特徴分析に掛ること−によシ、話者の声道のある 係数情報が得られる。トークンは終了点検出器にも掛けられる。装置は、トーク ン間の比較によシ、かつ対応する通常の人間集団のトークンにより、氏名詐称証 者を誤って許可する確率、又は真の話者を拒否する確率の手段を得る。Speakers must be registered before using the device for verification purposes. The device is A sufficient number of word tokens (tokens are short words) to register a user. This is referred to as "evidence" or "password" in this specification. ) obtained , the user for a series of reference word tokens until stored in the database. Prompt repeatedly. By subjecting the token to feature analysis, it is important to identify the speaker's vocal tract. Coefficient information can be obtained. The token is also applied to the endpoint detector. device talk By comparison between tokens and the corresponding tokens of the normal human population, name fraud evidence can be obtained. We obtain a measure of the probability of falsely admitting a speaker or rejecting a true speaker.

登録したユーザーは、自己の音声を検証(確認)したいときは、自分が要求して いる識別を入力し、次に装置がユーザーに発声を促す。ユーザーの発声はディジ タル的に符号化されて分析される。開始点と終了点とが検出され、発声の特徴に 対応する係数が導出される。選択した単語についてユーザーが前に記録したトー クンから導出し、選択した係数を、新しく受信した発声の係数と比較して、新し い発声と各基準トークンとの間の距離の測定値を導出する。この処理全ユーザー の付加的な発声について反復する。登録中に導出した確率情報に対する1以上の 距離測定値を分析することによシ、装置は誤判定する確率を決定する。これらの 確率に基づいて、ユーザーを受付けるか、拒否するかの判断を以下の複数の段階 で行なう。段階毎に累積する確率を用いることKより、異なる単語に対する幾つ かの音声試行と関連して音声をダイナミックに評価する手段が得られるので、検 証判断は種々の単語のそれぞれについてのユーザーの実行に基づいておシ、氏名 詐称証者を誤って許可する可能性を低減させている。If a registered user wishes to verify (confirm) his or her own voice, he or she may request it. The device then prompts the user to speak. The user's voice is digital It is then digitally encoded and analyzed. The start and end points are detected and the characteristics of the utterance are Corresponding coefficients are derived. Previously recorded tones by the user for the selected word The selected coefficients are compared with the coefficients of the newly received utterance to determine whether the new Derive a measure of the distance between the different utterances and each reference token. This process all users repeat for additional utterances. 1 or more for the probability information derived during registration. By analyzing the distance measurements, the device determines the probability of false positives. these Based on probability, the decision to accept or reject a user is made in multiple stages: Let's do it. By using the cumulative probability for each step, we can calculate how many This provides a means to dynamically evaluate speech in relation to speech trials. The judgment is based on the user's performance of each of the various words, names, names, etc. This reduces the possibility of erroneously allowing a false witness.

この発明の一つの概要的な特徴は、初期の段階で次の段階に進むべきか否かの判 断を行なう段階で、検証判断(すなわち、確認)を行なうことであシ、次の段階 では検証判断を最初の段階で行なった分析と、次の段階で行なった分析とに基づ いていることである。One general feature of this invention is that it is possible to determine at an early stage whether or not to proceed to the next step. At the stage of making a decision, it is necessary to make a verification judgment (i.e., confirm Now, let's make a verification decision based on the analysis performed in the first stage and the analysis performed in the next stage. It is something that is happening.

他の概要的な特徴は、記憶した音声情報から導出した確率データから得る少なく とも一つの確率値について検証判断をバイアスすることである。Other general features are the low probability data derived from memorized speech information. This is to bias the verification judgment with respect to a single probability value.

他の概要的な特徴は、話者が既知の人物であると検証されたときにのみ、話者の 発声についての試験情報に基づき記憶情報を更新することにある。Other summary characteristics are that the speaker's The objective is to update memory information based on test information regarding vocalizations.

他の概要的な特徴は、話者が既知の人物であると検証されたときに、装置(例え ば、ドアのロックのソレノイトリをトリガする非磁気的なパワー・スイッチであ る。Other general characteristics are that when the speaker is verified to be a known person, For example, a non-magnetic power switch that triggers a door lock solenoid. Ru.

他の概要的な特徴は、符号化されたトーン信号を検出し、デコート9すること、 かつ同一のディジタル・プロセッサを用いて音声検証を実行することにある。Other general features include detecting and decoding 9 encoded tone signals; and to perform voice verification using the same digital processor.

他の概要的な特徴は、分析を同時的に処理することができるように、異なるステ ーショ/から受信した異なる発声の分析を時分割ですることにある。Other general features are that different stages can be processed simultaneously so that analysis The purpose of this method is to time-share the analysis of different utterances received from the station/station.

他の概要的な特徴は、発声を受信する複数のステーションと、それぞれのステー ションにサービスを行なう複数のプロセッサと、リアル・タイムでそれぞれのス テーションにサービスを行なうリアル・タイム処理装置を有するホスト・コンピ ュータとを組合せることにろる。Other high-level features include multiple stations receiving vocalizations and each multiple processors servicing the application and each processor in real time. A host computer with real-time processing equipment that services the It is best to combine it with a computer.

他の概要的な特徴は、以下で説明する好ましい実施例、及び請求の範囲から明ら かとなる。Other general features will be apparent from the preferred embodiments described below and from the claims. It will be.

第1図はこの発明に用いられる音声検証の方法の一般的な概要ブロック図である 。FIG. 1 is a general overview block diagram of the voice verification method used in this invention. .

第2図はこの発明の話者検証装置で用いられる装置の好ましい一実施例の詳細な ブロック図である。FIG. 2 shows a detailed diagram of a preferred embodiment of the device used in the speaker verification device of the present invention. It is a block diagram.

第3図及び第4図はこの発明の話者検証装置の動作を説明するフローチャートで ある。3 and 4 are flowcharts explaining the operation of the speaker verification device of the present invention. be.

第5図はこの発明の音声検出装置の状態図である。FIG. 5 is a state diagram of the voice detection device of the present invention.

第6図から第8図はこの発明の話者検証装置の動作を説明するフローチャートで ある。6 to 8 are flowcharts explaining the operation of the speaker verification device of the present invention. be.

第9図は与えられた単語のトークンの比較を表わす全体的な歪みを得る方法のグ ラフ表示である。Figure 9 is a diagram of how to obtain the overall distortion representing the comparison of tokens of a given word. This is a rough display.

第10図およυ第11図はこの発明の話者検証装置の動作を示すフローチャート でるる。Figures 10 and 11 are flowcharts showing the operation of the speaker verification device of the present invention. Out.

第12図はこの発明の動作で導出した歪みを編成するアレー゛D″の表である。FIG. 12 is a table of array D'' that organizes the distortions derived in the operation of the present invention.

第13図はこの発明の動作において生成された単語側の5TATフアイルの表で ある。Figure 13 is a table of the 5TAT files on the word side generated in the operation of this invention. be.

第14図から第16図はこの発明の話者検証装置の動作を示すフローチャートで ある。14 to 16 are flowcharts showing the operation of the speaker verification device of the present invention. be.

第17図はリアル・タイム処理装置を有するホスト・コンピュータがサービスを する多重アクセス・モジュール装置のブロック図である。Figure 17 shows how a host computer with real-time processing equipment provides services. FIG. 2 is a block diagram of a multiple access module device that provides a multi-access module;

第18図はアクセス・モジュールのブロック図である。FIG. 18 is a block diagram of the access module.

第49図はアクセス・モジュール部分のブロック図である。FIG. 49 is a block diagram of the access module portion.

第20図はアクセス・モジュールにおけるリレ一式回路の回路図である。FIG. 20 is a circuit diagram of the relay set circuit in the access module.

第21図はリアル・タイム処理装置のメモリ配置テーブルのブロック図である。FIG. 21 is a block diagram of a memory arrangement table of the real-time processing device.

第22図、第23図はリアル・タイム処理装置で用いられる種々のテーブルであ る。Figures 22 and 23 show various tables used in real-time processing equipment. Ru.

第24図は検証処理のフローチャートである。FIG. 24 is a flowchart of the verification process.

第25図、第26図は他の検証処理のフローチャートである。FIGS. 25 and 26 are flowcharts of other verification processes.

第27図は他の検証処理で用いられるガウス関数を示す。FIG. 27 shows a Gaussian function used in other verification processes.

第1図を参照してこの発明を機能的に説明することができる。The present invention can be functionally explained with reference to FIG.

この装置の動作は、装置を作動させるスイッチもしくは他の機械的な作動装置の 動作のような外部条件にょシ、ユーザーの存在を検出するフォトセンサのような 電子検出装置により、ユーザーの音声を検出する音声もしくは音響の付勢により 、またはこれ以外に「タッチ・トーン」信号を付勢させるような雑音を作成する によりブロック20から開始される。The operation of this device is dependent on the operation of a switch or other mechanical actuating device that activates the device. External conditions such as motion, photosensors to detect the presence of the user By means of an electronic detection device, a voice or acoustic activation that detects the user's voice. , or otherwise create a noise that activates a "touch tone" signal. The process starts at block 20.

付勢された装置は、ユーザーによシ、又は前の時点でオイレータによるシステム 処理のために予め選択されたものにょシ、要求されている処理を実行するように 機能する。この観点において、装置はブロック2oから判断ブロック22に進み 、受取った命令に基づいて全体を24で示す「登録」モードに入るか否かを判断 する。The energized device is activated by the user or by the system at a previous point in time. If a pre-selected item is selected for processing, the requested processing will be performed. Function. In this regard, the apparatus proceeds from block 2o to decision block 22. , determines whether to enter the "registration" mode, indicated by 24, based on the received command. do.

登録モート9は特定のユーザーに関連する情報fc邑該ユーザーから獲得し、後 の時点でユーザーの識別を検証する際に用いる−ために処理し、かつ記憶する処 理を行なう。この情報には、データ・ベースを形成するように処理され、ユーザ ーが選択した基準単語を発声したもの(即ちトークン)が含まれており、このデ ータ・ベースを次のユーザー検証において比較用に用いる。Registration Mote 9 obtains information related to a specific user from the user, and then processing and storage for use in verifying the user's identity at the time of the do the right thing. This information is processed to form a database and This data contains the utterances (i.e. tokens) of the reference word selected by the user. The data base will be used for comparison in the next user validation.

従って、個人が検証用に装置を使用可能となる前に、彼または彼女は処理の登録 モードにおける登録処理を経る必要がある。Therefore, before an individual can use the device for verification, he or she must register for processing. It is necessary to go through the registration process in the mode.

装置が登録モードに進むように命令されたときは、装置は判断ブロック22から ブロック26に進み、オにレータは装置にユーザー名前、ユーザーが通過しても よいアクセス点、及びユーザー検証において偽許可及び偽拒絶誤シに対する最大 許容レベルを含む情報をキー・インする。アクセス点及び最大許容レベルが指定 されなかったときは、デフオールド値を用いる。When the device is commanded to enter registration mode, the device starts at decision block 22. Proceeding to block 26, the operator enters the username on the device, even if the user passes A good access point and maximum protection against false authorization and false rejection errors in user verification. Key in information including tolerance levels. Access point and maximum allowed level specified If not, use the default value.

装置はブロック26からブロック28に進み、ユーザーを促してユーザーが記録 すべき基準単語のリストのうちの一つを発声させる。このような発声によって、 パターンがユーザーの識別を表わしている音響的なメツセージを得る、即ち通信 をする。From block 26, the device proceeds to block 28, prompting the user to record. say one of the list of reference words to be used. With such utterances, Obtaining an acoustic message in which the pattern represents the user's identity, i.e. communication do.

装置は、ユーザーを促した後、ブロック3oに進み、受信信号を標本化すなわち 、正規化する。装置は発声を検出すると、ブロック32に進み、検出した発声を ディジタル形式に変換する。After prompting the user, the device proceeds to block 3o and samples the received signal, i.e. , normalize. If the device detects a vocalization, it proceeds to block 32 and records the detected vocalization. Convert to digital format.

装置は、ブロック22からブロック34に進み、受信信号を周期的に標本化し、 各期間は標本値を形成する。この標本値には特定の期間中に検出した音声を表わ す信号が含まれている。From block 22, the apparatus proceeds to block 34 and periodically samples the received signal; Each period forms a sample value. This sample value represents audio detected during a specific period. Contains signals.

標本値は、指定された標本数がフレームを形成するまで記憶され、次いでこのフ レームを処理することにより、フレームを表わす自己相関関数、正規化自己相関 関数、及び線形予測係数を得る。各トークンから抽出した一組の係数(「テンプ レート」と言う)は、以下で説明する検証処理で用いられる。この線形予測係数 は話者の声道特性を表わすものである。Sample values are stored until the specified number of samples form a frame, and then this frame is The autocorrelation function that represents the frame by processing the frame, the normalized autocorrelation Obtain the function and linear prediction coefficients. A set of coefficients (“temp”) extracted from each token rate") is used in the verification process described below. This linear prediction coefficient represents the speaker's vocal tract characteristics.

装置は、ブロック34からブロック36に進み、ブロック34で抽出した特徴を 用い、発声の開始点及び終了点を検出する。From block 34, the apparatus proceeds to block 36, where the device extracts the features extracted in block 34. to detect the start and end points of utterances.

受信信号のエネルギ及びスRクトル・レベルに基づいてこの終了点を検出するた めに、状態機械が用いられる。抽出された特徴及び終了点を一時記憶メモリ38 に記憶した後、ブロック36から判断ブロック40に進む。To detect this end point based on the energy and strain level of the received signal. A state machine is used for this purpose. Temporary memory 38 stores the extracted features and end points. After storing, block 36 advances to decision block 40.

それぞれ選択した各単語について指定トークン数を未だ得ているときは、ブロッ ク40はブロック28に戻り、他の発声をするようにユーザーを促し、以上説明 した処理を続ける。ブロック40において、必要なトークンを得たと判断したと きは、装置はブロック42に進み、命令を受取ってデータ・ベースを形成する時 点まで、ループして待機する。If you still have the specified number of tokens for each selected word, block block 40 returns to block 28 to prompt the user to make another utterance and Continue processing. In block 40, it is determined that the required token has been obtained. If so, the device proceeds to block 42 where it receives instructions to form a data base. Loop and wait until point.

装置は、データ・ベースを形成するように命令されると、ブロック42からブロ ック44に進み、全体的な歪み値が形成され、ブロック38から抽出した特徴を アクセスし、与えられた基準単語のそれぞれのテンプレートと自己のものとの間 で比較すると共に、これらの特徴を一般的な話者グループの対応するトークンに 対しても比較する。これらの比較の結果、−組の全体的な歪みが得られ、各歪み は対応する2つのテンプレート間。When the device is instructed to form a data base, the device starts from block 42. Proceeding to block 44, an overall distortion value is formed and the features extracted from block 38 are access and between each template of a given reference word and its own and compare these features to the corresponding tokens of a common group of speakers. Also compare. These comparisons result in an overall set of distortions, with each distortion is between two corresponding templates.

の距離値を表わすものである。It represents the distance value of .

装置は、ブロック44からブロック44に進み、対応する同一ノ話者のテンプレ ートについての話者間比較、及びユーザーのテアプレートと全体的なテンプレー トとの話者間比較について全体的な歪みを処理し、選択した1ん値レイルに従っ て氏名詐称証者の偽許可の確率を示すアレーに整理する。テンプレート及び対応 する因値を基準テンプレート・ブロック47に記憶し、ブロック47に記憶され たテンプレート及び成値に関連するユーザーの識別をブロック48に記憶する。From block 44, the device proceeds to block 44 and retrieves the corresponding same speaker template. Inter-speaker comparisons for user tear rates and overall templates Process the overall distortion for inter-speaker comparisons with are arranged into an array showing the probability of false authorization by a witness with a false name. Templates and correspondence The factor values to be stored in the reference template block 47 are stored in the reference template block 47; The identification of the user associated with the created template and the closing price is stored in block 48 .

装置は、全てのテンプレートを形成し、1開値を計算した後、ブロック46から ブロック49に進み、以下、登録モードの処°理を終了する。After the device has formed all templates and calculated the 1 open value, the system proceeds from block 46 to The process advances to block 49, whereupon the registration mode processing ends.

装置が判断ブロック22において登録モードに入るように命令されていないとき は、装置はブロック50に進み、全体的を53で示す検証モードに装置は入るか 否かを判断する。アクセス点にユーザーが存在するときは、この検証処理が開始 される。When the device is not commanded to enter registration mode at decision block 22 If the device proceeds to block 50, the device enters a verification mode indicated generally at 53. Decide whether or not. This verification process begins when the user is present at the access point. be done.

装置は、検証モードに入るように命令されたときは、ブロック52に進み、ユー ザーによる付勢を待機する。ユーザーは、限定的ではないが、キー−・パッドに 個人的な識別番号を入力すること、読取装置にプラスチック・カードを挿入する こと、又はマイクロフォンにその者の名前を言うことを含む幾つかの方法で装置 を付勢することができる。装置は、ブロック52においてこのユーザーのデータ を受信すると、ブロック54に進み、メッセー:)全送出してユーザーが登録モ ードで前に記憶した基準単語のうちの一つである発声の入力を要求する。When the device is commanded to enter verification mode, it proceeds to block 52 and the user Waits for activation by the user. The user may, but may not be limited to, Enter your personal identification number and insert your plastic card into the reader the device in several ways, including saying the person's name into the microphone. can be energized. The device stores this user's data in block 52. If the message is received, block 54 is entered and the message: prompt for an utterance of one of the reference words previously memorized in the code.

装置は、ブロック54から音声を表わす電子信号の受信を検出するブロック56 に進む。装置は、音声を検出すると、ブロック58に進み、電子信号全ディジタ ル的に符号化して、予め選択した期間で検出された受信音声を表わす8ビツトの ワードに形成し、これを以下、「フレーム」と呼ぶ。The apparatus detects reception of an electronic signal representing audio from block 56 at block 56. Proceed to. If the device detects audio, it proceeds to block 58 and converts the electronic signal to all digital signals. 8-bit data that represents received audio detected over a preselected time period. This is called a "frame" hereinafter.

次に、装置はブロック60に進み、各フレームラ処理し、その線形予測係数パラ メータ(以下、LPCパラメータと呼ぶ)を得る。LPCパラメータの導出には 、先ずフレーム内において近傍の音声標本値間の統計的な依存の程度を計る自己 相関係数の計算が含まれる。典型的なものとして、各フレームには100カら3 00の音声標本値が含まれ、自己相関係数は種々のこれらの標本値間の関係を表 わしている。The apparatus then proceeds to block 60 and processes each frame and its linear prediction coefficient parameters. (hereinafter referred to as LPC parameters). To derive the LPC parameters , first measure the degree of statistical dependence between neighboring audio sample values within a frame. Includes calculation of correlation coefficients. Typically, each frame contains 100 to 3 00 audio sample values are included, and the autocorrelation coefficient represents the relationship between various these sample values. I'm watching.

自己相関係数は「レビンソンのアルゴリズム」と呼ばれる周知のアルゴリズムを 用いることにより処理され、フレームを表わす係数グループを導出する。これら の自己相関係数は線形予測係数を含み、話者の声道の形状を表わしている。これ らの自己相関係数は処理によシ、この変換係数によって音声のフレームを表わす 線形予測係数グループを表わす一つの変換係数に変換される。この情報は以後で 使用するために記憶される。The autocorrelation coefficient is calculated using a well-known algorithm called "Levinson's algorithm". is processed to derive a group of coefficients representing the frame. these The autocorrelation coefficients include linear prediction coefficients and represent the shape of the speaker's vocal tract. this The autocorrelation coefficients of It is converted into one transform coefficient representing a group of linear prediction coefficients. This information will be provided later stored for use.

以上で説明した変換係数の導出処理は、発声が終了するまで、発声のセグメント について続けられる。従ってブロック62において、装置は発声の終了点を検出 して、当該発声に対応する変換係数グループを含むテンプレートを形成する。従 って、このテンプレートによって発声を表わすものとなる。The process of deriving the conversion coefficients explained above is performed until the utterance ends. I can go on about this. Therefore, in block 62, the device detects the end of the utterance. to form a template containing a group of transform coefficients corresponding to the utterance. subordinate This template represents the utterance.

装置は、このブロック62か′らブロック64に進み、発声のテンプレートはダ イナミック・プログラム分析によシ、特定の発声に対応する基準テンプレートに 比較される。比較用の基準テンプレートは基準テンプレート・メモリ66から抽 出され、基準テンプレート・メモリ66は、一般的な話者グループを表わす対応 の単語テンプレートと共に、登録処理中に個々のユーザーが生成したこれらのテ ンプレートを記憶している。ブロック66において参照される特定のテンプレー トは、識別メモリ68からの信号によシ識別される。この信号は、ブロック66 においてブロック52で入力したユーザーの識別に基づき、かつブロック54に おいて識別され、促されて特定の単語によシ、特定の基準テンプレートを選択す るものである。From this block 62, the device proceeds to block 64, where the template for the utterance is Dynamic program analysis allows you to create reference templates that correspond to specific utterances. be compared. A reference template for comparison is extracted from the reference template memory 66. and the reference template memory 66 contains a set of correspondences representing a common group of speakers. word templates, along with these templates generated by individual users during the registration process. remembers the template. The specific template referenced in block 66 The target is identified by a signal from identification memory 68. This signal is transmitted to block 66 based on the user's identity entered in block 52 in and in block 54; be identified and prompted to select a specific reference template for specific words. It is something that

ブロック64において生成された距離比較、即ち「歪み」は、それぞれその発声 の差である一組の値であり、その特定のユーザーの基準テンプレートのうちの一 つに対する比較によシ試験される。次いで、これらの差の値を処理して現在発声 と基準発声との間の相対的な対応性を示す「スコア」を得る。The distance comparisons or "distortions" generated in block 64 are each A set of values that is the difference between one of the reference templates for that particular user. Tested by comparison with one another. Then process these difference values to create the current utterance. and a reference utterance.

次に、装置は判断ブロック70に進み、ブロック72から適当な底値を参照して 許可するか、拒絶するか、未だ決定していないかを判断する。ブロック72の自 信はオにレータにより設定することができるが、オペレータによりセットされな かったときは、デフオールド値すなわち、default valuesにセッ トされる。これらのH5,値はエネーブル・モードにおける比較結果に基づく一 組の「スコア」を有し、氏名詐称証者が受信した選択試験発声を誤って受付ける 確率を表わしている。The device then proceeds to decision block 70 and references the appropriate bottom price from block 72. Decide whether to approve, deny, or have not yet decided. The self of block 72 The signal can be set by the operator, but must not be set by the operator. If the default value is will be played. These H5 values are based on comparison results in enabled mode. mistakenly accepts the selection test utterances received by the false name witness. It represents probability.

ブロック70では、ブロック64のスコアをブロック72のり値と比較する。ス コアが1句値以下であったとき、及びユーザーが少なくとも2つの試験単語を発 声したときは、その者は許可され、装置はブロック74に進み、以後検証モード すなわち、確認モードの処理を終結する信号を発生する。スコアが囚値以下であ っても、ユーザーが少なくとも2つの標本値を得ることができなかったときは、 装置はブロック54に戻シ、ここでユーザーを促して登録処理で得た他の基準単 語に対応する発声を得る。At block 70, the score of block 64 is compared to the value of block 72. vinegar When the core is less than or equal to the 1 phrase value and the user utters at least 2 test words. If the person does, the person is authorized and the device proceeds to block 74 and thereafter enters verification mode. That is, a signal is generated to terminate the confirmation mode processing. If the score is below the prison value However, if the user is unable to obtain at least two sample values, The device returns to block 54 where it prompts the user to enter other reference units obtained in the registration process. Obtain the utterance corresponding to the word.

ブロック70において、ユーザーがブロック72における面位以上のスコアを得 たときは、失敗とする。2回未満の失敗のときは、装置はブロック54に進み、 ユーザーの他の基準単語すなわち基準ワードについてユーザーを促す。ユーザー が2回とも失敗したときは、装置はブロック70からブロック74に進み、その ユーザーを氏名詐称証者として拒否する。装置は、ブロック74かうその個人の 不照合に基づいて以後の処理を禁止する信号を発生する。In block 70, the user obtains a score greater than or equal to the face position in block 72. If this happens, it is considered a failure. If there are fewer than two failures, the device proceeds to block 54; Prompt the user about the user's other reference words or reference words. user fails both times, the device proceeds from block 70 to block 74 and Reject the user as a false name witness. The device is located in Block 74 or that individual. A signal is generated to prohibit further processing based on the mismatch.

検証を得ること、または拒否することに対する以上の試行または失敗の数の以上 の例は、例示目的のみのもので1、これらのパラメータをオはレータの所望によ シ変更してもよい。この実施例においては、それぞれ新しい試験単語によシ、許 可及び拒否の成値が固定されたままである。しかし、選択により、更に多くの発 声試行を行なう時間に変更するためのブロック64の合成スコアにおける変化に 比例させて、1気値を変更することは可能性で多る。More attempts or failures to obtain or deny validation The example is for illustrative purposes only; these parameters can be modified as desired by the operator. You may change it. In this example, each new test word is Acceptance and rejection prices remain fixed. However, depending on your choice, you can generate even more to a change in the composite score of block 64 for changing the time at which the voice trial is performed; There are many possibilities to change the 1 Ki value proportionally.

第17図を参照すると、装置110においてIBM、e−ソナル・コンビーータ 112 (XTまたはこれと同等のもの)にリアル・タイム処理装置114が備 えられておシ、バス116を介して44の検証ボード(SVB)118に接続さ れ、リアル・タイムのサービスを行なっている。各SVBは多重処理形式により 2つのステーション102にサービスを行なうことができる。ステーションのう ちの一つであるステーション103は登録処理に割p付げられ、登録ステーショ ンと呼ばれる。Referring to FIG. 17, in device 110 an IBM e-sonal convector 112 (XT or equivalent) is equipped with a real-time processing unit 114. 44 verification boards (SVBs) 118 via bus 116. It provides real-time services. Each SVB is a multiprocessing format Two stations 102 can be serviced. station nou One of the stations, station 103, is assigned to the registration process and is the registration station. It is called.

この発明の装置はインタラブド・プロトコル後に同期的な方法、または直接メモ リ・アクセス(DMA)方法によυホスト・コンビーータのバスを介して動作す るように設計されている。The device of this invention can be used in a synchronous manner or directly after an interwoven protocol. operating via the bus of the host converter using a re-access (DMA) method. It is designed to

実質的にどのような基準によってもホスト・インターフェースをプログラムする ことができるが、ここに關示した実施例はホストとしてIBM、PC/TXを使 用することを仮定している。。Program host interfaces to virtually any standard However, the example presented here uses an IBM, PC/TX as the host. It is assumed that this will be used. .

従って、ホストは、商業的な市場で現存する周知のより/Mパーソナル、コンビ ーータのうちの多くのものから選択可能なものでおって、僅かな修正を必要とす るだけで実質的に如何なるコンピュータ・バスのインタフェースも行なう。こけ ホストは、ユーザーのために以上で述べた基準テンプレートを収集して記憶する こと、基準テンプレートについての統計的な情報全計算し、更新し、記憶するこ と、及び幾つかの検証作業を実行することができる。第17図に示した装置の物 理的な構成は、バス116及びSVB 118をホスト・コンピュータの内部に 収容するとともに、ステーション102をホストの外部に設けるようにしたもの である。Therefore, the host is more There are many options to choose from, requiring only minor modifications. It interfaces with virtually any computer bus. moss The host collects and stores the reference templates mentioned above for the user. Calculate, update, and store all statistical information about the reference template. and some verification tasks can be performed. The equipment shown in Figure 17 The logical configuration is to place bus 116 and SVB 118 inside the host computer. In addition to accommodating the host, the station 102 is provided outside the host. It is.

第18図を参照すると、各ステーション590は16キーのタッチ・トーン・バ ッド592と、マイクロフォン594と、表示ランフ596とを備えている。ス テーション590はマルチプレクサ602及び双方向3線式信号線598を介し て5BV600に接続されている。Referring to FIG. 18, each station 590 has a 16-key touch tone bar. A head 592, a microphone 594, and a display lamp 596 are provided. vinegar station 590 via multiplexer 602 and bidirectional three-wire signal line 598. and is connected to 5BV600.

第19図を参照すると、決して同時ではないが、登録及び検証中の種々の時点で 、ユーザーは、(例えば、検証中に自己を識別するために)タッチ・トーン・キ ーを押し、(例えば、基準単語を話すために)マイクロフォンに向って話す。タ ッチ・トーン・キーを押すと、DTFM)−ン発生器604は基準DTFM信号 ベアのうちの一つを発生し、これを信号合成器606を介して線598に転送し てSVB 118に送出する。マイクロフォンは話すことによシ音声信号を発生 し、これを信号合成器606を介して線598に転送する。Referring to Figure 19, at various times during registration and verification, but never at the same time, , the user uses a touch tone key (e.g. to identify himself during verification). - and speak into the microphone (for example, to speak the reference word). Ta When the switch tone key is pressed, the DTFM tone generator 604 generates the reference DTFM signal. one of the bears and forwards it to line 598 via signal combiner 606. and sends it to SVB 118. Microphones generate audio signals when you speak. and forwards it to line 598 via signal combiner 606.

SBVにおいて、5D106 (以下で説明する)は音声信号を受取シ、アナロ グ・ディジタル変換器(A/C)608を介して転送する。ディジタル化した標 本値は5D106からSP 122(以下で説明する)に転送され、ここでフレ ームに編成され、各フレームについて線形予測係数を導出する。付勢を表わす信 号が(第5図の状態機械によシ)検出されると、CP 110 (以下で説明す る)は次の受信フレームを分析して音声即ちトーン信号を受信したか否かを判断 する。トーン信号を検出すると、通常のフーリエ分析を実行してどのキーを押し たのかを判断する。しかし、音声信号を受信すると、以下に説明するようにこ− 1れらの音声信号を処理する。従って、DTFM信号の復号処理には音声信号の 処理に必要とする同一のハードウェア及びソフトウェアが用いられる。In SBV, the 5D106 (described below) receives the audio signal and converts the analog and a digital converter (A/C) 608. digitized sign This value is transferred from 5D106 to SP 122 (described below) where it is are organized into frames and derive linear prediction coefficients for each frame. belief that expresses encouragement When a signal is detected (by the state machine of Figure 5), CP 110 (described below) is activated. ) analyzes the next received frame to determine whether voice or tone signals have been received. do. Once a tone signal is detected, a normal Fourier analysis is performed to determine which keys are pressed. judge whether it is true or not. However, when an audio signal is received, this happens as explained below. 1. Process these audio signals. Therefore, in the decoding process of the DTFM signal, the audio signal is The same hardware and software required for processing is used.

第20図を参照すると、ステーション590内において(例えば、ドア・ロック ・ソレノイドを作動させるための)、固体回路リレー610が電源612(電源 装置)に接続されている。電源612は12ボルト又は24ボルトのAC又はD C(パルス化したDC)を供給することができ、スイッチによシ選択可能になっ ている。リレー610は(点線内に)ディオニックス(Dio−nics) D IG −12−08−45オプト・カップラー616の光源に電力を供給する「 オープン」 −コレクタの非反転バッファ614を備えている(オプト・カップ ラー内に備えられている光源は近赤外線スペクトルによシ光を発光するガリウム ・アルミニウム砒素型の発光ダイオ−)(LED)で°らる。)ドア開放信号6 18は、特殊な波形のものであシ、線598を介して送出され、カウンタ620 をリセットする。カウンタ620は内蔵rア受坐発振器622のクロック信号に よシ駆動されている。第2のカウンタ624は、種々のドア受坐の「オン」時間 (2秒〜50秒)についてスイッチにより選択可能(スイッチ625)である。Referring to FIG. 20, within station 590 (e.g., door lock ・The solid state circuit relay 610 connects to the power supply 612 (for operating the solenoid). device). Power supply 612 is 12 volt or 24 volt AC or D C (pulsed DC) can be supplied and can be selected by a switch. ing. The relay 610 (inside the dotted line) is Dio-nics D IG-12-08-45 “Supplies power to the light source of opto coupler 616” Open” - with collector non-inverting buffer 614 (opto cup The light source inside the laser is a gallium light source that emits light in the near-infrared spectrum. - Aluminum arsenic type light emitting diode (LED). ) Door open signal 6 18 is of a special waveform and is sent out via line 598 to counter 620. Reset. The counter 620 receives the clock signal of the built-in receiver oscillator 622. It's well driven. A second counter 624 measures the "on" time of the various door seats. (2 seconds to 50 seconds) can be selected by a switch (switch 625).

カウンタ624の出力はゲート628に接続されており、ゲート628はジャン パ630によシ選択する「通常オフ」または「通常オン」のドア受坐電力を供給 する。ゲート628の出力は直接、固体回路リレー610の状態を制御する。The output of counter 624 is connected to gate 628, which is connected to a jumper. Provides selectable “normally off” or “normally on” door receiving power to the PA630 do. The output of gate 628 directly controls the state of solid state circuit relay 610.

光学的に結合された(電気的に絶縁した)リレーの理由には2つめる。その第1 ″はリレー610の電力MO3FET、即ちそれらの入力駆動がシステム接地を 参照することを防止することであり、その第2は装置のロジックを雑音及びその 高い電圧(1500ボルト)のトランジェントから絶縁することである。There are two reasons for optically coupled (electrically isolated) relays. The first ” is the power MO3FET of relay 610, i.e. their input drive connects the system ground. The second is to prevent the logic of the device from being exposed to noise and It is to isolate from high voltage (1500 volts) transients.

オプト・カップラー616の出力は、非常に低抵抗のビレイン・ソース(Rオン として知られている最大0.085オーム)によシ特徴付けられる2つの電力M O3FET632,634 (モトローラMTP25No6tたはインターナシ ョナル・レフティファイア社IRF−541)’を駆動する。全ての電力MO3 FETは動作電圧の通常極性から逆方向に接続された複合ダイオード、ドレイン ・ソースを有する。このダイオ−rはACまたはDC動作が可能なリレー610 の動作において重要な働きをしている。一方の極性では、電流が左側の電力MO SFETのバルク及び右側の電力MO3FETのダイオードを介して流れる。極 性が反転すると、電流の流れも反転する。非機械的な接点と異なり、電力MO8 FETの接触抵抗は容易に経年変化をしないので、電力MO8FETはかなり信 頼性がある。またこれらの電力MO3FETは湿度によシ影響されず、デバイス 「オン」に切換えるために非常な低電流(<1oOX10 アンヘア)を必要と するだけである(従って、ターン・オンに非常に低電力の電圧源を用いることが できる)。素子634はゼネラル・エレクトリックから購入可能なV47ZA7 であシ、トランジェント制限及び保護に用いられる。The output of optocoupler 616 is connected to a very low resistance belain source (R on Two powers M characterized by a maximum of 0.085 ohm known as O3FET632, 634 (Motorola MTP25No6t or Internace) Drives the National Leftifier IRF-541)'. All power MO3 A FET is a composite diode, drain connected in the opposite direction from the normal polarity of the operating voltage. ・Has a source. This diode is a relay 610 capable of AC or DC operation. plays an important role in the operation of In one polarity, the current is the left power MO It flows through the bulk of the SFET and the diode of the right power MO3FET. very When the polarity is reversed, the flow of current is also reversed. Unlike non-mechanical contacts, power MO8 Power MO8FETs are quite reliable because the contact resistance of FETs does not change easily over time. Reliable. Also, these power MO3FETs are not affected by humidity and the device Requires very low current (<1oOX10 Anhair) to switch “on” (so a very low power voltage source can be used for turn-on) can). Element 634 is a V47ZA7 available from General Electric. Used for protection, transient limitation and protection.

第2図に示すシステムはリアルタイムで同時に別々のステーションに居る2人の ユーザーをノ・ンドリングするために2個の検証チャンネルを多重タスクするこ とができる。更に、前記システムは16個の別のユーザーステーション102ま で支援するように構成されている。SD 106は、データシステムを構成する ためのその他の周知の従来の論理エレメントに加えて制御のためのMMIからの PAL20RA10CNSプログラム可能論理アレイを含むエレメントから構成 される装置SD 106はステーション102かもアナログ信号全受取り、その 信号を多重化して16からなる組のチャンネルから2個のチャンネルを選択する 。次いで2個のチャンネルがその入力側と出力側の双方においてPCMP遇され 、]25から150ミリ秒毎にサンプリングされる。SD 106は、前記ザン プル全稈るよう相互に接続されているそれ自体のクロック108により励振され る。5D106は制御プロセッササブシステム(cp)110に電気的に接続さ れ、クロック108によシセノトされるサンプル変換時間毎にCplloに着l 込む。この間、Cplloは5D106から双方のチャンネルに対して一連の読 取シおよび書込み演算を行なうことができる。その他のときにはcpH。The system shown in Figure 2 is a real-time system that allows two people at different stations to communicate in real time. Multi-tasking two verification channels to keep users on track I can do it. Additionally, the system may have 16 separate user stations 102 or It is configured to support. SD 106 constitutes a data system from the MMI for control in addition to other well-known conventional logic elements for Consists of elements including PAL20RA10CNS programmable logic array The device SD 106 received by the station 102 receives all analog signals, and Multiplex signals and select 2 channels from a set of 16 channels . The two channels are then PCMP treated on both their input and output sides. , ] sampled every 25 to 150 milliseconds. SD 106 is the Excited by its own clock 108 interconnected to pull all culms Ru. 5D 106 is electrically connected to control processor subsystem (CP) 110. and arrives at Cpllo every sample conversion time clocked by clock 108. It's crowded. During this time, Cpllo will perform a series of readings for both channels from the 5D106. Read and write operations can be performed. cpH at other times.

は読取シ、あるいは書込みのための5D106に対する有効アクセス全稈ること ができない。is valid access to 5D106 for reading or writing. I can't.

Cplloは10MHzのM068000 マイクロプロセッサ112゜メモリ 114および入力/出力およびメモリアクセスのための各種の制御信号を発生さ せるための論理116とを含む。Cplloは、上位コンビーータとの通信およ び調整を含み、当該システムにおけるその他の全ての機能との通信および調整を 行う。Cplloは信号処理タスクを行うことができるものの、主としてデータ 管理手段として機能する。このように、011)110は当該システムの各部分 を直接制御したシ、アクセスすることができ、また上位インターフェースユニッ ト(HIU)118を介して記号化したデータの形態で上位コンビーータと通信 もできる。Cpllo is a 10MHz M068000 microprocessor with 112° memory 114 and various control signals for input/output and memory access. and logic 116 for setting the data. Cpllo is responsible for communication with the upper level converter and communication and coordination with all other functions in the system, including communication and coordination with all other functions in the system. conduct. Although Cpllo can perform signal processing tasks, it primarily handles data processing. Acts as a control measure. In this way, 011) 110 represents each part of the system. directly controlled system, can be accessed, and can also be accessed by the upper interface unit. Communicate with the upper convoter in the form of encoded data via the HIU 118 You can also do it.

0p110はまた中央データバッファ(CDB)120とも電気的に接続されて いる。該バッファは高速の4KX16の乱アクセスメモリデータバッファであっ て、これを介して、プロセッサ間の大多数のデータやメッセー:)全迅速、かつ 効率よく通すことができる。バッファはlNMOSによシ製造されている、例え ば4個の1MS1421S−50RAm装置(4X4096)によ多構成しうる 。演算の検証モードの場合、cp120はプロセッサ間の唯一のデータ源である 。この種の唯一の別のデータ通路はcp 110 トHIU 118 トノ間( 7)df−トチ6ル。CDB120は、Cpllo用、HIU118用および信 号処理サブシステム(Sp)122用のデータボートを含む。またCDB120 はcplloとのメモリをマツプした入力/出力通信のためのアト9レスポート も含む。直接メモリアクセスするために、CDBに対して高速に順に自動増分ア クセスできる12ビツトのカウンタ124がある。4KX16のメモリは5p1 22とHIU118とによシアクセスされるが、後者の場合は単にバイトの幅で アクセスされる。HIU118は126で示すラインにおいて信号を提供するが 、該ラインにCDB120が適正モート9で位置されると2バイト毎に自動増分 できる。しかしながら効率を最大とするためCplloに対してはワードあるい はバイトの幅の何れかでアクセスが行われる。0p110 is also electrically connected to a central data buffer (CDB) 120. There is. The buffer is a high speed 4KX16 random access memory data buffer. The vast majority of data and messages between processors pass through this :) All quickly, and Can be passed through efficiently. The buffer is fabricated by INMOS, e.g. For example, it can be configured into four 1MS1421S-50RAM devices (4X4096). . When in operation verification mode, the cp120 is the only source of data between processors. . The only other data path of this kind is between CP 110 and HIU 118 ( 7) df-tochi 6 le. CDB120 is for Cpllo, HIU118 and Contains a data boat for the signal processing subsystem (Sp) 122. Also CDB120 is an at9 address port for memory mapped input/output communication with cpllo. Also included. Auto-increment access to the CDB in fast order for direct memory access. There is a 12-bit counter 124 that can be accessed. 4KX16 memory is 5p1 22 and HIU118, but in the latter case it is simply a byte width. be accessed. HIU 118 provides a signal on line designated 126. , automatically increment every 2 bytes when CDB 120 is located on the line with proper mote 9. can. However, for maximum efficiency, word or is accessed in any byte width.

cplloの景重要機能の1つはCDB120の割付けを管理することである。One of cpllo's most important functions is managing CDB 120 allocation.

この点についそ、かつ効率を最大とするためにCDB 120はメモリをマツプ させてCplloとインタフェースするよう構成されていた。しかしながら5p 122とHIU118とは、CDB=i入力/出力装置と見做し、かつ直接的に メモリにアクセスすることによう達成されうるものと見做している。In this regard, and for maximum efficiency, the CDB 120 maps memory. It was configured to interface with Cpllo. However, 5p 122 and HIU118 are regarded as CDB=i input/output devices, and directly It is assumed that this can be achieved by accessing memory.

殆んどのプロセッサ間の通信はCDB120’e用いる必要があるので、検証モ ート9に坩るシステムの時間の多くが当該システムのこのエレメントにおいて使 われる。それにも拘わらず、ノ・−ドワイヤによる優先システムは何らないので 何れのプロセッサもCDB 120に対していつでもアクセスできる。Since most inter-processor communication requires the use of CDB120'e, the verification model Much of the system's time spent in Part 9 is spent in this element of the system. be exposed. Nevertheless, there is no no-wire priority system, so Any processor can access CDB 120 at any time.

CDB120に対するアクセスは、CDB120のリクエストがCI)110に よってまず許可される程度までCplloによって厳密に制御される。プロトコ ルはリクエストしているプロセンサによりCplloへの割込みを開始する。次 いでcpはCDB120120が使用されていなければ、割込みが要求元へ戻さ れ、その場合要求元はCpがCDBバスの所有を指示したことを推察できる。To access the CDB 120, a request from the CDB 120 is sent to the CI) 110. Therefore, it is first strictly controlled by Cpllo to the extent that it is allowed. protocol The module initiates an interrupt to Cpllo by the requesting prosensor. Next If the CDB120120 is not used, the interrupt will be returned to the requester. In this case, the requester can infer that Cp has instructed ownership of the CDB bus.

Cplloによっては特定の4−トが何ら使用可能とされず、その代りにCDB 120のプロセッサがそれ自体の制御信号を用いてこの作業を実行する。このス キームはハードウェアを保存しているにも拘わらず、何れのプロセッサも前述の ようにいつでもCDBにアクセスし得ることを意味している。このため、cp  100はCDB120に対してリクエストの待ち行列を制御する必要がある。Some Cpllo do not make any specific 4-totes available; instead, CDB The 120 processors perform this task using their own control signals. This space Despite Keym's conserving hardware, none of the processors mentioned above This means that you can access the CDB at any time. For this reason, cp 100 needs to control the queuing of requests to CDB 120.

5p122はその他のプロセッサの何れとも直接的な通信yl −トを有してい ないため、この目的に対してCDB120を使用する必要がある。また、HIU 118は、それとCplloとの間にボートがるるもののCDB 120に介し てメツセージおよび/またはデータを保存および検索することができる。この通 信システムを提供するために、各プロセッサは予め指定したメモリのウィンドウ を有する必要が、1、そのウィンドウの1つは他のプロセッサに知られている。The 5p122 has direct communication with any other processor. Therefore, it is necessary to use CDB 120 for this purpose. Also, H.I.U. 118 is connected to CDB 120, which has a boat between it and Cpllo. Messages and/or data can be stored and retrieved. This street To provide a communication system, each processor has a pre-specified window of memory. 1, one of its windows is known to other processors.

従って、CD8120t−何らか所有することによシメモリの適当なウィンドウ に単にアクセスすることにより何れかのプロセッサから何れかのプロセッサへデ ータを通すことができる。Therefore, by owning a CD8120t-some suitable window of memory from any processor to any other processor by simply accessing the data can be passed through.

また、cplloは、16/32ビツトのTMS32010信号処理プロセッサ である5p122にも接続されている。また、5p122は、例えばMM工63 81のような754 ns速度の8 X 1024ビツトの2個のpRomsの ようなエレメントによシ提供されるSpマイクロコード用のメモリ記憶装置を含 む。とのサブシステムは入力/出力復号化、Cplloとの通信およびCDB1 20へのデータ経路のためのランダム論理を含む。8p122は1秒当シ500 万回の演算速度で算術計算を行うので、ヘビイナンバーのハンドリングタスクの 全てに対して使用される。cplloはライン128上で特殊信号を送ることに よfisp122でタスクを開始し、該信号は5p122が、Cpによ、9CD Bに書込まれた命令により指定される個所まで分岐させる。Additionally, cpllo is a 16/32-bit TMS32010 signal processing processor. It is also connected to 5p122. In addition, 5p122 is, for example, MM engineering 63 Two pRoms of 8 x 1024 bits with 754 ns speed like 81 Contains memory storage for the Sp microcode provided by elements such as nothing. subsystems include input/output decoding, communication with Cpllo and CDB1 Contains random logic for the data path to 20. 8p122 is 500 per second Arithmetic calculations are performed at a speed of 10,000 calculations, making it easy to handle heavy number handling tasks. Used for everything. cpllo will send a special signal on line 128 5p122 starts the task with fisp122, and the signal is 5p122 with Cp, 9CD Branch to the location specified by the instruction written to B.

5p122は検証モードにおいて、未記号化のベクトル位置を含む命令の予め記 憶したライブラリヲ有し、それをaplioが呼出して各種のタスクを行う。従 ってSpH2は、そのタスクがCplloによシ開始される従属システムである 。また、選定されたタスクの持続時間全体に対してCplloがCDB120t sp122に割当てることが可能で、その場合CDB120はSp122用の専 用の記憶媒体となる。5p122 is used in verification mode to pre-record an instruction containing an unsymbolized vector position. It has a stored library that is called by aplio to perform various tasks. subordinate SPH2 is a dependent system whose tasks are initiated by Cpllo. . Also, Cpllo is CDB120t for the entire duration of the selected task. sp122, in which case CDB120 is dedicated for Sp122. It becomes a storage medium for

HIU 118は上位プロセッサ(図示せず)とCpIIOとの間ならびにCD B120との間のインタフェースとして機能する。The HIU 118 is connected between the upper processor (not shown) and the CpIIO as well as the CD It functions as an interface with B120.

全ての信号のインタフェースはHItJ118により緩衝され、HIU118は 互換性の要求に対応するよう上位プロセッサからの調時および制御信号を調整す る。例えば、第2図に示す調時システムと上位プロセッサの調時システムとの間 の非互換性は、HIIJ118の内部に来るプログラム可能アレイ調理装置(P AL)(図示せず)が埋合せる。All signal interfaces are buffered by HItJ118 and HIU118 is Adjusts timing and control signals from higher-level processors to meet compatibility requirements. Ru. For example, between the timing system shown in FIG. 2 and the timing system of the upper processor. The incompatibility with the Programmable Array Cooking Appliance (P AL) (not shown) will compensate.

上位プロセッサからの何れのデータ転送もCpIIOに対する割込みの形でまず リクエストされる必要がある。割込みベクトルはcp上位プロセッサのデータポ ートか、あるいは前述のようにCDBのメツセージウィンドつからの何れから読 取ることができる。しかしながら、システムによるアクセスの前に上位プロセッ サはシステムのアビレスを知っておく必要がある。ば−スアドレスが、単にアド レスコンパレータでらるHIU118の入力選択装置に設置されている。各シス テムのベースアドレスはスイッチを介してユーザがプログラム可能であって、処 理能力を高めるために使用するマルチシステムを上位プロセッサに提供する。こ のように、単により多くの河路盤を上位プロセッサのバスに設置することによシ 検証モードで使用するよう64個までのステージ目ン102を提供することがで きる。Any data transfer from the upper processor is first done in the form of an interrupt to CpIIO. Must be requested. The interrupt vector is the data point of the cp upper processor. Either from the CDB message window or from one of the CDB message windows as described above. You can take it. However, before access by the system, Sa needs to know the aviles of the system. The base address is simply an address. A response comparator is installed in the input selection device of the HIU 118. Each system The base address of the system is user programmable via a switch and Provides the upper processor with a multi-system that is used to increase its processing capabilities. child , by simply placing more subbases on the upper processor's bus. Up to 64 stage items 102 can be provided for use in verification mode. Wear.

5p122とHIU118とは遍在リセットおよび多相クロックゼネレータ(R CG)130とに接続されておシ、該ゼネレータは全体システムに対して全ての りセクトおよびクロック信号を提供する。第2図においてブロック線図で示す各 種のエレメントは当該技術分野の専門家に周知の多数の方法の何れかによりそれ ぞれ構成しうろことが認められる。5p122 and HIU118 are ubiquitous reset and multiphase clock generators (R CG) 130, the generator provides all provides sector and clock signals. Each of the blocks shown in the block diagram in Figure 2 Species elements can be prepared by any of a number of methods well known to those skilled in the art. It is recognized that each may be configured.

方法 当該システムがその目的を達成するための方法を第3図から第16図までを参照 して詳細に説明する。特に、第3図は第1図の24で全体的に示す登録モードを 示す。Method See Figures 3 to 16 for how the system achieves its objectives. This will be explained in detail. In particular, Figure 3 shows the registration mode generally indicated at 24 in Figure 1. show.

第3図全参照すれば、システムが一部ブロック150の登録モードまで進むと、 システムはブロック152においてユーザの名前;ユーザが通過しうるアクセス ポイントおよびユーザが間違って受入れたシ、かつ拒否するのに対して最大許容 しうるベルを得るよう演算を開始する。何ら値が特定されなければ、必要に応じ て省略時の値が提供される。ステップ152において、システムはまた、ユーザ が記録すべき基準ワードのリストを検索し、参考のためにそれら全記憶する。説 明のために、10個の基準ワードの使用について本明細書で説明する。しかしな がら、当該システムの機能や構造を変えることなく希望する何れの数の基準ワー ドも選択しうろことが認められる。多数の種々の基準ワードヲ用いることによシ 、特定のユーザの誤って受入れる可能性の最も少ないワードを識別することが可 能である。With full reference to FIG. 3, once the system has partially progressed to the registration mode of block 150, The system at block 152 identifies the user's name; the access that the user may have; Maximum tolerance for points and users incorrectly accepting and rejecting The calculation begins to obtain the possible bell. If no value is specified, then A default value is provided. In step 152, the system also retrieves a list of reference words to record and memorizes them all for reference. theory For clarity, the use of ten reference words is described herein. However However, you can create any desired number of reference works without changing the functionality or structure of the system. It is recognized that you can also select By using a large number of different criteria words, , it is possible to identify the words that are least likely to be mistakenly accepted by a particular user. It is Noh.

使用される基準ワードの数が増えるにつれて、誤る可能性の最も少ないワードヲ 入手する能力が向上する。このように、登録モードは当該システムの演算におけ る後の検証演算部分において用いうる一組のデータを特定のユーザから発生させ るべく機能する。As the number of reference words used increases, the word with the least chance of error is Improves ability to obtain. In this way, the registration mode is used in the calculations of the system. Generates a set of data from a specific user that can be used in the verification calculation part after the Function as much as possible.

ブロック152から、システムはブロック154へ進み、そこで情報に一時的な 識別番号が割当てられて、システムはステップ156へ進む。From block 152, the system proceeds to block 154 where the information is temporarily Once the identification number is assigned, the system proceeds to step 156.

ブロック156は、すでに集められている10個の基準ワードのトークンの数に 関する決定ブロックである。選定した数の10個のワードの各々のトークン(あ るいは発声)がなされなかったとすれば、上位プロセッサはステップ158へ進 み、督促命令を発生させてユーザから新しいワー)#ヲリクエストする。説明の ために、各基準ワードに対して4個のトークンを使用することについて本明細書 で記載している。当然、本発明の方法や装置を正しく作動させるために、概ね何 れの数のトークンを用いてもよいことが認められる。Block 156 determines the number of tokens of the ten reference words that have already been collected. This is a decision block regarding Each token of the selected number of 10 words (a If the host processor does not make a statement (or utters a word), the higher-level processor proceeds to step 158. and issue a dunning command to request a new work from the user. of explanation This specification describes the use of four tokens for each reference word in order to It is described in Naturally, in order for the method and apparatus of the present invention to operate properly, generally speaking, it is necessary to It is recognized that any number of tokens may be used.

督促命令に応答して、第2図のCp 110は5D106を介して、入力/出力 ライン104を通してステーション102と連通ずる信号を発生させることによ りスピーカ、あるいはその他の可聴あるいは可視通信手段によシューザはそのた めのトークンを記憶させるべき、10個の基準ワードの中の1個全発声するよう 促される。ステージyy102におけるマイクロフォンがユーザからの基準ワー ドの発声を受取シ、それをライン104と5D106とを介してステーション1 02からcplloへ連通させ、cplloにおいて後述のようにさらに処理さ れる。In response to the dunning command, Cp 110 of FIG. by generating a signal communicating with station 102 through line 104. The user may use a loudspeaker or other audible or visible means of communication to 1 out of 10 standard words to memorize the first token. Prompted. The microphone at stage yy102 receives the reference word from the user. station 1 via line 104 and line 106. 02 to cpllo, where it is further processed as described below. It will be done.

まで進み、そこでシステムが、「登録」ルーチンを呼出すことにより送入されて くるスピーチに対して自動相関係数(r係数)を発生させるよう指示する。登録 ルーチンについては第4図全参照して更に詳しく以下説明する。システムはr係 数を発生するにつれて、これらの係数を検査してシステムに送入されるスピーチ があるか否か検出する。督促信号に続く予めセットした時間内にスピーチが何ら 介在していないとすれば、上位プロセッサは不具合のあったことを検出してブロ ック162へ進む。督促信号に続いてシステムがスピーチを検出しなかった回数 が所定の限界回数を上廻ると、プロセッサはブロック164まテ進み、ユーザを 登録するためのそれ以上の試みは中止する。他方、不具合の回数が限界値金上廻 らなげれば、プロセッサはブロック158へ戻シ、再びユーザに発声を入力する よう促す。The system advances to generate an automatic correlation coefficient (r coefficient) for the upcoming speech. Registration The routine will be described in more detail below with full reference to FIG. The system is in charge These coefficients are inspected as the number of speeches fed into the system as they occur. Detect whether there is. If no speech occurs within a preset time following the dunning signal. If there is no intervention, the upper processor will detect that there is a problem and block it. Proceed to block 162. Number of times the system did not detect speech following a dunning signal exceeds a predetermined limit number of times, the processor proceeds to block 164 and sends the user Further attempts to register will be aborted. On the other hand, the number of defects exceeds the limit value. If not, the processor returns to block 158 and again inputs the user's utterance. I urge you to do so.

ブロック160においてスピーチが検出されるとすれば、上位プロセッサはブロ ック166まで進み、r係数を変形された直線の予測係数(aa係数)へ変換し 始める。前記予測係数は検出された発声とユーザの発声気管の形状とを相関させ る0この変換は第4図に関して説明する登録ルーチンの一部として実行される。If speech is detected in block 160, the higher level processor Proceed to block 166 and convert the r coefficient to the predicted coefficient (aa coefficient) of the transformed straight line. start. The prediction coefficient correlates the detected vocalization with the shape of the user's vocalizing trachea. This conversion is performed as part of the registration routine described with respect to FIG.

aa係数が発生した後上位プロセッサはブロック168まで進み、自動相関係数 と変形された直線予測係数とを将来の使用に備えてアレイに記憶させる。次いで プロセッサはブロック170まで進み、かつワードとトークンとのカウンタを増 分させて、また4個のトークンがユーザから受取られていないとすれば現在のワ ードの次のトークンを、4個のトークンが受取られずみであれば次のワードを識 別する。前述のように、トークンの数はプログラム可能でアわ、かつ使用前に操 作者が選択する。プシステムがそのリストにあるワードの各々に対して4個のド ブロック169マで進み、使用可能モードから記憶された情報を処理して検証モ ードでのシステムの後での演算に必要なデータを発生させる必要のあることを示 すフラッグをセットする。このフラッグをセットすると、システムはブロック1 71へ進み、そこで演算の登録モードから出て、第1図の開始ブロックへ戻り別 の指令を待つ。10個のワードの各々の4個のトークンが受取られなかったとす れば、システムはブロック156からブロック158へと進み、前述のように演 算する。After the aa coefficient is generated, the upper processor proceeds to block 168 and calculates the autocorrelation coefficient. and the transformed linear prediction coefficients are stored in an array for future use. then The processor advances to block 170 and increments the word and token counters. If 4 tokens have not been received from the user, the current If 4 tokens have not been received, the next word is recognized. Separate. As mentioned above, the number of tokens is programmable and can be manipulated before use. Author's choice. The drop system will print four words for each word in its list. Proceeding to block 169, the validation mode processes the information stored from the enable mode. Indicates the need to generate data required for later calculations in the system at the Set the flag. Setting this flag causes the system to block 1 Proceed to step 71, exit from the calculation registration mode, and return to the starting block in Figure 1 for another wait for instructions. Suppose 4 tokens of each of the 10 words were not received. If so, the system proceeds from block 156 to block 158 and performs as described above. Calculate.

第4図を参照すれば、第3図のブロック160において上位プロセッサにより行 われる登録ルーチンを説明することができる。Referring to FIG. 4, in block 160 of FIG. Explain the registration routine used.

第4図の登録モー)”160へ入ると、システムはブロック172へ進み、そこ でシステムは第2図のcpiioのMo 68000マイクロプロセツサが、毎 秒約8000個のサンプルの採集速度においてSD 106から受取られたアナ ログ発声信号を計数化する。Upon entering 160, the system advances to block 172 where the In the system, the cpiio Mo 68000 microprocessor shown in Figure 2 runs every time. Analyzers received from SD 106 at a collection rate of approximately 8000 samples per second. Quantify log vocalization signals.

サンプルフレームが形成され、cp 110のメモリ114に割当てられたバッ ファに記憶される。C0DECの割込みハンドうに制御が移ればいつでもサンプ ルの各々が8ビット幅のm −law記号化ワードとしてSD 106の符号器 /復号器(CODEC)チップから読出される。A sample frame is formed and a buffer is allocated in memory 114 of cp 110. It is memorized in Fa. Sampling is performed whenever control is transferred to the C0DEC interrupt hand. SD 106 encoder with each file as an 8-bit wide m-law encoding word. /decoder (CODEC) chip.

cpメモリ114のバッファが一部1フレーム分のサンプルで充満されると、シ ステムはブロック174まで進み、バッファからサンプル1cDB120ヘコピ イする。サンプルを構成する8ビツトコードのワードの各々は分解されて16ビ ノトのサンプルをつくる。この分解は、速度に対してテーブル駆動方法を用いた フライによシ行われる。mm−1aコンパンジヨン使用は当該技術分野において 周知である。この主題に関する包括的な説明はテキサスインストルメンツ社(T exas Instruments ) (1984)扁5IIIRAOOIに よる[デジタル信号処理応用報告: TMS 32010用(D コンA7デイ ング、n、−f7J (” Digital、 Signal Process −1ngApp1j、cation Report : Companding  Routines for theTmS 32010”)に提供されている 。この文書は参考のため本明細書に含めである。When the buffer of cp memory 114 is partially filled with samples for one frame, the The stem advances to block 174 and copies the sample 1 cDB 120 copies from the buffer. I do it. Each of the 8-bit code words that make up the sample is decomposed into 16-bit words. Create a notebook sample. This decomposition uses a table-driven method for velocity. It is done by frying. The use of mm-1a compansion is known in the art. It is well known. A comprehensive explanation on this subject is available from Texas Instruments exas Instruments) (1984) 5IIIRAOOI [Digital signal processing application report: For TMS 32010 (Dcon A7 day ng, n, -f7J (”Digital, Signal Process -1ngApp1j, cation Report: Companding Routines for theTmS 32010”) . This document is incorporated herein by reference.

ブロック174からシステムはブロック176まで進み、現在のフレームプラス 前のフレームの後半分を含むフレームを形成し、オーバラップ分析ができるよう にしてプレエンファシスを達成する。以下のようにフォーマットの入力サンプル に適用される一次有限インパルスレスポンスフィルタを用いることにょシサンプ ルはプレエンファシスサレル。From block 174 the system proceeds to block 176 where the current frame plus Forms a frame that includes the last half of the previous frame, allowing for overlap analysis. to achieve pre-emphasis. Input sample formatted as below A system sample using a first-order finite impulse response filter applied to Le is pre-emphasis.

y(n)=x(n)−−94X(n−1) (1)nはサンプルのインデックス 番号に等しく、Xはプレエンファシス前のサンプルに等しく、yはプレエンファ シスの後のサンプルに等しい。プレエンファシスは高周波数を強調したシ且っス ピーカとマイクロフォンとの間の開放空間に対するスピーカすなわち話し手の唇 からの音声変移によう発生する低周波数の強調を消去したりするために拘われる 。y(n)=x(n)−-94X(n-1) (1) n is the sample index number, X equals the sample before pre-emphasis, and y equals the sample before pre-emphasis. Equal to the sample after cis. Pre-emphasis is a scene that emphasizes high frequencies. the speaker's lips relative to the open space between the speaker and the microphone concerned with eliminating the low frequency emphasis that occurs as the voice transitions from .

一旦プレニンシアシスが行われると、正常化されていない自動相関が以下のよう に計算される。Once preninthiasis is performed, the unnormalized autocorrelation looks like this: It is calculated as follows.

R(1)= Σ (s(j)Xs(j+1)) (2)j −。R (1) = Σ (s (j) Xs (j + 1)) (2) j -.

1=0.・・・・・・P; sはサンプルのプレエンファシス値でIll、Lは分析フレームサイズであシ、 pは自動相関順序である。1=0. ...P; s is the sample pre-emphasis value Ill, L is the analysis frame size, p is the autocorrelation order.

式(2)からの正常化されていない自動相関は以下の関係式にょシ正常化された 相関へ変換される。The unnormalized autocorrelation from equation (2) has been normalized to the following relational expression: Converted to correlation.

r(1)=R(土)/R(0) (3)1=1.・・・・・・p。r(1)=R(Sat)/R(0) (3)1=1.・・・・・・p.

R(o)相関は「エネルギー」と称せられ、後述するように発声の始まりと終シ とを検出するためにシステムが用いる量である。The R(o) correlation is called “energy,” and as explained later, it is the quantity used by the system to detect

エネルギR(0)の項と共に等式(3)からの正常化した自動相関(r係数)は 5p122が計算を終了すれば直ちにcp 110に戻される。The normalized autocorrelation (r coefficient) from equation (3) along with the energy R(0) term is As soon as 5p 122 completes the calculation, it is returned to cp 110.

ブロック176からシステムはブロック178へ進み、そこで直線予測係数(L p)を展開させる。詳しくは、CI) 110 HCDB120からr係数のコ ピイを検索してap122e開始させLp係数を展開する。この達成のために採 用した再帰的方法はレビンンンのアルゴリズム(Levinson ’ s A lgorithm)として当該技術分野において周知である。このアルゴリズム についてはニューヨークのスプリングフェアラーグ社(1976年版)のジェイ 、ディ、マーケルおよびエイ、エッチ、グレイの[スピーチの直線的予測J ( J、 D、 market and A、 H,Gray、” Linear  Pre−dicMo、n of 5peech″、 Springer −Ve rlag、 New York、 (1976) )に詳しく述べられている。From block 176, the system proceeds to block 178 where the linear prediction coefficient (L Expand p). For details, refer to the r coefficient code from CI) 110 HCDB120. PI is searched, ap122e is started, and Lp coefficients are expanded. adopted to achieve this The recursive method used is Levinson's algorithm (Levinson's A lgorithm). This algorithm For details, see J.P., Spring Verlag, New York (1976 edition) , D., Markel and E., H., Gray [Linear Prediction of Speech J ( J, D, market and A, H, Gray,” Linear Pre-dicMo, n of 5peach'', Springer-Ve rlag, New York, (1976)).

このテキストを参考のため本明細書に含めである。This text is included herein by reference.

レビンソンのアルゴリズムは以下の関係に基づく再帰的方法によシー組のフィル タ係数を提供する。Levinson's algorithm fills the sea set in a recursive manner based on the following relationship. Provide data coefficients.

1=O1・・・・・・n、a 。(1) == 1はOでない全ての1に対する もの、a−、(0)=QはOでない全ての1に対するもの;およびeO=1であ る・ p次元のLpc分析においては算式(4) −(6)に記載のレビンンンのアル ゴリズムは、Lp係数から構成される1組のフィルタ係数a(i)、i=o、・ ・・・・・pf提供する。このp次元分析において、nの値は1からpまでの範 囲でる)、a(1)はnの各値に対して1=0.・・・・・・pの各値に対して 計算される。1=O1...n, a. (1) == 1 is for all 1s that are not O , a-, (0) = Q for all 1s that are not O; and eO = 1 Ru・ In p-dimensional Lpc analysis, Levinn's algorithm described in formulas (4) to (6) The algorithm is a set of filter coefficients a(i), i=o, consisting of Lp coefficients. ...Provide PF. In this p-dimensional analysis, the value of n ranges from 1 to p. ), a(1) is 1=0 for each value of n.・・・・・・For each value of p Calculated.

ブロック178からシステムはブロック180まで進み、cp係数をaa係数に 変形する。この変形を達成する方法は以下の通aa(j) = 2 X Σ a ri) x a (i+j)、:のi形u検証モードにおいて発声比較演算速度 を速めるために行われる。From block 178, the system proceeds to block 180, which converts the cp coefficient into an aa coefficient. transform. The way to achieve this transformation is as follows: aa(j) = 2 X Σ a ri) Voice comparison calculation speed in i-type u verification mode of x a (i+j), : This is done to speed up the process.

aa係数は、いわゆる残留エネルギ(an)の2進ロガリズムと共に、sp 1 22が変形を完了した際CDB 120に残される。The aa coefficient, along with the binary logarithm of the so-called residual energy (an), is 22 is left in the CDB 120 when the transformation is completed.

一旦フレームが分析され、その正常化された自動相関、エネ/l/キRI:O) 、 aa係数および残留エネルギenのロゴリズムカ抽出されると、システムは 決定ブロック182まで進む。プロ、り182において、Cplloは抽出され たデータをステートマシンへ送入し、フレームが記録された間ユーザがステーシ ョン102のマイクロフォンに向かって話していたか否か検出する。このステー トマシンについては第5図を参照して以下詳細に説明する。Once the frame is analyzed and its normalized autocorrelation, E/l/KRI:O) , Once the logo rhythms of aa coefficient and residual energy en are extracted, the system is Proceed to decision block 182. In Pro, ri182, Cpllo is extracted data into the state machine so that the user remains in the state machine while the frame is being recorded. It is detected whether or not the person is speaking into the microphone of the section 102. This stay Thomasin will be described in detail below with reference to FIG.

スピーチ検出器がスピーチが何ら行われていないと判定すると、システムはブロ ック184へ進み、スピーチ検出器のステートマシンが出口状態にあるか否か検 出する。出口状態であるとすれば、スピーチが完了している全示し、システムは ブロック186まで進み、第4図に示すアルゴリズムの演算を停止し、次いで第 3図のブロック160へ戻る。システムがブロック184にある間にステートマ シンが出口状態にないとすれば、システムはブロック172へ戻シ、前述のよう に処理するため次のスピーチサンプルを獲得する。If the speech detector determines that no speech is occurring, the system blocks Proceed to block 184 and check whether the speech detector state machine is in the exit state. put out If the exit state indicates that the speech is complete, the system will Proceeding to block 186, the operation of the algorithm shown in FIG. Returning to block 160 of FIG. While the system is in block 184, the state master If the machine is not in the exit state, the system returns to block 172, as described above. Obtain the next speech sample for processing.

スピーチ検出器がシステムが決定ブロック182にある間現在のところスピーチ が行われていることを示せば、システムはブロック188まで進み、システムが 登録モードにあるが否か検出する。システムが登録モードにあるとすれば、シス テムはズ0ツク190まで進み、第2図のメモリ114にaa係数を記憶する。The speech detector currently detects speech while the system is at decision block 182. is occurring, the system proceeds to block 188 where the system Detects whether it is in registration mode or not. Assuming the system is in registration mode, the system The system advances to check 190 and stores the aa coefficient in memory 114 of FIG.

システムが登録モードにないとすれば、ブロック188がらプロ、り192まで 進み、正常化すなわち正規化された自動相関係数と、レビンンンのアルゴリズム からの残留エネルギとをメモリ114に記憶する。ブロックr90または192 の何れかからシステムはブロック172に戻シ、前述のように連続的に機ユーザ からの有効スピーチの最後のフレームが見出されると直ちに、これまで抽出され てきたパラメータセットの全てがメモリ114からCDB 120ヘコピイされ る。次いで上位プロセッサがCplloによシ割込まれ、完全な発声に対する・ ξラメータがCDB 120へ送られつつあることを示す。次いで上位プロセッ サはCDB 120からのパラメータを読取シ、最終的にその結果をその大容量 記憶装置に記憶させる。If the system is not in registration mode, from block 188 to 192 advance, normalized or normalized autocorrelation coefficients, and Levinn's algorithm The residual energy from is stored in memory 114. block r90 or 192 The system then returns to block 172 and continues to As soon as the last frame of valid speech from All parameter sets that have been sent are copied from memory 114 to CDB 120. Ru. The higher-level processor is then interrupted by Cpllo and ξ parameter is being sent to CDB 120. Then the upper process The server reads the parameters from the CDB 120 and finally sends the results to the large capacity Store it in the storage device.

第5図全参照して、スピーチの始まシと終シ点とを検出するために使用されるス テート線図を説明できる。新しいフレームに対する自動相関ならびにエネルギが 入力信号から送られると常に、第5図に示す状態を有する有限ステートマシンが 使用されて前記のパラメニタからスピーチが有効か、あるいはスピーチのある状 態と無い状態の変移状態のどの状態にシステムが入っているか検出する。Referring to Figure 5, the screen used to detect the start and end points of speech. Be able to explain the Tate diagram. Auto-correlation and energy for new frames Whenever an input signal sends a finite state machine with the states shown in Figure 5, used to determine whether the speech is valid or the state in which the speech is from the above parameters. Detects which state the system is in between transitional states between state and non-state.

ステート線図は、初期および最終の状態であるサイレンスステート200t−含 む。この状態においては、マシンは発声の始まりを検出するよう待機し、発声の 終りが検出された後復帰する。The state diagram includes the initial and final states of silence state 200t. nothing. In this state, the machine waits to detect the beginning of a utterance and Returns after the end is detected.

発声の開始が検出されると、ステートマシンはサイレンスステート200からア テンションステート202まで進む。詳しくは、マシンは検出された信号のエネ ルギがある上限レイル以上となるか、あるいはある下限レベルを下廻るかすれば アテンションステートへ進み、正常化されたすなわち、正規化された自動相関機 能(r)は、マシンがノイズを測定した自動相関機能<r)の値からの予め選定 した限界距離r1以上であるユークリッド距離を有する。このノイズの自動相関 機能はサイレンスステート200においてマシンにに 再帰的に更新される。When the start of speech is detected, the state machine wakes up from the silence state 200. Proceed to tension state 202. In detail, the machine determines the energy of the detected signal. If Lugi exceeds a certain upper limit rail or falls below a certain lower limit level, Proceed to the attention state and normalize, i.e., the normalized autocorrelator The function (r) is preselected from the value of the autocorrelation function <r) with which the machine measures the noise. has a Euclidean distance that is greater than or equal to the critical distance r1. Autocorrelation of this noise Functions are updated recursively to the machine in the silence state 200.

検出されたエネルギがシステムをサイレンスステート1離すないようにするに十 分高い場合、かつマシンがアテンションステート202で3回サイクル分を費し た場合マシンはサイレンスステート202からスピーチステート204まで進む 。Enough to prevent the detected energy from leaving the system in the Silence State 1. minute, and the machine spends three cycles in attention state 202. the machine advances from the silence state 202 to the speech state 204 .

一旦スピーチステート204にあると、スピーチは検出されたエネルギが「スピ ーチの終り」の限界以下に低下し、発生の終りが検出されたことを示すまでそこ に留っている。その時点でマシンは出口ステート206へ進む。出口ステート2 06カラ、もし検出されたエネルギが5回のサイクルの後下限を1廻るに十分な 程高くないとすればサイレンスステートへ進む。もし十分高い値のエネルギア: 検出されるとすればマシンは出口ステート206から再開ステート208まで進 み、該再開ステートは、エネルギが出口ステート206へ戻るに十分高くなく、 且つマシンが再開ステー)282.3サイクル分費したとき、アテンションステ ートと同様にマシンをスピーチステート204へ戻すよう機能する。Once in the speech state 204, the speech is There the It remains in At that point the machine proceeds to exit state 206. exit state 2 06 Kara, if the detected energy is sufficient to go around the lower limit once after 5 cycles. If it's not too expensive, proceed to Silence State. If the value of energy is high enough: If detected, the machine proceeds from exit state 206 to resume state 208. , the restart state is not high enough in energy to return to the exit state 206; and the machine has spent 282.3 cycles (in the restart stage), the attention stage It functions to return the machine to the speech state 204 in the same manner as the speech state 204.

またスピーチ検出オートマトンは本発明による減衰システムを制御することが注 目される。このようにステートがサイレンスステートとなればいつでも、減衰器 レジスタが変更されてノイズ音する一定しくルに保持する。一旦ステートマシン がサイレンスステート1離れると、減衰は一定に保持される。現在好適な一実施 例においては、スピーチ検出マシンはソフトウェアを含む。もつともハードウェ アの実施例は当該技術分野の専門家によシ、マシンについての前述の説明に基づ き容易に提供しうる。It is also noted that the speech detection automaton controls the damping system according to the invention. be noticed. Thus, whenever a state becomes a silent state, the attenuator When the register is changed, the noise is kept constant. Once the state machine When leaves the silence state 1, the attenuation remains constant. One currently preferred implementation In an example, the speech detection machine includes software. Hardware The embodiment of A may be explained by a person skilled in the art based on the foregoing description of the machine. can be easily provided.

登録演算を完了すると、システムは操作者あるいは例えば調時装置のようなその 他の手段によシ作動されて、検出モードに゛ おいて送入されるスピーチ信号を 比較するために使用されるデータ(−スを形成するために登録モードにおいて発 生する情報を利用する。特に、第6図は適当なデータベースを構成しうるように するシステムの性能を発揮させる方法を示す。After completing the registration operation, the system will Activated by other means to detect speech signals delivered in detection mode. The data used for comparison (- issued in registration mode to form a make use of the information that is generated. In particular, Figure 6 shows how to configure an appropriate database. We will show you how to maximize the performance of your system.

データベースの形成を要求する信号を受取ると、システムは第6図のブロック2 20からブロック222まで進み、第3図の169においてセットしたフラッグ が依然としてセットされているか否か検出する。フラッグがセットされていない とすれば、処理すべきデータが何らなく、システムはブロック224−1で進み 、データベースをつくるための過程の演算を終了し、第1図のステート20を開 始させるよう復帰する。Upon receiving a signal requesting the creation of a database, the system executes block 2 of FIG. 20 to block 222, and the flag set at 169 in FIG. is still set. flag not set , there is no data to process and the system continues at block 224-1. , completes the calculations in the process of creating the database, and opens state 20 in Figure 1. Return to start.

処理スべきデータがあるとすれば、システムはブロック222からブロック22 6マで進み、そこでCDB 120に記憶された次のワードを獲得する。ブロッ ク226において、システムはまたデータベースの準備を完了したか否か検出す る。まだ完了していなければ、システムはブロック226からブロック228ま で進む。If there is data to be processed, the system proceeds from block 222 to block 22. Proceed in 6 ma and acquire the next word stored in CDB 120. Block At step 226, the system also detects whether the database is ready. Ru. If not already completed, the system continues from block 226 to block 228. Proceed with

ブロック228において、システムは「スピーカ間内部・話し手」の比較を行い 、登録モードにおいて展開された統計が相互に比較されて「グローバルディスト ーション(大域的ひずみ)すなわち全体的な否」を展開し、ワードがワード間で 相違する程度を指示する。前記のスピーカ間(内部・話し手)の比較は(内部・ 話し手)の比較に対するグローノ;ルディストージョンは所定のトークンのr( 1)e、同じスピーカによシつくられた同じワードの全ての他のトークンのa  a /i)と比較することによりつくシ出される。このように、tの異なったト ークンがあるとすれば、Tw=(t−t)−tのスピーカ間(内部・話し手)の 比較が行われる。上位ゾロセッサは、前述の過程を実行し、かつ第7図から第9 図に関して後述するスピーカ間(内部・話し手)のルーチングを用いることによ り前記のスピーカ間の比較からグローバルディストーションGi獲得する。At block 228, the system performs a "speaker-to-speaker-to-speaker" comparison. , the statistics developed in registration mode are compared with each other and (global distortion) or global distortion, and words are Indicate the degree of difference. The above comparison between speakers (internal/speaker) is (internal/speaker). grono for the comparison of speakers); rudistortion is the r( 1) e, a of all other tokens of the same word produced by the same speaker It is determined by comparing with a/i). In this way, different tones of t If there is a A comparison is made. The upper Zorocessor executes the above-mentioned process and performs the steps in FIGS. 7 to 9. By using routing between speakers (internal/talker), which will be explained later in the figure, The global distortion Gi is obtained from the comparison between the speakers.

一旦スビーカ間のグローバルディストーションがブロック228において展開さ れると、それらは将来の使用に備えて記憶され、システムはブロック230へ進 む。Once the global distortion between the speakers is developed at block 228, Once they are stored for future use, the system proceeds to block 230. nothing.

ブロック230において、スピーカのワードに対するスピーカ間(すなわち、相 互・話し手)比較はそのワードのスピーカのNトークンの各々に対してグローバ ルディストーション(C,) ’e得ることにより計算される。該グローバルデ ィスト−:)!l 7 (G)は包括的なデータベースにおいて全てのスピーカ によシ発生する同じワードのその他の全てのトークンのaa (il値とそノド −クンのr(1)値とを比較することから発生する。前記の包括的データベース は検証システムによシ使用される10個の基準ワードの翻訳における広範囲の変 化を網羅する。何故なら、それぞれ明確に異った発声気管特性を有する個人から なる群によるトークンの発生を表示するからである。n人のスピーカがあるとす れば、Tb=n、t2のスピーカ間(相互・話し手)の比較が行われる。ブロッ ク230においてスピーカ間比較を達成するための方法についての詳細な説明は 第10図に関して後述する。At block 230, the inter-speaker (i.e., mutual Comparisons are made between global speakers for each of the speaker's N tokens of the word. It is calculated by obtaining the distortion (C,)'e. The global data List:)! l 7 (G) is a list of all speakers in a comprehensive database. aa of all other tokens of the same word that occur (il value and its node) - It is generated by comparing the r(1) value of Kun. Comprehensive database of the above covers a wide range of variations in the translation of the 10 reference words used by the verification system. Covers all aspects of This is because individuals with distinctly different vocal tracheal characteristics This is because it displays the occurrence of tokens according to the group. If there are n speakers If so, a comparison between the speakers (mutual/speaker) is performed at Tb=n and t2. Block A detailed description of how to achieve inter-speaker comparisons in the This will be described later with reference to FIG.

ブロック230においてスピーカ間(相互・話し手)のディストー:)ヨンを獲 得した後、システムはブロック232まで進み、そこでスピーカ間(内部・話し 手)からのディストーションとスピーカ間(相互・話し手)の比較とが合わされ て数が下がる方向に記憶され、アレイDに記憶される。このアレイにおけるディ ストーションの全体数はd=Tw+TBである。このアレイにおけるディストー ションはスピーカ間(相互・話し手)あるいはスピーカ間(内部・話し手)のデ ィストーションとうはルが付げ続けられる。ブロック232でつくられるアレイ Dの例を第12図に示す。In block 230, the distortion between the speakers (mutual/talker) is obtained. After obtaining the signal, the system proceeds to block 232, where the The distortion from the hand) and the comparison between the speakers (each other/speaker) are combined. The numbers are stored in descending order and stored in array D. The data in this array The total number of torsions is d=Tw+TB. Distortion in this array tion is a device between speakers (mutual/speaker) or between speakers (internal/speaker). Distortion continues to be added. Array created by block 232 An example of D is shown in FIG.

ブロック232からシステムはブロック234マで進み、そこで統計ファイル5 TATがつくられる。第12図に示す順序のディストーションを用いることによ りシステムは、受入れ/拒否の決定のための限界値が特定のスピーカ間のディス トーションのディストーションに対応するディストーション値に基づいていると すれば、それぞれのスピーカディストーションに対して、システムが間違って実 際のスピーカを拒否したり、間違って偽のスピーカを受入れたりし易いことを指 示するファイルをつくる。第12図のアレイDにおけるインフォーメーションに 基づいた5TATフアイルの一例を第・13図に示す。第13図の5TATフア イルを展開するためにブロック234において用いられる過程を第11図に関し て以下説明する。From block 232 the system proceeds to block 234 where the statistics file 5 TAT is created. By using the distortion order shown in Figure 12, system, the threshold for acceptance/rejection decisions is based on specific speaker-to-speaker Based on the distortion value corresponding to the distortion of the torsion. This will ensure that the system is not running incorrectly for each speaker distortion. This indicates that it is easy to reject a real speaker or mistakenly accept a fake speaker. Create a file that shows Information in array D in Figure 12 An example of the 5TAT file based on this is shown in Figure 13. 5TAT faucet in Figure 13 The process used in block 234 to develop the file is illustrated in FIG. This will be explained below.

ブロック234から、第6図に示すシステムはブロック226へ戻り被登録人の 次のワードを獲得する。全てのワードが前述のように処理されたとすれば、シス テムはブロック236マで進み、0RDERフアイルを構成し、このファイルは 現在のスピーカを包括的なデータベースにその人のデータが記憶されているその 他のスピーカから判別しうる基準ワードの各々の相対的能力を示す。高度の区別 能力全盲するワードとは間違って拒否する誤差比率の何れかの所定レベルにおい て間違って受入れる誤差比率の低いワードのことである。システムはワード対ワ ードの5TATフアイルにおいて間違って受入れる場合の最大値に基いたワード ヲ仕分けすることにより現在のユーザに対してワードの相対的な判別能力を検出 する。このように、例えば、第13図に示す5TATフアイルにより表示される ワードを仕分けるために使用fる値1dERRORFALSE ACCEPTの JI、出りの下での最初の入口であって、これは2/6の値でらる。基準ワード 3に対するワード毎の5TAT7アイルの各々からの前記の表示値は数が小さく なる順に並べられ、五−ザ毎に識別されるファイル[0RDERJに保存される 。From block 234, the system shown in FIG. 6 returns to block 226 to register the registrant. Get the next word. If all words were processed as described above, the system The system proceeds in block 236 and configures the 0RDER file, which is The current speaker's data is stored in a comprehensive database whose The relative ability of each of the reference words to be distinguished from other speakers is shown. Altitude distinction A blind word is a word that is incorrectly rejected at any given level of error ratio. This refers to words with a low error rate that are incorrectly accepted. The system is word-to-word. Word based on the maximum value for false acceptance in the 5TAT file of the code Detect the relative discrimination ability of words for the current user by sorting do. Thus, for example, the 5TAT file shown in FIG. The value used to sort words is 1dERRORFALSE ACCEPT. JI, the first entrance below the exit, has a value of 2/6. standard word The above display values from each of the 5 TAT 7 isles per word for 3 are small in number. Files arranged in the order of .

ブロック236にある間、システムはその識別子記憶ファイルにおける特定ユー ザに対する登録時に得た情報(名前、アクセス点、誤差レイル)を入力する。前 記ファイルは当該ユーザの識別子に対応するデータベース情報にリンクされてい る。While in block 236, the system Enter the information you obtained when registering for the user (name, access point, error rail). Before The file is linked to database information corresponding to the user's identifier. Ru.

第7図から第9図までを参照することによシ、スピーカ間(内部・話し手)の比 較を行うために第6図に示すブロック228で用いられる過程を説明することが できる。第7図を参照すれば、第6図に示すブロック228へ入る際システムは ブロック240まで進行し、そこで現在検討されておシ、かつ被登録人が発声し たワードの次のトークンを装填する。一旦次のトークンが装填すれると、システ ムはブロック242まで進み、そこで「CompAREJの過程が呼出される。By referring to Figures 7 to 9, the ratio between the speakers (internal/talker) can be determined. The process used at block 228 in FIG. 6 to perform the comparison may now be described. can. Referring to FIG. 7, upon entering block 228 shown in FIG. Proceed to block 240, where the current consideration and the registrant's uttered Loads the next token of the word. Once the next token is loaded, the system The system continues to block 242, where the CompAREJ process is called.

CompARE過程は被登録人が発生したワードの他のトークジと、当該トーク ンを比較することによシ検討されている特定のトークンに対するグローバルディ ストーションを提供する。The CompARE process compares the registered person with other tokens of the generated word and the token. global index for the particular token being considered by comparing the Provide a stortion.

比較を完了し、かつグローバルディストーションを獲得すると、システムはブロ ック244まで進み、かつ後で使用するためにディストー:):l 7 f記憶 する。ブロック244からシステムはブロック240まで戻り、Nトークンの次 のトークンを獲得し、前述のようにこのトークンの処理を行う。所定のワードに 対してそれ以上トークンが入手できないとすればシステムは第6図のブロック2 30に対応するブロック230マで進み、スピーカ間の比較を開始する。After completing the comparison and acquiring the global distortion, the system will Proceed to block 244 and distort for later use:):l 7 f memory do. From block 244, the system returns to block 240 and returns to the next N token. , and process this token as described above. to the given word On the other hand, if no more tokens are available, the system Proceeding to block 230, corresponding to number 30, the comparison between the speakers begins.

さて第8図と第9図とを参照すれば、第7図のブロック242において使用され るCompARE過程を説明する。第7図のcompAREブロック242へ入 るとシステムは第8図のブロック242まで進み、基準トークンとテストトーク ンとの間の比較を開始する。イントラスピーカ比較の場合基準トークンは被登録 人の前の発声の中の1個である。テストトークンとは第6図のブロック228に 示すように、データベースをつくる上で現在処理されているトークンである。Referring now to FIGS. 8 and 9, in block 242 of FIG. The CompARE process will be explained. Enter compARE block 242 in FIG. The system then proceeds to block 242 of Figure 8, where the reference token and test token are Start a comparison between In the case of intra-speaker comparison, the reference token is registered. This is one of the things you can say in front of other people. The test token is shown in block 228 of Figure 6. As shown, these are the tokens currently being processed to create the database.

aaa数セットの基準パターンをテストテンプレートのr fi)およびe値に 対して比較することによシ比較が行われる。The reference pattern of the aaa number set is used as the rfi) and e value of the test template. Comparisons are made by comparing against each other.

テストの状況については第9図にグラフ表示しておシ、基準軸280上で零から jまで各フレームに対してaa値全全指定ることにより基準テンプレートが規定 されることが判る。同様にテストテンプレートの零から1までの各フレームに対 するrとeの値は1軸282に沿って位置する。基準テンプレートの長さはjI ldl上で原点284からMまで延びるものとして示されている。The test situation is shown graphically in Fig. 9. A reference template is defined by specifying all aa values for each frame up to j. It turns out that it will be done. Similarly, for each frame from 0 to 1 in the test template, The values of r and e are located along one axis 282. The length of the reference template is jI It is shown extending from the origin 284 to M on ldl.

同様(、テストテンプレートの長さはi軸のNとして示す位置まで原点284か ら延びるものとして示されている。Similarly (the length of the test template is from the origin 284 to the position shown as N on the i-axis) It is shown as extending from

テストの結果は、原点284と、288で示すMとN位置の軸に対して垂直の線 の交差点との間の可能な全ての軌道を横移動することによシ経験される最小量の ディストーションを示すグローバルディスト−9aン値Gで示す。The result of the test is a line perpendicular to the axis of the origin 284 and the M and N positions indicated at 288. of the minimum amount experienced by traversing all possible trajectories between the intersections of It is indicated by a global distortion-9a value G indicating distortion.

前記ノブローバルブイスト−ジョンGは、第8図のフロー線図で示され、かつ以 下説明する2段階の方法によシ得られる。The knob blow valve quist John G is shown in the flow diagram of FIG. It is obtained by a two-step method described below.

第8図に示すブロック242からシステムは決定ブロック246まで進み、そこ で基準テンプレートのフレームMの数はテストテンプレートのフレームNの数と 比較される。フレームの前記数の差が所定の限界値をはみ出しているとすれば、 システムはブロック248マで進み、発声の長さは比較するには互換性のないこ とを示す出力信号r999Jを提供する。図示実施例に対しては、限界値は 発声の長さが限界値内に入っているとすれば、システムはブロック250まで進 み、1=0の初期値をセットする。ブロック250カラシステムはブロック25 2まで進み、j=oの初期値をセットする。ブロック252からシステムは次に ブロック254まで進み、システムの所定点1.jにおける局部ディストーショ ンを計算して比較過程の第1段階を完了する。1とjの初期値はOであるので、 過程は原点284から始まり、そこから点288までの最小軌道を検出する必要 がある。From block 242 shown in FIG. 8, the system proceeds to decision block 246, where The number of frames M in the reference template is equal to the number of frames N in the test template. be compared. If the difference in said number of frames exceeds a given limit value, then The system proceeds at block 248, and the length of the utterance is not compatible with the comparison. It provides an output signal r999J indicating the following. For the illustrated embodiment, the limits are If the length of the utterance is within the limits, the system proceeds to block 250. and set the initial value of 1=0. block 250 color system is block 25 Proceed to step 2 and set the initial value of j=o. From block 252, the system then Proceeding to block 254, the predetermined points in the system 1. Local distortion at j , and complete the first step of the comparison process. Since the initial values of 1 and j are O, The process starts from the origin 284 and requires finding the minimum trajectory from there to point 288. There is.

ブロック254において、第2図の5P122はlL&係数のNベクトルと正規 化された自己相関rとを比較する。局部歪結果でらるNはCDB120内に16 ビツトの値としてストアされる。In block 254, 5P122 of FIG. Compare the calculated autocorrelation r. N in the local distortion result is 16 in CDB120. Stored as a bit value.

これらの局部歪を得るための関係は H=。The relationship to obtain these local strains is H=.

として示される。is shown as

次に、マドリスク内の各1.j点のためにそのロケーションで)基準とテストテ ンプレート間で距離測定を表示する歪値が発生される。Next, each 1. ) reference and test test at that location for point j. A distortion value is generated that represents the distance measurement between the templates.

ブロック254内に演算された局部歪(i、j)が含まれておシ、システムは次 にブロック256に移り、第9図のグラフ上の座標1及びjによって示される特 定位置用の全体的な距離値(1゜j)を発生する。この最小距離バスを決定する ために、プロセッサは与えられた位置に対する異なるバスの値をめ、そして最小 歪値を有する・ξスを選択する。次に、第9図のグラフ上の点290用の最小の 全体的な歪を決定するために、292.294及び296で示される3つのパス の間からの最小歪が受入れられる。この最小・ぞスは次の関係によって数学的に 決定できる。The calculated local distortion (i, j) is included in block 254, and the system is The process then moves to block 256, where the characteristic indicated by coordinates 1 and j on the graph of FIG. Generate an overall distance value (1°j) for the home position. Determine this minimum distance bus , the processor calculates the values of different buses for a given position and calculates the minimum Select ξ that has a distortion value. Next, the minimum value for point 290 on the graph of FIG. Three passes shown at 292, 294 and 296 to determine the overall distortion A minimum distortion from between is accepted. This minimum zos is calculated mathematically by the following relationship You can decide.

dは前もって発生された局部歪、前もって決定されていない指数すなわち負の数 になるものは零の値に割当てられる。例えば、点1=1.5=1でのgi、 j の値は点1−2. j−1,及び1−1.j−2でのgのための値を要求する。d is the pre-generated local distortion, an undetermined exponent, i.e. a negative number is assigned a value of zero. For example, gi at point 1=1.5=1, j The value of points 1-2. j-1, and 1-1. Request the value for g at j-2.

これらのgの値は軸の負側にないので、彼等はシステム内に存在せず、従って彼 等は零の値に割当てられる。Since these values of g are not on the negative side of the axis, they are not present in the system and therefore their etc. are assigned a value of zero.

最小パスの値を定義する最後の全体的な歪は第9図の点288に発見される。こ の点のために、システム内のブロック256戻る。この最後のG値は以下のよう に決定される。The final global distortion that defines the value of the minimum path is found at point 288 in FIG. child Return to block 256 in the system for the point. This last G value is as follows determined.

実際の動作において、上述の演算を継続するために全ての情報が必要であるので 、apHoは全体的な歪の3つの列及び局部歪の2つの列だけを維持する。これ は重要な記憶スペースを節約する。更に、上述のグイナミイクプログラミングア ルゴリズムにおける平行四辺形境界のために、点の略々30%がイクスプリトサ ーチから省略される。これ°らの点は原点284に及び第9図のラインの終点2 86に接続されている角を有する平行四辺形の外側である。これらの点は、はぼ j軸上のN値、j軸上のM値でおるグラフのこれらの境界の近くに特に集中して いる。In actual operation, all the information is needed to continue the above calculation. , apHo maintains only three columns of global strain and two columns of local strain. this saves important storage space. In addition, the above-mentioned Guinamiku programming Due to the parallelogram boundary in the algorithm, approximately 30% of the points are omitted from the program. These points reach the origin 284 and end point 2 of the line in FIG. 86 is the outside of the parallelogram with corners connected to it. These points are Especially concentrated near these boundaries of the graph between the N value on the j-axis and the M value on the j-axis. There is.

第9図のグラフ上の現在の点1.jのための全体的な歪が得られた後に1システ ムはブロック260に移シ、かつj指数が1だけ増加される。そして、システム は決定ブロック262ニ移りかつ基準証拠(reference toker) 内のaa係数の数と新しいj指数が等しいかどうか決定する。もし、j指数がa a係数の数と等しくなければ、システムはブロック254へ戻シ、第9図のグラ フ内の新しい位置用の歪を上述の如く演算する。Current point 1 on the graph in Figure 9. 1 system after the global strain for j is obtained. The system moves to block 260 and the j index is incremented by one. And the system moves to decision block 262 and the reference toker Determine whether the number of aa coefficients in and the new j index are equal. If the j index is a If the number of a coefficients is not equal, the system returns to block 254 and returns to the graph of FIG. The distortion for the new position within the file is computed as described above.

もし、j指数が基準証拠のaa係数と等しければ、システムはブロック262か らブロック264へ移シ、かつ1指数を1だけ増加する。ブロック264からシ ステムが決定ブロック266に移シ、テスト証拠(test token)のr 係数の数と1指数が等しいはブロック252へ戻シ、j指数を零に等しくセット し、第9図のグラフ内Ω新しい位置で歪の引出しを継続する。もし、新しい指数 1がテスト証拠(test token)のためにセットするr係数に等しげれ ば、次にシステムは第9図のグラフ内の最後の点288にある。システムは上記 方程式a3で示された如きに定義された点288での最後の正規化された全体的 な歪値のブロック268へ移る。この正規化された値はテスト証拠と基準証拠の 比較に対応する全体的な歪になる。If the j index is equal to the aa coefficient of the reference evidence, the system returns to block 262. The process then moves to block 264, and the 1 index is incremented by 1. From block 264 The stem moves to decision block 266, where the test token is If the number of coefficients and 1 index are equal, return to block 252 and set j index equal to zero. Then, strain extraction is continued at the new position of Ω in the graph of FIG. If the new index 1 should be equal to the r factor set for the test token For example, the system is then at the last point 288 in the graph of FIG. The system is above The final normalized global at point 288 defined as shown in equation a3 Moving on to block 268 for distortion values. This normalized value is the difference between test evidence and reference evidence. There will be an overall distortion corresponding to the comparison.

第6図のブロック228内の内部・話し手比較を完了し、かつ上述の処理を利用 した後に、システムは相互・話し手比較が実行される第6図のブロック230へ 移る。第10図を参照して、相互・話し手比較の成就がもっと詳細に述べられる 。特に、ブロック230に達しているとき、システムは特定のワードが処理され ている間に使用者の次の証拠へ進めるブロック300へ移る。一度この証拠が認 識されると、次の一般的な証拠へ進めるブロック302へ移り、かつ現在のワー ドが検査されている間に特定の一般的な話し手の次の証拠へ進め葱ズロソク30 4へ移る。Complete the intra-speaker comparison in block 228 of FIG. 6 and use the process described above. After that, the system moves to block 230 of FIG. 6 where an inter-speaker comparison is performed. Move. With reference to Figure 10, the achievement of inter-speaker comparison is described in more detail. . In particular, when block 230 is reached, the system indicates that a particular word has been processed. 300, which advances to the user's next evidence. Once this evidence is recognized Once identified, the process moves to block 302 which advances to the next general evidence and Proceed to the next evidence of a particular common speaker while the word is being examined.30 Move on to 4.

システムは、ブロック304内に示されている如く、特定の一般的な話し手から の証拠を伴うユーザからのワードの現在の証拠の比較を導くブロック306へ移 る。この比較の成就のための手順は第8図及び第9図に関して上述されたものと 同じでi、比較された証拠用のスコア値を表わす全体的な歪音発生する各比較を 伴う。比較の完成後(て、全体的な歪は更に使用されるためにストアされる。The system selects a specific common speaker as shown in block 304. Moving to block 306, which leads to a comparison of the current evidence of the word from the user with the evidence of Ru. The procedure for accomplishing this comparison is as described above with respect to Figures 8 and 9. At the same time, each comparison yields an overall distortion representing the score value for the compared evidence. Accompany. After the comparison is completed, the overall distortion is stored for further use.

一般的な話し手の次の証拠を得る。もし、考察下のワード・に関連している話し 手用の証拠がそれ以上なげれば、システムはブロック304からブロック302 へ移シ、次の一般的な話し手に進み・次に上述の如く一般的な話し手用の証拠の 数値をめる。Obtain the following evidence of common speakers. If the story is related to the word under consideration, If there is no further evidence, the system proceeds from block 304 to block 302. Move on to the next common speaker and then move on to the evidence for common speakers as described above. Calculate the numbers.

もし、一般的な話し手からの現在のワードの証拠がそれ以上なければ、システム はブロック302からブロック300へ移シ、そして特定なワードのユーザの次 の証拠へ進む。もし、そのワードのユーザの証拠の全ての比較が完了すれば、シ ステムは第10図のブロック308にストアされた歪が組合され上述の如くスト アされる第6図のフローチャート内のブロック232ヘブロノク300から移る 。If there is no more evidence of the current word from common speakers, the system moves from block 302 to block 300, and the user's next Proceed to the evidence. If all comparisons of the user's evidence for that word are completed, the system The stem is combined with the distortions stored in block 308 of FIG. Moving from block 232 Hebronok 300 in the flowchart of FIG. .

第11図を参照して、第6図のブロック234によって実行される如(STAT ファイルの作図の成就用の手順を述べることは可能であり、システムは前もって 考察されていない上位桁を有する内部・話し手用の次の全体的な歪値が第12図 のアレイDから得られる第11図のブロック310ヘジヤンプすることによpS TATファイルの作図を開始した。第12図を参照して例えばブロック310の 活性化は内部・話し手比較番号6に対応する歪値87を得る。この情報はストア され、システムはERRORFALSE ACCEPT (ERRORFA)値 が引出されるブロック312に移る。11, as performed by block 234 of FIG. It is possible to state the steps for accomplishing the construction of a file, and the system The following global distortion values for internal speakers with high order digits not considered are shown in Figure 12. pS by jumping to block 310 in FIG. 11 obtained from array D of Started drawing the TAT file. Referring to FIG. 12, for example, block 310 The activation obtains a distortion value of 87, which corresponds to internal-speaker comparison number 6. This information is stored in and the system returns the ERRORFALSE ACCEPT (ERRORFA) value. Moving to block 312, where is drawn.

第13図のper ” word 5TATフアイルの情報全稈るために、第1 2図のアレイDに記憶された各々の内部・話し手歪は数1=0.・・・・・・T wを割シ当てられている。アレイDの各々のTw内部・話し手歪については、そ の歪よシ数的に小さいアレイ内の内部・話し手歪の数は演算されかつアレイJに 記憶される。In order to see all the information in the ``per'' word 5TAT file in Figure 13, the first Each internal/speaker distortion stored in array D in FIG. 2 is expressed by the equation 1=0.・・・・・・T w is assigned. For each Tw internal/speaker distortion in array D, The number of internal speaker distortions in the array that are numerically smaller than the distortions in J is computed and added to array J. be remembered.

これらのアレイ内に1=O2・・・・・・TWのエレメントがある。数TWで割 シ当てられたアレイD内の内部・話し手歪については、数的((その歪に等しい か又は以下である歪の総数は(相互および内部・話し手)演算され且つアレイK に記憶される。上記発生された情報に基づいて、第13図のper−word  5TATフアイルのERORFA欄は以下の関係を用いて第11図のブロック3 21の要求によって発生される。Within these arrays there are elements of 1=O2...TW. Divide by number TW For the intra-speaker distortion in the assigned array D, the numerical ((equal to that distortion The total number of distortions (mutual and intra-speaker) that is less than or equal to is computed and array K is memorized. Based on the information generated above, the per-word in FIG. The ERORFA column of the 5TAT file is set to block 3 in Figure 11 using the following relationship. 21 request.

per −word 5TATフアイルのERRORFAの第1のエレメントは 上記式14全第12図のDアレイにおいて上から下に移動するとき出会う第1の 内部・話し手歪値に適用することによシ確定する。この場合においては、第1の 出会った歪値は歪値値については、数的に配列番号6より小さい2相互・話し手 歪が存在するので、上述の関係はJ = (1) = 2 =i発生する。出会 った第1の歪(配列番号6)より小さいか等しい6歪が存在するのでKは6であ る。一方、40の値の内部・話し手歪については、その点以下の相互・話し手歪 が存在しないこと一注意すべきである。従って、ERRORFAの分子はOであ り、一方、第1の出会った内部・話し手歪に含まれている6歪が存在するので分 母は6のままである。ブロック312のERRORFA欄の開発が完了したとき は、システムは第13図のper−wordSTATファイルのERRORFA LSE Rz、F、cr (ERRORFR)を開発するブロック314へ移動 する。上述の関係全利用してERROR工欄は以下の関係を発生する。The first element of ERRORFA in the per-word 5TAT file is The first equation encountered when moving from top to bottom in the D array in Figure 12 This is determined by applying it to the internal speaker distortion value. In this case, the first The encountered distortion value is numerically smaller than array number 6 in terms of distortion value. Since distortion exists, the above relationship occurs: J=(1)=2=i. encounter Since there are 6 strains that are smaller than or equal to the first strain (SEQ ID NO. 6), K is 6. Ru. On the other hand, for internal/speaker distortion with a value of 40, mutual/speaker distortion below that point It should be noted that there is no such thing. Therefore, the molecule of ERRORFA is O. On the other hand, since there are six distortions included in the first internal/speaker distortion, My mother remains 6. When the development of the ERRORFA column of block 312 is completed In this case, the system uses ERRORFA in the per-word STAT file in Figure 13. Move to block 314 to develop LSE Rz, F, cr (ERRORFR) do. Utilizing all of the above relationships, the ERROR field generates the following relationship.

第12図のアレイDを参照して、ERRORFRの式15は、第13図において 出会い従って番号ニー1が割シ当てられる第1の内部・話し手歪を検査すること によシ第13図の値を定義する。一般的な場合において、システム内にN内部・ 話し手歪が存在し、上記式は87の歪でERRORFRの値をl−1/n=0  / n = Oと指示する。システムはブロック314から次にブロック316 へ移動し、ブロック312および314で開発された情報を説明のために第13 図に描かれたper−word 5TATフアイルに記憶する◇per−wor d 5TATフアイルの完成に伴って、システムはブロック316からブロック 310へ移動する。このブロック310は、上述された方法で・D′アレイから 次の内部・話し手歪を得て、そのワードのためのper−word 5TATフ アイルヲ形成する。アレイDにそれ以上内部・話し手歪がなければ、システムは 第6図のブロック226へ移動し、上述の如く機能する。登録手順が完了したら 、ユーザは安全なエリヤへのアクセスを得る試みにおいて本発明の確認モードを 起動し、また本発明の確認システムが応用するアクセス、同人確認等の目的で利 用される。再び第1図を参照して、システムが登録状態になければ、ブロック5 0へ移動し、確認モードの有無を決定する。確認モードと決定されれば、第14 図のブロック50へ移動し、確認成就の手順を活性化する。システムは第14図 のブロック50からブロック400へ移動し、ステーショア102の1つでの現 在のアクセスの要求の有無?決定する。Referring to array D in FIG. 12, equation 15 for ERRORFR is expressed in FIG. Examining the first intra-speaker distortion that encounters and is therefore assigned the number Knee 1 Define the values shown in Figure 13 accordingly. In the general case, there are N internal There is speaker distortion, and the above formula sets the value of ERRORFR to l-1/n=0 with a distortion of 87. / Indicate n = O. From block 314, the system then proceeds to block 316. 13 and the information developed in blocks 312 and 314 for explanation. The per-word drawn in the diagram is stored in the 5TAT file ◇per-word d Upon completion of the 5TAT file, the system proceeds from block 316 to Move to 310. This block 310 is constructed from the D′ array in the manner described above. Obtain the following internal speaker distortion and create a per-word 5TAT file for that word. Form an aisle. If there is no further internal/speaker distortion in array D, the system Moving to block 226 of FIG. 6, it functions as described above. Once the registration process is complete , the user uses the verification mode of the present invention in an attempt to gain access to a secure area. Activated and used for the purpose of access, co-identification, etc. to which the verification system of the present invention is applied. used. Referring again to FIG. 1, if the system is not in the registered state, block 5 0 and determines whether or not there is confirmation mode. If the confirmation mode is determined, the 14th Moving to block 50 of the diagram, the verification success procedure is activated. The system is shown in Figure 14. from block 50 to block 400 and the current state on one of the stayshores 102 Is there a current access request? decide.

ブロック400において、ホスト・プロセッサは動作のための全てのアクセス点 を継続的にスキャンする。動作が表示されなければ、ライン402を通してシス テムループはブロック400へ戻り、そしてここで要求が行われるような時間ま で機能する。At block 400, the host processor identifies all access points for operation. scan continuously. If no activity is indicated, the system The system loops back to block 400, where it determines the time at which the request is made. It works.

ユーザは個人確認番号即ちキー・ぞア)’(KEY PAD)の入力、プラスチ ックカードの挿入、マイクロフォンへの名前の入力のような種々の方法で確認要 求を与える。要求を検出したときは、システムはブロック404へ移動し、ユー ザに確認のための要求を発生する。この要求は0P100からSD 106 を 介してステーション102へ転送される。ユーザ確認について急いでいれば、シ ステムはブロック406に移動し、5D106を介してステーション102から の入力信号を監視し、同一性証明情報に存在する表示に対応する信号のエネルギ レベルを検出する。この形式の入力信号が予め設定された時間期間の後に検出さ れなければ、システムはブロック404への戻p1ユーザからの同一性証明を要 求する。同一性証明を含む信号を検出したときは、システムはブロック408へ 移動する。ブロック408において、システムは、同一性証明が手続きされたユ ーザに対応するがどうか及び同一性証明が特定のアクセス点からのアクセスであ ると認めるかどうかを決定するために、ユーザ用に予め記憶された同一性証明情 報と比較する。同一性証明が表示された基準に合わないときには、システムはブ ロック410へ移動し、ユーザを拒絶する信号を発生する。同一・性証明は特定 のアクセス点として容認可能とされれば、システムはブロック412に移動し、 予め入力され且つ記憶された特定のユーザ用のデータに基づいたしきい値全設定 する。しきい値が指定されていなげれば、システムはデホルト(defalt) 値を利用する。The user must enter their personal identification number (KEY PAD), confirmation in various ways, such as inserting a card or entering a name into the microphone. give a request. If a request is detected, the system moves to block 404 where the user generates a request for confirmation from the user. This request is from 0P100 to SD106 is transferred to station 102 via If you are in a hurry about user verification, you can The stem moves to block 406 and leaves station 102 via 5D106. monitors the input signal of the Detect levels. An input signal of this form is detected after a preset time period. If not, the system returns to block 404 and requires proof of identity from the p1 user. seek When the system detects a signal containing proof of identity, the system proceeds to block 408. Moving. At block 408, the system identifies the user whose identity has been processed. whether the user is compatible with the user and whether the identity proof is accessed from a specific access point. identity credentials previously stored for the user to determine whether Compare with the information. When the proof of identity does not meet the displayed criteria, the system will Move to lock 410 and generate a signal rejecting the user. Identity/gender proof is specific is acceptable as an access point, the system moves to block 412; All threshold settings based on pre-entered and memorized data for a specific user do. If no threshold is specified, the system defaults to Use values.

設定されているしきい値は、要求を拒絶する前に許される検査(各ワード毎に検 査が継続される)の最大回数、要求を容認可能なものとして許す前に要求されて いる検査の最低回数、容認のために要求されるホルト・アクセプト・エラー・レ イト(false accept error rate) (ERRORFA )のしくル、容認のために要求されるホルト・リジェクト・エラー・レイト(f alse rejection error rate ) (ERRORFA  )及び容認されている検査失敗の最大回数を含んでいる。しきい値が設定され たときは、システムはブロック412からブロック414へ移動し、この特定の ユーザのための0RDERフアイルをアクセスする。システムは登録手続きモー ドにおいて創作された0RDERフアイルからの次のワードを得る。新しいワー ドを有するシステムはブロック414からブロック418に移動し、ユーザがス テーション102のマイクロフォンに選択されたワードを話すように要求する。The configured threshold determines the number of checks allowed before rejecting a request (checking each word). the maximum number of times that a request is requested before allowing it to be accepted as acceptable. Minimum number of tests required for acceptance, Holt Acceptance Error Level required for acceptance. (false accept error rate) (ERRORFA ), the halt-reject error rate required for acceptance (f alse rejection error rate) (ERRORFA ) and the maximum number of test failures allowed. Threshold is set , the system moves from block 412 to block 414 and selects this particular Access the 0RDER file for the user. The system is in registration procedure mode. Get the next word from the 0RDER file created in the code. new war The system with the command moves from block 414 to block 418 where the user request the microphone of station 102 to speak the selected word.

ユーザによって発声された現在の合言葉を受信したときは、システムはブロック 420へ移動し、正規化された自己相関係数rを得る。これらのr係数はテスト 手順にょ)得られるe’テスト手順は、確認プロセスを促進するために現在のス ピーチにおけるr係数を発生するように他のパラメータと同様に機能する。この 手順は第4図のとともに前述されている。When the system receives the current secret word spoken by the user, it will block Step 420 obtains the normalized autocorrelation coefficient r. These r coefficients are tested The resulting e’test procedure can be used to It functions similarly to other parameters to generate the r-factor at the peak. this The procedure is described above in conjunction with FIG.

r係数を受信したときは、システムはブロック422へ移動し、現在の合言葉( トークン: token)とユーザの対応している4つのテンプレートとを比較 し、そしてこれらの比較から得られた全体的な歪を利用し、per −word  5TATフアイルからERRORFA用の現在値を得る。このERRORFA t得るための手順は第15図に詳しく描かれておシ、更に後述される。5TAT フアイルからのERRORFAの訂正の動作の間に、現在の歪よシ大きな歪が5 TATフアイルの中に記憶されていないことがわかれば、検査は失敗したとみな される。システムはブロック428へ移動し、容認または拒絶がされなければな らないことに関するどの動作をするかを決定するために更にテストが行われる。When the r coefficient is received, the system moves to block 422 and enters the current secret word ( Compare token: token) with the four templates supported by the user. and using the overall distortion obtained from these comparisons, per-word Get the current value for ERRORFA from the 5TAT file. This ERRORFA The procedure for obtaining t is depicted in detail in FIG. 15 and will be discussed further below. 5TAT During the operation of ERRORFA correction from the file, a distortion larger than the current distortion If it is found that it is not stored in the TAT file, the test is considered to have failed. be done. The system moves to block 428 where an acceptance or rejection must be made. Further testing is performed to determine what actions to take regarding not being present.

ブロック428内で実行されているテスト手順は第16図を参照して後述される 。ブロック428のテスト手順の決定ノ基づいて、システムは何も決定せず、そ して次のワードが0RDERフアイルから得られ動作が上述のように継続される ブロック414へ戻るか、またはブロック432へ戻シ要求者を容認する。ブロ ック430および432から第2図のステーション102へ転送される信号が発 生され容認者の決定を助ける。勿論、これらの信号は外部装置へ確認された場所 へのドアを開くこと、選択された装置の動作を開始させる等のことを成就するた めに転送される。The test procedure performed within block 428 is described below with reference to FIG. . Based on the decision of the test procedure of block 428, the system makes no decision; the next word is obtained from the 0RDER file and operation continues as described above. Return to block 414 or return to block 432 to accept the requester. Bro The signals transmitted from the stations 430 and 432 to station 102 in FIG. It helps in deciding who is allowed to be born. Of course, these signals are sent to external devices where they are confirmed. to open a door to a computer, start a selected device, etc. will be forwarded to you.

ブロック422でERRORFAが訂正されれば、システムはブロック426へ 移動し、累積された誤差値が調整される。ブロック426を通る初めのノξス上 で累積誤差はブロック422から与えられたERRORFAと対応する。ブロッ ク426を通る次のパス上で累積誤差は前の累積誤差値とブロック422から受 信した現在のERROR,A値との組合わせを含む。一実施例において、この組 合わせは前の累積誤差とブロック422から受信された現在のERROR,A値 の積を含む。そして、累積誤差は新しい要求が評価される毎に氏名詐称者の容認 失敗の確率に基づいて調整される。システムはブロック426からブロック42 8へ移動し、後述される手順に従って要求者の容認または拒絶に関連した決定が 行われる。If ERRORFA is corrected at block 422, the system proceeds to block 426. The accumulated error values are adjusted. On the first node ξ passing through block 426 The accumulated error corresponds to ERRORFA provided from block 422. Block On the next pass through block 426, the accumulated error is combined with the previous accumulated error value received from block 422. Contains the combination with the current ERROR and A values received. In one embodiment, this set The match is the previous accumulated error and the current ERROR,A value received from block 422. Contains the product of And the cumulative error is the imposter's acceptance each time a new request is evaluated. Adjusted based on probability of failure. The system runs from block 426 to block 42. 8, and the decision related to acceptance or rejection of the requester is made according to the procedures described below. It will be done.

第15図を参照して、ブロック422のERRORFAi得るための手順を述べ る。ブロック422に入ったとき、システ゛ムは第15図のブロック440に直 ちに移動し、登録モードで発生された次の4つaaミツアイルテストされたワー ドに対応する)?得るoaa値を得たとき、システムはブロック442へ移動し 、第14図のブロック442で得た新しいr係数とブロック440から得たaa 係数とを比較する。この比較は第8図および第9図を参照して前に説明された手 順によって成就され、新しい証拠(joken )のr値とブロック440で得 られた証拠のaa値との差を表示する全体的な歪を発生する。Referring to FIG. 15, the procedure for obtaining ERRORFAi in block 422 will be described. Ru. Upon entering block 422, the system proceeds directly to block 440 of FIG. Move to next 4 AA Mitsu Air tested works generated in registration mode. )? When the oaa value is obtained, the system moves to block 442. , the new r coefficient obtained from block 442 of FIG. 14 and aa obtained from block 440. Compare with the coefficient. This comparison is based on the approach previously described with reference to Figures 8 and 9. The r-value of the new evidence (joken) and the result obtained at block 440 are generates an overall distortion that displays the difference between the aa value of the evidence and the

システムはブロック444へ移動し、ブロック442で得られた全体的な歪値を 読み出す。この歪値は記憶され、システムはブロック446へ移動し、このユー ザに対応している記憶された証拠Nの何れもが現在の発声の値とまだ比較されて いないがを決定する。比較されていない証拠があれば、システムはブロック44 0に戻シ、上述の如く機能する。比較されるべき証拠がこれ以上の残っていなげ れば、システムはブロック448へ移動し、このブロック448は新しいr値と ユーザの記憶されタテンプレー)Hの比較によって発生された全体的な歪を合成 歪全発生するために処理する。この合成歪は幾つかの別の値を含んでいる。例え ば、一実施例において、証拠歪値は合成歪を含むように一緒に平均される。他の 実施例においては、歪の最小の値が選択され、更に他の実施例においては、最小 の二つの歪が平均される。合成歪の構成が選択される基礎は発明が利用される応 用の形式から独立しておシ且つオペレータの希望からも独立している。現在の発 声を表示する合成歪値が決定されれば、システムはブロック450へ移動し、登 録モードで作成されたper−word 5TATフアイルが参照される。The system moves to block 444 and calculates the overall strain value obtained in block 442. read out. This strain value is stored and the system moves to block 446 to None of the stored evidence N corresponding to the Decide whether or not. If there is evidence that has not been compared, the system will block 44 If set back to 0, it will function as described above. There's no more evidence left to compare. If so, the system moves to block 448, which stores the new r value and Synthesizes the overall distortion generated by comparing the user's stored data (play) Distortion is fully processed to occur. This composite distortion includes several other values. example For example, in one embodiment, the evidence distortion values are averaged together to include the composite distortion. other In some embodiments, the minimum value of distortion is selected, and in still other embodiments, the minimum value of distortion is selected. The two distortions are averaged. The basis on which the configuration of the composite distortion is selected depends on the application in which the invention is utilized. It is independent of the type of use and also independent of the wishes of the operator. current issue Once the composite distortion value for displaying the voice is determined, the system moves to block 450 and registers the voice. The per-word 5TAT file created in record mode is referenced.

ブ07り450において、合成歪はper−word 5TATフアイルの歪と 比較され、合成歪と最も近いがそれより大きい歪が同一のものとみなされる。In block 07ri 450, the combined distortion is the distortion of the per-word 5TAT file. A comparison is made and the distortion closest to but greater than the resultant distortion is considered to be the same.

同一のものとみなされた歪に関連したE RRORFAが抽出され、出す14図 のブロック422へ供給されるERRORFAとして利用される。E RRORFA related to distortions that are considered to be the same is extracted and output Figure 14 is used as ERRORFA which is supplied to block 422.

合成歪がper−word 5TATフアイルのどの歪よシも太きいときには、 ERRORFAが抽出されず、代りに1に等しいERROR,Aが検査が失敗し たことを表示するブロック422へ供給される。システムが第14図のブロック 422からブロック424へ進み、そしてブロック428へ進む場合は、累積誤 差426は失敗した検査に応答して調整されないことは注見される。不注意な雑 音、ユーザのしゃつくり、またはユーザを現在の入力中の彼の発声から邪魔する どのような種類の問題の彼の別の発声を容認される見込みに不利に影響しない。When the composite distortion is thicker than any distortion in the per-word 5TAT file, ERRORFA is not extracted and instead ERROR,A equal to 1 indicates the test fails. A block 422 is provided which displays the information that has been received. The system is the block shown in Figure 14. 422 to block 424 and then to block 428, the cumulative error Note that the difference 426 is not adjusted in response to a failed test. careless miscellaneous Sounds, user jerks, or distract the user from his or her utterances during the current input His different utterances on any kind of issue will not adversely affect the likelihood of being tolerated.

それにも拘わらず、このような普通でない発声は繰り返されるなら、検出された 間違った発声や音はシステムで認識され容認または拒絶に影響する・テストブロ ックを含む第14図のブロック428の動作が第16図に関連して述べられる。Nevertheless, if such unusual vocalizations are repeated, they may be detected. Incorrect pronunciations and sounds are recognized by the system and affect acceptance or rejection. The operations of block 428 of FIG. 14, including the block, will be described in connection with FIG.

特に、ブロック428に入ったときは、システムはブロック460へ移動し、ブ ロック424がらの7エイルカウンタがユーザが検査の予め設定された回数を越 値は2である。熱論、この値はオペレータの裁量で設定されても良い。失敗した 検査が最大を越えていれば、システムはブロック430へ移動し、上述の如く要 求者を拒絶する。失敗した検査が最大を越えていなければ、システムはブロック 462へ移動し、検査の最大回数が越えられたかを決定する。この条件は、要求 者の累積誤差がしきい値よシ大きいがブロック460の検査が失敗されていない ときに生じる。検査の最大回数のための緩やかなしきい値5である。再びもし彼 が希望するなら、オペーレタは別の値を選択できる。最大検査が限度を越えてい れば、システムはブロック430へ移動し、上述の方法で要求者を拒絶する。最 大検査が限度を越えていなげれば、システムはブロック464へ移動し、第14 図のブロック426からの累積誤差がしきい値より大きいか決定される。もし、 そうなら、システムは第14図のブロック414へ移動し、0RDERフアイル からの次のワートヲ得て、上述のように処理する。累積誤差がしきい値よシ小さ ければ、システムはブロック466へ移動し、要求者が少なくとも2回を越えて いるか全決定する。このことは少なくとも2回の検査がこの要求者のために行わ れた且つ第2の検査の終りで累積誤差が容認のためのしきい値以下であることを 意味する。Specifically, when block 428 is entered, the system moves to block 460 and blocks The 7 ail counter in lock 424 indicates that the user has exceeded the preset number of tests. The value is 2. In theory, this value may be set at the operator's discretion. We're screwed If the test exceeds the maximum, the system moves to block 430 and performs the required checks as described above. reject the applicant. If the number of failed checks does not exceed the maximum, the system blocks 462 to determine if the maximum number of tests has been exceeded. This condition requires The cumulative error of Occasionally occurs. A loose threshold of 5 for the maximum number of tests. If he again The operator can select another value if desired. Maximum inspection exceeds limit If so, the system moves to block 430 and rejects the requester in the manner described above. most If the major check is not over the limit, the system moves to block 464 and enters the fourteenth It is determined whether the accumulated error from block 426 of the diagram is greater than a threshold. if, If so, the system moves to block 414 of FIG. Obtain the next word from and process as described above. Cumulative error is smaller than threshold If so, the system moves to block 466 and indicates that the requester has Determine if there are any. This means that at least two checks have been carried out for this requester. and that at the end of the second test the cumulative error is below the threshold for acceptance. means.

上述の実施例で、累積誤差はブロック426の各検査によって調整される。他の 実施例において、しきい値は累積誤差と一緒に調整される。この調整は、累積誤 差のために行われたと同じ方法で、しきい値に現在のERRORFA値を乗算す るような累積誤差での変化の割合として行われ乞。結果として、分数によって乗 算される如く小さくなる累積誤差の傾向はしきい値レベルの低下を伴い、容認さ れる氏名詐称者の見込みは検査の増加によって増加されなくなる。2回以下の検 査が行われたことが検出されると、システムはブロック466からブロック41 4に移動し、0RDERフアイルから次のワード全稈て、上述のように処理する 。少なくても2回の検査が行われていれば、システムはブロック468へ移動し 、要求者に彼が容認されたことを連絡するために又は容認信号によって動作され る装置全始動させるためにステーション102金介して転送される信号を発生し て要求者を容認する。In the example described above, the cumulative error is adjusted by each test in block 426. other In an embodiment, the threshold is adjusted together with the cumulative error. This adjustment is based on cumulative error. Multiply the threshold by the current ERRORFA value in the same way as was done for the difference. This is done as a percentage change in the cumulative error. As a result, multiplied by the fraction The tendency of the cumulative error to decrease as calculated is accompanied by a decrease in the threshold level and The likelihood of identity fraudsters being identified will not increase with increased testing. No more than 2 inspections Once it is detected that a scan has occurred, the system proceeds from block 466 to block 41. 4 and process the next entire word from the 0RDER file as described above. . If at least two tests have been performed, the system moves to block 468. , to inform the requester that he has been accepted or operated by an acceptance signal. generates a signal that is transferred through station 102 to start all the equipment accept the requester.

よりMのパーソナルコンピュータ112のリアルタイム動作システム114全成 就するのに、以下のステップが要求される。The real-time operation system 114 of M's personal computer 112 is fully completed. The following steps are required to accomplish this:

第21図全参照して、パーンナルコンピュータのメモリーがスタック(stac ks) 124として使用されるべくブロック内に組込まれている。これらのス タック同時と進行される各12のプロセス(processes)めに全ての修 飾可能データを保持する。実行されるべき各プロセスのイメージ(image) はそのスタックに記憶されている。プロセスOはイメージ初期設定を必要とせず 、全ての他の初期設定およびセットアツプを実行する特殊なものと指摘される。Referring to FIG. 21, the memory of the personal computer is stacked (stack). ks) is incorporated into the block to be used as 124. These spaces All repairs for each of the 12 processes to be carried out at the same time Holds decorative data. Image of each process to be executed is stored in that stack. Process O does not require image initialization , and perform all other initial configuration and setup special points.

その後は、プロセスOは時間を連続的に読出し、シャード・セマフォード・メモ リー(shared semaphored memory)のロケーション内 の他の全てのプロセスを有用にする“タイム(t1mθ)″を作成する。イメー ジが初期設定された後はルーチンが動作の開始2許された1クロツク・割込み・ サービス・ルーチン”即ち゛クロックISR”と呼ばれる。クロックISRはプ ロセスのスタックの現在のプロセスのイメージを押し進める。他のプロセスの状 態に基づいて、決定はパーソナル・コンピュータのデジタル・プロセッサの使用 に値いする0スケジエーラ(5che4uler )″によって行われる。選択 されたプロセッサのスタックのアドレスはプロセスティプル126から回収され 、そのイメージはスタックを急に出ていく。そのプロセスの動作は割込みから復 温したときに直ちに開始される。初期イメージの危険部分は正しい割込み復帰ア ドレスとフラグの立証である。After that, process O continuously reads the time and shard semaford memo In the location of Lee (shared semaphored memory) Creates a "time (t1mθ)" that makes all other processes useful. Image After the clock is initialized, the routine begins operation with one allowed clock, interrupt, and It is called a "service routine" or "clock ISR." The clock ISR Pushes the image of the current process through the process stack. other process status Based on the This is done by the 0 scheduler (5che4uler)” who deserves the The address of the stack of the processed processor is retrieved from the process tipple 126. , the image suddenly leaves the stack. The operation of that process will resume from the interrupt. Starts immediately when warmed up. The dangerous part of the initial image is This is proof of the dress and flag.

スタックおよびイメージ変化の手順は“文脈スイッチ(contθXBwitc h)”と呼ばれる。第2の機構も文脈スイッチを実行する。おるイベント’を待 つプロセスは、割込みが行われそしてスタック決定および他のプロセスのイメー ジポツプポツピング(popping)が継続されていれば、イメージを造る文 脈スイッチ機構に対して制御を与える。プロセスはプログラムのスペースを共用 する。“純”即ち”再入可能”コードが絶対に必要とされる。各々共用される資 料、装置、資源は専用のセマフォー(θθmaphore )によって保護され なければならない。セマフォーはセクトされ、iう最小非削込み動作によって試 験されるフラグである。問題になるのは2つのプロセスは試験即ち同一ロケーシ ョン、装置、資源の修飾を試み、かつその動作中に非干渉を除く可能性である。The procedure for stacking and changing images is “context switch” (contθXBwich The second mechanism also performs a context switch. One process is interrupted and the stack determination and image of the other process is If popping continues, the sentence that creates the image Provides control over the pulse switch mechanism. Processes share program space do. "Pure" or "reentrant" code is absolutely needed. resources shared by each materials, equipment, and resources are protected by dedicated semaphores (θθmaphore). There must be. The semaphore is sected and tested by a minimum non-cutting operation. flag to be tested. The problem is that the two processes are tested, i.e. in the same location. It is the possibility of attempting to modify the components, devices, resources and eliminating non-interference during their operation.

セマフォービは、割込み中止しフラグを読出すプロセスを有すことによシ確実性 を保証する。フラグが無げれば、フラグがセットされ、割込みが再び開始される 。Semaphobes ensure reliability by having a process that aborts interrupts and reads flags. guaranteed. If the flag is gone, the flag is set and the interrupt is started again. .

フラグが有効なら、文脈スイッチ(即ち、文脈切替え)が行われる。プロセッサ がこの文脈に再び戻るときには、フラグが再び試験される。割込みはこの文脈中 はセマフォーが無くなるまでオフのままである。各々の装置(例えば、クロック 、スクリーン、キーボード、ディスク、rθ232バス、および5VB)は1コ マン)” (command )”機能および”割込み・サービス・ルーチン( intsrrupu 5ervice routine)″機能と関連している 。SVBは、4つまでのボードを共用するDMA機能を使用する権利をボードが あるか決定するために割込み・サービス・ルーチンの0ラウンド9・ロビン(r ound robin)”様式で試験される。装置が使用されるとき、プロセス は装置セマフォーをセットし、割込みを停止し、装置をコマンドシ、装置ビジィ フラグをセットし、文脈切替えが禁止される。スケジューラはそのプロセスに復 帰することができる。プロセスは装置セマフォーを解除し、割込みぬ戻す。プロ セスのプロセッサ使用に関するスケジューラの決定は、優先度、ディバイス・ビ ーシイ・フラグ、プロセス状態に基づいている。2つのレベルの優先度がある。If the flag is valid, a context switch is performed. processor When returns to this context again, the flag is tested again. Interrupt is in this context remains off until there are no more semaphores. Each device (e.g. clock , screen, keyboard, disk, rθ232 bus, and 5VB) are in one piece. command) function and interrupt service routine ( is related to the intsrrupu 5service routine)” function. . SVB grants boards the right to use the DMA feature to share up to four boards. Round 9 Robin (r When the device is used, the process sets the device semaphore, stops interrupts, commands the device, and sets the device busy. Sets a flag to disable context switching. The scheduler returns to that process. can be returned. The process releases the device semaphore and returns without interruption. Professional The scheduler's decisions regarding processor usage for a process are based on priorities, device - policy flags, based on process state. There are two levels of priority.

高優先度は残存されなければならないシステムのユーザに対する連続する正しい 音のスピーチ出方に対してのみ与えられる。全ての他のプロセスは低優先度全盲 する。高優先度プロセスは低優先度プロセス状態える絶対先例を有する。スヶジ ー−ラは同時ド切替えられた物に従うプロセスを示している”ラントハロビン( round robin)″様式のプロセスティプルを試験する。このランド・ ロビン試験の間、装置尾 および無駄なプロセスがスキップされるのを待つ。第 1の実行可能低優先度プロセスが記憶されている。高優先度プロセスが待機中な ら、最初に発見された物が栗初に実行される。何も発見されなげれば、記憶され た低優先度タスクが実行される。プロセス0はブロック化即ち゛無効”されるこ とは不可能であり、従ってスケジュラ−は常にプロセスを実行するために有して いる。プロセスは”キイルド(kllled)Ilまたはト顎ム)” (doo med )″される。キイルト毛れたプロセスは直ちに終了され、文脈記切替え が出され、続いてランド・ロビン試験にスキップされる。High priority should be preserved for consecutive correct users of the system. It is given only to the speech production of sounds. All other processes are low priority blind do. A high priority process has an absolute precedent for being in a low priority process state. Sugaji ``Landharobin'' indicates a process that follows simultaneous de-switching. round robin)” style process tipple. During the Robin test, wait for the device tail and wasteful processes to be skipped. No. One executable low priority process is stored. High priority process is waiting The first thing discovered will be executed first. If nothing is discovered, it will be remembered. The lower priority task is executed. Process 0 is blocked or “disabled” is not possible, so the scheduler always has to run the process. There is. The process is “kllled” (doo). med)''.The quilting process is immediately terminated and the context change will be issued, followed by a skip to the Land Robin exam.

ドウムドされたプロセスはプロセスが終了するまで継続する。A domed process continues until the process terminates.

これは“プロセストリイブ(process aθ1ver )″を指摘したプ ロセスの初期イメージを有することにょシ成就される。プロセストリイブはプロ セスティプルに明記された機能を機能を実行する無限ループである。この無限ル ープはプロセスドラムフラグ(procesθaoom nag)セットを検出 したときに自身で終了し、文脈切シ替えを出す。プロセスは”イクス(exec ’ed)”される。イクスプロセスに対して、まず確実に無駄にされなけ゛れば ならない。キルコマンドはプロセス及び機能ポインターがそのプロセスを入力す るためのプロセスティプルにコピーされ、そのプロセスティプル入力のリマイン ダ(remainder )が入力データにまるまでキイルドとしてのこるプロ セス状態を除いて初期化されるために、発生される。プロセス状態は”ライブ( live)”になる。動作システムはファイルシステムの同等物内に固定デスク を保存しなければならない。デスクは7つのブロックに組織サレル。スナワチ、 BOOT、0PERATIONG SYSTEM。This is the program that pointed out “process tribe (process aθ1ver)”. This is accomplished by having an initial image of the process. Processtribe is a professional It is an infinite loop that performs the functions specified in the sestiple. This infinite le detects process drum flag (processθaoom nag) set When it does, it terminates itself and issues a context switch. The process is “exec” 'ed)' will be done. For the process, it must first be ensured that it is not wasted. No. The kill command is executed when the process and function pointer enters the process. is copied to the process tipple for the The program that remains as a killed until the remainder fills the input data. generated to be initialized except for the process state. The process state is “live” ( The operating system is a fixed disk in the file system equivalent. must be preserved. The desk is organized into seven blocks. Sunawachi, BOOT, 0PERATION SYSTEM.

5TUCTURES、HEADERS、IMPO3TORS、ENROLLEE S。5TUCTURES, HEADERS, IMPO3TORS, ENROLLEE S.

AUDIT TRALLである。BOOTは動作システム及び構成を定義するた めのデスク連結を含む動作システム全完成させるに必要なプログラムを含む。例 えば、確認の管理における全てのデスク及び資料である。5TRUCTURES は全ての7つのブロックが配置されたマツプである。これらのブロックは主要な ブロックは時々分離された小さなブロックに分割される。例えば2つのHEAD ERば1つのコピーへのダメージが有用なデータを永久に破壊しないように遠く 離されたデスクセクタに記憶される。これは、2枚のコピーを有する5TRUC TURESHAも同様である。これらの5TRUCTURESHAのロケーショ ンはBOOT内に記憶される。HEADERSは全ての会員に個人データ及びE NROLLEESブロックとIMPO8TORSブロックのリンケイジを含む。AUDIT TRALL. BOOT is used to define the operating system and configuration. Contains the programs necessary to complete the entire operating system, including desk connection. example For example, all desks and materials in the management of confirmations. 5 TRUCTURES is a map in which all seven blocks are placed. These blocks are the main Blocks are sometimes split into separate smaller blocks. For example, two HEADs ER is far enough so that damage to one copy does not permanently destroy useful data. stored in a separate desk sector. This is 5TRUC with 2 copies The same goes for TURESHA. THE LOCATION OF THESE 5TRUCTURESHA The key is stored in BOOT. HEADERS provides all members with personal data and Contains linkage between NROLLEES and IMPO8TORS blocks.

IMPO8TORSプロ、りは証拠のアレイである。各IMPO3TOR8は各 々5ワードの5つの証拠を有する。ENROLLEESブロックは証拠のアレイ である。各々の会員のために各々5ワードの5つの証拠がある。IMPO8TORS Pro is an array of evidence. Each IMPO3TOR8 There are 5 pieces of evidence of 5 words each. ENROLLEES block is an array of evidence It is. There are 5 pieces of evidence of 5 words each for each member.

確認手顆は動作システムによシ与えられる根本的機能を使用する別のモジュール に記憶されている。確認は3つの主要なサブモジュール、VERIFY、ENR OLL、MANAGEに分割されている。ENROLLはManager Ac cess Pnint″動作からのみ理解できる。内部的に、50の証拠をワー ド毎に57−ト0×5証拠で成る25の証拠と共に保持する大きな証拠バッファ がある。2つにバッファはRAM内で内部・話し手及び相互・話し手の統計値を 発生する動作をし続けるために必要とされている。ディスクのシフトオフ及びオ ンの間この動作はシステムを低速にする。(記:これらのバッファは、またBA CKUPのようなENROLLと同時に実行しない他にモジュールによって使用 される。BACKUPは、また、25証拠のブロックをそれぞれシフトオンし、 且つデスケラト及びディスクをシフトオフする)プロンプ) (promptθ )はRAM内で同様な速度原理によシ保持される。スピーチプロンプチング(5 peech prompting )(音声出力)の間、スケジューラによるプ ロセッサの割シ振シは粗悪な品質の音になる出力スピーチ細分部分を作る。従っ て、スピーチ出力は高優先度が与えられる。プロンプトが出力された時、プロセ スは割り振シ処理者用のコマンドをセットし、ボード割り込み処理者への送信及 び動作を待つとき自身にマークする。割シ込み処理者は停止された割り込みを有 するので、セマフォー及びディバイスビイシイフラグが不必要となるようにDM A用の争いが存在してはならない。割シ込み処理者はプロセスの要求が終了しし だいにプロセスのため動作待機フラグを消す。動作を待つ間にプロセス文脈切シ 替えが出力され、動作フラグ消去を待つまで再び実行されない。ディスクから証 拠を検索する間、プロセスはディスクをセマフォーし、コマンド及びDMAeセ ットし、ディスクをビイシイとマークし、ディスクがビイシイの実行するだめの 他のプロセス時間を与えることを切シ替え文脈切シ替えに要求する。ディスクが 処理された時、空きの如くマークされたディスクの割込みヲ災行し、セマフォー を切る。ラウントロピンループがこのプロセスに再び達した時、スケ−ジー−ラ このプロセスの実行を継続する。ENROLLは”ドクム(doom )″プロ セス1であるところのMANAGERから開始する。プロセス1は確認プロセス でおるので、システムは時間切れ及びそれ自身を消滅させるために確認を待つ。The confirmation hand condyle is a separate module that uses the underlying functionality provided by the movement system. is stored in Verification consists of three main submodules: VERIFY, ENR It is divided into OLL and MANAGE. ENROLL is Manager Ac It can only be understood from the cess Pnint'' behavior. Internally, the 50 proofs are Large evidence buffer to hold with 25 pieces of evidence consisting of 57-t0x5 pieces of evidence per code There is. Second, the buffer stores internal/speaker and inter/speaker statistics in RAM. It is needed to continue the movement that occurs. Disk shift off and on This action slows down the system during the process. (Note: These buffers are also BA Used by modules in addition to not running at the same time as ENROLL like CKUP be done. BACKUP also shifts on 25 blocks of evidence each, and shift off the deskerato and disk) (prompt) (promptθ ) are held in RAM according to similar speed principles. Speech prompting (5 During peach prompting (audio output), the scheduler Processor allocation creates output speech subdivisions that result in poor quality sound. follow Therefore, speech output is given high priority. When the prompt is output, the process The interrupt processor sets commands for the allocator and sends them to the board interrupt handler. mark itself when waiting for an action. The interrupt handler owns the stopped interrupt. Therefore, the DM There must be no conflict for A. The interrupt handler waits until the process' request is finished. Finally, clear the operation standby flag for the process. Process context disconnection while waiting for operation The change will be output and will not be executed again until the operation flag is cleared. proof from disk While searching for a location, the process semaphores the disk and sends commands and DMAe mark the disk as readable, and mark the disk as readable. Requires the switch context switch to give other process time. The disk is When processed, the interrupt on the disk marked as free is executed and the semaphore is cut. When the round tropin loop reaches this process again, the scaler Continue running this process. ENROLL is “Doom” Pro We start with MANAGER, which is session 1. Process 1 is a confirmation process The system waits for confirmation to time out and delete itself.

起こりえる正当な確認を割込ませることは不適切である。プロセス1が自身を消 滅させた後、MANAGERはプロセス1上に立ったKILL7ラグを見るかつ プロセス1上のEXECof ENROLLを実行する。ENROLLは重要な 統計を得ることにより開始され、各証拠が訂正された時にそれは自身の番号とそ れのワード番号に従って順次にRぷスコアに記憶される。証拠が長さにおける大 きな分散によって試験される。このような分散が発見されなげれば、際立った長 さを有する証拠金置換える試みがなされる。多くの証拠がワード内で“際立つ( θtanaout )″であれば、そのワード9のための証拠の新しい設定が指 示される。It is inappropriate to interrupt possible valid confirmations. Process 1 deletes itself. After killing, MANAGER sees KILL7 lag standing on process 1 and Execute EXECof ENROLL on process 1. ENROLL is important It starts by getting statistics, and when each piece of evidence is corrected it has its own number and its The word numbers are sequentially stored in the Rp score. evidence is large in length tested by large dispersion. If such dispersion is not discovered, significant Attempts are being made to replace margins with Much evidence “stands out” ( θtanaout)'', a new setting of evidence for that word 9 is specified. shown.

これが失敗すれば、ENROLLは失敗する。ENROLLが失敗すれば、証拠 はにバッファに記憶されているに証拠に変換される。ボードは同一のワードの他 の証拠と比較したような各証拠のスコア(5corI5) k発生するために指 示される。このスコアはHEADSER内に記憶された内部・話し手の統計を決 定するのに使用される。任命された氏名詐称者はr証拠バッファ内へ読出され、 内部・話し手続計が同様な方法で発生される。任命されない氏名詐称者のために 統計の誤りセットが発生される。If this fails, ENROLL will fail. If ENROLL fails, evidence is converted into evidence stored in a buffer. The board has the same word Score for each piece of evidence (5corI5) as compared to the evidence of shown. This score determines the internal speaker statistics stored in the HEADSER. used to define The appointed impersonator is read into the evidence buffer; An internal conversation meter is generated in a similar manner. For unappointed name impostors An incorrect set of statistics is generated.

これらの統計は発生された内部・話し手続計と組み合わされる。These statistics are combined with generated internal conversation statistics.

これらの統計はHEADSEHに記憶される。K証拠バッファはユーザディスク 見出しく udj、 )に割り当てられ、書出される。These statistics are stored in HEADSEH. K evidence buffer is user disk It is assigned to the index udj, ) and written out.

r証拠バッファ内への読戻しが行われ、ディスク上に悪いセクターかどうかを決 定するためにバイト対バイトの比較が行われる。もしそうなら、正常な書込み/ 続出しシーケンスが実行されるか又はディスクが満配はなるまで他のudiが発 生される。A read back into the evidence buffer is performed to determine if it is a bad sector on the disk. A byte-by-byte comparison is performed to determine the If so, normal write/ Other udis will continue to be issued until the continuation sequence is executed or the disk is full. be born.

そして、RAM内のHEADSERが不正の如くマークされ、直ちに書出しが行 われる。このことは証拠を変更し、統計がHEADSEHに不正の如くマークし 15分フラッシュが生じるまで書出しされない確認と対照をなす。VVERIF Yはプロセスエないし8の普通の機能である。第22図で述べられるVERIF Yプロセスのフローチャトは上述の確認動作のシステム114を動作することに よりとられたステップを描いている。Then, HEADSER in RAM is marked as invalid, and writing is performed immediately. be exposed. This changes the evidence and the statistics mark HEADSEH as fraudulent. Contrast with confirmation, which is not written out until a 15 minute flush occurs. VVERIF Y is a normal function of Process E-8. VERIF stated in Figure 22 The flowchart of the Y process is to operate the confirmation operation system 114 described above. It depicts the steps taken.

添付されたAppenxdix Aは確認、構成および登録のデータベースのサ ブプログラムの目的コードのコピーである。目的コードは、8進数形式、プログ ラミング言語Cおよび1BM PC/XT用のマスコンポバージョンアセンブリ 言語で記載しである。また、Appenxdix BはTMS 32010で記 載されたsp目的コードのコピーでおる。Appenxdix CはMotor o’la S −recOrdフォーマットのコピーである。CP目的コードは プログラミング言語CおよびM 68000アセンブリ言語のMASSCOMP バー:)ヨンアセンブリで記載されている。勿論、これらの付属物のコードが技 術的に公知の多くの言語で実質的に”プログラム”されることは認められる。従 って付属物に開示された実施例は本発明の1つの参照例として与えられたもので アシ、本発明の範囲を如何なる方法でも限定するものではない。上述された装置 および方法は以下の信頼でき且つ能率的なスピーチ確認システムを提供すること により従来技術を越える優れた改良を含んでいる。本発明は(1)スピーチの始 めと終りを能率的に且つ正確に検出する手段を含んでいて、(2)音声コードの 特徴に関し、時間又は強度制限に基づく制限なしに基準及びテスト発声間の比較 を供給する確認用の・ξラメータを提供し、(3)氏名詐称者を間違って容認し 又は正しい話し手を拒絶する確率の表示全発生し、内部及び相互・話し手の両方 に基づく別の発声の複数の比較の結果の関数である容認のための結果を利用する 確認モー1を提供し、(4)話し手を容認又は拒絶するかを決定する間おおよそ の一定基準を維持すること金許すところの話し手の容認又は拒絶のための任意の 可変しきい値を供給する。Attached Appendix A provides validation, configuration and registration database support. This is a copy of the program's purpose code. The purpose code is in octal format, program Mass component version assembly for Ramming language C and 1BM PC/XT It is written in the language. Also, Appenxdix B is written in TMS 32010. Copy the SP purpose code posted. Appenxdix C is Motor It is a copy of the o'la S-recOrd format. CP purpose code is Programming languages C and M68000 assembly language MASSCOMP Bar:) Described in yon assembly. Of course, these attached cords are It is recognized that the program may be substantially "programmed" in many languages known in the art. subordinate The embodiments disclosed in the appendix are given as one reference example of the present invention. However, it is not intended to limit the scope of the invention in any way. device mentioned above and the method provides a reliable and efficient speech verification system for: It contains significant improvements over the prior art. The present invention provides (1) the beginning of a speech; (2) includes a means for efficiently and accurately detecting the beginning and end of the audio code; Comparison between reference and test utterances with respect to features, without restrictions based on time or intensity limitations (3) erroneously condone name fraudsters; or indication of the probability of rejecting the correct speaker, both internal and mutual speakers Utilizing results for acceptance that are a function of the results of multiple comparisons of different utterances based on (4) Approximately while deciding whether to accept or reject the speaker. Maintaining certain standards of discretion allows for the acceptance or rejection of speakers Provides a variable threshold.

本発明はその範囲全能れることなく又は本質的特徴全能れることなく他の形に具 体化できる。The present invention may be embodied in other forms without fulfilling its scope or essential characteristics. It can be embodied.

例えば、第25図を参照して、登録動作の完成の後、第1の基準ワードの発声の 登録のだめの内部・話し手の全体的な歪値を演算(500)するために続行され る。一度そのワードのための全体的な歪値が演算されると、最大の値が捨てられ 、平均及び全体的な歪値の残りのための分散が演算され、後の確認動作用に記憶 される(502)。For example, referring to FIG. 25, after the registration operation is completed, the utterance of the first reference word is Continue to calculate (500) the overall distortion value of the speaker inside the registration chamber. Ru. Once the overall distortion value for that word has been computed, the largest value is discarded. , the average and variance for the rest of the overall strain values are computed and stored for later verification operations. is performed (502).

同様に、相互・話し手の全体的な歪値を演算するための相互・話し手比較が実行 され(504)、最大の歪値が捨てられ、全体的な歪値の残シのために、相互・ 話し手の平均及び分散が演算され及び記憶される(506)。Similarly, inter/speaker comparisons are performed to calculate the overall distortion values for each/speaker. (504), the largest distortion value is discarded, and the mutual Speaker means and variances are computed and stored (506).

各々の別の基準ワード及び彼らの対応する発声のグループのために、内部・話し 手及び相互・話し手の平均及び分散が上述のように演算され且つ記憶される。For each separate reference word and their corresponding utterance group, internal speech Hand and inter-speaker means and variances are computed and stored as described above.

第26図を参照して、確認動作の間、システムが要求されたユーザの同一性を確 認し得た後に、システムはメモリから内部・話し手及び相互・話し手の平均及び 分散値、基準ワード、各基準ワードに関連した発声のに係数及び要求されたユー ザの同一性に対応する2つのしきい値U及びv−1訂正する(522)。Referring to Figure 26, during the verification operation, the system verifies the identity of the requested user. After recognition, the system calculates the internal and inter-speaker averages and Variance values, reference words, coefficients of utterances associated with each reference word, and requested users. The two thresholds U and v-1 corresponding to the identity of the user are corrected (522).

基準ワードから、システムは任意に1のワー)”i選択し、ユーザに選択された ワードをマイクロフォンに話すように促す(524)。受信された発声は正規化 された自己相関係数rを得るために直ちに処理される(526)。r係数は、全 体的な歪の新しい組を演算するためにそのワード(登録されたユーザによって前 ((話されている)の記憶されている各々の発声のに係数と比較される(528 )。全体的な歪の組から、1個の組合わされたスコア(即ち、全体的な歪の平均 )が演算される。組合わされたスコア及び内部・話し手及び相互・話し手の平均 及び分散値を使用することによって、2つの値P及びQが演算され、彼らは登録 されたユーザがいま演算されたスコアよシ悪い組合わされたスコアを生じる発声 を生じる確率と、いま演算されたスコアよシ良い組合わされたスコアを生じる発 声を生じる確率とをそれぞれ表示する。第27図を参照して、Pは同一性を肯定 するために、組合わされたスコア546からの2つの内部・話シ手値(即ち、平 均524と分散544)によって特定されたガウス形密度関数540の積分によ って演算される(即ち、Pは破線された領域548に等しい)。From the reference words, the system arbitrarily selects 1 word) and selects the word selected by the user. prompt the user to speak the word into the microphone (524). Received utterances are normalized is immediately processed (526) to obtain the calculated autocorrelation coefficient r. The r coefficient is that word (previously registered by a registered user) to compute a new set of physical distortions. (is compared with the coefficient of each remembered utterance of (spoken) (528 ). From the set of global distortions, one combined score (i.e. the average of the global distortions) ) is calculated. Combined scores and intra-speaker and inter-speaker averages By using the and variance values, two values P and Q are computed and they are registered utterances that result in a worse combined score than the score just computed. and the probability of producing a combined score that is better than the score just computed. The probability of generating a voice is displayed respectively. Referring to Figure 27, P affirms identity. In order to By integrating a Gaussian density function 540 specified by mean 524 and variance 544), (ie, P is equal to the dashed area 548).

同様に、Qは同一性を否定するために、組合わされたスコア546からの2つの 相互・話し手(即ち、平均522と分散554)によって特定されたガウス形密 度関数の積分によって演算される(即ち、Qは破線された領域556に等しい) 。Similarly, Q can use two from the combined score 546 to disprove identity. Gaussian density specified by each speaker (i.e. mean 522 and variance 554) calculated by integrating the degree function (i.e. Q is equal to the dashed area 556) .

再び第26図を参照して、Pおよび現在の基準ワードの現在の発声に対応する確 率値である間は、PおよびQはpおよびqの新しい値が演算される毎に更新され た累積確率値であり、即ちユーザから新しい発声が受信される毎にPおよびQ( 1に初期化される)は個々の確率新しい値PおよびQ’tそれぞれ積算すること により更新される。結果的に、ユーザの最初の発声の後、PおよびQはpおよび qにそれぞれ等しくなる(560)。確認決定(562) ’iするために、P およびQはそれぞれ登録されたユーザのために2つのしきい値Uおよび■と比較 される。PがUよシ小さいがUがV (564)以上に保たれれば、ユーザは拒 絶され、逆に、QがVよシ小さいがPがU (566)以上に保たれれば、ユー ザは容認される。しかし、PがU以上に保たれかつQがV (568)以上に保 たれれば、ユーザを容認または拒絶するための決定は行われず、代シに基準ワー ドの他の1つが選択され、ユーザは他の発声を促される。p、 q、 pの新し い値がこの発声のために演算され、更新された値Pおよびqがもう一度UとVと 比較される。ユーザを容認するが拒絶するために確認決定を行われるまでシステ ムはユーザに発声を促し続ける。Referring again to FIG. 26, the confirmation corresponding to the current utterance of P and the current reference word. While rate values, P and Q are updated each time a new value of p and q is computed. is the cumulative probability value of P and Q( (initialized to 1) are to be multiplied by the individual probabilities new values P and Q't respectively. Updated by. Consequently, after the user's first utterance, P and Q become p and q (560). Confirmation decision (562) 'i, P and Q are compared with two thresholds U and ■ for registered users, respectively. be done. If P is smaller than U, but U remains greater than or equal to V (564), the user is rejected. On the other hand, if Q is smaller than V but P is kept above U (566), then the user The is acceptable. However, if P is kept above U and Q is kept above V (568), If the user is Another one of the codes is selected and the user is prompted to say another. New p, q, p new values are computed for this utterance, and the updated values P and q are once again used as U and V. be compared. The system accepts the user until a confirmation decision is made to reject it. The system continues to prompt the user to speak.

確認決定の感度および安全レベルは直接に2つのしきい値UおよびVに関連する 。UおよびVが比較的に小さな値に設定されていれば、確認動作は発声および分 析の長いシーケンスを要求する傾向になる。低いしきい値しばルの、区恵は増加 された安全性であり、即ち氏名詐称者が容認されないで正しいユーザが拒絶され ない大きい確実性であり、勿論増加された確実性は長い確認動作と反対に重要で ある。The sensitivity and safety level of the confirmation decision is directly related to the two thresholds U and V . If U and V are set to relatively small values, the confirmation action can be performed by vocalizing and This tends to require long sequences of analysis. When the threshold is low, Kuei increases security, i.e., impersonators are not tolerated and legitimate users are rejected. There is no great certainty, and of course the increased certainty is important as opposed to a long confirmation run. be.

■の値に関連したUの値が低くなればシステムは大きな組合わされた全体的な歪 値を示す不規則な発声音よシ寛大にし、一方Uの値に関連したVの値が低くなれ ば正しいユーザと容認されるべき氏名詐称者の両方がより困難になる。■The lower the value of U relative to the value of the system, the greater the combined overall distortion. Make the irregular vocalizations that indicate values more lenient, while lowering the value of V relative to the value of U. This makes it more difficult for both legitimate users and impostors to be tolerated.

確認動作の始めで、ユーザが正確な同一性(570)を供給すれば、彼は直ちに 拒絶されない、代りに、彼は不足している基準ワードのグループの幾つかを発す ることを促される。しかし、発声の結果が捨てられ、ユーザは最後の発声を話し た後で直ちに拒絶される。この手順は彼が正確な同一性を発生しているかどうか 全ユーザから聞き知ることを防ぐ。If the user supplies the correct identity (570) at the beginning of the verification operation, he will immediately is not rejected, instead he utters some of the group of missing criterion words. be encouraged to do so. However, the results of the utterances are discarded and the user cannot speak the last utterance. It is immediately rejected after Whether this procedure is causing him exact identity Prevent all users from knowing.

ユーザが登録されたユーザとして容認されれば、確認動作中に彼または彼女が話 した発声は記憶された基準発声と内部・話し手及び相互・話し手の平均及び分散 値とを更新するのに使用される。これは人間の声に常に生じる変化を受入れるの に行われる。更新することは非常に新しい発声に非常に古い発声よシも重要性を 自動的に与える。If the user is accepted as a registered user, he or she will be able to speak during the verification operation. The produced utterances are compared with the memorized reference utterances, internal/speaker and mutual/speaker averages and variances. Used to update values. This accepts the changes that occur constantly in the human voice. It will be held on. Updating very old utterances to very new utterances is also important. Give automatically.

記載された実施例は説明された例のみ限定されず全ての範囲が考察されるべきで あシ、従って本発明の範囲は実施例よシもむしろ請求の範囲によって示されてい る。請求の範囲の同一の意味および領域内の変更は本発明の範囲内に包括される べきである。The described embodiments are not limited to the illustrated examples, but should be considered in their entirety. Therefore, the scope of the invention is indicated by the claims rather than the embodiments. Ru. Changes within the same meaning and scope of the claims shall be embraced within the scope of the invention. Should.

浄書(内容に変更ない FIG、3 FIG、4 FIG、5 FIG、 7 FIG、 6 FIG、8 FIG、70 FIG、77 7Y ”D“ FIG、 72 FIG、 73 竹表昭63−500126 (26) FIG、16 −−」 FIG、77 FIG、 79 J FIG、21b KEYBOARD TABLE(−πン”うζηし) 」2?唸1!ぺ≧シ:巨 −(π〜吐ゴ≦ム〕FIG、 220 立訂E厘 歴r5ヨヒL )EAry:RtxrENspoNtts41@) RECORD(1−)−V >t (−4=−4) RE!;JDENT ENT l ラ”>)−I〉ドJ )FIG、 23b FIG、24() FIG、 24b FIG、25 F/G、26 手続補正書(方力 1.事件の表示 PCT/US86101402 2、発明の名称 話者照合装置 3、補正をする者 事件との関係 出 願人 住所 名 称 ニック・インダストリーズ・インコーホレーテッド4、代理人 住 所 東京都千代田区大手町二丁目2番1号新大手町ビル 206号室 電話270−6641〜6646 7、補正の内容 別紙の通り(尚、(3)及び(4)の書面の内容には変更なし)国際調査報告Engraving (no changes to the content) FIG.3 FIG.4 FIG.5 FIG. 7 FIG. 6 FIG.8 FIG. 70 FIG. 77 7Y D“ FIG. 72 FIG. 73 Takeomote Sho 63-500126 (26) FIG. 16 --” FIG. 77 FIG. 79 J FIG. 21b KEYBOARD TABLE (-πn”uζηshi)” 2? Roan 1! Pe≧C: Huge −(π〜vomit≦mu)FIG, 220 Risetsu E Rinki R5 Yohi L ) EARry: RtxrENspoNtts41@) RECORD (1-)-V >t (-4=-4) RE! ;JDENT ENT l la”>)-I〉Do )FIG, 23b FIG. 24 () FIG, 24b FIG. 25 F/G, 26 Procedural amendment (holi) 1. Display of incidents PCT/US86101402 2. Name of the invention speaker verification device 3. Person who makes corrections Relationship to the incident: Applicant address Name: Nick Industries Incorporated 4, Agent Address: Room 206, Shin-Otemachi Building, 2-2-1 Otemachi, Chiyoda-ku, Tokyo Phone 270-6641-6646 7. Contents of correction As per the attached sheet (note that there are no changes to the contents of documents in (3) and (4)) international search report

Claims (55)

【特許請求の範囲】[Claims] 1.話し手が知られている人間かどうか前記知られている人間のスピーチについ ての基準情報を含む記憶された情報に基づいて確かめる方法において、前記確認 の第1段階で、前記話し手の発声を前記記憶された情報に関連して分析し、前記 分析に基づいて次の段階を続けるかを判断し、もし続け無いときには前記話し手 を受入れるか或いは拒絶するかを決定し、 もし続けると決定した場合には、前記次の段階で前記記憶された情報に関連した 前記話し手の少なくとも付加的な発声についてのテスト情報を分析し、 第1の段階で行われた分析と段階2の段階で行われた分析の両方に基づいて確認 決定を行う、 ことを特徴にする方法。1. Whether the speaker is a known human being or not. In the method of verifying based on stored information including reference information of the in a first step of analyzing said speaker's utterances in relation to said stored information; Based on the analysis, decide whether to continue with the next step, and if not, the speaker decide whether to accept or reject the If it is decided to continue, the next step will be to analyzing test information about at least additional utterances of the speaker; Confirmed based on both the analysis conducted in the first stage and the analysis carried out in the second stage make a decision, How to characterize things. 2.前記分析は前記比較の結果を暗示する差データを得るために前記テスト情報 と前記基準情報とを比較することと、前記決定が前記差データから得られる確率 値および少なくとも1のしきい値とに基づくことを含むことを特徴とする請求の 範囲第1項に記載の方法。2. The analysis analyzes the test information to obtain difference data that implies the results of the comparison. and the probability that the decision is obtained from the difference data. and at least one threshold value. The method described in Scope No. 1. 3.前記記憶された情報は、ある与えられた前記差データのための確率値を暗示 する確率値を含むことを特徴とする請求の範囲第1項に記載の方法。3. The stored information implies a probability value for a given difference data. 2. A method according to claim 1, characterized in that the method comprises a probability value that . 4.複数の前記次の段階を含み、各々の前記次の段階は前記記憶された情報に関 連した少なくとも別の前記話し手の付加的な発声についてのテスト情報の分析を 含み、前記確認決定は前記第1の段階および前記第2の段階における前記分析に 基づいて行われることを特徴とする請求の範囲第1項に記載の方法。4. a plurality of said next steps, each said next step relating to said stored information; analysis of test information about additional utterances of at least another said speaker in sequence; and the confirmation decision is based on the analysis in the first step and the second step. A method according to claim 1, characterized in that the method is carried out based on. 5.1つは氏名詐称者を間違って容認する見込みを表し、他は前記知られている 人間を間違って拒絶する見込みを表示する2つの前記確率値を有し、2つの前記 しきい値を有することを特徴とする請求の範囲第2項に記載の方法。5. One represents the likelihood of falsely accepting a name imposter; the other is the known having two said probability values indicating the likelihood of incorrectly rejecting a human; 3. A method according to claim 2, characterized in that it comprises a threshold value. 6.前記しきい値は調整可能であることを特徴とする請求の範囲第5項に記載の 方法。6. Claim 5, characterized in that the threshold value is adjustable. Method. 7.前記次の段階における前記確率値は前記第1の段階の確率値に部分的に基づ いていることを特徴とする請求の範囲第5項に記載の方法。7. the probability value in the next stage is based in part on the probability value of the first stage; 6. A method according to claim 5, characterized in that: 8.前記確認決定は前記話し手が前記知られている人間であるかを決定すること を含むことを特徴とする請求の範囲第1項に記載の方法。8. The confirmation decision determines whether the speaker is the known person. A method according to claim 1, characterized in that the method comprises: 9.もし前記確認決定が前記話し手が前記知られている人間てあると決定したと きは前記テスト情報に基づいて前記記憶された情報が更新されることを更に含む ことを特徴とする請求の範囲第1項に記載の方法。9. If said confirmation decision determines that said speaker is said known person; further comprising updating the stored information based on the test information. A method according to claim 1, characterized in that: 10.前記発声および前記付加的発声は前記基準情報の基礎を形成する1組のワ ードからランダムに引出された2つのワードを含むことを特徴とする請求の範囲 第1項に記載の方法。10. Said utterance and said additional utterance form a set of words forming the basis of said reference information. Claims characterized in that they include two words randomly drawn from a code. The method described in paragraph 1. 11.話し手が知られている人間かどうかを前記知られている人間のスピーチに ついての線予知係数に基づく基準値を含む記憶された情報に基づいて確かめる方 法において、与えられたテスト情報分析の結果によって前記話し手が前記知られ ている人間かどうかの確率を暗示する確率値を前記記憶された情報から得ること と、 確認の間、前記記憶され情報に関連して前記話し手の発声についての情報を分析 し、前記発声に対する前記テスト情報分析の結果を前記話し手の前記発声用の少 なくとも1つの確率値を得るために前記確率データに供給し、 少なくとも前記確率値に基づいて確認決定を行うことを特徴とする方法。11. Indicate whether the speaker is a known human being in said known human speech. Confirmation based on stored information including reference values based on line prediction coefficients In the method, the result of a given test information analysis determines that the speaker is obtaining from the stored information a probability value indicating the probability of whether the person is and, during verification, analyzing information about the speaker's utterances in relation to the stored information; The result of the test information analysis for the utterance is used as a small sample for the utterance of the speaker. feeding said probability data to obtain at least one probability value; A method characterized in that a confirmation decision is made based at least on said probability value. 12.前記確率データが確率分布関数から得られる数を含むことと、 各前記確率値が前記確率分布関数の1つの部分を積分することにより得られるこ とを含むことを特徴とする請求の範囲第11項に記載の方法。12. the probability data includes a number obtained from a probability distribution function; that each said probability value is obtained by integrating one part of said probability distribution function; 12. The method according to claim 11, comprising: 13.前記値は平均および分散を含むことを特徴とする請求の範囲第12項に記 載の方法。13. Claim 12, wherein the values include a mean and a variance. How to put it on. 14.1つの前記確率値が氏名詐称者が前記知られている人間であることを間違 って決定する見込みを表示し、他の前記確率値が前記話し手が前記知られている 人間であることを間違って決定する見込みを表示する2つの前記確率値と、2つ の前記確率分布関数を有することを特徴とする請求の範囲第12項に記載の方法 。14. If one said probability value is incorrect that the name imposter is said known person. indicates the likelihood that the speaker will decide that the other probability value is the known two said probability values indicating the likelihood of incorrectly determining that the person is human; The method according to claim 12, characterized in that the probability distribution function is . 15.前記テスト情報が前記話し手の前記発声の正規化された自己相関係数に基 づくテスト値を含み、前記分析が前記基準値と前記テスト値との間の差を表示す る全体的な歪を得るために前記テスト値と前記基準値との比較することを含むこ とを特徴とする請求の範囲第11項に記載の方法。15. The test information is based on a normalized autocorrelation coefficient of the utterance of the speaker. a test value determined by the test value, and the analysis indicates a difference between the reference value and the test value. comparing said test value with said reference value to obtain an overall distortion of 12. The method according to claim 11, characterized in that: 16.前記確率データは前記知られている人間による複数の発声証拠および他の 人間による複数の発声証拠から得られ、前記確率データは以下のものを含む、 前記知られている人間による2つの前記発声証拠の可能な組合わせのための線予 知係数間の差をそれぞれ表示する全体的な歪値の平均値と等しい内部・話し手平 均値と、前記内部・話し手の全体的な歪値の分散値と等しい内部・話し手分散値 と、 前記知られている人間による前記発声と前記他の人間による前記発声との各々の 組合わせ可能性のための線予知係数間の差を各々表示する全体的な歪値の平均値 と等しい相互・話し手平均値と、 前記相互・話し手の全体的な歪値の分散値と等しい内部・話し手の分散値と、お よび第1の前記確率値は前記内部・話し手平均値および分散値によって識別され たガウス形密度関の前記テスト値と基準値の差を表示する前記全体的な歪値から 正の無限大への積分に等しいことと、 相互・話し手平均値と分散値人間によって識別されたガウス形密度関数の負の無 限大から前記テスト値と基準値の差を表示する前記全体的な歪値への積分に等し い第2の前記確率値とを含む請求の範囲第15項に記載の方法。16. The probability data includes the known human vocalization evidence and other obtained from multiple human vocalization evidences, said probability data including: line predictions for possible combinations of the two said vocalization evidences by said known humans; The internal and speaker palms are equal to the average value of the overall distortion value, which displays the difference between the intelligence coefficients, respectively. The mean and the within-speaker variance equal to the variance of the overall distortion values for said within-speaker. and, each of the utterances by the known human being and the utterances by the other human being; The average value of the overall distortion values, each displaying the difference between the line prediction coefficients for combinability. and the inter-speaker mean value equal to The within-talker variance is equal to the mutual-talker overall distortion value variance, and and a first said probability value is identified by said within-speaker mean value and variance value. From the overall distortion value which displays the difference between the test value and the reference value of the Gaussian density function is equal to the integral to positive infinity, and Negative null of Gaussian density function identified by inter/speaker mean and variance values equal to the integral from the limit to the overall strain value that displays the difference between the test value and the reference value. and a second said probability value. 17.前記記憶された情報は第1および第2のしきい値を含み、前記方法は更に 前記第1および第2の確率値と前記第1および第2のしきい値間の比較にそれぞ れ基づく確認決定を行うことを含むことを特徴とする請求の範囲第16項に記載 の方法。17. the stored information includes first and second thresholds, and the method further comprises: for comparing the first and second probability values and the first and second thresholds, respectively. Claim 16 includes making a confirmation decision based on the the method of. 18.請求の範囲第17項のステップは複数回繰り返され、第1の累積する確率 値は総ての前の第1の確率値の積と等しく、第2の累積する確率値は総ての前の 第2確率値の積に等しく、前記確認決定は前記第1および第2の累積する確率値 と前記2つのしきい値とのそれぞれの比較に基づいていることと、前記確認決定 が、もし第1の累積する確率値が前記第1のしきい値より小さく且つ前記第2の 確率値が前記第2のしきい値より大きい時には話し手が前記知られている人間で ないとして拒絶され、もし前記第1の確率値が前記第1のしきい値より大きく且 つ前記第2の累積する確率値が前記第2のしきい値より小さい時には前記話し手 が前記知られている人間であると確認するように決定されることを含む、ことを 特徴とする請求の範囲第17項に記載の方法。18. The steps of claim 17 are repeated multiple times, and the first cumulative probability The value is equal to the product of all previous first probability values, and the second cumulative probability value is equal to the product of all previous first probability values. equal to the product of second probability values, said confirmation decision being equal to the product of said first and second cumulative probability values; and said confirmation decision is based on a respective comparison between said two thresholds and said confirmation decision. , if the first cumulative probability value is less than the first threshold and the second When the probability value is greater than the second threshold, the speaker is the known person. if the first probability value is greater than the first threshold and When the second cumulative probability value is less than the second threshold, the speaker is determined to confirm that said person is said to be a known human being. 18. The method of claim 17. 19.前記しきい値が所望の保証度に従って調節されることを特徴とする請求の 範囲第16項に記載の方法。19. Claims characterized in that said threshold is adjusted according to a desired degree of assurance. The method according to scope item 16. 20.話し手が知られている人間かどうか前記知られている人間のスピーチにつ いての基準情報を含む記憶された情報に基づいて確かめる方法において、 前記記憶された情報に関連した前記話し手の発声についてのテスト情報の分析に 基づいて前記話し手が前記知られている人間かどうかを確認することと、 もし前記話し手が前記知られている人間と確認されたときには、前記記憶された 情報を前記テスト情報に基づいて更新することとを含む、ことを特徴とする方法 。20. Whether the speaker is a known person or not, regarding the speech of said known person. In a method for ascertaining based on stored information including reference information, analyzing test information about the speaker's utterances in relation to the memorized information; checking whether the speaker is the known person based on If the speaker is identified as the known person, the memorized updating information based on the test information. . 21.装置が動力を受取ることを認められている知られている人間として話し手 が確認されることに基づいて動力を必要としている装置に動力を供給する装置に おいて、前記知られている人間のスピーチについての記憶された情報に関連した 前記人間の現在の発声の分析に基づいて前記人間が前記知られている人間である と確認し、このときには論理確認信号を出力する装置と、 前記論理信号に応答して前記装置に動力を送る非機械的、非磁気的スイッチとを 含む、ことを特徴とする装置。21. Speaker as a known person from whom the device is authorized to receive power equipment that supplies power to equipment requiring power based on the verification that related to the stored information about the known human speech. the human is the known human based on an analysis of the human's current vocalizations; and a device that outputs a logic confirmation signal at this time; a non-mechanical, non-magnetic switch for powering the device in response to the logic signal; A device characterized in that it includes. 22.前記パーワースインチはパーワーMOSFET装置を含むことを特徴とす る請求の範囲第21項に記載の装置。22. The power inch includes a power MOSFET device. 22. The apparatus according to claim 21. 23.前記装置は前記話し手がドアを通れるようにドアロックを解除するための ソレノイドを含むことを特徴とする請求の範囲第21項に記載の方法。23. The device is configured to unlock a door so that the speaker can pass through the door. 22. The method of claim 21, comprising a solenoid. 24.話し手が知られている人間かどうか前記知られている人間のスピーチにつ いての基準情報を含む記憶された情報に基づいて確かめる装置において、 前記確認に関連したキー化された情報を受信しかつコード化されたトーン信号を 発生するキー動作されるトーン発生器と、前記話し手の発声に応答してアナログ 電気信号を発生するマイクロフォンと、 前記トーン信号と前記アナログ信号の両方を搬送するチャネルと、 前記チャネルから受信された信号をディジタル信号に変換するアナログ・ディジ タル変換器と、 前記記憶された情報に関連した前記発声に対応した前記ディジタル信号を前記確 認の部分として分析する記憶されたプログラムによって制御されるディジタルプ ロセッサであって前記プロセッサは前記キー化された情報を得るために前記トー ン信号に対応したディジタル信号を検出し解読するようにプログラムされており 、そして前記装置は前記キー化されている情報に基づいた確認を導くために採用 されていることを特徴とする装置。24. Whether the speaker is a known person or not, regarding the speech of said known person. In an apparatus for verifying based on stored information including reference information of receiving keyed information related to said confirmation and transmitting a coded tone signal; A key activated tone generator that generates an analog tone generator in response to the speaker's utterances. a microphone that generates an electrical signal; a channel carrying both the tone signal and the analog signal; an analog digital converter that converts the signal received from said channel into a digital signal; a barrel converter, the digital signal corresponding to the utterance associated with the stored information; A digital computer controlled by a stored program that analyzes as part of the a processor, the processor configured to obtain the keyed information; is programmed to detect and decode digital signals that correspond to , and said device is employed to derive verification based on said keyed information. A device characterized by: 25.複数の話し手が知られている人々かどうかを前記知られている人々のスピ ーチについての情報を含む記憶された情報に基づいて確かめる装置において、 前記複数の話し手からの発声を受信する複数のステーションと、 前記確認の一部として前記記憶された情報に関連した各前記発車を分析すること をプロセッサに可能するように配列された記憶されたプログラムによって制御さ れるディジタルプロセッサとを含み、 前記記憶されたプログラムは前記ディジタルプロセッサに前記異なる発声が同時 に処理されるように異なる前記発声の分析のステップをタイム・インタリーブす るように配列されていることを特徴とする装置。25. Check whether multiple speakers are known people or not. In an apparatus for ascertaining based on stored information including information about a a plurality of stations receiving utterances from the plurality of speakers; analyzing each said departure associated with said stored information as part of said verification; controlled by a stored program arranged to allow the processor to a digital processor, The stored program causes the digital processor to simultaneously execute the different utterances. time-interleaving the steps of analysis of the different utterances so that they are processed into A device characterized in that the device is arranged in such a manner that the 26.複数の話し手が知られている人々かどうかを前記知られている人々のスピ ーチについての情報に基づいて確かめる装置において、 前記複数の話し手からの発声を受信しかつ前記話し手の情報を発生する複数のス テーションと、 前記ステーションのそれぞれのユーザに対応する複数のプロセッサと、 前記プロセッサを管理するホストコンピュータであって、複数のプロセッサがリ アルタイムで前記それぞれのステーションに対応できるように複数の前記プロセ ッサの制御をタイム・インタリーブするリアルタイム動作システムにより前記ホ ストコンピュータが制御されることを特徴とする装置。26. Check whether multiple speakers are known people or not. In an apparatus for ascertaining based on information about the a plurality of slots that receive utterances from the plurality of speakers and generate information about the speakers; and a plurality of processors corresponding to respective users of the station; A host computer that manages the processors, wherein a plurality of processors A plurality of said processes can be used to handle said respective stations in real time. A real-time operating system that time-interleaves the control of the host 1. A device characterized in that a strike computer is controlled. 27.音響信号源の同一性を確認する方法において、前記音響信号源からの音響 信号を受信することと、前記音響信号源からの第1のパラメータを得ることとそ して前記第1のパラメータは前記音響信号源の物理的特性に対応していることと 、 前記音響信号源から前に受信した音響信号から得た第2のパラメータと前記第1 のパラメータを比較し、これにより前記第1および第2のパラメータの比較を表 示する第1の歪値を発生することと、 前記第1の歪値と他のグループを伴う前記第2のパラメータの複数のグループの 各々の比較を表示する複数の第2の歪値とを比較し、前記第2の歪値は他の音響 信号源からの音響信号の誤り確認に関して対応している確率値を各々同一のもの とみなすことと、 前記第1の歪値と第2の歪値との比較に基づいて第1の誤差値を発生し、前記第 2の歪値の一つによって同一のものとみなされた確率に対応させることと、 前記音響信号源からの第2の音響信号のために上述のステップを繰り返すことと 、 前記ステップの端繰り返しの間の前記第1の誤差値における変化を反映している 第2の誤差値を発生することと、前記第2の誤差値としきい値とを比較すること と、もし第2の誤差値としきい値との関係が予め選択された容認基準に従ってい れば容認信号を発生することを特徴とする方法。27. In a method for confirming the identity of an acoustic signal source, the acoustic signal from the acoustic signal source is receiving a signal and obtaining a first parameter from the acoustic signal source; and the first parameter corresponds to a physical characteristic of the acoustic signal source. , a second parameter obtained from an acoustic signal previously received from the acoustic signal source and the first and thereby represent a comparison of said first and second parameters. generating a first strain value representing; a plurality of groups of said second parameters with said first distortion values and other groups; a plurality of second distortion values displaying each comparison, said second distortion values being compared with other acoustic The corresponding probability values for error confirmation of the acoustic signal from the signal source are the same. and generating a first error value based on a comparison of the first distortion value and the second distortion value; 2 corresponding to the probability of being considered to be the same by one of the distortion values; repeating the above steps for a second acoustic signal from the acoustic signal source; , reflecting changes in the first error value between end iterations of the step; generating a second error value; and comparing the second error value with a threshold. and if the relationship between the second error value and the threshold is in accordance with a preselected acceptance criterion. The method is characterized in that: generating an acceptance signal if the 28.前記第2のパラメータがパラメータのグループを含む、各パラメータのグ ループは前記第1のパラメータに対応した音響信号に類似する特性を有する音響 信号に対応した請求の範囲第27項に記載された如き音響信号源の同一性を確認 する方法。28. the second parameter includes a group of parameters; The loop is an acoustic signal having characteristics similar to the acoustic signal corresponding to the first parameter. Confirm the identity of the acoustic signal source as described in claim 27 corresponding to the signal. how to. 29.第1のパラメータと第2のパラメータとを比較するステップが、第1のパ ラメータと前記第2のパラメータのグループの各々を分離的に比較し、これによ り各々比較のための歪値を発生するステップと、 合成値を発生するために各々の比較からの歪値を発生するステップとを含む請求 の範囲28項に記載された如き音響信号源の同一性を確認する方法。29. The step of comparing the first parameter and the second parameter includes the step of comparing the first parameter and the second parameter. and each of said second parameter groups separately; generating distortion values for comparison, respectively; and generating distortion values from each comparison to generate a composite value. A method of verifying the identity of an acoustic signal source as described in Section 28 of 30.第1の誤差値を発生するステップが、第1および第2の歪値に応答して第 1の歪値より次に大きい第2の歪値を選択するステップと、 第1の誤差値として選択された第2の歪値に関連した確率値を選定するステップ とを含む請求の範囲27項に記載された如き音響信号源の同一性を確認する方法 。30. generating a first error value in response to the first and second distortion values; selecting a second strain value that is next larger than the first strain value; selecting a probability value associated with the second distortion value selected as the first error value; A method for confirming the identity of an acoustic signal source as described in claim 27, comprising: . 31.もし第2の歪値が第1の歪値より大きくなけれ選定するステップが、第2 の歪値によって表示された音響信号を発生する音響信号源以外の音響信号源から の音響信号を表示する第1の歪値を示す第1の誤差値に値を選定することを含む 請求の範囲30項に記載された如き音響信号源の同一性を確認する方法。31. If the second strain value is not larger than the first strain value, the step of selecting the second strain value from an acoustic signal source other than the acoustic signal source that generates the acoustic signal indicated by the distortion value of selecting a value for a first error value indicative of a first distortion value indicative of the acoustic signal; A method for verifying the identity of an acoustic signal source as claimed in claim 30. 32.第2の誤差値が前記方法の以前のステップの各繰り返し内において発生さ れた第1の誤差値に応答して変化された合成値を含み、これにより選択された音 響信号源を確認するために前記方法の実施において発生された誤差値の影響を表 示する表示値を供給する請求の範囲30項に記載された如き音響信号源の同一性 を確認する方法。32. A second error value is generated within each iteration of the previous step of the method. the selected sound. represents the effect of error values generated in the implementation of said method to identify the acoustic signal source; The identity of the acoustic signal source as claimed in claim 30 which provides the indicated value How to check. 33.第1および第2のパラメータが自己相関係数aa係数を含み、本方法にお いて利用される歪を得るためにパラメータのグループの一つが正規化された自己 相関係数がパラメータの他のグループのaa係数と比較される請求の範囲27項 に記載された如き音響信号源の同一性を確認する方法。33. The first and second parameters include autocorrelation coefficients aa coefficients, and the method One of the groups of parameters is normalized to obtain the distortion used in the Claim 27: The correlation coefficient is compared with the aa coefficients of other groups of parameters. A method for verifying the identity of an acoustic signal source as described in . 34.音響信号の受信ステップ前に前記音響信号源から前に受信された別の音響 信号を表示している値の表から音響信号を選択するステップと、 前記音響信号源と通信しかつ前記音響信号源から与えられるべき選択された音響 的な信号を同一のものとみなす敏速な信号を発生するステップとを含む請求の範 囲27項に記載された如き音響信号源の同一性を確認する方法。34. another sound previously received from the sound signal source before the step of receiving the sound signal; selecting an acoustic signal from a table of values displaying signals; selected audio in communication with and to be provided by the audio signal source; and generating a prompt signal that equates two different signals. A method of verifying the identity of an acoustic signal source as described in paragraph 27. 35.音響信号源の同一性を確認する方法において、前記音響信号源からの複数 の音響信号を受信することと、前記音響信号の各々を表示するパラメータを発生 させることと、 前記信号が同一の音響的なメッセージパターンを与えようとする前記音響信号の グループのために、グループ内の音響信号を表示するパラメータ間の差を表示す る第1の値を発生させることと、前記グループからのパラメータと音響的メッセ ージパターンと類似した他の音響信号源からの信号を表示するパラメータとを比 較することと、 前記比較ステップに応答して、他の音響信号源からの信号を表示する前記パラメ ータとグループ内の音響信号を表示する前記パラメータとの間の差を表示する第 2の値を発生することと、前記第1の値のために前記音響信号源からの音響信号 を表示するパラメータに類似する値を有するパラメータによって表示された他の 音響信号源からの音響信号の誤った確認の確率を表示している確率値を発生する ことと、 確認されるべき新しい音響信号を受信することと、前記新しい信号を表示する新 しいパラメータを発生することと、 前記新しいパラメータと前記新しい音響信号として同じ音響的メッセージを各々 が与えようとする音響信号のグループのパラメータとを比較することと、 前記新しいパラメータ比較ステップに応答して、前記音響信号のグループのパラ メータと新しいパラメータ間の差を表示する新しい値を発生することと、 前記新しい差値と前記第1の値を比較し、前記新しい差値に接近した前記第1の 値の1つを選択することと、前記選択された第1の値に関連した確率値に対応し た第1の誤差値を発生することと、 確認されるべき新しい他の音響信号を受信することと、前記他の新しい音響信号 のために新しい音響信号の受信ステップ以下の上述のステップを繰り返すことと 、前記繰り返しステップから生じる第1の合成誤差値を反映する第2の誤差値を 発生することと、 第2の誤差値としきい値とを比較することと、もし第2の誤差値としきい値間の 関係が予め選択された容認基準に従っているときには、容認信号を発生すること を含む方法。35. In a method for confirming the identity of an acoustic signal source, the plurality of acoustic signal sources receiving acoustic signals and generating parameters representing each of said acoustic signals; and of said acoustic signals such that said signals attempt to give the same acoustic message pattern. For groups, display the difference between the parameters that display the acoustic signals within the group. generating a first value of a parameter from said group and an acoustic message; parameters that display signals from other similar acoustic signal sources. to compare and In response to the comparing step, the parameter representing signals from other acoustic signal sources; a second parameter that displays the difference between the parameter and the said parameter that displays the acoustic signal within the group. generating an acoustic signal from the acoustic signal source for the first value; Display other parameters displayed by the parameter with similar values to the parameter Generating a probability value indicating the probability of false confirmation of an acoustic signal from an acoustic signal source And, receiving a new acoustic signal to be confirmed and a new acoustic signal displaying said new signal; generating new parameters and the same acoustic message as the new parameters and the new acoustic signal, respectively. comparing the parameters of the group of acoustic signals that are intended to be given by In response to the new parameter comparison step, the parameters of the group of acoustic signals are generating a new value that displays the difference between the meter and the new parameter; The new difference value and the first value are compared, and the first value approaches the new difference value. selecting one of the values and a probability value associated with said selected first value; generating a first error value, receiving a new other acoustic signal to be confirmed; and said other new acoustic signal. and repeating the above steps following the step of receiving a new acoustic signal for , a second error value reflecting the first composite error value resulting from the iterative step. occur and comparing the second error value with the threshold; and if the difference between the second error value and the threshold is generating an acceptance signal when the relationship conforms to preselected acceptance criteria; method including. 36.請求の範囲35項に記載された如き音響信号源の同一性を確認する方法に おいて、 複数の音響信号の受信ステップより前に、前記音響信号源を同一のものとみなす 記憶された情報を含む方法。36. A method for confirming the identity of an acoustic signal source as described in claim 35 Leave it behind. Before the step of receiving a plurality of acoustic signals, the acoustic signal sources are considered to be the same. Methods of containing stored information. 37.請求の範囲35項に記載された如き音響信号源の同一性を確認する方法に おいて、 前記複数の音響信号が複数の音響信号のグループを含み、各前記グループは同一 の音響的メッセージを表示している複数の信号を含んでいる方法。37. A method for confirming the identity of an acoustic signal source as described in claim 35 Leave it behind. The plurality of acoustic signals includes a plurality of groups of acoustic signals, each group being the same. A method comprising a plurality of signals displaying an acoustic message. 38.第1の値を得るステップがグループ内の音響信号のパラメータとグループ 内の他の音響信号のパラメータとを比較するステップを含む請求の範囲35項に 記載された如き音響信号源の同一性を確認する方法。38. The step of obtaining the first value is the parameter of the acoustic signal in the group and the group Claim 35, further comprising the step of comparing parameters of other acoustic signals within the A method of confirming the identity of an acoustic signal source as described. 39.複数の音響信号を受信するステップが、前記音響信号をモニターするステ ップと、前記信号によって表示された音響的なメッセージの開始および終りを検 出するステップとを含み、これにより各々が音響的メッセージを表示する複数の 音響信号を形成する請求の範囲35項に記載された如き音響信号源の同一性を確 認する方法。39. The step of receiving a plurality of acoustic signals includes the step of monitoring the acoustic signals. detect the start and end of the acoustic message displayed by the signal. emitting a plurality of sounds, each displaying an acoustic message. Ascertaining the identity of the acoustic signal source as defined in claim 35 forming the acoustic signal. method of recognition. 40.音響信号源の同一性を確認する装置において、前記音響信号源からの音響 信号を受信する手段と、前記音響信号源からの第1のパラメータを得る手段と、 そして前記第1のパラメータは前記音響信号源の物理的特性に対応していること と、 前記音響信号源から前に受信した音響信号から得た第2のパラメータと前記第1 のパラメータを比較する手段と、これにより前記第1および第2のパラメータの 比較を表示する第1の歪値を発生することと、 前記第1の歪値と第2の歪値との比較に基づいて第1の誤差値を発生し、前記第 2の歪値の一つによって同一のものとみなされた確率に対応させる手段と、 前記音響信号源からの第2の音響信号を受信することから生じる第1の誤差値に おける変化を反映している第2の誤差値を発生する手段と、 前記第2の誤差値としきい値とを比較する手段と、もし第2の誤差値としきい値 との関係が予め選択された容認基準に従っていれば容認信号を発生する手段とを 備えたことを特徴とする装置。40. In an apparatus for confirming the identity of an acoustic signal source, the acoustic signal from the acoustic signal source is means for receiving a signal; and means for obtaining a first parameter from the acoustic signal source; and the first parameter corresponds to a physical characteristic of the acoustic signal source. and, a second parameter obtained from an acoustic signal previously received from the acoustic signal source and the first means for comparing the parameters of said first and second parameters; generating a first strain value displaying a comparison; generating a first error value based on a comparison of the first distortion value and the second distortion value; means for corresponding the probabilities of being considered to be the same by one of the two distortion values; a first error value resulting from receiving a second acoustic signal from the acoustic signal source; means for generating a second error value reflecting a change in the means for comparing the second error value and a threshold; and if the second error value and the threshold means for generating an acceptance signal if the relationship with the A device characterized by: 41.音響信号源の同一性を確認する方法において、第1の音響信号を受信する ことと、 前記第1の音響信号を表示するテスト値を発生することと、第2の音響信号を受 信することと、 前記テスト値が第1および第2の音響信号を表示するように調節することと、 前記調節されたテスト値をしきい値と比較することと、調節されたテスト値とし きい値との関係が予め選択され容認基準に従っていれば容認信号を発生すること とを含むことを特徴とする方法。41. In a method of verifying the identity of an acoustic signal source, receiving a first acoustic signal. And, generating a test value indicative of the first acoustic signal; and receiving a second acoustic signal. to believe and adjusting the test value to indicate first and second acoustic signals; comparing the adjusted test value with a threshold; generating an acceptance signal if the relationship with the threshold value is in accordance with a preselected acceptance criterion; A method comprising: 42.もし調節されたテスト値としきい値との関係が予め選択された容認基準に 従っていないときには、第2の信号を受信するステップから開始する上記のステ ップを繰り返すステップを更に含む請求の範囲41項に記載された如き音響信号 源の同一性を確認する方法。42. If the relationship between the adjusted test value and the threshold meets the preselected acceptance criteria, If not, the above steps starting from the step of receiving the second signal an acoustic signal as claimed in claim 41, further comprising the step of repeating How to confirm source identity. 43.繰り返しステップの前に、もし調節されたテスト値としきい値との関係が 予め選択された容認基準に従っていなくて、かつ繰り返しステップが予め選択さ れた回数を実行しているときには動作を終了ステップを含む請求の範囲42項に 記載された如き音響信号源の同一性を確認する方法。43. Before the iterative step, if the relationship between the adjusted test value and the threshold is If the pre-selected acceptance criteria are not followed and the repeat step is pre-selected. Claim 42 includes a step of terminating the operation when the operation has been executed the number of times the operation has been performed. A method of confirming the identity of an acoustic signal source as described. 44.動作を終了する前に、もし調節されたテスト値としきい値との関係が予め 選択された容認基準に従っていなくて、かつ繰り返しステップが予め選択された 回数を実行しているときには否容認信号が発生される請求の範囲43項に記載さ れた如き音響信号源の同一性を確認する方法。44. Before finishing the operation, if the relationship between the adjusted test value and the threshold value is Selected acceptance criteria not followed and repeat step pre-selected According to claim 43, a rejection signal is generated when the number of times is executed. A method for confirming the identity of an acoustic signal source such as 45.前記テスト値を調節するステップが、前記第2の音響信号を表示するテス ト値を発生することと、第1の音響信号を表示するテスト値と第2の音響信号を 表示するテスト値とを乗算することと、 これにより第1および第2の音響信号の前記組合わせを含む値を発生することを 含む請求の範囲41項に記載された如き音響信号源の同一性を確認する方法。45. The step of adjusting the test value includes adjusting the test value for displaying the second acoustic signal. a test value indicative of the first acoustic signal and a second acoustic signal; by multiplying by the test value to be displayed; thereby generating a value comprising said combination of first and second acoustic signals. 42. A method of verifying the identity of an acoustic signal source as set forth in claim 41. 46.前記第1の音響信号が前記音響信号源からの第1の通信を表示し、前記第 2の音響信号が前記音響信号源からの第2の通信を表示し、前記第2の通信は前 記第1の通信と異なる請求の範囲41項に記載された如き音響信号源の同一性を 確認する方法。46. the first acoustic signal is indicative of a first communication from the acoustic signal source; a second acoustic signal indicative of a second communication from said acoustic signal source, said second communication The identity of the acoustic signal source as recited in claim 41, which is different from the first communication, How to check. 47.音響信号源の同一性を確認する方法において、各々の第1のテンプレート が選択された音響信号源からの選択された通信の別々の音響的通信の表示を含む 複数の第1のテンプレートを供給することと、 各々の第2のテンプレートが別の音響信号源からの選択された通信の音響的通信 の表示を含む複数の第2のテンプレートを供給することと、 複数の第1のテンプレートのあるものと前記第1のテンプレートの他のものとを 個々に比較して、前記個々のあるもの用の第1の歪値を定義し、前記第1の歪値 は選択された音響信号源からの同じメッセージの別の音律的通信における差を表 示することと、 複数の第1のテンプレートのあるものと複数の第2のテンプレートのあるものと を比較し、他の音響信号源と比較されたものとして選択された音響信号源による 選択された音響的通信における差を表示する第2の歪値を定義することと、第1 の歪値と第2の歪値を比較し、前記第1の歪値のための確率値を発生し、前記確 率値は他の音響信号源からの選択された通信の音響的伝送が選択された第1の歪 値に対する予め決められた関係を有する歪値を有するという見込みの表示を与え ることと、 前記確率値に基づいた音響信号源の容認のためのしきい値を選択することと、 音響信号源からの選択された通信の音響的伝送の表示を含む第3のテンプレート 受信することと、 第3の歪値を定義するために第3のテンプレートと第1のテンプレートとを比較 することと、 しきい値と第3の歪値との関係が予め選択された容認基準に従っているときには 、第3のテンプレートによって表示された音響信号源を容認することとを含むこ とを特徴とする方法。47. In a method for confirming the identity of an acoustic signal source, each first template includes a separate acoustic communication representation of the selected communication from the selected acoustic signal source. providing a plurality of first templates; Each second template corresponds to the acoustic communication of the selected communication from another acoustic signal source. providing a plurality of second templates including representations of; some of the plurality of first templates and other of the first templates; defining a first strain value for each of said first strain values; represents the difference in different phonetic transmissions of the same message from the selected acoustic signal source. to show and One with multiple first templates and one with multiple second templates. by the acoustic signal source selected as compared with other acoustic signal sources. defining a second distortion value indicative of a difference in the selected acoustic communication; and a second strain value to generate a probability value for the first strain value; The rate value is the first distortion at which the acoustic transmission of the selected communication from the other acoustic signal source is selected. gives an indication of the probability of having a strain value that has a predetermined relationship to the value. And, selecting a threshold for acceptance of an acoustic signal source based on the probability value; a third template including a representation of an acoustic transmission of a selected communication from an acoustic signal source; receiving and Comparing the third template and the first template to define a third distortion value to do and when the relationship between the threshold and the third distortion value is in accordance with a preselected acceptance criterion; , accepting the acoustic signal source represented by the third template. A method characterized by: 48.前記音響信号源を容認するステップの前に、第1の選択された通信と異な る第2の選択された通信のために前記方法のステップを繰り返すステップと、 第3のテンプレートと第1のテンプレートとを比較するステップによって発生さ れた第3の歪の組合わせを含む誤差値を発生するステップと、 前記誤差値としきい値とを比較するステップと、もし前記誤差値としきい値との 関係が予め選択された容認基準に従っていれば第3のテンプレートによって表示 された音響信号源を容認するステップとを含む請求の範囲47項に記載された如 き音響信号源の同一性を確認する方法。48. before the step of accepting the acoustic signal source different from the first selected communication. repeating the steps of the method for a second selected communication; generated by the step of comparing the third template and the first template. generating an error value including a third distortion combination; comparing the error value with a threshold, and if the error value and the threshold are different; Displayed by third template if relationship complies with pre-selected acceptance criteria as claimed in claim 47. A method for verifying the identity of the source of an acoustic signal. 49.もし誤差値としきい値との関係が予め選択された容認基準に従っていない ときには、請求の範囲28項のステップを繰り返すステップを更に含む請求の範 囲48項に記載された如き音響信号源の同一性を確認する方法。49. If the relationship between the error value and the threshold value does not follow the preselected acceptance criteria Sometimes the claim further comprises the step of repeating the steps of claim 28. A method of verifying the identity of an acoustic signal source as described in paragraph 48. 50.請求の範囲48項のステップを繰り返すステップの前に、もし誤差値とし きい値との関係が予め選択された容認基準に従っていなくて、かつ請求の範囲4 8項のステップが予め選択された回数実行されていれば前記方法の動作を終了す るステップを含む請求の範囲49項に記載された如き音響信号源の同一性を確認 する方法。50. Before the step of repeating the steps of claim 48, if the error value is The relationship with the threshold value does not comply with preselected acceptance criteria, and claim 4 The operation of the method is terminated if the steps in section 8 have been performed a preselected number of times. verifying the identity of the acoustic signal source as described in claim 49, including the step of how to. 51.誤差値が第3のテンプレートと第1のテンプレートとを比較するステップ によつて発生された第3の歪を発生を含む請求の範囲48項に記載された如き音 響信号源の同一性を確認する方法。51. Comparing the error value between the third template and the first template A sound as set forth in claim 48, including generation of a third distortion generated by A method for verifying the identity of an acoustic signal source. 52.音響信号源を同一のものとみなすとき容認しきい値を定義する方法におい て、 各々の第1のテンプレートが選択された音響信号源からの選択された通信の別々 の音響的通信の表示を含む複数の第1のテンプレートを供給することと、 各々の第2のテンプレートが別の音響信号源からの選択された通信の音響的通信 の表示を含む複数の第2のテンプレートを供給することと、 複数の第1のテンプレートのあるものと前記第1のテンプレートの他のものとを 個々に比較して、前記個々のあるもの用の第1の歪値を定義し、前記第1の歪値 は選択された音響信号源からの同じメッセージの別の音響的通信にむける差を表 示することと、 複数の第1のテンプレートのあるものと複数の第2のテンプレートのあるものと を比較し、他の音響信号源と比較されたものとして選択された音響信号源による 選択された音響的通信における差を表示する第2の歪値を定義することと、第1 の歪値と第2の歪値を比較し、前記第1の歪値のための確率値を発生し、前記確 率値は他の音響信号源からの選択された通信の音響的伝送が選択された第1の歪 値に対する予め決められた関係を有する歪値を有するという見込みの表示を与え ることと、 前記確率値に基づいた音響信号源の容認のためのしきい値を選択することとを含 むことを特徴とする方法。52. A method for defining acceptance thresholds when acoustic signal sources are considered to be the same. hand, Each first template separates the selected communications from the selected acoustic signal source. providing a plurality of first templates including representations of acoustic communications of; Each second template corresponds to the acoustic communication of the selected communication from another acoustic signal source. providing a plurality of second templates including representations of; some of the plurality of first templates and other of the first templates; defining a first strain value for each of said first strain values; represents the difference for another acoustic communication of the same message from the selected acoustic signal source. to show and One with multiple first templates and one with multiple second templates. by the acoustic signal source selected as compared with other acoustic signal sources. defining a second distortion value indicative of a difference in the selected acoustic communication; and a second strain value to generate a probability value for the first strain value; The rate value is the first distortion at which the acoustic transmission of the selected communication from the other acoustic signal source is selected. gives an indication of the probability of having a strain value that has a predetermined relationship to the value. And, selecting a threshold for acceptance of the acoustic signal source based on the probability value; A method characterized by: 53.音響信号源の同一性を確認する装置において、第1の音響信号を受信する 手段と、 前記第1の音響信号を表示するテスト値を発生する手段と、第2の音響信号を受 信する手段と、 前記第2の音響信号を第1および第2の音4信号組合わせを与えるために調節す る手段と、調節されテスト値としきい値との関係が予め選択された容認基準に従 っているときには容認信号を発生する手段とを備えたことを特徴とする装置。53. receiving a first acoustic signal in a device for verifying the identity of an acoustic signal source; means and means for generating a test value indicative of said first acoustic signal; and means for receiving a second acoustic signal. the means to believe, adjusting the second acoustic signal to provide a four-signal combination of the first and second sounds; and the relationship between adjusted test values and thresholds in accordance with preselected acceptance criteria. and means for generating an acceptance signal when an acceptance signal is received. 54.音響信号の始めと終りを検出する方法において、選択された開始しきい値 レベル以上の音響エネルギーを検出するステップと、 開始エネルギーしきい値以上の音響エネルギー検出された後で且つ前記音響エネ ルギーが選択された第1のしきい値時間期間を越える時間期間の間選択された第 1のアテンションしきい値レベル以上である時に音響信号の始めと同一のものと みなすステップと、 前記音響エネルギーが選択された終了信号しきい値レベル以下に落ちる時を検出 するステップと、 前記音響エネルギーが選択された終了信号しきい値レベル以下に落ちる時が検出 された後でかつ前記音響エネルギーが選択された第2のしきい値時間期間を越え る時間期間の間選択された第2のアテンションしきい値レベル以上てある時に音 響信号の終りと同一のものとみなすステップとを含むことを特徴とする方法。54. Selected starting thresholds in the method for detecting the beginning and end of an acoustic signal detecting acoustic energy above a level; After an acoustic energy above a starting energy threshold is detected and the acoustic energy the selected first threshold time period for which the energy exceeds the selected first threshold time period. the same as the beginning of the acoustic signal when it is above the attention threshold level of 1. The step of considering detecting when the acoustic energy falls below a selected termination signal threshold level; the step of detecting when the acoustic energy falls below a selected termination signal threshold level; and the acoustic energy exceeds a selected second threshold time period. the sound when the selected second attention threshold level is exceeded for a period of time. and equating the end of the acoustic signal. 55.音響エネルギーを検出するステップに続き、かつ前記音響エネルギーが選 択された開始スピーチしきい値レベル以上でないときに、該方法はノイズを含む 信号のために測定されている自己相関関数の値から予め選択された距離以上のユ ークリッド距離を正規化された自己相関関数が有する状態における他の開始信号 しきい値レベル以上の音響エネルギーを検出するステップを含む請求の範囲54 項に記載された如き音響信号源の始めと終りを検出する方法。55. following the step of detecting acoustic energy, and wherein the acoustic energy is selected; The method is noisy when the selected starting speech threshold level is not above the selected starting speech threshold level. If the signal is over a preselected distance from the value of the autocorrelation function being measured for the signal, – Other starting signals in the state where the autocorrelation function normalized to the Clid distance has Claim 54 comprising the step of detecting acoustic energy above a threshold level. A method for detecting the beginning and end of an acoustic signal source as described in Section.
JP50373286A 1985-07-01 1986-07-01 speaker verification device Pending JPS63500126A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US75103185A 1985-07-01 1985-07-01
US751031 1985-07-01

Publications (1)

Publication Number Publication Date
JPS63500126A true JPS63500126A (en) 1988-01-14

Family

ID=25020188

Family Applications (1)

Application Number Title Priority Date Filing Date
JP50373286A Pending JPS63500126A (en) 1985-07-01 1986-07-01 speaker verification device

Country Status (4)

Country Link
EP (1) EP0233285A4 (en)
JP (1) JPS63500126A (en)
AU (1) AU6128586A (en)
WO (1) WO1987000332A1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276697A (en) * 2009-05-26 2010-12-09 Waseda Univ Voice processing apparatus and program

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990008379A1 (en) * 1989-01-17 1990-07-26 The University Court Of The University Of Edinburgh Speaker recognition
US5054083A (en) * 1989-05-09 1991-10-01 Texas Instruments Incorporated Voice verification circuit for validating the identity of an unknown person
GB2237135A (en) * 1989-10-16 1991-04-24 Logica Uk Ltd Speaker recognition
GB0427205D0 (en) 2004-12-11 2005-01-12 Ncr Int Inc Biometric system
US9251792B2 (en) 2012-06-15 2016-02-02 Sri International Multi-sample conversational voice verification

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3673331A (en) * 1970-01-19 1972-06-27 Texas Instruments Inc Identity verification by voice signals in the frequency domain
DE2511233C2 (en) * 1975-03-14 1977-03-10 Dornier Gmbh Procedure to prevent unintentional land or water contact by aircraft flying at low altitudes
US4032711A (en) * 1975-12-31 1977-06-28 Bell Telephone Laboratories, Incorporated Speaker recognition arrangement
GB1569450A (en) * 1976-05-27 1980-06-18 Nippon Electric Co Speech recognition system
DE2844156A1 (en) * 1978-10-10 1980-04-24 Philips Patentverwaltung METHOD FOR VERIFYING A SPEAKER
JPS6057261B2 (en) * 1980-03-18 1985-12-13 日本電気株式会社 Multi-line audio input/output device
JPS5870292A (en) * 1981-10-22 1983-04-26 日産自動車株式会社 Voice recognition equipment for vehicle
JPS5876893A (en) * 1981-10-30 1983-05-10 日本電気株式会社 Voice recognition equipment
JPS59178587A (en) * 1983-03-30 1984-10-09 Nec Corp Speaker confirming system
IT1160148B (en) * 1983-12-19 1987-03-04 Cselt Centro Studi Lab Telecom SPEAKER VERIFICATION DEVICE

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010276697A (en) * 2009-05-26 2010-12-09 Waseda Univ Voice processing apparatus and program

Also Published As

Publication number Publication date
EP0233285A4 (en) 1987-12-01
WO1987000332A1 (en) 1987-01-15
AU6128586A (en) 1987-01-30
EP0233285A1 (en) 1987-08-26

Similar Documents

Publication Publication Date Title
US6161090A (en) Apparatus and methods for speaker verification/identification/classification employing non-acoustic and/or acoustic models and databases
US10476872B2 (en) Joint speaker authentication and key phrase identification
US9183367B2 (en) Voice based biometric authentication method and apparatus
AU2013203139B2 (en) Voice authentication and speech recognition system and method
US5548647A (en) Fixed text speaker verification method and apparatus
US6272463B1 (en) Multi-resolution system and method for speaker verification
EP0983587B1 (en) Speaker verification method using multiple class groups
Li et al. Automatic verbal information verification for user authentication
JP2007133414A (en) Method and apparatus for estimating discrimination capability of voice and method and apparatus for registration and evaluation of speaker authentication
US5937381A (en) System for voice verification of telephone transactions
US8433569B2 (en) Method of accessing a dial-up service
CN101154380A (en) Method and device for registration and validation of speaker&#39;s authentication
JPH11327585A (en) Method of dynamic speech recognition using free speech grading method and apparatus therefor
Campbell Speaker recognition
Li et al. Recent advancements in automatic speaker authentication
Ma et al. English-Chinese bilingual text-independent speaker verification
JPS63500126A (en) speaker verification device
Singh et al. Voice disguise by mimicry: deriving statistical articulometric evidence to evaluate claimed impersonation
CN113990288B (en) Method for automatically generating and deploying voice synthesis model by voice customer service
Furui Speech and speaker recognition evaluation
US9978373B2 (en) Method of accessing a dial-up service
CN118474256A (en) Identity authentication method, system, equipment, medium and product based on voiceprint recognition
CN117351945A (en) Identity authentication method, device and medium
CN115034904A (en) Transaction admission auditing method, apparatus, device, medium and program product
McInnes et al. User response to prompt wording styles in an automated banking service with a Wizard of Oz simulation of word-spotting