JP2005512246A - 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム - Google Patents
動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム Download PDFInfo
- Publication number
- JP2005512246A JP2005512246A JP2003551774A JP2003551774A JP2005512246A JP 2005512246 A JP2005512246 A JP 2005512246A JP 2003551774 A JP2003551774 A JP 2003551774A JP 2003551774 A JP2003551774 A JP 2003551774A JP 2005512246 A JP2005512246 A JP 2005512246A
- Authority
- JP
- Japan
- Prior art keywords
- user
- probability
- input
- behavior
- feature vector
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000012795 verification Methods 0.000 title claims abstract description 71
- 238000000034 method Methods 0.000 title claims abstract description 52
- 239000013598 vector Substances 0.000 claims description 48
- 230000004044 response Effects 0.000 claims description 14
- 230000009471 action Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 5
- 230000001755 vocal effect Effects 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 239000000463 material Substances 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 5
- 230000003993 interaction Effects 0.000 description 4
- 238000005352 clarification Methods 0.000 description 3
- 230000003542 behavioural effect Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 125000002066 L-histidyl group Chemical group [H]N1C([H])=NC(C([H])([H])[C@](C(=O)[*])([H])N([H])[H])=C1[H] 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/32—User authentication using biometric data, e.g. fingerprints, iris scans or voiceprints
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/30—Authentication, i.e. establishing the identity or authorisation of security principals
- G06F21/31—User authentication
- G06F21/316—User authentication by observing the pattern of computer usage, e.g. typical user behaviour
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/22—Interactive procedures; Man-machine interfaces
- G10L17/24—Interactive procedures; Man-machine interfaces the user being prompted to utter a password or a predefined phrase
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Computer Security & Cryptography (AREA)
- Human Computer Interaction (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Software Systems (AREA)
- Signal Processing (AREA)
- General Health & Medical Sciences (AREA)
- Social Psychology (AREA)
- Artificial Intelligence (AREA)
- Collating Specific Patterns (AREA)
- Machine Translation (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
ユーザのアイデンティティを検証するためのシステム及び方法を提供する。
【解決手段】
本発明によるシステムは、ユーザ(110)からの入力を受けとってその入力を提携コマンドに変換するための会話システム(114)を含む。入力から特徴を抽出するための動作検証装置(118)が会話システム(114)に結合される。それらの特徴はユーザの動作パターンを含む。動作検証装置(118)は、入力された動作を動作モデル(214)に比較して、ユーザが会話システムと対話することを許容されるかどうかを決定する。
Description
1.ユーザの音声、指紋、手書き等によって決定可能である、そのユーザが誰であるかということ、
2.パスワード、又は或るバイオメトリック質問(例えば、母親の旧姓が何であるか)に対する返答によって決定可能である、ユーザが知っているもの、
3.識別ドキュメント、キー、特定の番号を持った携帯電話等のような、ユーザが所持しているもの。
(数1)
v = [v1.....vn](1)
音声認識エンジンが1つの言語モデル又は1セットの言語モデルを使用して認識を行う。2つ以上の言語モデルが使用されるとき、それらのモデルの幾つかが所定のユーザに対して個別設定される(それは、所定のユーザによって頻繁に話されるワード及びフレーズを使用して形成されるパーソナル・キャッシュとして知られている)。言語モデル・スコアは内部的に生成及び使用され、認識が完了した後に廃棄される。しかし、これらのスコアは、特に、頻繁に使用されるワード及びフレーズの選択に関してユーザを特徴付けることができる情報を保持する。例えば、ユーザが普通に「口述開始(begin dictation)」と言う場合、「このメッセージ用のテキストを作りましょう(let us create the textfor this message)」という詐称者を検出することが可能である。同様に、いつも簡潔且つ最適なフレーズを使用してコマンドを発するユーザは、長い文章を使用する詐称者から区別可能である。従って、言語モデル・スコアは、特徴ベクトル内に特徴として保管及び組み込み可能である。単一のフレーズ又は複数のフレーズに基づいて詐称者を拒絶する必要がないことは注目されるべきである。その代わり、累積的な動作スコアが所定のユーザ・セッションに対して維持され、ユーザが詐称者であるか又はシステムを使用することに関して検証されてないかを決定するためには、閾値に関して定期的にチェックされる。
音響モデル・スコア(高速マッチ・スコア及び詳細マッチ・スコアとしても知られている)及び他の中間出力が音声認識エンジンにおいて内部的に使用され、認識後に廃棄される。言語モデル・スコアと同様に、音響モデル・スコアは、ユーザを特徴付けることに関する情報も含み、所定のタスクに対するスコアの正常範囲からの如何なる偏移も検出され、詐称者を識別するために使用可能である。従って、音響モデルを特徴ベクトルに加えることは有用である。
NLUエンジンは「テキスト・ツー・定型コマンド(text-to-formalcommand)」から変換が完了した後に廃棄される内部スコアも生成する。これらのスコアは、ユーザを特徴付ける場合に使用可能な情報も含む。NLUエンジンは、通常、2つ又はそれ以上のステージ(タグ付けステージ及び変換ステージのようなステージ)を含み、所定のタスクに対する正常範囲からの如何なる逸脱も検出されるように、これらのスコアすべてが、特徴ベクトルに付加可能である。
ユーザは、ユーザが発するコマンドのシーケンスにおけるパターン及びタスクを達成するためにしばしば使用されるコマンドの結合を示すことが多い。「自然言語ダイアログ・システムのための適応性コマンド予測装置(Adaptive Command Predictor for a Natural Language Dialog System)」と題したG. Ramaswamy 及び J. Kleindienst の両氏により1999年10月30日に出願された米国特許出願番号第09/431,034号において開示されているシステムのような過去の動作に基づいてユーザの次のコマンドを予測するシステムが会話システムの精度を改善するために及びシステムが主導権をとってユーザに次のコマンドを提案するために使用可能である。しかし、これらのアプリケーションのほかに、コマンド予測システムは詐称者を検出する場合にも有用である。実際のユーザによって使用されたことがない(従って、低いコマンド予測スコアを得ると思われる)コマンドを人が発する場合、又は最高ランキング予測のコマンドの部分ではなかった(これもコマンド予測スコアが低いと思われる)一連のコマンドを人が発する場合、通常のコマンド又はコマンド・シーケンスが詐称者の存在を表すことがある。従って、コマンド予測スコアは特徴ベクトルに加えられるべき良好な特徴である。
ほとんどの言語において、2つ以上の発音を有する幾つかのワードが存在する。例えば、英語の場合、ワード「the」は、次のような一般的な発音を有する:
|DH AH
|DH AX
|DH IY。
システムが手書き認識又はイメージ認識のような他の入力形態をサポートする場合、これらの認識エンジンからのスコアは、音声認識からの言語モデル・スコア及び音響モデル・スコアと同様に特徴ベクトルにも追加可能である。
会話システムは、ユーザからの口頭入力を受け入れるのみならず、ユーザとのダイアログを維持し、ユーザに与えられるべき応答を生成する。本発明のシステムは、そのシステムがユーザに対して一般にどのような応答を生成するかを調べ、その情報を使用して詐称者を検出することが可能である。「私はそのメッセージを見つけることができませんでした(I could not find that message)」、「そのような会合はありません(there is no suchmeeting)」、又は「あなたはそのミューチャル・ファンドにおける取り分がありません(you do not own any shares in thatmutual fund)」というような応答は、ユーザがシステムとの従来の対話に関する知識を持たず、潜在的に詐称者であり得るということを意味する。同様に、或るユーザは非常に几帳面であり、更なる明確化を必要としない「これをスティーブ・ジョーンズに送ってください(sendthis to Steve Jones)」というようなコマンドを発し得るが、別のユーザは曖昧であって、明確化のための更なるダイアログを必要とする「これをスティーブに送ってください(sendthis to Steve)」と同じコマンドを発し得る。システムは、「あなたはスティーブ・ジョーンズのことを云っているのですか、それともスティーブ・ブラウンのことを云っているのですか(doyou mean Steve Jones or Steve Brown?)」という形の質問をユーザにプロンプト指示し得る。この場合、実際のユーザよりももっと几帳面であるか或いはもっと曖昧である詐称者が検出可能である。
マルチモーダル入力(音声、キーボード、マウス、手書き、身振り等)をサポートするシステムに対して、ユーザは、一般に使用する入力形態の結合が本発明に従って分析されてタスクを達成し、同じタスクに対する異なるセットの入力形態を使用しようとしている詐称者を検出することが可能である。例えば、或るユーザは、ファイルを保管するために「保管(save)」ボタンをクリックすることを望むことがあり得るし、別のユーザは、このタスクに対する口頭コマンドを使用することを望むことがあり得る。従って、或るタスクを達成するために使用される入力形態を特徴ベクトルにおける追加の特徴として加えることは有用である。
或るシステムは、ユーザが任意の所定の時間にオープンされる複数のトランザクションを有することを許容し得る(ユーザは、1つのタスクを終わらせた後でなければ次のタスクに移ってはならないわけではない)。この場合、現在オープンしているトランザクションの数及び最も古いトランザクションが開始した以後に経過した時間を表す特徴が追加可能である。この情報は、所定のユーザの特質を表す特徴ベクトルを構成するためにも使用可能である。ダイアログ状態は、システムにおいて遂行されるアクティビティの使用のタイプ又は期間も含む。例えば、或る特定の使用は、システムにログ・オンするときいつもeメールをアクセスし得るし、しかる後、株価をチェックし得る。
種々のユーザが種々の速度でシステムと対話し得る。しかし、所定のユーザは、コマンド相互間の期間、例えば、ユーザがコマンド相互間で一時停止する時間において規則性を示すことが多い。従って、最後のコマンドの終了と現在のコマンドの開始との間の期間が1つの特徴として明示的に入力可能である。
(数3)
Pb(t)=αtP(t)+αt−1P(t−1)+....+αt−mP(t−m) (3)
(数4)
Ptotal(t)=βaPa(t)+βbPb(t) (4)
Claims (40)
- ユーザ・アイデンティティを検証するためのシステムであって,
ユーザからの入力を受け取り、前記入力を定型コマンドに変換するための会話システムと,
前記会話システムに結合され、前記入力から特徴を抽出するための動作検証装置と、
を含み,前記特徴は前記ユーザの動作パターンを含み,前記動作検証装置は前記動作パターンを動作モデルに比較し、前記ユーザが前記会話システムと対話することを許容されるかどうかを決定するように適応する、システム。 - 前記会話システムは、前記入力として受け取られた音声を解釈するための自然言語理解ユニットを含む、請求項1に記載のシステム。
- 前記入力は、音声、手書き、テキスト、及び身振りの少なくとも1つを含む、請求項1に記載のシステム。
- 前記動作検証装置は、前記入力から特徴ベクトルを抽出するための特徴抽出装置を含む、請求項1に記載のシステム。
- 前記特徴ベクトルは、言語モデル・スコア、音響モデル・スコア、及び自然言語理解スコアの少なくとも1つを含む、請求項4に記載のシステム。
- 前記特徴ベクトルは、コマンド叙述スコア及び発音スコアの少なくとも1つを含む、請求項4に記載のシステム。
- 前記特徴ベクトルは、前記ユーザに対するシステム応答に関する情報を含む、請求項4に記載のシステム。
- 前記特徴ベクトルは、ユーザ・コマンド相互間の期間及び前記ユーザと前記会話システムとの間のダイアログ状態の少なくとも1つを含む、請求項4に記載のシステム。
- 前記特徴ベクトルは、前記ユーザによって使用される入力形態のタイプを含む、請求項4に記載のシステム。
- 前記動作モデルは複数のモデルを含む、請求項1に記載のシステム。
- 前記動作検証装置は確率計算装置を含み、前記確率計算装置は、前記ユーザが前記ユーザの動作に基づいて前記会話システムと対話することを許容される第1の確率を計算するように適応する、請求項1に記載のシステム。
- 前記動作検証装置は、ユーザに対する動作モデルを構成するためのモデル構成装置を含み、前記動作モデルは、動作を前記ユーザの現在の動作に比較するために前記確率計算装置によって使用される、請求項11に記載のシステム。
- 前記ユーザからの音響及びバイオメトリック情報を決定し、前記ユーザが前記ユーザの音響又はバイオメトリック情報に基づいて前記会話システムと対話することを許容される第2の確率を決定するための音響及びバイオメトリック検証装置を更に含み、
前記動作検証装置は、前記ユーザが前記会話システムとの対話を許容されることを検証するために前記第1の確率を前記第2の確率と統合するように適応した確率混合装置を含む、請求項11に記載のシステム。 - 前記第1の確率は、前記ユーザが前記会話システムを使用することを許容されるかどうかを決定するために閾値確率と比較される、請求項11に記載のシステム。
- 動作検証装置を使用して、動作に基づきユーザを検証するための方法であって、
ユーザからの入力を受け取り、前記入力を定型コマンドに変換するための会話システムに前記入力を供給するステップと、
前記ユーザの動作パターンを含む特徴を前記入力から抽出するステップと、
前記動作パターンを動作モデルに比較して、前記ユーザが前記システムと対話することを許容されるかどうかを決定するステップと、
を含む方法。 - 前記会話システムは自然言語理解ユニットを含み、
前記自然言語ユニットを使用して、前記入力として受け取られた音声を解釈するステップを更に含む、請求項15に記載の方法。 - 前記入力は、音声、手書き、テキスト、及び身振りの少なくとも1つを含む、請求項15に記載の方法。
- 前記動作検証装置は特徴抽出装置を含み、
前記特徴抽出装置を使用して前記入力から特徴ベクトルを抽出するステップを更に含む、請求項15に記載の方法。 - 前記特徴ベクトルは、言語モデル・スコア、音響モデル・スコア、及び自然言語理解スコアの少なくとも1つを含む、請求項18に記載の方法。
- 前記特徴ベクトルは、コマンド叙述スコア及び発声スコアの少なくとも1つを含む、請求項18に記載の方法。
- 前記特徴ベクトルは前記ユーザに対するシステム応答に関する情報を含む、請求項18に記載の方法。
- 前記特徴ベクトルは、ユーザ・コマンド相互間の期間及び前記ユーザと前記システムとの間のダイアログ状態の少なくとも1つを含む、請求項18に記載の方法。
- 前記特徴ベクトルは、前記ユーザによって使用される入力形態のタイプを含む、請求項18に記載の方法。
- 前記動作検証装置は確率計算装置を含み、
前記ユーザが前記ユーザの動作に基づいて前記システムと対話することを許容されるかどうかを表すための第1の確率を前記確率計算装置において計算するステップを更に含む、請求項15に記載の方法。 - 前記動作検証装置はモデル構成装置を含み、
動作をユーザの現在の動作に比較するために前記確率計算装置によって使用される該ユーザに対する動作モデルを構成するステップを更に含む、請求項24に記載の方法。 - 音響及びバイオメトリック検証装置によって決定された前記ユーザの音響及びバイオメトリック情報に基づいて、前記ユーザが前記システムと対話することを許容されるかどうかを表すための第2の確率を決定するステップと、
前記ユーザが前記システムとの対話を許容されることを検証するために、確率混合装置を使用することによって前記第1の確率を前記第2の確率と統合するステップと、
を含む、請求項24に記載の方法。 - 前記ユーザが前記システムを使用することを許容されるかどうかを決定するために前記第1の確率が閾値確率に比較される、請求項24に記載の方法。
- 動作検証装置を使用して、動作に基づきユーザを検証するための方法ステップを遂行するためにマシンにより実行し得るプログラム命令を具体的に実施する、前記マシンにより読み取り可能なプログラム・ストレージ・デバイスであって、前記方法ステップは、
ユーザからの入力を受け取り、前記入力を定型コマンドに変換するための会話なシステムに前記入力を供給するステップと、
前記ユーザの動作パターンを含む特徴を前記入力から抽出するステップと、
前記動作パターンを動作モデルに比較して、前記ユーザが前記システムと対話することを許容されるかどうかを決定するステップと
を含む、プログラム・ストレージ・デバイス。 - 前記会話システムは自然言語理解ユニットを含み、
前記方法ステップは、前記自然言語理解ユニットを使用して、前記入力として受け取られた音声を解釈するステップを更に含む、請求項28に記載のプログラム・ストレージ・デバイス。 - 前記入力は、音声、手書き、テキスト、及び身振りの少なくとも1つを含む、請求項28に記載のプログラム・ストレージ・デバイス。
- 前記動作検証装置は特徴抽出装置を含み、
前記方法ステップは、前記特徴抽出装置を使用して前記入力から特徴ベクトルを抽出するステップを更に含む、請求項28に記載のプログラム・ストレージ・デバイス。 - 前記特徴ベクトルは、言語モデル・スコア、音響モデル・スコア、及び自然言語理解スコアの少なくとも1つを含む、請求項31に記載のプログラム・ストレージ・デバイス。
- 前記特徴ベクトルは、コマンド叙述スコア及び発声スコアの少なくとも1つを含む、請求項31記載のプログラム・ストレージ・デバイス。
- 前記特徴ベクトルは前記ユーザに対するシステム応答に関する情報を含む、請求項31記載のプログラム・ストレージ・デバイス。
- 前記特徴ベクトルは、ユーザ・コマンド相互間の期間及び前記ユーザと前記システムとの間のダイアログ状態の少なくとも1つを含む、請求項31記載のプログラム・ストレージ・デバイス。
- 前記特徴ベクトルは、前記ユーザによって使用される入力形態のタイプを含む、請求項31に記載のプログラム・ストレージ・デバイス。
- 前記動作検証装置は確率計算装置を含み、
前記方法ステップは、前記ユーザが前記ユーザの動作に基づいて前記システムと対話することを許容されるかどうかを表すための第1の確率を前記確率計算装置において計算するステップを更に含む、請求項28に記載のプログラム・ストレージ・デバイス。 - 前記動作検証装置はモデル構成装置を含み、
前記方法ステップは、動作をユーザの現在の動作に比較するために前記確率計算装置によって使用される該ユーザに対する動作モデルを構成するステップを更に含む、請求項37に記載のプログラム・ストレージ・デバイス。 - 前記方法ステップは、更に、
音響及びバイオメトリック検証装置によって決定された前記ユーザの音響及びバイオメトリック情報に基づいて、前記ユーザが前記システムと対話することを許容されるかどうかを表すための第2の確率を決定するステップと、
前記ユーザが前記システムとの対話を許容されることを検証するために、確率混合装置を使用することによって前記第1の確率を前記第2の確率と統合するステップと、
を含む、請求項37に記載のプログラム・ストレージ・デバイス。 - 前記ユーザが前記システムを使用することを許容されるかどうかを決定するために前記第1の確率が閾値確率に比較される、請求項37に記載のプログラム・ストレージ・デバイス。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/US2001/047910 WO2003050799A1 (en) | 2001-12-12 | 2001-12-12 | Method and system for non-intrusive speaker verification using behavior models |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2005512246A true JP2005512246A (ja) | 2005-04-28 |
JP4143541B2 JP4143541B2 (ja) | 2008-09-03 |
Family
ID=32986313
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003551774A Expired - Fee Related JP4143541B2 (ja) | 2001-12-12 | 2001-12-12 | 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム |
Country Status (5)
Country | Link |
---|---|
EP (1) | EP1470549B1 (ja) |
JP (1) | JP4143541B2 (ja) |
KR (1) | KR20040068548A (ja) |
CN (1) | CN1213398C (ja) |
AU (1) | AU2002230762A1 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009175984A (ja) * | 2008-01-23 | 2009-08-06 | Nippon Telegr & Teleph Corp <Ntt> | 本人認証装置、本人認証方法および本人認証プログラム |
JP2018509649A (ja) * | 2015-02-05 | 2018-04-05 | 北京得意音通技▲術▼有限▲責▼任公司Beijing D−Ear Technologies Co., Ltd. | 動的パスワード音声に基づいた自己学習機能を有する身分認証システム及び方法 |
JP2023503718A (ja) * | 2020-01-30 | 2023-01-31 | グーグル エルエルシー | 音声認識 |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN100437577C (zh) * | 2004-09-10 | 2008-11-26 | 索尼株式会社 | 用户识别方法、用户识别装置、电子设备和电子*** |
KR100847532B1 (ko) * | 2006-04-06 | 2008-07-21 | 재단법인서울대학교산학협력재단 | 사용자의 행동 패턴 정보를 이용한 사용자 인증에 사용되는사용자 단말기 및 인증 장치 |
TWI416366B (zh) | 2009-10-12 | 2013-11-21 | Htc Corp | 生物特徵資料建立方法、電子裝置及電腦程式產品 |
CN103019378B (zh) * | 2012-12-07 | 2016-09-07 | 无锡清华信息科学与技术国家实验室物联网技术中心 | 一种移动电子设备手势控制交互方法、装置及移动终端 |
CN103738295B (zh) * | 2013-12-25 | 2016-03-02 | 科大讯飞股份有限公司 | 一种基于语音识别的被盗机动车辆的主动式报警与跟踪***及方法 |
CN104954343B (zh) * | 2014-03-31 | 2018-04-17 | 腾讯科技(深圳)有限公司 | 验证信息处理方法、服务器及*** |
CN105489218A (zh) * | 2015-11-24 | 2016-04-13 | 江苏惠通集团有限责任公司 | 一种语音控制的***、遥控器及服务器 |
CN111462733B (zh) * | 2020-03-31 | 2024-04-16 | 科大讯飞股份有限公司 | 多模态语音识别模型训练方法、装置、设备及存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH05274269A (ja) * | 1991-11-18 | 1993-10-22 | Internatl Business Mach Corp <Ibm> | コンピュータ・システムにおけるアクセスの正当性検証のための方法及びシステム |
NL9200297A (nl) * | 1992-02-18 | 1993-09-16 | Nederland Ptt | Methode voor toegangsbeveiliging van een dataterminal. |
US6081782A (en) * | 1993-12-29 | 2000-06-27 | Lucent Technologies Inc. | Voice command control and verification system |
WO1997023816A1 (en) * | 1995-12-21 | 1997-07-03 | Philips Electronics N.V. | User identification system for data processing equipment with keyboard |
-
2001
- 2001-12-12 EP EP01991007.4A patent/EP1470549B1/en not_active Expired - Lifetime
- 2001-12-12 CN CNB018234100A patent/CN1213398C/zh not_active Expired - Lifetime
- 2001-12-12 KR KR10-2004-7007200A patent/KR20040068548A/ko not_active Application Discontinuation
- 2001-12-12 JP JP2003551774A patent/JP4143541B2/ja not_active Expired - Fee Related
- 2001-12-12 AU AU2002230762A patent/AU2002230762A1/en not_active Abandoned
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009175984A (ja) * | 2008-01-23 | 2009-08-06 | Nippon Telegr & Teleph Corp <Ntt> | 本人認証装置、本人認証方法および本人認証プログラム |
JP2018509649A (ja) * | 2015-02-05 | 2018-04-05 | 北京得意音通技▲術▼有限▲責▼任公司Beijing D−Ear Technologies Co., Ltd. | 動的パスワード音声に基づいた自己学習機能を有する身分認証システム及び方法 |
JP2023503718A (ja) * | 2020-01-30 | 2023-01-31 | グーグル エルエルシー | 音声認識 |
JP7255032B2 (ja) | 2020-01-30 | 2023-04-10 | グーグル エルエルシー | 音声認識 |
Also Published As
Publication number | Publication date |
---|---|
EP1470549B1 (en) | 2019-04-10 |
AU2002230762A8 (en) | 2009-10-08 |
JP4143541B2 (ja) | 2008-09-03 |
EP1470549A1 (en) | 2004-10-27 |
CN1213398C (zh) | 2005-08-03 |
AU2002230762A1 (en) | 2003-06-23 |
KR20040068548A (ko) | 2004-07-31 |
EP1470549A4 (en) | 2007-08-08 |
CN1522431A (zh) | 2004-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6490560B1 (en) | Method and system for non-intrusive speaker verification using behavior models | |
US7689418B2 (en) | Method and system for non-intrusive speaker verification using behavior models | |
KR102151681B1 (ko) | 언어 모델용 대화 상태들 결정 | |
JP6561219B1 (ja) | 話者照合 | |
KR102026396B1 (ko) | 화자 검증을 위한 신경망들 | |
CN104143326B (zh) | 一种语音命令识别方法和装置 | |
US20170236520A1 (en) | Generating Models for Text-Dependent Speaker Verification | |
CN108989349B (zh) | 用户账号解锁方法、装置、计算机设备及存储介质 | |
CN105723450A (zh) | 用于话语检测的包络比较 | |
JPWO2006109515A1 (ja) | 操作者認識装置、操作者認識方法、および、操作者認識プログラム | |
TW202018696A (zh) | 語音識別方法、裝置及計算設備 | |
JP4143541B2 (ja) | 動作モデルを使用して非煩雑的に話者を検証するための方法及びシステム | |
KR20230116886A (ko) | 페이크 오디오 검출을 위한 자기 지도형 음성 표현 | |
KR20230070523A (ko) | 텍스트 종속 화자 검증 피처들의 자동 생성 및/또는 사용 | |
JP5646675B2 (ja) | 情報処理装置及び方法 | |
JP6996627B2 (ja) | 情報処理装置、制御方法、及びプログラム | |
CN117378006A (zh) | 混合多语种的文本相关和文本无关说话者确认 | |
Maes et al. | Conversational speech biometrics | |
JPWO2018088534A1 (ja) | 電子機器、電子機器の制御方法及び電子機器の制御プログラム | |
JP4245948B2 (ja) | 音声認証装置、音声認証方法及び音声認証プログラム | |
CN110895938B (zh) | 语音校正***及语音校正方法 | |
JP2020154061A (ja) | 話者識別装置、話者識別方法およびプログラム | |
Ceaparu et al. | Multifactor voice-based authentication system | |
CN112037772B (zh) | 基于多模态的响应义务检测方法、***及装置 | |
Madhusudhana Rao et al. | Machine hearing system for teleconference authentication with effective speech analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040812 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070612 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070912 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070912 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20080108 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080404 |
|
A911 | Transfer to examiner for re-examination before appeal (zenchi) |
Free format text: JAPANESE INTERMEDIATE CODE: A911 Effective date: 20080513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080610 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080616 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4143541 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
S202 | Request for registration of non-exclusive licence |
Free format text: JAPANESE INTERMEDIATE CODE: R315201 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110620 Year of fee payment: 3 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120620 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130620 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |