JP7326983B2 - 情報処理装置及び情報処理プログラム - Google Patents
情報処理装置及び情報処理プログラム Download PDFInfo
- Publication number
- JP7326983B2 JP7326983B2 JP2019148427A JP2019148427A JP7326983B2 JP 7326983 B2 JP7326983 B2 JP 7326983B2 JP 2019148427 A JP2019148427 A JP 2019148427A JP 2019148427 A JP2019148427 A JP 2019148427A JP 7326983 B2 JP7326983 B2 JP 7326983B2
- Authority
- JP
- Japan
- Prior art keywords
- authentication
- characters
- character
- voice
- displayed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- User Interface Of Digital Computer (AREA)
Description
請求項1の発明は、複数の文字を含む文字列について、該文字列内の一文字又は複数文字を表示するように制御する表示制御手段と、前記表示制御手段によって表示された文字を発声したユーザーの音声を受け付ける受付手段と、一文字又は複数文字の音声毎に認証する第1認証手段と、前記第1認証手段による複数の認証結果に対して予め定められた規則を適用することによって、前記音声を発したユーザーを認証する第2認証手段を有する情報処理装置である。
<第1の実施の形態>
図1は、第1の実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(「ソフトウェア」の解釈として、コンピュータ・プログラムを含む)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、それらのモジュールとして機能させるためのコンピュータ・プログラム(例えば、コンピュータにそれぞれの手順を実行させるためのプログラム、コンピュータをそれぞれの手段として機能させるためのプログラム、コンピュータにそれぞれの機能を実現させるためのプログラム)、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するという意味である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(例えば、データの授受、指示、データ間の参照関係、ログイン等)の場合にも用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態にしたがって、又はそれまでの状況・状態にしたがって定まることの意を含めて用いる。「予め定められた値」が複数ある場合は、それぞれ異なった値であってもよいし、2以上の値(「2以上の値」には、もちろんのことながら、全ての値も含む)が同じであってもよい。また、「Aである場合、Bをする」という記載は、「Aであるか否かを判断し、Aであると判断した場合はBをする」の意味で用いる。ただし、Aであるか否かの判断が不要である場合を除く。また、「A、B、C」等のように事物を列挙した場合は、断りがない限り例示列挙であり、その1つのみを選んでいる場合(例えば、Aのみ)を含む。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(「ネットワーク」には、一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。もちろんのことながら、「システム」には、人為的な取り決めである社会的な「仕組み」(つまり、社会システム)にすぎないものは含まない。
また、各モジュールによる処理毎に又はモジュール内で複数の処理を行う場合はその処理毎に、対象となる情報を記憶装置から読み込み、その処理を行った後に、処理結果を記憶装置に書き出すものである。したがって、処理前の記憶装置からの読み込み、処理後の記憶装置への書き出しについては、説明を省略する場合がある。なお、ここでの記憶装置としては、ハードディスクドライブ、RAM(Random Access Memoryの略)、外部記憶媒体、通信回線を介した記憶装置、CPU(Central Processing Unitの略)内のレジスタ等を含んでいてもよい。
なお、そのセキュリティレベルは、ユーザーが用いる機能に応じて決定してもよい。ここで「ユーザーが用いる機能」は、認証前にユーザーが用いる機能を選択させればよい。例えば、複写の機能を用いる場合は、3文字の文字列を生成し、ファックス受信の機能を用いる場合は、6文字の文字列を生成するようにしてもよい。また、そのセキュリティレベルは、ユーザーが指定する処理量に応じて決定してもよい。ここで「ユーザーが指定する処理量」は、認証前に、ユーザーに処理量を入力させればよい。例えば、1枚の複写である場合は、3文字の文字列を生成し、10枚の複写である場合は、6文字の文字列を生成するようにしてもよい。
文字列生成モジュール105が生成する文字列は、数字列であってもよいし、英字列であってもよいし、カタカナ等の文字列であってもよい。例えば、数字列である場合は、0~9の文字のうち、文字列生成モジュール105は、セキュリティレベルに応じた文字数の数字をランダムに選択してもよい。ランダムに選択しているので、同じ文字列が表示される可能性は低く、以前に認証された音声の録音を使用しても認証させることは困難である。また、文字列生成モジュール105は過去に使用した文字列を記憶しておき、その過去に使用した文字列以外の文字列を生成するようにしてもよい。
また、表示制御モジュール110は、文字列内の一文字又は複数文字を複数回に分けて、表示装置115に表示させるよう制御するようにしてもよい。ここで、「複数回に分けて」とは、次の一文字又は複数文字を表示する場合には、前回に表示していた一文字又は複数文字を非表示にすることを含む。つまり、表示装置115に表示する「一文字又は複数文字」は、1つの「一文字又は複数文字」である。
また、表示制御モジュール110は、表示する文字の読み仮名をも、表示装置115に表示させるよう制御するようにしてもよい。表示する文字に複数の読みがある場合であっても、ユーザーによる読みを統一させるようにするためである。例えば、「1」と表示した場合、「イチ」、「ヒトツ」等のように複数の読みがあるが、「イチ」と表示させたい場合は、「1」とともに「イチ」と表示させる。
また、予め定められた時間内に、音声受付モジュール120が音声を受け付けなかった場合、又は、認証(A)モジュール130による認証が行われなかった場合、表示制御モジュール110は、次の文字を、表示装置115に表示させるよう制御するようにしてもよい。
また、表示制御モジュール110は、文字列生成モジュール105によって生成された文字列内の一文字又は複数文字を、表示装置115に表示するよう制御するようにしてもよい。以下、例示する場合は、文字列生成モジュール105によって生成された文字列内の一文字を順に、表示装置115に表示するように制御する場合について説明する。
ここでの認証は、音声を用いたユーザーの認証であり、いわゆる声紋認証である。そして、音声認識も行っている。
また、認証(A)モジュール130は、表示制御モジュール110によって表示された文字毎に認証を行うようにしてもよい。具体的には、認証(A)モジュール130は、一文字又は複数文字の音声毎に、その音声の認識を行う。その音声の認識結果が、表示制御モジュール110によって表示するように制御された「一文字又は複数文字」、つまり、表示装置115によって表示されている「一文字又は複数文字」と同じであるか否かを判断する。同じであった場合に、声紋認証を行う。認証(A)モジュール130による認証失敗として、表示装置115によって表示されている「一文字又は複数文字」が異なる場合、声紋認証ができなかった場合、声紋認証はできたが、前回の声紋認証とは異なるユーザーとなった場合が該当する。なお、ここでの「声紋認証できた」とは、予め定められたユーザーの音声であることである。また、「前回の声紋認証」とは、1回のユーザー認証にあたって、表示装置115によって表示されている「一文字又は複数文字」が複数回ある場合における前回である。もちろんのことながら、1回のユーザー認証にあたって、最初の声紋認証においては、前回の声紋認証はない。もちろんのことながら、1回のユーザー認証にあたって、表示装置115によって表示されている「一文字又は複数文字」が複数回ある場合、全回の声紋認証の結果が同じユーザーの認証とならないと、ユーザー認証モジュール125による認証は成功しない。
また、認証(A)モジュール130は、図11の例を用いて後述する機械学習装置(B)1100によって生成された学習モデルであって、表示制御モジュール1110によって表示された一文字又は複数文字に対応する学習モデルを用いて、認証を行うようにしてもよい。
また、認証(B)モジュール135は、予め定められた回数の認証(A)モジュール130による認証失敗があった場合は、認証失敗とするようにしてもよい。「予め定められた規則」の一例として、「予め定められた回数の認証(A)モジュール130による認証失敗があった場合は、認証失敗とする」ことが定められている。この他に、「予め定められた規則」として、「認証(A)モジュール130による認証失敗が続けてX回以上ある場合は、認証失敗とする」等としてもよい。
図2(a)の例に示す画像処理装置200は、情報処理装置100を有している。ユーザーは、画像処理装置200の複写、プリント等の機能を利用するために、情報処理装置100によって認証される必要がある。ユーザーは、情報処理装置100によって表示された文字を読み上げ、その音声をマイクで受け付けて認証を行う。つまり、ユーザーは、予め定められたパスワードを発声するのではなく、その場で表示された文字を読み上げることによって認証される。
機械学習装置(A)700、機械学習装置(B)1100は、ユーザーの音声の機械学習を行って、情報処理装置100の認証(A)モジュール130の機能を発揮する学習モデルを生成する。機械学習は、ニューラルネットワークをつくる「学習フェーズ」と、できあがったニューラルネットワークを使って正解を出す「予測フェーズ」の2つに分かれるが、学習フェーズは機械学習装置(A)700又は機械学習装置(B)1100で行われ、予測フェーズは情報処理装置100の認証(A)モジュール130で行われる。つまり、機械学習装置(A)700又は機械学習装置(B)1100による学習によって生成された学習モデルを、画像処理装置200の情報処理装置100に送信し、情報処理装置100は、その学習モデルを認証(A)モジュール130として用いる。
以下に示す例では、「複数の文字を含む文字列」をパスワードと称する。パスワードの一例として、複数の数字によって構成されている場合を示す。また、表示装置115に表示する「文字列内の一文字又は複数文字」として、そのパスワードの数字を1桁ずつ順に表示する例を示す。
ステップS304では、ユーザー認証画面にパスワードを1桁表示する。
ステップS308では、タイムアウト時間が経過したか否かを判断し、経過した場合はステップS304へ戻り、それ以外の場合はステップS310へ進む。パスワードを構成する1桁の数字を表示した時からの時間を計時し、予め定められた時間を過ぎた場合を、タイムアウト時間が経過したと判断する。タイムアウト時間は、任意に設定することができる。例えば、2秒等としてもよい。
ステップS312では、認証条件に合致するか否かを判断し、合致する場合はステップS314へ進み、それ以外の場合はステップS304へ戻る。例えば、認証条件として、ステップS302で生成されたパスワードのうち予め定められた文字数以上で、ステップS310の判断でOKとなっていることを認証条件としてもよい。その一例として、ステップS302で生成されたパスワードの全部の数字で、ステップS310の判断でOKとなっていることを認証条件としてもよい。
ステップS316では、失敗可能回数に達したか否かを判断し、達した場合はステップS318へ進み、それ以外の場合はステップS304へ戻る。前述したように、失敗可能回数は、このフローチャートにおける処理における失敗の回数であってもよいし、失敗が連続した回数であってもよい。失敗可能回数は、任意に設定することができる。例えば、3回等としてもよい。
ステップS318では、認証失敗とする。つまり、ログインは不成功であり、このユーザーは画像処理装置200を使用することができない。
ステップS304での表示例を示すものである。画像処理装置200に備え付けられている液晶ディスプレイ、有機ELディスプレイ等の表示装置に表示する。
ユーザー認証画面400には、パスワード表示領域410、残時間表示領域420を表示する。
パスワード表示領域410には、パスワード文字表示領域412、読み表示領域414を表示する。パスワード文字表示領域412には、パスワードの1桁の数字を表示する。読み表示領域414には、その数字の読みを表示する。数字「4」について、ユーザーによる発声を「ヨン」に統一させるようにしている。
残時間表示領域420は、パスワード文字表示領域412に数字を表示させた時からの経過時間を示すものである。この例では、時間が経過するとバーが左から右に伸びていき、右端に達した場合がステップS308で、タイムアウト時間が経過したことを示しており、ユーザーは経過時間がわかる。
ユーザー認証画面400における表示遷移の例を示している。この例では、4桁以上で声紋認証ができ、ステップS316における失敗可能回数を3回としている。なお、各画面の切り替えは、規定時間毎に切り替えてもよいし、その画面に表示している1桁の数字における認証の成功、又は、失敗が判明した時点で切り替えるようにしてもよい。
ユーザー認証画面400-a1のパスワード文字表示領域412に「4」、読み表示領域414に「ヨン」と表示する。声紋認証ができたので、ユーザー認証画面400-a2を表示する。
ユーザー認証画面400-a2のパスワード文字表示領域412に「1」、読み表示領域414に「イチ」と表示する。声紋認証ができ、ユーザー認証画面400-a1での声紋認証のユーザーと同じであるので、ユーザー認証画面400-a3を表示する。
ユーザー認証画面400-a3のパスワード文字表示領域412に「5」、読み表示領域414に「ゴ」と表示する。声紋認証ができ、ユーザー認証画面400-a2での声紋認証のユーザーと同じであるので、ユーザー認証画面400-a4を表示する。
ユーザー認証画面400-a4のパスワード文字表示領域412に「6」、読み表示領域414に「ロク」と表示する。声紋認証ができ、ユーザー認証画面400-a3での声紋認証のユーザーと同じであり、4桁の声紋認証ができたので、認証成功とする。
ユーザー認証画面400-b1のパスワード文字表示領域412に「4」、読み表示領域414に「ヨン」と表示する。声紋認証ができたので、ユーザー認証画面400-b2を表示する。
ユーザー認証画面400-b2のパスワード文字表示領域412に「1」、読み表示領域414に「イチ」と表示する。タイムアウト時間が経過したので、ユーザー認証画面400-b3を表示する。
ユーザー認証画面400-b3のパスワード文字表示領域412に「5」、読み表示領域414に「ゴ」と表示する。声紋認証ができ、ユーザー認証画面400-b1での声紋認証のユーザーと同じであるので、ユーザー認証画面400-b4を表示する。
ユーザー認証画面400-b4のパスワード文字表示領域412に「6」、読み表示領域414に「ロク」と表示する。声紋認証ができ、ユーザー認証画面400-b3での声紋認証のユーザーと同じであるので、ユーザー認証画面400-b5を表示する。
ユーザー認証画面400-b5のパスワード文字表示領域412に「9」、読み表示領域414に「キュウ」と表示する。声紋認証ができ、ユーザー認証画面400-b4での声紋認証のユーザーと同じであり、4桁の声紋認証ができたので、認証成功とする。
ユーザー認証画面400-c1のパスワード文字表示領域412に「4」、読み表示領域414に「ヨン」と表示する。声紋認証ができたので、ユーザー認証画面400-c2を表示する。
ユーザー認証画面400-c2のパスワード文字表示領域412に「1」、読み表示領域414に「イチ」と表示する。声紋認証ができ、ユーザー認証画面400-c1での声紋認証のユーザーと同じであるので、ユーザー認証画面400-c3を表示する。
ユーザー認証画面400-c3のパスワード文字表示領域412に「5」、読み表示領域414に「ゴ」と表示する。声紋認証できなかったので、ユーザー認証画面400-c4を表示する。
ユーザー認証画面400-c4のパスワード文字表示領域412に「6」、読み表示領域414に「ロク」と表示する。声紋認証ができ、ユーザー認証画面400-c2での声紋認証のユーザーと同じであるので、ユーザー認証画面400-c5を表示する。
ユーザー認証画面400-c5のパスワード文字表示領域412に「9」、読み表示領域414に「キュウ」と表示する。声紋認証ができ、ユーザー認証画面400-c4での声紋認証のユーザーと同じであり、4桁の声紋認証ができたので、認証成功とする。
ユーザー認証画面400-d1のパスワード文字表示領域412に「4」、読み表示領域414に「ヨン」と表示する。声紋認証ができたので、ユーザー認証画面400-d2を表示する。
ユーザー認証画面400-d2のパスワード文字表示領域412に「1」、読み表示領域414に「イチ」と表示する。タイムアウト時間が経過したので、ユーザー認証画面400-d3を表示する。
ユーザー認証画面400-d3のパスワード文字表示領域412に「5」、読み表示領域414に「ゴ」と表示する。声紋認証ができたので、ユーザー認証画面400-d4を表示する。
ユーザー認証画面400-d4のパスワード文字表示領域412に「6」、読み表示領域414に「ロク」と表示する。声紋認証ができ、ユーザー認証画面400-d3での声紋認証のユーザーと同じであるので、ユーザー認証画面400-d5を表示する。
ユーザー認証画面400-d5のパスワード文字表示領域412に「9」、読み表示領域414に「キュウ」と表示する。声紋認証ができ、ユーザー認証画面400-d4での声紋認証のユーザーと同じであるので、ユーザー認証画面400-d6を表示する。
ユーザー認証画面400-d6のパスワード文字表示領域412に「7」、読み表示領域414に「ナナ」と表示する。声紋認証ができ、ユーザー認証画面400-d5での声紋認証のユーザーと同じであり、連続して4桁の声紋認証ができたので、認証成功とする。
ユーザー認証画面400-e1のパスワード文字表示領域412に「4」、読み表示領域414に「ヨン」と表示する。声紋認証できなかったので、ユーザー認証画面400-e2を表示する。
ユーザー認証画面400-e2のパスワード文字表示領域412に「1」、読み表示領域414に「イチ」と表示する。声紋認証ができたので、ユーザー認証画面400-e3を表示する。
ユーザー認証画面400-e3のパスワード文字表示領域412に「5」、読み表示領域414に「ゴ」と表示する。声紋認証できなかったので、ユーザー認証画面400-e4を表示する。
ユーザー認証画面400-e4のパスワード文字表示領域412に「6」、読み表示領域414に「ロク」と表示する。声紋認証ができ、ユーザー認証画面400-e2での声紋認証のユーザーと同じであるので、ユーザー認証画面400-e5を表示する。
ユーザー認証画面400-e5のパスワード文字表示領域412に「9」、読み表示領域414に「キュウ」と表示する。声紋認証できず、その回数が3回に達したので、認証失敗とする。
ステップS604では、パスワード生成ルールにしたがって、パスワードを生成する。
ステップS608では、音声を受け付ける。
ステップS614では、認証条件に合致するか否かを判断し、合致する場合はステップS616へ進み、それ以外の場合はステップS606へ戻る。
ステップS618では、失敗可能回数に達したか否かを判断し、達した場合はステップS620へ進み、それ以外の場合はステップS622へ進む。
ステップS622では、パスワード生成ルールにしたがって、パスワードを変更し、ステップS606へ戻る。
(1)全てのデータを一括で学習・推論する方法(第2の実施の形態に該当する)
・声紋データの認証のための学習をする場合に、文字毎に付加データを加える。
・推論時に取得した声紋データに、表示されている文字に対応する付加データを加えて推論を実施する。
(2)1文字ごとに学習・推論する方法(第3の実施の形態に該当する)
図7は、第2の実施の形態の構成例についての概念的なモジュール構成図である。
機械学習装置(A)700は、文字列生成モジュール705、表示制御モジュール710、表示装置715、音声受付モジュール720、機械学習モジュール725、送信モジュール740を有している。
表示装置715は、表示制御モジュール710と接続されている。表示装置715は、図1の例に示した情報処理装置100の表示装置115と同等の機能を有している。
ここで、「予め定められたユーザー」は、認証対象のユーザーである。具体的には、対象とする機器又はサービスの利用が許可されるユーザーである。
声紋データの学習方法として、Aさん、Bさん、Cさん、Dさんの4人分の数字「0」から「9」を読み上げた声紋データである学習単位データ800を用いて、機械学習装置(A)700は学習を行う。つまり、図8の例に示す学習単位データ800として、40文字の学習を一括で行うようにしている。ただし、その際に、各数字の声紋データに付加データを加えている。具体的には、図9の例に示すように、「0」の声紋データ910aに付加データ910bである「0x00」を加え、「1」の声紋データ911aに付加データ911bである「0x10」を加え、「2」の声紋データ912aに付加データ912bである「0x20」を加え、「3」の声紋データ913aに付加データ913bである「0x30」を加え、「4」の声紋データ914aに付加データ914bである「0x40」を加え、「5」の声紋データ915aに付加データ915bである「0x50」を加え、「6」の声紋データ916aに付加データ916bである「0x60」を加え、「7」の声紋データ917aに付加データ917bである「0x70」を加え、「8」の声紋データ918aに付加データ918bである「0x80」を加え、「9」の声紋データ919aに付加データ919bである「0x90」を加えて、学習データとしている。なお「0x」は、その後に続く数字は16進数であることを示している。
学習単位データ800を用いて学習を行うので、生成される学習モデルも1つである。
まず、ユーザー認証画面400に「パスワードを発音してください」と表示する。
次に、ユーザー認証画面400に「0(ゼロ)」と表示する。それを見たユーザー1010は「0」1012aと読み上げる。音声受付モジュール120は、声紋データ1020aを受け付ける。そして、声紋データ1020aに付加データ1030aを加えて、合成データ1040aを生成する。機械学習装置(A)700によって生成された学習モデル1050を用いて、合成データ1040aはユーザー1010による認識結果「0」1060aと認証する。なお、付加データ1030aは、声紋データ1020aを受け付けた際にユーザー認証画面400に表示されていた「0」に対応する付加データ910bである。
次に、ユーザー認証画面400に「8(ハチ)」と表示する。それを見たユーザー1010は「8」1012bと読み上げる。音声受付モジュール120は、声紋データ1020bを受け付ける。そして、声紋データ1020bに付加データ1030bを加えて、合成データ1040bを生成する。機械学習装置(A)700によって生成された学習モデル1050を用いて、合成データ1040bはユーザー1010による認識結果「8」1060bと認証する。なお、付加データ1030bは、声紋データ1020bを受け付けた際にユーザー認証画面400に表示されていた「8」に対応する付加データ918bである。
次に、ユーザー認証画面400に「7(ナナ)」と表示する。それを見たユーザー1010は「7」1012cと読み上げる。音声受付モジュール120は、声紋データ1020cを受け付ける。そして、声紋データ1020cに付加データ1030cを加えて、合成データ1040cを生成する。機械学習装置(A)700によって生成された学習モデル1050を用いて、合成データ1040cはユーザー1010による認識結果「7」1060cと認証する。なお、付加データ1030cは、声紋データ1020cを受け付けた際にユーザー認証画面400に表示されていた「7」に対応する付加データ917bである。
次に、ユーザー認証画面400に「3(サン)」と表示する。それを見たユーザー1010は「3」1012dと読み上げる。音声受付モジュール120は、声紋データ1020dを受け付ける。そして、声紋データ1020dに付加データ1030dを加えて、合成データ1040dを生成する。機械学習装置(A)700によって生成された学習モデル1050を用いて、合成データ1040dはユーザー1010による認識結果「3」1060dと認証する。なお、付加データ1030dは、声紋データ1020dを受け付けた際にユーザー認証画面400に表示されていた「3」に対応する付加データ913bである。
図11は、第3の実施の形態の構成例についての概念的なモジュール構成図である。
機械学習装置(B)1100は、文字列生成モジュール1105、表示制御モジュール1110、表示装置1115、音声受付モジュール1120、機械学習モジュール1125、送信モジュール1140を有している。
文字列生成モジュール1105は、表示制御モジュール1110と接続されている。文字列生成モジュール1105は、図7の例に示した機械学習装置(A)700の文字列生成モジュール705と同等の機能を有している。
表示制御モジュール1110は、文字列生成モジュール1105、表示装置1115、機械学習モジュール1125の学習データ生成モジュール1130と接続されている。表示制御モジュール1110は、図7の例に示した機械学習装置(A)700の表示制御モジュール710と同等の機能を有している。
表示装置1115は、表示制御モジュール1110と接続されている。表示装置1115は、図7の例に示した機械学習装置(A)700の表示装置715と同等の機能を有している。
声紋データの学習方法として、Aさん、Bさん、Cさん、Dさんの4人分の数字「0」から「9」のそれぞれを読み上げた声紋データである学習単位データ1200、学習単位データ1201、学習単位データ1202、学習単位データ1203、学習単位データ1204、学習単位データ1205、学習単位データ1206、学習単位データ1207、学習単位データ1208、学習単位データ1209を用いて、機械学習装置(B)1100は学習を行う。つまり、学習単位データ1200を用いて学習モデルを生成し、学習単位データ1201を用いて学習モデルを生成し、学習単位データ1202を用いて学習モデルを生成し、学習単位データ1203を用いて学習モデルを生成し、学習単位データ1204を用いて学習モデルを生成し、学習単位データ1205を用いて学習モデルを生成し、学習単位データ1206を用いて学習モデルを生成し、学習単位データ1207を用いて学習モデルを生成し、学習単位データ1208を用いて学習モデルを生成し、学習単位データ1209を用いて学習モデルを生成して、合計10個の学習モデルを生成する。
まず、ユーザー認証画面400に「パスワードを発音してください」と表示する。
次に、ユーザー認証画面400に「0(ゼロ)」と表示する。それを見たユーザー1310は音声(0)1312aと読み上げる。音声受付モジュール120は、声紋データ1320aを受け付ける。そして、音声モデル(0)1350を用いて、声紋データ1320aはユーザー1310による認識結果(0)1360aと認証する。なお、音声モデル(0)1350は、声紋データ1320aを受け付けた際にユーザー認証画面400に表示されていた「0」に対応する学習モデルである。
次に、ユーザー認証画面400に「8(ハチ)」と表示する。それを見たユーザー1310は音声(8)1312bと読み上げる。音声受付モジュール120は、声紋データ1320bを受け付ける。そして、音声モデル(8)1358を用いて、声紋データ1320bはユーザー1310による認識結果(8)1360bと認証する。なお、音声モデル(8)1358は、声紋データ1320bを受け付けた際にユーザー認証画面400に表示されていた「8」に対応する学習モデルである。
次に、ユーザー認証画面400に「7(ナナ)」と表示する。それを見たユーザー1310は音声(7)1312cと読み上げる。音声受付モジュール120は、声紋データ1320cを受け付ける。そして、音声モデル(7)1357を用いて、声紋データ1320cはユーザー1310による認識結果(7)1360cと認証する。なお、音声モデル(7)1357は、声紋データ1320cを受け付けた際にユーザー認証画面400に表示されていた「7」に対応する学習モデルである。
次に、ユーザー認証画面400に「3(サン)」と表示する。それを見たユーザー1310は音声(3)1312dと読み上げる。音声受付モジュール120は、声紋データ1320dを受け付ける。そして、音声モデル(3)1353を用いて、声紋データ1320dはユーザー1310による認識結果(3)1360dと認証する。なお、音声モデル(3)1353は、声紋データ1320dを受け付けた際にユーザー認証画面400に表示されていた「3」に対応する学習モデルである。
なお、図14に示す情報処理装置100等のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図14に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、プロセッサーとして、GPU(Graphics Processing Unitの略、GPGPU(General-Purpose computing on Graphics Processing Unitsの略)を含む)を用いてもよいし、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(具体例として、ASIC(Application Specific Integrated Circuitの略)等がある)や再構成可能な集積回路(具体例として、FPGA(Field-Programmable Gate Arrayの略)等がある)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続している形態でもよく、さらに図14に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、特に、パーソナルコンピュータの他、携帯情報通信機器(携帯情報通信機器として、携帯電話、スマートフォン、モバイル機器、ウェアラブルコンピュータ等を含む)、情報家電、ロボット、複写機、ファックス、スキャナ、プリンタ、複合機(複合機とは、スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)等に組み込まれていてもよい。
なお、前述の各種の実施の形態を組み合わせてもよく、また、各モジュールの処理内容として背景技術で説明した技術を採用してもよい。例えば、第2の実施の形態による学習モデルと第3の実施の形態による学習モデルの2種類を生成しておき、認証(A)モジュール130は、その2つの学習モデルを切り替えて使用するようにしてもよい。具体的には、認証(A)モジュール130は、第2の実施の形態による学習モデルを用いた認証を行い、認証される率が予め定められた値よりも低い場合は、第3の実施の形態による学習モデルを用いた認証を行うようにしてもよい。また、この逆であってもよい。また、認証(A)モジュール130は、音声受付モジュール120が受け付けた音声に対して、第2の実施の形態による学習モデルと第3の実施の形態による学習モデルを用いた認証を行い、両者が合致する場合に、その文字におけるユーザーの認証が成功したとしてもよい。不一致の場合は、その文字におけるユーザーの認証は失敗としてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通等のために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD-R、DVD-RW、DVD-RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD-ROM)、CDレコーダブル(CD-R)、CDリライタブル(CD-RW)等、ブルーレイ・ディスク(Blu-ray(登録商標) Disc)、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM(登録商標))、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)、SD(Secure Digitalの略)メモリーカード等が含まれる。
そして、前記のプログラムの全体又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、又は無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分若しくは全部であってもよく、又は別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して記録されていてもよい。また、圧縮や暗号化等、復元可能であればどのような態様で記録されていてもよい。
105…文字列生成モジュール
110…表示制御モジュール
115…表示装置
120…音声受付モジュール
125…ユーザー認証モジュール
130…認証(A)モジュール
135…認証(B)モジュール
200…画像処理装置
290…通信回線
700…機械学習装置(A)
705…文字列生成モジュール
710…表示制御モジュール
715…表示装置
720…音声受付モジュール
725…機械学習モジュール
730…学習データ生成モジュール
735…学習モジュール
740…送信モジュール
1100…機械学習装置(B)
1105…文字列生成モジュール
1110…表示制御モジュール
1115…表示装置
1120…音声受付モジュール
1125…機械学習モジュール
1130…学習データ生成モジュール
1135…学習モジュール
1135a…学習モジュール
1135b…学習モジュール
1135c…学習モジュール
1140…送信モジュール
Claims (15)
- 複数の文字を含む文字列について、該文字列内の一文字又は複数文字を表示するように制御する表示制御手段と、
前記表示制御手段によって表示された文字を発声したユーザーの音声を受け付ける受付手段と、
一文字又は複数文字の音声毎に認証する第1認証手段と、
前記第1認証手段による複数の認証結果に対して予め定められた規則を適用することによって、前記音声を発したユーザーを認証する第2認証手段
を有し、
前記表示制御手段は、前記文字列内の一文字又は複数文字を複数回に分けて表示するように制御し、
前記第1認証手段は、前記表示制御手段によって表示された文字毎に認証を行い、
予め定められた時間内に、前記受付手段が音声を受け付けなかった場合、又は、前記第1認証手段による認証が行われなかった場合、前記表示制御手段は、次の文字の表示を行うように制御する、
情報処理装置。 - 前記第2認証手段は、予め定められた回数の前記第1認証手段による認証失敗があった場合は、認証失敗とする、
請求項1に記載の情報処理装置。 - 前記表示制御手段は、表示する文字の読み仮名をも表示するように制御する、
請求項1に記載の情報処理装置。 - 前記表示制御手段が表示対象とする前記文字列を、セキュリティレベルに応じて生成する生成手段
をさらに有し、
前記表示制御手段は、前記生成手段によって生成された前記文字列内の一文字又は複数文字を表示するように制御する、
請求項1に記載の情報処理装置。 - さらに、予め定められた一文字又は複数文字について、複数人の予め定められたユーザーによって発声された音声を受け付ける受付手段と、
前記一文字又は複数文字毎に予め定められた情報を前記音声に付加したデータを、認証するための学習データとして生成する生成手段と、
前記生成手段によって生成された学習データを用いて、音声を用いた認証用の学習を行って1つの学習モデルを生成する学習モデル生成手段
を有し、
前記第1認証手段は、前記学習モデル生成手段によって生成された学習モデルを用いて、認証を行う、
請求項1に記載の情報処理装置。 - さらに、予め定められた一文字又は複数文字について、複数人の予め定められたユーザーによって発声された音声を受け付ける受付手段と、
予め定められた一文字又は複数文字毎の前記音声を、認証するための学習データとして生成する生成手段と、
前記生成手段によって生成された学習データを用いて、音声を用いた認証用の学習を行って一文字又は複数文字毎の学習モデルを生成する学習モデル生成手段
を有し、
前記第1認証手段は、前記学習モデル生成手段によって生成された学習モデルであって、前記表示制御手段によって表示された一文字又は複数文字に対応する学習モデルを用いて、認証を行う、
請求項1に記載の情報処理装置。 - コンピュータを、
複数の文字を含む文字列について、該文字列内の一文字又は複数文字を表示するように制御する表示制御手段と、
前記表示制御手段によって表示された文字を発声したユーザーの音声を受け付ける受付手段と、
一文字又は複数文字の音声毎に認証する第1認証手段と、
前記第1認証手段による複数の認証結果に対して予め定められた規則を適用することによって、前記音声を発したユーザーを認証する第2認証手段
として機能させ、
前記表示制御手段は、前記文字列内の一文字又は複数文字を複数回に分けて表示するように制御し、
前記第1認証手段は、前記表示制御手段によって表示された文字毎に認証を行い、
予め定められた時間内に、前記受付手段が音声を受け付けなかった場合、又は、前記第1認証手段による認証が行われなかった場合、前記表示制御手段は、次の文字の表示を行うように制御する、
情報処理プログラム。 - 複数の文字を含む文字列について、該文字列内の一文字又は複数文字を表示するように制御する表示制御手段と、
前記表示制御手段によって表示された文字を発声したユーザーの音声を受け付ける受付手段と、
一文字又は複数文字の音声毎に認証する第1認証手段と、
前記第1認証手段による複数の認証結果に対して予め定められた規則を適用することによって、前記音声を発したユーザーを認証する第2認証手段
を有し、
前記表示制御手段は、表示する文字の読み仮名をも表示するように制御する、
情報処理装置。 - 前記表示制御手段は、前記文字列内の一文字又は複数文字を複数回に分けて表示するように制御し、
前記第1認証手段は、前記表示制御手段によって表示された文字毎に認証を行う、
請求項8に記載の情報処理装置。 - 前記第2認証手段は、予め定められた回数の前記第1認証手段による認証失敗があった場合は、認証失敗とする、
請求項9に記載の情報処理装置。 - 予め定められた時間内に、前記受付手段が音声を受け付けなかった場合、又は、前記第1認証手段による認証が行われなかった場合、前記表示制御手段は、次の文字の表示を行うように制御する、
請求項9に記載の情報処理装置。 - 前記表示制御手段が表示対象とする前記文字列を、セキュリティレベルに応じて生成する生成手段
をさらに有し、
前記表示制御手段は、前記生成手段によって生成された前記文字列内の一文字又は複数文字を表示するように制御する、
請求項8に記載の情報処理装置。 - さらに、予め定められた一文字又は複数文字について、複数人の予め定められたユーザーによって発声された音声を受け付ける受付手段と、
前記一文字又は複数文字毎に予め定められた情報を前記音声に付加したデータを、認証するための学習データとして生成する生成手段と、
前記生成手段によって生成された学習データを用いて、音声を用いた認証用の学習を行って1つの学習モデルを生成する学習モデル生成手段
を有し、
前記第1認証手段は、前記学習モデル生成手段によって生成された学習モデルを用いて、認証を行う、
請求項8に記載の情報処理装置。 - さらに、予め定められた一文字又は複数文字について、複数人の予め定められたユーザーによって発声された音声を受け付ける受付手段と、
予め定められた一文字又は複数文字毎の前記音声を、認証するための学習データとして生成する生成手段と、
前記生成手段によって生成された学習データを用いて、音声を用いた認証用の学習を行って一文字又は複数文字毎の学習モデルを生成する学習モデル生成手段
を有し、
前記第1認証手段は、前記学習モデル生成手段によって生成された学習モデルであって、前記表示制御手段によって表示された一文字又は複数文字に対応する学習モデルを用いて、認証を行う、
請求項8に記載の情報処理装置。 - コンピュータを、
複数の文字を含む文字列について、該文字列内の一文字又は複数文字を表示するように制御する表示制御手段と、
前記表示制御手段によって表示された文字を発声したユーザーの音声を受け付ける受付手段と、
一文字又は複数文字の音声毎に認証する第1認証手段と、
前記第1認証手段による複数の認証結果に対して予め定められた規則を適用することによって、前記音声を発したユーザーを認証する第2認証手段
として機能させ、
前記表示制御手段は、表示する文字の読み仮名をも表示するように制御する、
情報処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019148427A JP7326983B2 (ja) | 2019-08-13 | 2019-08-13 | 情報処理装置及び情報処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019148427A JP7326983B2 (ja) | 2019-08-13 | 2019-08-13 | 情報処理装置及び情報処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021033315A JP2021033315A (ja) | 2021-03-01 |
JP7326983B2 true JP7326983B2 (ja) | 2023-08-16 |
Family
ID=74675814
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019148427A Active JP7326983B2 (ja) | 2019-08-13 | 2019-08-13 | 情報処理装置及び情報処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7326983B2 (ja) |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000099090A (ja) | 1998-09-22 | 2000-04-07 | Kdd Corp | 記号列を用いた話者認識方法 |
JP2000148187A (ja) | 1998-11-18 | 2000-05-26 | Nippon Telegr & Teleph Corp <Ntt> | 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体 |
JP2004279770A (ja) | 2003-03-17 | 2004-10-07 | Kddi Corp | 話者認証装置及び判別関数設定方法 |
JP2006293804A (ja) | 2005-04-13 | 2006-10-26 | Lin Chyi Yeu | パスワードの入力及び認証システム |
JP2016099507A (ja) | 2014-11-21 | 2016-05-30 | 日本電信電話株式会社 | 音響特徴量変換装置、音響モデル適応装置、音響特徴量変換方法、音響モデル適応方法、およびプログラム |
US20180060552A1 (en) | 2016-08-25 | 2018-03-01 | Sensory, Incorporated | Voice-Based Liveness Verification |
US20180068102A1 (en) | 2016-09-05 | 2018-03-08 | International Business Machines Corporation | User authentication using prompted text |
JP2019504355A (ja) | 2016-03-29 | 2019-02-14 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | 数字音声認識における音声デコーディングネットワークを構築するための方法、装置及び記憶媒体 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2991144B2 (ja) * | 1997-01-29 | 1999-12-20 | 日本電気株式会社 | 話者認識装置 |
-
2019
- 2019-08-13 JP JP2019148427A patent/JP7326983B2/ja active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000099090A (ja) | 1998-09-22 | 2000-04-07 | Kdd Corp | 記号列を用いた話者認識方法 |
JP2000148187A (ja) | 1998-11-18 | 2000-05-26 | Nippon Telegr & Teleph Corp <Ntt> | 話者認識方法、その方法を用いた装置及びそのプログラム記録媒体 |
JP2004279770A (ja) | 2003-03-17 | 2004-10-07 | Kddi Corp | 話者認証装置及び判別関数設定方法 |
JP2006293804A (ja) | 2005-04-13 | 2006-10-26 | Lin Chyi Yeu | パスワードの入力及び認証システム |
JP2016099507A (ja) | 2014-11-21 | 2016-05-30 | 日本電信電話株式会社 | 音響特徴量変換装置、音響モデル適応装置、音響特徴量変換方法、音響モデル適応方法、およびプログラム |
JP2019504355A (ja) | 2016-03-29 | 2019-02-14 | テンセント・テクノロジー・(シェンジェン)・カンパニー・リミテッド | 数字音声認識における音声デコーディングネットワークを構築するための方法、装置及び記憶媒体 |
US20180060552A1 (en) | 2016-08-25 | 2018-03-01 | Sensory, Incorporated | Voice-Based Liveness Verification |
US20180068102A1 (en) | 2016-09-05 | 2018-03-08 | International Business Machines Corporation | User authentication using prompted text |
Also Published As
Publication number | Publication date |
---|---|
JP2021033315A (ja) | 2021-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Song et al. | Machine learning models that remember too much | |
JP6575132B2 (ja) | 情報処理装置及び情報処理プログラム | |
CN101496337B (zh) | 硬盘驱动器认证 | |
Bursztein et al. | Easy does it: More usable CAPTCHAs | |
US20090240949A9 (en) | Identity authentication based on keystroke latencies using a genetic adaptive neural network | |
EP3474179A1 (en) | Information processing apparatus, method for controlling same, and computer program | |
US20160142405A1 (en) | Authenticating a device based on availability of other authentication methods | |
US20220188706A1 (en) | Systems and methods for generating and applying a secure statistical classifier | |
CN108431842A (zh) | 用于对文件进行认证和验证的方法和服务器 | |
US20200314082A1 (en) | Authentication system using key identification information | |
JP7215242B2 (ja) | 画像処理装置及びプログラム | |
CN108770370A (zh) | 用于对文件进行认证和验证的方法和服务器 | |
US11126883B2 (en) | Character string recognition apparatus, and non-transitory computer readable medium | |
EP3528152A1 (en) | Method and apparatus for user authentication | |
JP7326983B2 (ja) | 情報処理装置及び情報処理プログラム | |
US8314955B2 (en) | Apparatus and method for requesting password re-entry for external-device display and not requesting password re-entry for image display on display unit of the apparatus | |
CN104683622A (zh) | 信息处理装置及其控制方法 | |
US20190020773A1 (en) | Information processing apparatus, method for controlling information processing apparatus, and recording medium | |
JP2006344185A (ja) | 認証サーバおよび認証プログラム | |
US20230289735A1 (en) | Apparatus and methods for screening users | |
US10621332B2 (en) | Computer system, IoT device monitoring method, and program | |
JP7202951B2 (ja) | 不正リモートログイン検知装置、方法、及びプログラム | |
US20210203795A1 (en) | Communication system including image forming apparatus and information processing apparatus, and configured to realize linkage between chat function and user note function | |
CN107770409A (zh) | 认证装置 | |
Azimpourkivi et al. | Human distinguishable visual key fingerprints |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220721 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230215 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230221 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230419 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230516 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230621 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230717 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7326983 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |