JP5516620B2 - 照合処理装置及びその制御方法、並びにコンピュータ・プログラム - Google Patents

照合処理装置及びその制御方法、並びにコンピュータ・プログラム Download PDF

Info

Publication number
JP5516620B2
JP5516620B2 JP2012052543A JP2012052543A JP5516620B2 JP 5516620 B2 JP5516620 B2 JP 5516620B2 JP 2012052543 A JP2012052543 A JP 2012052543A JP 2012052543 A JP2012052543 A JP 2012052543A JP 5516620 B2 JP5516620 B2 JP 5516620B2
Authority
JP
Japan
Prior art keywords
data
collation
verification
failure
processor
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012052543A
Other languages
English (en)
Other versions
JP2013186776A (ja
Inventor
章 山中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2012052543A priority Critical patent/JP5516620B2/ja
Publication of JP2013186776A publication Critical patent/JP2013186776A/ja
Application granted granted Critical
Publication of JP5516620B2 publication Critical patent/JP5516620B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Techniques For Improving Reliability Of Storages (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は、例えばデータを照合する照合処理装置等の障害を回避する技術分野に関する。
今日、たとえば個人の識別のために、得られた指紋などのデータを複数の登録済みのデータと照らし合わせる照合処理装置が用いられている。
係る照合処理装置は、照合の正確性や大量の登録済みデータとの照合の迅速性はもとより、その用途から照合処理システムとしての可用性が高いこと、すなわちシステムが常に利用可能な状態であることが求められている。
係る照合処理装置では、照合を正確かつ高速に実行するために、高並列の照合プロセッサを用いて、たとえばパターン認識技術などによりデータの照合を行っている。なお、高並列とは、個別メモリを備えた複数台の照合プロセッサを用いて入力されたデータを並列的に高速処理する手法の一つである。
そして上位装置である外部装置は、照合の対象とする被照合データ(つまり、Searchデータ。以下、「Sデータ」と称する)を、高並列の複数の照合プロセッサが有する各々のメモリにあらかじめ転送する。さらに外部装置は、照合する複数の登録済み照合データ(つまり、Fileデータ。以下、「Fデータ」と称する)を各照合プロセッサのメモリに順次転送することによって、Sデータとの照合を並列的に行うことにより高速処理を実現する。
一方で、係る照合処理装置を構成する複数の照合プロセッサのうち、何れかの照合プロセッサにおいて障害が発生すると、当該照合プロセッサへ転送していたデータは消失する可能性がある。その際に、消失したデータは、再度、外部装置から照合処理装置内の故障していない別の照合プロセッサのメモリへ転送しなおす必要があるので、処理を再開するのに時間を要することにより、可用性が低下するという問題がある。
また、仮に照合処理装置ごと二重化していたとしても、搭載している照合プロセッサが故障する可能性があるならば、システム全体を無停止にすることは困難である。
このような問題を解決するため、特許文献1に記載の技術は、外部装置があらかじめ転送したSデータのコピーとFデータのコピーを他のプロセッサのメモリにも格納しておき、何れかのプロセッサに障害が発生した際は、他のプロセッサのメモリにも格納しておいたSデータのコピーとFデータのコピーとを、他の故障していないプロセッサの何れかにおいて改めて読込むことによって、データ照合処理を続行する方法を開示する。
特開2010−182141号公報
特許文献1が参照する一般的な技術には、複数のモジュールで分散処理するデータベースにおいて、現用データベースを保持するメモリの内容が壊れた際に、管理用サーバから現用データベースのコピーである予備データベースを予備モジュールへ転送することにより処理を継続することが記載されている。
これは特許文献1が参照する一般的な技術では、管理用サーバから予備モジュールへ予備データベースを転送し直すと共に切り替えるのに時間がかかり、かつ切り替え中はデータベースにアクセスができないので、その課題を解決しようとするものである。
特許文献1では、予め現用データベースの予備データベースを各モジュール内に配置するため、切替え時に、切替え管理用サーバから複数モジュールへのデータ転送が不要になる。 このためデータベースアクセスができなくなる時間が短縮される。
しかしながら、特許文献1に記載の技術は、全てのプロセッサのメモリに格納されているデータのコピーを他のプロセッサで保持する必要がある。すなわち、装置全体で照合情報を格納するためのメモリ容量が2倍必要となり、そのために装置のコストが増大するという問題があり、故障の予測に基づいて必要最小限のデータを保持しようとしているわけではない。
そのため、外部装置からの指示に基づいてFデータの入れ替えが頻繁に発生するような運用を行うシステムにおいては、データの入れ替え作業の時間が膨大になると共に、運用効率が著しく低下するので、特許文献1が開示する手法は、このような運用形態には適用できないという問題がある。
本発明の主たる目的は、上述した課題を解決するために、
照合プロセッサの故障の発生を予測しつつ、故障が発生した際に、短時間で復旧すると共に、復旧に要するメモリやデータ転送などの処理資源の占有量を抑制することができる照合処理装置の制御装置等を提供することである。
本発明は、上述した課題の解決を目的としてなされた。即ち、本発明に係る照合処理装置は、データを照合する複数の処理部の状態を診断する診断情報に基づいて、該複数の処理部のうち特定の処理部の故障の予兆を検知した際に、該特定の処理部に転送するデータを記憶デバイスにも格納すると共に、前記特定の処理部が故障した際には、前記記憶デバイスに格納した前記データを故障の予兆を検知していない他の処理部に転送すると共に該他の処理部による照合処理を指示する。
なお、同目的は、上記構成を有する照合処理装置の制御方法、並びにその障害回避方法を、コンピュータによって実現するコンピュータ・プログラム、およびそのコンピュータ・プログラムが格納されている、コンピュータ読取り可能な記憶媒体によっても達成される。
また、同目的を解決する本発明の他の見地である照合処理システムは、上述した処理部の故障予測に基づいて当該故障が予測された処理部のデータを記憶デバイスにも格納するとともに、当該故障が予測された処理部において故障が発生した場合に、記憶デバイスに格納したデータを故障が予測されていない他の処理部に転送することにより照合処理を行う方法を実現する機能に集積回路を適用すると共に、その集積回路を搭載する照合処理装置を制御して照合処理を行う系としての照合処理システムによっても達成される。
本発明によれば、照合プロセッサの故障の発生を予測しつつ、故障が発生した際に、短時間で復旧すると共に、復旧に要するメモリやデータ転送などの処理資源の占有量を抑制することができる。
本発明の第1の実施形態に係る照合処理装置の概要を示すブロック図である。 本発明の第2の実施形態に係る照合処理装置の詳細を示すブロック図である。 本発明の第2の実施形態に係る照合プロセッサの故障予兆の診断に基づいたデータのバックアップ動作を示すブロック図である。 本発明の第2の実施形態に係る照合プロセッサの故障予兆の診断に基づいたバックアップデータの転送動作を示すブロック図である。 本発明の第2の実施形態に係る一般的な照合処理装置の動作を示すフローチャートである。 本発明の第3の実施形態に係る照合処理装置の応用例を示すブロック図である。 本発明の第4の実施形態に係る照合処理装置の各制御機能に集積回路を用いた系としての照合処理システムを示すブロック図である。
以下、本発明を実施する形態について図面を参照して詳細に説明する。
<第1の実施形態>
本発明の第1の実施形態の構成について説明する。図1は、本発明の第1の実施形態に係る照合処理装置の概要を示すブロック図である。
本実施形態の照合処理装置1は、制御部2と、記憶デバイス3と、第1処理部4および第2処理部5からなる照合処理部8とからなる。また、制御部2は、第1処理部4および第2処理部5へ照合情報7である被照合データであるSデータおよび照合データであるFデータを転送する。また、制御部2は、第1処理部4もしくは第2処理部5から診断情報6を入手する。
つづいて本実施形態の照合処理装置1の動作について説明する。
本実施形態に係る照合処理装置1は、Sデータを複数のFデータと照合する処理部を複数有する照合処理部8の状態を調べた結果である診断情報6に基づいて、何れかの処理部の故障予兆を検知する制御部2は、その故障予兆を検知した何れかの処理部に転送するFデータを記憶デバイス3にも格納する。
それと共に、上述した故障予兆を検知した特定の処理部が故障した際には、制御部2は記憶デバイス3に格納しておいた複数のFデータを故障の予兆を検知していない他の処理部に転送すると共に、他の処理部による照合処理を指示する。
すなわち本実施形態によれば、何れかの処理部が故障したとしても、他の故障の予兆がない処理部に記憶デバイスが保持するFデータを転送することにより、Fデータの喪失を防ぐと共に、図示していない外部装置から改めてFデータを転送し直す必要がないので、復旧処理を迅速に行うことができるという効果を奏することができる。
また、故障の予兆の判定をした処理部のみのFデータを、予め記憶デバイスにバックアップするので、復旧および照合処理継続のために必要な記憶デバイスやデータ転送などの処理資源の占有量は最小限で済ませることができるという効果を奏することができる。
さらに、制御部が故障の予兆を診断した後も、実際に故障が発生するまでは、照合処理を継続することができるため、性能低下の期間を抑制できるという効果を奏することができる。
なお、本実施形態における記憶デバイスには、読書き可能なメモリ等を用いてもよい。
つまり、本実施形態によれば、照合処理部の故障の発生を予測しつつ、故障が発生した際に、短時間で復旧すると共に、復旧に要するメモリやデータ転送などの処理資源の占有量を抑制することができる。
以上、本発明の第1の実施形態として、上述した構成および動作を例に説明したが、本発明は、必ずしも係る構成や動作には限定されない。
<第2の実施形態>
次に、第1の実施形態を基本とする本発明の第2の実施形態について図2乃至図5を参照して詳細に説明する。図2は、本発明の第2の実施形態に係る照合処理装置の詳細を示すブロック図である。
本実施形態の照合処理装置1は、外部装置20に接続されており、その外部装置20からの照合情報7である図示していないSデータおよびFデータとのデータ転送および、照合の指示を受け取る。また、照合処理装置1は、全体制御部10と複数個の照合プロセッサである照合プロセッサA15、照合プロセッサB18、・・・、および照合プロセッサn19(nは整数。以下、同様)から構成される。
また、照合処理装置1の全体制御部10は、データ転送・照合指示制御部11、照合結果編集部12、全体メモリ13、診断制御部14とを備える。
また、照合処理装置1内の、各照合プロセッサである照合プロセッサA15、B18、・・・、n19は、SデータとFデータとを保持する照合メモリ16を各々で有している。
全体制御部10は、上述した外部装置20からのSデータおよびFデータとのデータ転送および、照合の指示を元にしてデータ転送・照合指示制御部11から、複数個の照合プロセッサに対して上述したデータ転送と照合指示を送出する。
具体的には、外部装置20は、全体制御部10内のデータ転送・照合指示制御部11に対して、まずSデータを転送する。そしてデータ転送・照合指示制御部11から各照合プロセッサに対して、そのSデータを転送する。
次に、外部装置20は、全体制御部10のデータ転送・照合指示制御部11に、複数のるFデータのデータセットを順次転送する。そしてデータ転送・照合指示制御部11は、各照合プロセッサA15、B18、・・・、n19の各々の照合メモリ16に順次割り振る。
そして、外部装置20から出力される、各照合プロセッサA15、B18、・・・、n19に対する照合指示に基づいてデータ転送・照合指示制御部11は、各照合プロセッサに対して順次照合指示を送出する。
それによって、先に外部装置20からデータ転送・照合指示制御部11を経て各照合プロセッサの照合メモリ16に転送しているSデータに対して、全体制御部10は同じく外部装置20からデータ転送・照合指示制御部11を経て各照合プロセッサの照合メモリ16に順次転送するFデータとの照合を逐次行い、その照合結果である照合結果情報9を全体制御部10の照合結果編集部12へ送出する。
また、各照合プロセッサA15、B18、・・・、n19は、各々診断部17を有しており、その各診断部17は、各照合プロセッサA15、B18、・・・、n19内の各々の照合メモリ16の読み書きの際のデータエラーを検出すると共に訂正することが可能なError Checking and Correction(以下、「ECC」と称する)エラーの検出と、各照合プロセッサA15、B18、・・・、n19の照合プロセッサ自身の稼動に伴う発生する熱の温度および、その温度で照合処理を実行した時間を積算した値の収集と計算を行う。
照合結果編集部12は、各照合プロセッサA15、B18、・・・、n19から送出された照合結果情報9を編集すると共に、外部装置20が照合処理装置1へ送出した全てのSデータおよびFデータとの図示していない照合結果をひとまとめに編集したのち、全体メモリ13へ格納する。
ここで、照合結果編集部12は、全体制御部10のデータ転送・照合指示部11から各照合プロセッサに対して転送した照合情報7と、その照合結果である照合結果情報9を把握しているので、照合処理の途中で、何れかの照合プロセッサが故障したか否かを知ることができる。
そして、外部装置20は、その照合結果を照合処理の完了後に全体メモリ13から引き取る。
また、全体制御部10が有する診断制御部14は、各照合プロセッサA15、B18、・・・、n19の各々の診断部17で得られた、各照合プロセッサA15、B18、・・・、n19の各々が備える照合メモリ16の検出および訂正可能エラーであるECCエラーの発生回数の情報を収集したその情報を元に、今後照合処理が不可能となるような故障が発生するか否かを予測する機能を有している。
同様に、診断制御部14は、各照合プロセッサA15、B18、・・・、n19の各々の診断部17で得られた、各照合プロセッサA15、B18、・・・、n19の各々の照合プロセッサ自身が発生する熱の温度および、その温度における動作時間の情報を収集したその情報を元に、今後照合処理が不可能となるような故障が発生するか否かを予測する機能を有している。
なお診断部17で収集する照合プロセッサの温度情報は、たとえば、照合プロセッサの半導体にあらかじめ内蔵する温度測定用のサーマルダイオードの電流―電圧特性の温度依存性を利用することにより、その電流−電圧特性の値を温度情報に変換した情報を用いてもよいし、照合プロセッサの発熱面に取り付けた外部温度センサからの温度情報を用いてもよい。
診断制御部14は、その故障の予測において前記ECCエラーおよび照合プロセッサ自身の温度とその温度での動作時間の各情報に、後述する重み付けを行って点数化し、その点数が、あらかじめ決めた閾値の点数を越えた場合に、故障予兆があるプロセッサと判断する。
具体的な例を示すと、ECCエラーの発生の際は1回あたり+1000ポイントを加点する。
また、各照合プロセッサの温度を照合プロセッサに内蔵する温度計測機能で測定した照合プロセッサの実測温度の平均値が、たとえば動作保障温度範囲の上限値の80%値を設定値としてその温度とのプラス方向の温度差、すなわち+ΔT℃(セ氏。以下、同様)と、その設定値を越えた温度で照合処理を行った時間Dの積算つまり(+ΔT × D)を加点する。
これらを合計した値があらかじめ定める閾値を越えた場合は、故障する可能性がある、すなわち故障予兆の照合プロセッサであると判断する。
たとえば、設定値を10℃越えて10時間運用した場合は、+100ポイントを加算するので、ECCエラーが1回発生した場合の合計は1100ポイントとなる。
ここで、たとえば、閾値を1500ポイントとして設定していれば、上述した合計値が1500ポイントを越えた時点で故障の可能性がある照合プロセッサとして故障予兆の判断を行うと共に、当該照合プロセッサでこれから処理しようとする外部装置20からデータ転送・照合指示制御部11を経て照合プロセッサの照合メモリ16に転送されるFデータは、全体メモリ13の照合プロセッサ用の図示していないバックアップ領域にも格納しておき、実際の当該照合プロセッサの故障発生の際に備える。
なお、上述した照合プロセッサの実測温度の平均値とは、たとえば10秒間の平均値などとすればよい。また実測温度の平均値と比較する対象は、たとえば、照合プロセッサの動作保障温度範囲の中央値や、中央値と上限値の間で照合処理装置1の設置環境に応じて決めればよい。
また、全体制御部10のデータ転送・照合指示制御部11と、各照合プロセッサが有する照合メモリ16との間でデータ転送する際に用いる図示していないキャッシュメモリにおけるECCエラーも故障予兆の対象として診断部17において診断するようにしてもよい。
なお、上述した故障の予兆を観測するパラメータおよび、その閾値は説明の都合上、一例としてあげているので上述したパラメータや閾値に限定しているわけではない。
次に、上述した本実施形態の構成にもとづいてその動作について説明する。図5に示す、本実施形態に係る一般的な照合処理装置の動作を示すフローチャートに基づいて、図2乃至図4のブロック図も参照しながら説明する。
まず、一般的な動作の流れについて以下に説明する。
照合処理装置1の全体制御部10は、外部装置20からの図2には図示していないSデータを受信する(ステップS1)。
次に、Sデータを受信した全体制御部10のデータ転送・照合指示制御部11は、全ての照合プロセッサA15、B18、・・・、n19に対して、その受信したSデータを転送する(ステップS2)。
次に、照合処理装置1の全体制御部10のデータ転送・照合指示制御部11は、外部装置20から、図2には図示していない複数のFデータと、その照合を指示する照合指示とを受信する(ステップS3)。ここで、複数のFデータとは、たとえば登録済みの生体データなどであれば、複数人数分のデータセット(すなわち、複数人数分)を表す。
そして、全体制御部10のデータ転送・照合指示制御部11は、複数あるFデータのうちの個々のFデータを処理の空いている照合プロセッサに順次に転送すると共に、順次、照合指示を出す(ステップS4)。
ここで、個々のFデータとは、たとえば登録済みの生体データなどであれば、1人分ずつのデータを表す。つまりデータ転送・照合指示制御部11は、各照合処理プロセッサごとに、1人分ずつのFデータを順次割り付ける。
また、全体制御部10がFデータを割り付ける先の、処理の空いている照合プロセッサとは、全体制御部10の照合結果編集部12が、処理を割り振った照合プロセッサと、その照合処理が終了したか否かを管理しているため、まだ処理を割り振っていないか、あるいは照合処理が終了した照合プロセッサのことを意味する。
次に、各照合プロセッサは、ステップS2で、データ転送・照合指示制御部11があらかじめ転送したSデータと、ステップ4で、データ転送・照合指示制御部11が処理の空いている照合プロセッサに個々に転送したFデータとの照合処理を実施すると共に、その個々の照合プロセッサの照合結果情報9を照合結果編集部12へ送出する(ステップS5)。
そして、照合結果編集部12は、各照合プロセッサから得られた個々の照合結果情報9を照合結果編集部12で編集することにより、外部装置20から照合処理装置1の全体制御部10に送出された全てのFデータの照合結果を作成する(ステップS6)。
最後に、全体制御部10は、外部装置20にステップS6で求めた照合結果を送信する(ステップS7)。
ここで、ステップS4もしくは、ステップS5において、何れかの照合プロセッサで故障が発生すると、当該照合プロセッサに転送されたSデータおよびFデータが消失してしまうことになる。
なお、一般的な照合処理では、全体制御部10は、どの照合プロセッサにどのFデータを転送したかの情報を管理していないため、外部装置20から転送された全てのFデータについて再度データを転送しなおし、最初から照合処理を実行しなおす必要がある。
次に、本実施形態における動作について、上述した一般的な動作の流れのとの違いを中心に図3および図4を用いて説明する。ここでは、診断制御部14が照合プロセッサA15で故障の可能性が高いと判断した場合の動作を例に説明する。
図3は本実施形態に係る照合プロセッサの故障予兆の診断に基づいたデータのバックアップ動作を示すブロック図である。
また、図4は、本実施形態に係る照合プロセッサの故障予兆の診断に基づいたバックアップデータの転送動作を示すブロック図である。
図3に示すように、データ転送・照合指示制御部11は、診断制御部14が診断情報6に基づいて照合プロセッサA15で故障が発生する可能性があると判断した場合、これから照合プロセッサA15の照合メモリ16へ転送する図示していないFデータを全体制御部10の全体メモリ13にも格納する(つまり、バックアップする)。
その際に、全体制御部10は、照合プロセッサA15が正常に動作することにより、照合プロセッサが照合結果情報9を照合結果編集部12へ送出した場合は、全体制御部10の全体メモリ13に格納したデータを破棄する(以下、同様)。
ここで、照合処理途中に照合プロセッサA15が故障した場合を考える。
何れかの照合プロセッサが故障に至ったか否かの判断は、データ転送・照合指示制御部11からの照合指示に対して、各照合プロセッサからの図示していない了解の応答が所定の期間までに来ないか、もしくは、照合処理の開始後、照合結果編集部12へ照合結情報9が所定の期間までに来ないことで判断する。
図4に示すように、全体制御部10は、照合プロセッサA15への照合指示に対する応答もしくは、照合処理を開始した後の照合結果情報9をそれぞれ所定の期間内に送出しない場合は、照合プロセッサA15が故障に至ったと判断する。そして全体制御部10のデータ転送・照合指示制御部11は、全体メモリ13のバックアップ領域に格納したFデータを全体メモリ13から他の故障の予兆がない照合プロセッサ(例えば照合プロセッサB18)の照合メモリ16へ転送すると共に、その照合プロセッサB18に対し照合指示を出す。
上記の手法により、照合処理の途中で何れかの照合プロセッサが故障した場合においても、Fデータを外部装置20から再送する必要がなくなり、また、バックアップ領域に格納するFデータも故障の可能性がある照合プロセッサの分だけでよいため、Fデータを格納するためのメモリ容量や、データの転送量とそれに伴うバスの占有率が少なくて済む。
なお、本実施形態では、Fデータのバックアップ領域への格納は、一例として全体制御部10の全体メモリ13の図示していないバックアップ領域に格納するように説明しているが、変形例として、そのFデータのサイズに応じて他の故障予兆のない照合プロセッサの照合メモリ16に格納するようにしてもよい。
すなわち本実施形態に係る照合処理装置によれば、何れかの処理部が故障したとしても、他の故障予兆がない処理部に全体メモリが保持するFデータを転送することにより、Fデータの喪失を防ぐと共に、外部装置から改めてFデータを転送し直す必要がないので、復旧処理を迅速に行うことができるという効果を奏することができる。
また、故障の予兆の判定をした処理部のみのFデータを、予め全体メモリにバックアップするので、復旧および照合処理継続のために必要なメモリ資源の占有量は最小限で済ませることができるという効果を奏することができる。
さらに、全体制御部の診断制御部が故障の予兆を診断した後も、実際に故障が発生するまでは、照合処理を継続することができるため、性能低下の期間を抑制できるという効果を奏することができる。
つまり、照合処理プロセッサの故障の発生を予測しつつ、故障が発生した際に、短時間で復旧すると共に、復旧に要するメモリやデータ転送などの処理資源の占有量を抑制することができる。
以上、本発明の第2の実施形態として、上述した構成および動作を例に説明したが、本発明は、必ずしも係る構成や動作には限定されない。
<第3の実施形態>
次に、第2の実施形態を基本とする、第3の実施形態について図6を参照して説明する。
図6は、本実施形態に係る照合処理装置の応用例を示すブロック図である。図6に示す本実施形態のブロック図は、全体制御部10に、閾値制御部25を追加している点が図2に示す第2の実施形態と異なる。
したがって、以下の説明において、第2の実施形態で説明した図2と同じ動作をする箇所は同一の符号を付し、説明を省略すると共に、本実施形態における上述した相違点を中心に、構成と動作および効果を説明する。
本実施形態では、故障の予兆をモニタリングする際のパラメータや、故障の予兆と判断する閾値は、本照合処理装置1を構成する全体制御部10が有する全体メモリ13のメモリの空き容量に応じて可変できる。つまり、Fデータの格納に使用することができる容量が多ければ、故障予兆であると判断する閾値を下げることにより、故障の予測をすることができるプロセッサの数を多くする。
これにより、より多くのFデータを格納することによって、耐故障性を向上することが可能となる。
全体制御部10の閾値制御部25は、全体メモリ13の全容量のうち、全体制御部10を含む照合処理装置1を制御するためのメモリ領域以外の領域をFデータのためのバックアップ領域とし、そのバックアップ領域が、ある容量より大きい場合は、第2の実施形態2で説明したように、故障予兆であると診断する閾値を下げる。
つまり、たとえばECCエラーの発生回数に基づくポイント値および照合プロセッサの動作保障温度範囲の上限値のたとえば80%である設定値から+ΔT℃を越えて運用した時間Dとの積算時間に基づくポイント値とを合算した合計ポイント値に対する閾値を下げる。
一例としては、故障の予兆を判断する閾値を1500ポイントから1200ポイントに下げることである。これにより、故障予兆のモニタリング条件を厳しくすることになるので、より多くの照合プロセッサの故障予兆をモニタリングすることができる。
これによって、全体制御部10は、複数の照合プロセッサのそれぞれのFデータを全体メモリ13のバックアップ領域にそれぞれの照合プロセッサごとに格納することにより、複数の照合プロセッサが故障した場合でも、故障の予兆がない他の照合プロセッサを代替先として、その照合メモリ16に転送するFデータを予め準備をしておくことができる。
そして故障が発生した場合は、速やかにそれぞれの照合プロセッサごとのFデータを全体メモリ13のバックアップ領域から転送することによって、外部装置20から転送し直すのとは異なり、ほぼ遅滞なく照合作業を続行することができる。
また、本実施形態の応用例として、図示していないCentral Processing Unit(中央処理装置以下、「CPU」と称する)と、チップセットと、読書き可能な不揮発性ストレージと、図2に示す全体メモリ13とからなる全体制御部10により制御する照合処理装置1を実現するために、上述した図2乃至図6に示すブロック図の各機能およびフローチャートの動作を、実現可能なApplication Program(以下、「AP」と称する)つまりコンピュータ・プログラムとして供給した後、そのコンピュータ・プログラムを全体制御部10による照合処理装置の制御方法として用意した上記CPUおよび協働するOperating System(以下、「OS」と称する)ならびにAPを、メモリに読出して実行することによって達成するようにしてもよい。
すなわち本実施形態に係る照合処理装置によれば、何れかの処理部が故障したとしても、他の故障予兆がない処理部にメモリが保持するFデータを転送することにより、照合データの喪失を防ぐと共に、外部装置から改めてFデータを転送し直す必要がないので、復旧処理を迅速に行うことができるという効果を奏することができる。
また、故障予兆の判定をした処理部のみのFデータを、予め全体メモリに格納するので、復旧および照合処理継続のために必要なメモリ資源の占有量は最小限で済ませることができるという効果を奏することができる。
さらに、全体制御部の診断制御部が故障の予兆を診断した後も、実際に故障が発生するまでは、照合処理を継続することができるため、性能低下の期間を抑制できるという効果を奏することができる。
その上、その複数の照合プロセッサに対応する全体メモリのFデータのバックアップ領域のサイズと、複数の照合プロセッサが故障の予兆のポイント値とをモニタリングしつつ、故障予兆の閾値を自動的に可変することによって、耐故障性と必要リソースとのバランスをとることができるという効果を奏することができる。
つまり、照合処理プロセッサの故障の発生を予測しつつ、故障が発生した際に、短時間で復旧すると共に、復旧に要するメモリやデータ転送などの処理資源の占有量を抑制することができる。
以上、本発明の第3の実施形態として、上述した構成および動作を例に説明したが、本発明は、必ずしも係る構成や動作には限定されない。
<第4の実施形態>
次に、第2乃至第3の実施形態を基本とする、第4の実施形態について説明する。
本実施形態について、図7に示す本実施形態に係る照合処理装置の各制御機能に集積回路を用いた系としての照合処理システムを示すブロック図を用いて説明する。
本実施形態は、たとえば、図6に示す照合処理装置の応用例における障害回避方法を実現する各機能を集積回路化した系としての照合処理システム30として捉えることができる。
つまり、図6に示す、データ転送・照合指示制御部11と、照合結果編集部12と、診断制御部14と、閾値制御チップ25の何れかの制御機能を集積回路として構成する点が異なる。
そのため、以下の説明において、第2乃至第3の実施形態で説明した、図2や図6に示すブロック図と同じ構成や、図5に示すフローチャートおよび、第2の実施形態、第3の実施形態において説明した内容と同じ動作をする箇所は、説明を省略すると共に、本実施形態における上述した相違点を中心に、構成と動作および効果を説明する。
本実施形態では、照合処理システム30における高並列の照合プロセッサを制御する全体制御部10が有する機能のうち、図6に示したデータ転送・照合指示制御部11と、照合結果編集部12と、診断制御部14および閾値制御部25の各制御機能を、図7に示したデータ転送・照合指示制御チップ31、照合結果編集チップ32および、診断・閾値制御チップ33を用いて実現する。なお、診断制御部14と閾値制御部25は別チップであってもかまわない。
なお、本実施形態における照合処理システム30の動作については、第2および第3の実施形態で照合処理装置1として説明している動作と同様であるので省略する。
そして、本照合処理システム30は、上述した基本となる実施形態の変形例として、現在では一般的な技術である集積回路を用いることにより、上述した基本となる実施形態の効果に加えて、小型化、低消費電力化が可能となると共に、これらに伴い、設置の自由度が向上するという効果も得ることもできる。
また、集積回路を用いることで照合処理システム30の全体制御部10が有する各機能の処理を高速に行うことができるという追加の効果も得ることができる。
また、上述した図6に示す機能ブロックを、照合処理システムの大きさや消費電力との兼ね合いに応じて、その一部を集積回路化すると共に、残りはソフトウェアにより処理するように分担する装置構成としてもよい。
すなわち本実施形態に係る照合処理装置によれば、何れかの処理部が故障したとしても、他の故障の予兆がない処理部にメモリが保持するFデータを転送することにより、照合データの喪失を防ぐと共に、外部装置から改めてFデータを転送し直す必要がないので、復旧処理を迅速に行うことができるという効果を奏することができる。
また、故障予兆の判定をした処理部のみのFデータを、予め全体メモリに格納するので、復旧および照合処理継続のために必要なメモリ資源の占有量は最小限で済ませることができるという効果を奏することができる。
さらに、全体制御部の診断制御部が故障の予兆を診断した後も、実際に故障が発生するまでは、照合処理を継続することができるため、性能低下の期間を抑制できるという効果を奏することができる。
また、複数の照合プロセッサに対応する全体メモリのFデータのバックアップ領域のサイズと、複数の照合プロセッサが故障の予兆のポイント値とをモニタリングしつつ、故障予兆の閾値を自動的に可変することによって、耐故障性と必要リソースとのバランスをとることができるという効果を奏することができる。
その上、全体制御部が有する各処理機能を集積回路化することで、小型化、低消費電力化および設置の自由度の向上および処理の高速化という追加の効果も奏するこができる。
つまり、照合処理プロセッサの故障の発生を予測しつつ、の故障が発生した際に、短時間で復旧すると共に、復旧に要するメモリやデータ転送などの処理資源の占有量を抑制することができる。
以上、本発明の第4の実施形態として、上述した構成および動作を例に説明したが、本発明は、必ずしも係る構成や動作には限定されない。
本発明は、上述した各実施形態には限定されず、被照合データと複数の照合データとの照合を行う、たとえば指紋、掌紋などの生体データなどの照合処理装置等に適用可能である。
1 照合処理装置
2 制御部
3 記憶デバイス
4 第1処理部
5 第2処理部
6 診断情報
7 照合情報
8 照合処理部
9 照合結果情報
10 全体制御部
11 データ転送・照合指示制御部
12 照合結果編集部
13 全体メモリ
14 診断制御部
15 照合プロセッサA
16 照合メモリ
17 診断部
18 照合プロセッサB
19 照合プロセッサn
20 外部装置
25 閾値制御部
30 照合処理システム
31 データ転送・照合指示制御チップ
32 照合結果編集チップ
33 診断・閾値制御チップ

Claims (10)

  1. データを照合する複数の処理部の状態を診断する診断情報に基づいて、該複数の処理部のうち特定の処理部の故障の予兆を検知した際に、該特定の処理部に転送するデータを記憶デバイスに格納すると共に、前記特定の処理部が故障した際には、前記記憶デバイスに格納した前記データを故障の予兆を検知していない他の処理部に転送すると共に、転送したデータに対する当該他の処理部による照合処理を指示する制御部を有する照合処理装置。
  2. 前記各処理部が照合するデータは、照合される対象である被照合データと、その被照合データと比較する複数の照合データとを含み、
    前記制御部は、
    前記被照合データを前記複数の処理部である複数の照合プロセッサに転送し、前記複数の照合データのうちの個々の照合データを、前記各照合プロセッサに個々に割り当てると共に、該各照合プロセッサに転送された前記被照合データと、前記照合データとを照合するよう指示することを特徴とする請求項1に記載の照合処理装置。
  3. 前記制御部は、
    前記照合プロセッサの診断部から前記各照合プロセッサが有する照合メモリにおける誤り検出並びに誤り訂正可能なECC(Error Checking and Correction)エラーの発生回数と、前記照合プロセッサの動作に伴って該各照合プロセッサ自身が発生する熱の温度およびその温度での稼動時間との積算値から成る診断情報を受け取り、受け取った該診断情報を基に、故障予兆がある前記照合プロセッサを特定することを特徴とする請求項に記載の照合処理装置。
  4. 前記制御部は、
    少なくとも何れかの前記照合プロセッサの前記診断部からの前記診断情報を成す前記ECCエラーの発生回数と、当該照合プロセッサ自身が発生する熱の温度およびその温度での稼動時間との積算値に対して、それぞれに重み付けをした値をポイント数として付与すると共に、前記ECCエラーの発生回数のポイント数と前記照合プロセッサ自身が発生する熱の温度およびその温度での稼動時間との積算値のポイント数とを合計した合計ポイント数が予め定める閾値を越える場合に、当該照合プロセッサ故障する予兆があると判断することを特徴とする請求項3に記載の照合処理装置。
  5. 前記制御部は、
    前記記憶デバイスである全体メモリを更に含み、
    前記故障予兆を検知した特定の照合プロセッサへ転送される前記照合データを、前記全体メモリへ転送することを特徴とする請求項4に記載の照合処理装置。
  6. 前記制御部は、
    記全体メモリの記憶領域から、前記照合処理装置が稼動する際に使用する記憶領域を除いた領域をバックアップ領域とし、そのバックアップ領域の記憶容量が、複数の前記照合データを格納可能である場合に、前記診断情報に基づいて少なくとも前記何れかの照合プロセッサ故障予兆あるかについて判断する際の、前記合計ポイント数の閾値を動的に変更すると共に、前記バックアップ領域に前記故障予兆であると判断される当該複数の前記照合プロセッサに割り当てられる分の前記複数の照合データを格納することを特徴とする請求項4に記載の照合処理装置。
  7. 前記制御部は、
    前記照合プロセッサからの照合結果である照合結果情報を編集する照合結果編集部を更に含み、前記特定の照合プロセッサが正常に動作した際には、その照合結果情報を前記照合結果編集部へ送出すると共に、前記全体メモリに格納したデータ破棄することを特徴とする請求項に記載の照合処理装置。
  8. 前記制御部は、
    前記被照合データおよび前記照合データを転送すると共に照合の実行を指示するデータ転送・照合指示制御部と、前記各照合プロセッサの前記各診断部からの前記診断情報を受け取り、受け取った該診断情報を基に何れの前記照合プロセッサに故障予兆があるかを診断する診断制御部と、前記全体メモリの前記バックアップ領域における記憶容量に応じて前記診断情報に基づく前記少なくとも何れかの照合プロセッサに故障予兆があると判断する閾値を動的に変更する閾値制御部とを更に含み、
    前記データ転送・照合指示制御部と、前記照合結果編集部と、前記全体メモリと、前記診断制御部と、前記閾値制御部との少なくとも何れかを半導体集積回路とすることを特徴とする請求項に記載の照合処理装置。
  9. データを照合する複数の処理部の状態を診断する診断情報に基づいて、該複数の処理部のうち特定の処理部の故障の予兆を検知した際に、該特定の処理部に転送するデータを記憶デバイスに格納すると共に、
    前記特定の処理部が故障した際には、前記記憶デバイスに格納した前記データを故障の予兆を検知していない他の処理部に転送すると共に、転送したデータに対する当該他の処理部による照合処理を指示することを特徴とする照合処理装置の制御方法。
  10. 照合処理装置を制御するコンピュータ・プログラムであって、そのコンピュータ・プログラムにより、
    データを照合する複数の処理部の状態を診断する診断情報に基づいて、該複数の処理部のうち特定の処理部の故障の予兆を検知した際に、該特定の処理部に転送するデータを記憶デバイスに格納すると共に、前記特定の処理部が故障した際には、前記記憶デバイスに格納した前記データを故障の予兆を検知していない他の処理部に転送すると共に、転送したデータに対する当該他の処理部による照合処理を指示する制御をコンピュータに実現させることを特徴とするコンピュータ・プログラム。
JP2012052543A 2012-03-09 2012-03-09 照合処理装置及びその制御方法、並びにコンピュータ・プログラム Active JP5516620B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012052543A JP5516620B2 (ja) 2012-03-09 2012-03-09 照合処理装置及びその制御方法、並びにコンピュータ・プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012052543A JP5516620B2 (ja) 2012-03-09 2012-03-09 照合処理装置及びその制御方法、並びにコンピュータ・プログラム

Publications (2)

Publication Number Publication Date
JP2013186776A JP2013186776A (ja) 2013-09-19
JP5516620B2 true JP5516620B2 (ja) 2014-06-11

Family

ID=49388122

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012052543A Active JP5516620B2 (ja) 2012-03-09 2012-03-09 照合処理装置及びその制御方法、並びにコンピュータ・プログラム

Country Status (1)

Country Link
JP (1) JP5516620B2 (ja)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH096545A (ja) * 1995-06-14 1997-01-10 Nec Field Service Ltd ユーザファイルバックアップシステム
JP2900901B2 (ja) * 1996-11-13 1999-06-02 三菱電機株式会社 サーバシステムの保守運用管理方式
JPH11110259A (ja) * 1997-10-02 1999-04-23 Toshiba Corp 機器寿命管理システム及び記録媒体
JP2001034495A (ja) * 1999-07-27 2001-02-09 Nec Corp 二重化システム
JP2003308178A (ja) * 2002-04-18 2003-10-31 Nec Soft Ltd 情報処理装置および情報処理方法
JP4789021B2 (ja) * 2009-02-06 2011-10-05 日本電気株式会社 データ処理装置及びデータ処理方法

Also Published As

Publication number Publication date
JP2013186776A (ja) 2013-09-19

Similar Documents

Publication Publication Date Title
US9317350B2 (en) Method and apparatus for faulty memory utilization
Dai et al. Self-healing and hybrid diagnosis in cloud computing
US7730364B2 (en) Systems and methods for predictive failure management
CN110046061A (zh) 内存错误处理方法和装置
CN105718355B (zh) 基于在线学习的超级计算机结点故障主动容错方法
US6820213B1 (en) Fault-tolerant computer system with voter delay buffer
JP7125602B2 (ja) データ処理装置および診断方法
US7886181B2 (en) Failure recovery method in cluster system
US20170017557A1 (en) Storage controlling device, storage controlling method, and non-transitory computer-readable recording medium
TW202123012A (zh) 固態式硬碟及用於固態式硬碟的方法及製品
CN108694094A (zh) 用于处理存储器访问操作的装置和方法
WO2012119432A1 (zh) 提高计算机***稳定性的方法及计算机***
JP5516620B2 (ja) 照合処理装置及びその制御方法、並びにコンピュータ・プログラム
US8522075B2 (en) Storage system having storage devices for storing data and control devices for controlling the storage devices
US20220012147A1 (en) System and device for data recovery for ephemeral storage
EP2312443A2 (en) Information processing apparatus, method of controlling information processing apparatus and control program
JP5849491B2 (ja) ディスク制御装置、ディスク装置異常検出方法、及びプログラム
CN113147776A (zh) 车辆用热备份故障处理***、方法及采用其的车辆
US9092364B2 (en) Implementing storage adapter performance control
JP2009003537A (ja) 計算機
US20200264946A1 (en) Failure sign detection device, failure sign detection method, and recording medium in which failure sign detection program is stored
JP6993472B2 (ja) 深層学習チップを検出する方法、装置、電子機器、およびコンピュータ記憶媒体
US20170206133A1 (en) Control device, method of controlling a storage device, and storage system
CN115509803A (zh) 软件恢复方法、电子设备及存储介质
JP2021136034A (ja) ストレージ装置の故障に対するデータ管理、削減、並びにサンプリング方式

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131001

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140304

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140317

R150 Certificate of patent or registration of utility model

Ref document number: 5516620

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150