JP2004062441A - サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置 - Google Patents
サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置 Download PDFInfo
- Publication number
- JP2004062441A JP2004062441A JP2002218682A JP2002218682A JP2004062441A JP 2004062441 A JP2004062441 A JP 2004062441A JP 2002218682 A JP2002218682 A JP 2002218682A JP 2002218682 A JP2002218682 A JP 2002218682A JP 2004062441 A JP2004062441 A JP 2004062441A
- Authority
- JP
- Japan
- Prior art keywords
- server
- performance
- monitoring
- monitoring request
- server device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Facsimiles In General (AREA)
- Debugging And Monitoring (AREA)
- Computer And Data Communications (AREA)
Abstract
【課題】卜ラフィック増加を抑えながら高性能のサーバ装置を監視することを可能とする。
【解決手段】サービスを提供する複数のサーバ装置S1a,S1b,S2a,S2bと、これらのサーバ装置の中から該当するサーバ装置を監視する旨のサーバ監視要求を発行する通信端末C1と、サーバ監視要求に応じて該当するサーバ装置を監視するサーバ管理装置N1〜N4とを備え、サーバ管理装置N1〜N4は、近傍のサーバ装置の登録を受け付けるとともに、そのサーバ装置の性能を測定し、測定結果を性能情報として該サーバ装置を特定する識別子に関連付けて保持するサーバ性能記憶部10と、監視要求に応じて、監視要求に該当する各サーバ装置の性能情報に基づいてサーバ装置の障害を判定するサーバ障害判定部9と、サーバ障害判定部9による判定結果を通信端末C1に通知する通知手段4とを有する。
【選択図】 図2
【解決手段】サービスを提供する複数のサーバ装置S1a,S1b,S2a,S2bと、これらのサーバ装置の中から該当するサーバ装置を監視する旨のサーバ監視要求を発行する通信端末C1と、サーバ監視要求に応じて該当するサーバ装置を監視するサーバ管理装置N1〜N4とを備え、サーバ管理装置N1〜N4は、近傍のサーバ装置の登録を受け付けるとともに、そのサーバ装置の性能を測定し、測定結果を性能情報として該サーバ装置を特定する識別子に関連付けて保持するサーバ性能記憶部10と、監視要求に応じて、監視要求に該当する各サーバ装置の性能情報に基づいてサーバ装置の障害を判定するサーバ障害判定部9と、サーバ障害判定部9による判定結果を通信端末C1に通知する通知手段4とを有する。
【選択図】 図2
Description
【0001】
【発明の属する技術分野】
本発明は、携帯電話機やデスクトップパソコンなどの通信端末やコンピュータから、ネットワーク上に配置されるサーバ装置を監視するためのサービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置に関する。
【0002】
【従来の技術】
近年にあっては、携帯電話機やパーソナルコンピュータ等の通信端末から、ネットワーク上に分散配置されたサーバ装置にアクセスし、サーバ上で実行されるプログラムと、通信端末上で実行されるプログラムとを連携させて、各種のサービスを提供するシステムが構築されている。
【0003】
上記システムにおいて、サーバやネットワーク障害によるプログラム実行の中断から迅速に回復するには、サーバやネットワークの監視の周期を短くして障害検出時間を短縮するとともに、分散システムにおける障害の場所を特定し、必要に応じて代替のサーバに切り替えることが必要になる。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の分散システムにおける障害復帰にあっては、主に末端の通信端末によりサーバの障害を検出していたため、障害が発生した場所(無線リンク,ネットワーク,或いはいずれかのサーバ)を特定することが難しかった。また、ネットワーク上の監視装置を利用したとしても、広域に分散したサーバの監視はトラフィックを増加させるため、監視の頻度は低くせざるを得なく、障害検出に時間がかかるという問題があった。
【0005】
そこで、本発明は、以上の点に鑑みてなされたもので、サーバ管理装置を分散配置して、各サーバ装置の管理を行わせることで、卜ラフィック増加を抑えながら高頻度でサーバ装置を監視することを可能とするサービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置を提供することをその目的とする。
【0006】
【課題を解決するための手段】
上記課題を解決するために、本発明は、複数のサーバ管理装置により、サービスを提供する複数のサーバ装置の中から該当するサーバ装置を、監視要求に応じて監視する際に、サーバ管理装置において、近傍のサーバ装置の登録を受け付けるとともに、そのサーバ装置の性能を測定し、測定結果を性能情報としてサーバ装置を特定する識別子に関連付けて保持し、監視要求に応じて、監視要求に該当する各サーバ装置の性能情報に基づいてサーバ装置の障害を判定し、この判定結果を通信端末や監視要求元の他のサーバ管理装置に通知する。
【0007】
このような本発明によれば、各近傍のサーバ装置の登録を受け付けるサーバ管理装置を導入するため、性能や状態の監視のための通信が広域のパスに拡散しないようにすることができる。
【0008】
上記発明においては、通信端末や他のサーバ管理装置から受け取った監視要求を、他のサーバ管理装置に転送し、転送先のサーバ管理装置が管理するサーバ装置の識別子とその性能情報を含む応答を受け取り、自身が管理するサーバ装置で障害が発生していると判定した場合に、要求元の通信端末に通知するとともに、自機が受信した監視要求を他のサーバ管理装置に転送し、受信した転送先のサーバ管理装置が管理するサーバ装置の性能情報を代替のサーバ装置として、監視要求元に送信することが好ましい。
【0009】
この場合には、管理装置が他の管理装置にサーバ監視要求を転送したり、受信できるようにすることで、分散配置されたほかの管理装置が管理している遠隔のサーバ装置も監視可能とすることができる。さらに、サーバ装置に障害が発生した場合には、代替のサーバ装置を監視要求元に与ることができる。
【0010】
上記発明においては、他のサーバ管理装置との間の遅延を測定し、その測定結果を保持するステップ(6)を備え、ステップ(1)において、ステップ(6)で保持された測定結果と、ステップ(5)で受信した性能情報とを、遠隔サーバ装置の性能情報として保持することが好ましい。
【0011】
この場合には、通信端末の近傍のサーバ管理装置が通信端末との間のパスや、監視対象のサーバ装置を管理するサーバ管理装置までのパスの性能を測定することで、通信端末の無線リンク状態と、サーバ装置までの途中のネットワークの障害を検出することを可能にすることができる。
【0012】
上記発明においては、ステップ(2)において、監視要求で指定された監視時間が経過するか、監視要求で指定された監視回数が終了するか、監視要求元から終了の通知を受けるかのいずれかの時点で判定を終了することが好ましい。
【0013】
この場合には、通信端末がサーバ装置の監視時間や監視回数を指定可能にすることで、要求監視元が監視の終了要求を発行しなくても自動的に監視を終了させることができる。また、ユーザーや管理者の意思に基づいて、監視の終了要求を発行すれば、監視中でも監視を終了することもでき、サーバ管理の多様化を図ることができる。
【0014】
上記発明においては、ステップ(2)においては、監視要求で指定された監視周期に基づいて、周期的に監視を行うことが好ましい。
【0015】
この場合には、監視要求元が、性能を測定する頻度を監視要求に含めることが可能となり、障害によるサービス中断の時間を短くするには監視周期を短くしたり、頻繁な監視を必要としない種別のサーバ装置の場合、監視周期を長くするなど、目的に応じた設定が可能となる。この結果、一律な監視周期の設定に比べ、トラフィックや処理を削減し、効率的な監視が可能になる。
【0016】
上記発明においては、各サーバ装置の性能情報は、応答処理時間や通信遅延、処理負荷を含むことが好ましい。
【0017】
この場合には、サーバ管理装置が実際に測定する性能情報として、応答時間や負荷、遅延を含ませることにより、応答時間が遅い、負荷が高い、遅延が大きいなどの障害や性能低下を検出することを可能にする。また、通信端末自身が、サーバ装置の性能の様々な項目について、監視する項目を指定することを可能にする。例えば、遅延や応答時間の情報のみが必要で、負荷の監視の必要がない場合は、そのように要求することで、効率的な監視が可能になる。
【0018】
上記発明においては、性能情報の閾値と、登録された各サーバの性能情報と閾値とを比較し、この比較結果に応じて、自機に登録されたサーバ装置に関する情報を、他のサーバ管理装置に対して登録の移管を依頼するステップを有することが好ましい。
【0019】
また、上記発明においては、自機に登録された各サーバの識別子と、他のサービス管理システムに登録された各サーバの識別子とを照合し、重複して登録されているサーバを特定するステップと、重複して登録されているサーバ装置の性能情報を比較し、この比較結果に応じて、管轄する近傍のサーバ装置を決定するステップと、この決定に応じて、自機における登録の削除又は他のサービス管理システムにおける登録の削除を依頼するステップとを有することが好ましい。
【0020】
この場合には、複数のサーバ管理装置が重複して同一のサーバ装置を管理することを回避することができ、サーバ監視のための通信が、重複して送信されるのをより的確に防止することができる。
【0021】
【発明の実施の形態】
(サービス管理システムの構成)
本発明に係るサービス管理システムについて図を参照しつつ説明する。図1は本実施形態に係るサービス管理システムの全体構成を示す説明図である。
【0022】
図1に示すように、本実施形態に係るサービス管理システムは、サービスの提供を受ける通信端末C1と、サーバ管理装置N1〜N4と、所定のサービスを提供するサーバ装置S1a,S1b、S2a〜cとから構成される。なお、上記サーバ装置を示す符号S1及びS2は、サービスの種別を意味し、同一の符号S1及びS2を付されたサーバ装置は、同種のサービスを提供することを示す。
【0023】
各サーバ管理装置N1〜N4は、後述するマッピング部8により定められた近傍のサーバ装置を管理する通信サーバであり、通信ネットワークを介して相互に接続され、各サーバ管理装置は相互に直接的に、或いは他のサーバ管理装置を経由して間接的に接続されている。図示した例では、サーバ管理装置N1は、サーバ装置S1aの登録を受け付け、サーバ管理装置N2は、サーバ装置S2a及びS2bの登録を受け付け、サーバ管理装置N3は、サーバ装置S1b及びS2cの登録を受け付けている。
【0024】
(サーバ管理装置の構成)
図2は、上述したサーバ管理装置N1〜N4の内部構成を示すブロック図である。
【0025】
同図に示すように、サーバ管理装置N1〜N4は、通信部1と、サービス監視要求受信部2と、サービス監視要求転送部3と、サービス監視通知部4と、サーバ装置性能測定部5と、他管理装置性能測定部6と、管理部7と、マッピング部8と、サーバ障害判定部9と、サーバ性能記憶部10と、タイマ11とから構成される。
【0026】
通信部1は、サーバ管理装置と他の機器が通信を行うためのモジュールであり、通信手段は有線・無線、或いはパケット交換、回線交換など方式を問わない。
【0027】
サービス監視要求受信部2は、通信端末C1や他サーバ管理装置からサービス監視要求を受けると、サーバ装置性能測定部5を起動する。この性能監視要求には、監視対象サーバや監視する性能項目(遅延や応答時間、負荷)、監視頻度(例えば30秒ごと)、監視時間(1回、指定時間範囲、監視終了指示まで)、障害が起きたときのアクション(性能監視要求元に通知するなど)などが指定される。
【0028】
サービス監視要求転送部3は、サービス監視要求受信部2が受信した監視要求のコピーを他のサーバ管理装置に中継転送するものである。なお、転送する際、このサービス監視要求転送部3は、当該サーバ管理装置が、転送先である他サーバ管理装置から応答をもらえるように、当該サーバ管理装置の識別子(転送元)と、サービス監視要求を送信した端末装置(ユーザー)の識別子をサービス監視要求に含める。
【0029】
また、サービス監視要求転送部3は、中継回数制限を行うため、現在までに中継された数(中継回数)をサービス監視要求に含める。なお、転送を受けた他サーバ管理装置は、サービス監視応答にパス遅延フィールドの値を含めて返すため、監視要求元のサーバ管理装置は、遠隔サーバ装置までの遅延を見積もることができる。
【0030】
さらに、サービス監視要求転送部3は、中継数がある設定値を超えた場合、中継を行わないようにする。さらに、中継の際、パス上の遅延を計算するため、転送先のサーバ管理装置までの遅延をパス遅延フィールドに足す。
【0031】
サービス監視通知部4は、サーバ性能判定部9が判定した障害発生を、通信端末C1に直接、或いは他のサーバ管理装置を経由して間接的に通知するものである。
【0032】
サーバ装置性能測定部5は、そのサービス監視要求に基づいて(タイマなどを利用しつつ)、サーバ装置の性能を測定し、サーバ性能記憶部10に記録する。記録の際、サーバ障害判定部が呼び出され、サーバ性能が異常状態や障害状態でないかを判定する。障害の場合、サービス監視通知部が呼び出され、サービス監視要求に基づくアクションが実行される。例えば、要求元の通信端末やサーバ装置にその障害が通知される。
【0033】
他管理装置性能測定部6は、他のサーバ管理装置と通信を行い、他のサーバ管理装置における遅延やスループットを測定し、測定に係るサーバ管理装置の識別子と、遅延時間、スループット、測定時刻などの性能情報とを関連付けて、1つのレコードとして、サーバ性能記憶部10に記録する。なお、他管理装置性能測定部6は、サービス監視要求を他のサーバ管理装置に転送した際に、この他のサーバ管理装置の応答速度を測定することにより他サーバ管理装置の性能を測定する。
【0034】
なお、サーバ装置性能測定部5及び他管理装置性能測定部6は、タイマにより周期的に起動されてもよいし、サーバ装置から登録要求を受け付けたときに起動されてもよい。そして、サーバ装置性能測定部5や他管理装置性能測定部6が起動されたときには、これらが保持する他のサーバ管理装置との遅延情報に基づき、サーバ性能記憶部10に蓄積されたサーバ装置の遅延情報を更新する。例えば、ある遠隔のサーバ装置の遅延情報が50msとして受信し、そのサーバ装置が登録されているサーバ管理装置N1までの遅延が100msであった場合、そのサーバ装置の遅延情報は150msとして更新される。
【0035】
マッピング部8は、図4に示すように、サーバ性能記憶部10に対してデータの入出力を行うインターフェース部81と、性能情報の閾値を記憶する閾値記憶手段82と、サーバ性能記憶部10に登録された各サーバの性能情報と閾値とを比較する比較部84と、比較部84による比較結果に応じて、自機に登録されたサーバ装置に関する情報を、他のサーバ管理装置に対して登録の移管を依頼する移管依頼部85とを有している。
【0036】
さらに、本実施形態に係るマッピング部8は、自機に登録された各サーバの識別子と他のサービス管理システムに登録された各サーバの識別子とを照合し、重複して登録されているサーバを特定する重複検出部83と、重複して登録されているサーバ装置の性能情報を比較し、この比較結果に応じて、管轄する近傍のサーバ装置を決定する管轄決定部86と、管轄決定部86の決定結果に応じて、自機における登録の削除又は他のサーバ管理装置における登録の削除を依頼する重複排除部87とを備えている。
【0037】
サーバ障害判定部9は、サーバ性能記憶部10から、サービス監視要求に合致する種別のサーバ装置を抽出し、要求された品質に基づいてサーバ装置を選択し、選択されたサーバに関連付けられた性能情報をサービス監視通知部4に渡す。
【0038】
サーバ性能記憶部10は、サーバの識別子、サーバのアドレス、サーバ管理装置からサーバ装置までの遅延、サーバ装置の応答時間、サーバ装置の負荷、この情報の有効期間などの性能情報を蓄積したレコードを格納するデータベースである。例えば、サーバ管理装置N1のサーバ性能記憶部10には、サーバ装置S1aの遅延や負荷、サーバ管理装置N2との遅延、サーバ管理装置N4との遅延が記録され、サーバ管理装置N2のサーバ性能記憶部10には、サーバ装置S2aとS2bの遅延や負荷、サーバ管理装置N1,N4との遅延が記録されている。
【0039】
なお、上記各サーバ装置の性能情報は、サーバ装置性能測定部5により、各サーバ装置からの登録を受け付ける際に、測定が行われ、記録される。
【0040】
また、このサーバ性能記憶部10は、タイマ11に接続されており、このタイマ11の計時結果を利用して、有効期間が過ぎたレコードを削除する機能を備えている。
【0041】
管理部7は、上記各部1〜6,8〜11の動作を管理し、制御する管理サーバであり、システム管理者の操作端末等の接続され、システム全体の集中管理が可能となっている。また、本実施形態に係る管理部7は、マッピング部12の移管依頼部85や重複排除部87からの要求に応じて、各他のサーバ管理装置に対して、登録の移管や排除の依頼を送信する。
【0042】
(サーバ装置の構成)
次いで、図3にサーバ装置S1a,S1b,S2a,S2bの構成を示す。同図に示すように、各サーバ装置S1a,S1b,S2a,S2bは、通信部21と、サービス登録部22と、サービス処理部23と、性能測定要求受信/応答部24と、サーバ負荷等獲得部25と、サーバ性能記憶部20と、通信部21とを備えている。
【0043】
サーバ性能記憶部20は、サーバ負荷等獲得部25による自機の負荷測定結果を蓄積し、性能測定要求受信/応答部24を通じたサーバ管理装置からの測定要求に応じて、蓄積された負荷情報を出力するものである。なお、本実施形態においては、サービス処理部23が、ある処理を行ったときの処理時間や、通信端末や他のサーバ装置からの受信や送信の際のスループット等の性能情報を、処理の度に、或いは一定時間ごとにサーバ性能記憶部20に記録することで、性能測定要求受信/応答部24はより詳細な性能情報を与えることができる。
【0044】
通信部21は、サーバ管理装置と他の機器が通信を行うためのモジュールであり、通信手段は有線・無線、或いはパケット交換、回線交換など方式を問わない。
【0045】
サービス登録部22は、近傍のサーバ管理装置に対して自機の登録を要求し、登録に際し必要な情報(自機の識別子、性能情報、登録有効期間等)を登録先に送信するものである。
【0046】
サービス処理部23は、通信端末C1からの要求に応じて、サーバ装置が提供するサービスの処理を行う部分であり、通信部21を介して通信端末C1やサーバ装置と相互にやりとりする。
【0047】
性能測定要求受信/応答部24は、サーバ管理装置からの性能測定要求に対し、応答を返す部分である。例えば、遅延測定は、サーバ管理装置が発行するpingパケット(TCP/IPのICMP)に対して、性能測定要求受信/応答部24がpingパケットを送り返すというように実装することができる。サーバ装置の応答時間は、例えば、性能測定要求受信/応答部24がダミーの処理か、サービス処理部の一部の処理を行い、その処理時間を応答時間として返すことができる。
【0048】
サーバ負荷等獲得部25は、サーバ装置の負荷について、現在のCPU使用率やメモリ使用率など計測するものである。この測定結果は、負荷情報として、性能測定要求受信/応答部24を介して、管轄するサーバ管理装置に応答される。
【0049】
(サービス管理システムを用いたサービス管理方法)
以上の構成を有するサービス管理システムを用いたサービス管理方法は以下の手順で行われる。図5は、サービス管理システムの動作を示すシーケンス図である。なお、ここでは、通信端末C1がサービスの提供を受けるにあたり、サーバ装置S2aと連携して処理を行っているものとする。
【0050】
先ず、通信端末C1よりサーバ装置S2aに対するサービス監視要求を、近傍のサーバ装置であるサーバ管理装置N1に発行する(S101)。このとき、近傍のサーバ管理装置のアドレス情報は、手動で静的に、或いはDHCPサービス等を使って動的に、通信端末C1に設定される。
【0051】
このサービス監視要求を受けたサーバ管理装置N1は(S201)、自分が管理しているサーバ装置か否かを判断し(S202)、自分が管理しているサーバ装置ではないと判断した場合には、そのサーバ装置S2aを管理しているサーバ管理装置N2にサービス監視要求を転送する(S203)。
【0052】
本実施形態では、この判断は、マッピング部によって作成されたマップに従って行われる。なお、この判断については、サーバ装置を管理しているサーバ管理装置の情報は、サーバ装置自身が保持しているか、或いは各サーバ管理装置が互いに管理しているサーバ装置の情報を交換することにより、取得するようにしてもよい。
【0053】
このステップS203におけるサービス監視要求の転送は、直接的に送信してもよいし、他のサーバ管理装置を経由して行ってもよい。転送の方式は、自分宛以外で新規に受け取ったサービス監視要求を、単純に隣接するサーバ管理装置に転送するフラッディング方式や、各サーバ管理装置が宛先までの経路を知っていてサービス監視要求内にその経路を指定する経路指定方式などいずれの方式も採用することができる。
【0054】
ステップS202において自分が管理しているサーバ装置であると判断した場合には、ステップS204に移行し、監視時間か、或いは監視回数が超過していないかについて判断を行い(S204)、監視時間外であるときや監視回数を超過しているときには、処理を終了する(S205)。
【0055】
ステップS204において、監視時間である、或いは監視回数以内であると判断したときには、他管理装置とのパス性能を測定し(S206)、次いで、サーバ装置の性能を測定し(S207)、測定結果を記録する(S208)。
【0056】
なお、上記ステップS207の性能記録に際しては、他のサーバ管理装置と重複してサーバ装置を登録しないように、マッピング処理が行われる。すなわち、サーバ管理装置は、サーバ装置の登録に際して、他のサーバ管理装置に登録されたサーバ装置の情報を取得し、重複登録がないか、或いは、自機よりもより近傍のサーバ管理装置がないかを判断し、重複している場合には、最も近傍のサーバ管理装置へ登録を依頼したり、自機における登録を抹消したり、既に自機に登録されている場合には、自機に登録された情報を他のサーバ管理装置に転送し、登録の移管を行う。
【0057】
そして、この記録された測定結果に基づいて、障害が発生していないかどうかを判断し(S209)、障害が発生している場合には、サービス監視要求で指定されたアクションに従い、通信端末C1に対して障害通知を送信する(S210及びS102)。障害通知を受信した通信端末C1は、サーバ装置の障害通知に対して、代替となる利用可能なサーバを監視して他のサーバ装置を利用したり、サーバ装置が提供するサービスを使わないようにすることで障害から回復できる。
【0058】
サーバ管理装置N1が、サーバ管理装置N2とN1の間のネットワークパスの障害を検出して通信端末C1に通知した場合、通信端末C1は、サーバ管理装置N2以外のサーバ管理装置N1と通信可能なサーバ管理装置が管理しているサーバ装置を監視し、例えばサーバ管理装置N3が管理しているサーバ装置S2cを代替サーバとして利用することができる。
【0059】
サーバ管理装置N1が通信端末C1との間のパスの障害を検出した場合は、通信端末C1に通知できないが、その通信端末が連携処理しているサーバ装置に通知して処理を停止することも可能である。
【0060】
ステップS209において障害が発生していないと判断した場合には、監視周期タイマにより所定時間待機状態を維持した後(S211)、上記S204〜S210までの処理をループ処理により繰り返す。
【0061】
一方、ステップS203において、サーバ管理装置N1からサーバ装置S2aに対するサービス監視要求を受け取ったサーバ管理装置N2は(S301)、サーバ監視手順へ移行し(S302)、サービス監視応答を送信する(S303)。
【0062】
次いで、監視時間か、或いは監視回数が超過していないかについて判断を行い(S304)、監視時間外であるときや監視回数を超過しているときには、処理を終了する(S305)。
【0063】
ステップS304において、監視時間である、或いは監視回数以内であると判断したときには、サーバ装置の性能を測定し(S306)、測定結果を記録する(S307)。そして、この記録された測定結果に基づいて、障害が発生していないかどうかを判断し(S308)、障害が発生している場合には、通信端末C1に対して障害通知を送信する(S309及びS102)。ステップS308において障害が発生していないと判断した場合には、監視周期タイマにより所定時間待機状態を維持した後(S310)、上記S304〜S309までの処理をループ処理により繰り返す。
【0064】
(変更例)
なお、本実施形態では、通信端末が監視要求を発行するモデルを説明したが、サーバ装置が他のサーバ装置の提供するサービスを利用して連携処理を行う場合も、そのサーバ装置の監視が必要になる。この場合も、同様にしてサーバ装置を効率的に監視可能である。すなわち、監視要求元のサーバ装置が監視要求を、監視対象サーバ装置を管理するサーバ管理装置に送り、障害の通知を受けることができる。
【0065】
【発明の効果】
以上説明したように、本発明のサービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置によれば、サーバ管理装置が各々管理するサーバの監視を行うことで、無線リンク,ネットワーク,複数のサーバのどこで障害が起きたかの切り分けが容易となる。また、各サーバの障害監視は近傍のサーバ管理装置との間で行われ、障害検出時のみ通信端末に対して通知が行われるため、頻繁な監視をしてもトラフィックの増加を抑えることができ、障害検出を早めることができる。さらに、障害の切り分けにより、サーバ障害の場合は異なるサーバ機器上のサーバ、ネットワーク障害の場合、異なる経路上のサーバなど、障害に影響されない代替サーバを選択することが可能になり、確実な障害回復を実現することができる。
【図面の簡単な説明】
【図1】実施形態に係るサービス管理システムの全体構成を模式的に示す説明図である。
【図2】実施形態に係るサーバ管理装置の構成例を示すブロック図である。
【図3】実施形態に係るサーバ装置の構成例を示すブロック図である。
【図4】実施形態に係るマッピング部の内部構成を示すブロック図である。
【図5】実施形態に係る通信端末がサーバ装置の監視要求を発行して受信するまでの、サーバ装置の監視手順におけるシーケンス図である。
【符号の説明】
C1…通信端末
N1〜N4…サーバ管理装置
S1a,S1b,S2a,S2b…サーバ装置
1…通信部
2…サービス監視要求受信部
3…サービス監視要求転送部
4…サービス監視通知部
5…サーバ装置性能測定部
6…他管理装置性能測定部
7…管理部
8…マッピング部
9…サーバ障害判定部
10…サーバ性能記憶部
11…タイマ
12…マッピング部
20…サーバ性能記憶部
21…通信部
22…サービス登録部
23…サービス処理部
24…応答部
25…サーバ負荷等獲得部
81…インターフェース部
82…閾値記憶手段
83…重複検出部
84…比較部
85…移管依頼部
86…管轄決定部
87…重複排除部
【発明の属する技術分野】
本発明は、携帯電話機やデスクトップパソコンなどの通信端末やコンピュータから、ネットワーク上に配置されるサーバ装置を監視するためのサービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置に関する。
【0002】
【従来の技術】
近年にあっては、携帯電話機やパーソナルコンピュータ等の通信端末から、ネットワーク上に分散配置されたサーバ装置にアクセスし、サーバ上で実行されるプログラムと、通信端末上で実行されるプログラムとを連携させて、各種のサービスを提供するシステムが構築されている。
【0003】
上記システムにおいて、サーバやネットワーク障害によるプログラム実行の中断から迅速に回復するには、サーバやネットワークの監視の周期を短くして障害検出時間を短縮するとともに、分散システムにおける障害の場所を特定し、必要に応じて代替のサーバに切り替えることが必要になる。
【0004】
【発明が解決しようとする課題】
しかしながら、従来の分散システムにおける障害復帰にあっては、主に末端の通信端末によりサーバの障害を検出していたため、障害が発生した場所(無線リンク,ネットワーク,或いはいずれかのサーバ)を特定することが難しかった。また、ネットワーク上の監視装置を利用したとしても、広域に分散したサーバの監視はトラフィックを増加させるため、監視の頻度は低くせざるを得なく、障害検出に時間がかかるという問題があった。
【0005】
そこで、本発明は、以上の点に鑑みてなされたもので、サーバ管理装置を分散配置して、各サーバ装置の管理を行わせることで、卜ラフィック増加を抑えながら高頻度でサーバ装置を監視することを可能とするサービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置を提供することをその目的とする。
【0006】
【課題を解決するための手段】
上記課題を解決するために、本発明は、複数のサーバ管理装置により、サービスを提供する複数のサーバ装置の中から該当するサーバ装置を、監視要求に応じて監視する際に、サーバ管理装置において、近傍のサーバ装置の登録を受け付けるとともに、そのサーバ装置の性能を測定し、測定結果を性能情報としてサーバ装置を特定する識別子に関連付けて保持し、監視要求に応じて、監視要求に該当する各サーバ装置の性能情報に基づいてサーバ装置の障害を判定し、この判定結果を通信端末や監視要求元の他のサーバ管理装置に通知する。
【0007】
このような本発明によれば、各近傍のサーバ装置の登録を受け付けるサーバ管理装置を導入するため、性能や状態の監視のための通信が広域のパスに拡散しないようにすることができる。
【0008】
上記発明においては、通信端末や他のサーバ管理装置から受け取った監視要求を、他のサーバ管理装置に転送し、転送先のサーバ管理装置が管理するサーバ装置の識別子とその性能情報を含む応答を受け取り、自身が管理するサーバ装置で障害が発生していると判定した場合に、要求元の通信端末に通知するとともに、自機が受信した監視要求を他のサーバ管理装置に転送し、受信した転送先のサーバ管理装置が管理するサーバ装置の性能情報を代替のサーバ装置として、監視要求元に送信することが好ましい。
【0009】
この場合には、管理装置が他の管理装置にサーバ監視要求を転送したり、受信できるようにすることで、分散配置されたほかの管理装置が管理している遠隔のサーバ装置も監視可能とすることができる。さらに、サーバ装置に障害が発生した場合には、代替のサーバ装置を監視要求元に与ることができる。
【0010】
上記発明においては、他のサーバ管理装置との間の遅延を測定し、その測定結果を保持するステップ(6)を備え、ステップ(1)において、ステップ(6)で保持された測定結果と、ステップ(5)で受信した性能情報とを、遠隔サーバ装置の性能情報として保持することが好ましい。
【0011】
この場合には、通信端末の近傍のサーバ管理装置が通信端末との間のパスや、監視対象のサーバ装置を管理するサーバ管理装置までのパスの性能を測定することで、通信端末の無線リンク状態と、サーバ装置までの途中のネットワークの障害を検出することを可能にすることができる。
【0012】
上記発明においては、ステップ(2)において、監視要求で指定された監視時間が経過するか、監視要求で指定された監視回数が終了するか、監視要求元から終了の通知を受けるかのいずれかの時点で判定を終了することが好ましい。
【0013】
この場合には、通信端末がサーバ装置の監視時間や監視回数を指定可能にすることで、要求監視元が監視の終了要求を発行しなくても自動的に監視を終了させることができる。また、ユーザーや管理者の意思に基づいて、監視の終了要求を発行すれば、監視中でも監視を終了することもでき、サーバ管理の多様化を図ることができる。
【0014】
上記発明においては、ステップ(2)においては、監視要求で指定された監視周期に基づいて、周期的に監視を行うことが好ましい。
【0015】
この場合には、監視要求元が、性能を測定する頻度を監視要求に含めることが可能となり、障害によるサービス中断の時間を短くするには監視周期を短くしたり、頻繁な監視を必要としない種別のサーバ装置の場合、監視周期を長くするなど、目的に応じた設定が可能となる。この結果、一律な監視周期の設定に比べ、トラフィックや処理を削減し、効率的な監視が可能になる。
【0016】
上記発明においては、各サーバ装置の性能情報は、応答処理時間や通信遅延、処理負荷を含むことが好ましい。
【0017】
この場合には、サーバ管理装置が実際に測定する性能情報として、応答時間や負荷、遅延を含ませることにより、応答時間が遅い、負荷が高い、遅延が大きいなどの障害や性能低下を検出することを可能にする。また、通信端末自身が、サーバ装置の性能の様々な項目について、監視する項目を指定することを可能にする。例えば、遅延や応答時間の情報のみが必要で、負荷の監視の必要がない場合は、そのように要求することで、効率的な監視が可能になる。
【0018】
上記発明においては、性能情報の閾値と、登録された各サーバの性能情報と閾値とを比較し、この比較結果に応じて、自機に登録されたサーバ装置に関する情報を、他のサーバ管理装置に対して登録の移管を依頼するステップを有することが好ましい。
【0019】
また、上記発明においては、自機に登録された各サーバの識別子と、他のサービス管理システムに登録された各サーバの識別子とを照合し、重複して登録されているサーバを特定するステップと、重複して登録されているサーバ装置の性能情報を比較し、この比較結果に応じて、管轄する近傍のサーバ装置を決定するステップと、この決定に応じて、自機における登録の削除又は他のサービス管理システムにおける登録の削除を依頼するステップとを有することが好ましい。
【0020】
この場合には、複数のサーバ管理装置が重複して同一のサーバ装置を管理することを回避することができ、サーバ監視のための通信が、重複して送信されるのをより的確に防止することができる。
【0021】
【発明の実施の形態】
(サービス管理システムの構成)
本発明に係るサービス管理システムについて図を参照しつつ説明する。図1は本実施形態に係るサービス管理システムの全体構成を示す説明図である。
【0022】
図1に示すように、本実施形態に係るサービス管理システムは、サービスの提供を受ける通信端末C1と、サーバ管理装置N1〜N4と、所定のサービスを提供するサーバ装置S1a,S1b、S2a〜cとから構成される。なお、上記サーバ装置を示す符号S1及びS2は、サービスの種別を意味し、同一の符号S1及びS2を付されたサーバ装置は、同種のサービスを提供することを示す。
【0023】
各サーバ管理装置N1〜N4は、後述するマッピング部8により定められた近傍のサーバ装置を管理する通信サーバであり、通信ネットワークを介して相互に接続され、各サーバ管理装置は相互に直接的に、或いは他のサーバ管理装置を経由して間接的に接続されている。図示した例では、サーバ管理装置N1は、サーバ装置S1aの登録を受け付け、サーバ管理装置N2は、サーバ装置S2a及びS2bの登録を受け付け、サーバ管理装置N3は、サーバ装置S1b及びS2cの登録を受け付けている。
【0024】
(サーバ管理装置の構成)
図2は、上述したサーバ管理装置N1〜N4の内部構成を示すブロック図である。
【0025】
同図に示すように、サーバ管理装置N1〜N4は、通信部1と、サービス監視要求受信部2と、サービス監視要求転送部3と、サービス監視通知部4と、サーバ装置性能測定部5と、他管理装置性能測定部6と、管理部7と、マッピング部8と、サーバ障害判定部9と、サーバ性能記憶部10と、タイマ11とから構成される。
【0026】
通信部1は、サーバ管理装置と他の機器が通信を行うためのモジュールであり、通信手段は有線・無線、或いはパケット交換、回線交換など方式を問わない。
【0027】
サービス監視要求受信部2は、通信端末C1や他サーバ管理装置からサービス監視要求を受けると、サーバ装置性能測定部5を起動する。この性能監視要求には、監視対象サーバや監視する性能項目(遅延や応答時間、負荷)、監視頻度(例えば30秒ごと)、監視時間(1回、指定時間範囲、監視終了指示まで)、障害が起きたときのアクション(性能監視要求元に通知するなど)などが指定される。
【0028】
サービス監視要求転送部3は、サービス監視要求受信部2が受信した監視要求のコピーを他のサーバ管理装置に中継転送するものである。なお、転送する際、このサービス監視要求転送部3は、当該サーバ管理装置が、転送先である他サーバ管理装置から応答をもらえるように、当該サーバ管理装置の識別子(転送元)と、サービス監視要求を送信した端末装置(ユーザー)の識別子をサービス監視要求に含める。
【0029】
また、サービス監視要求転送部3は、中継回数制限を行うため、現在までに中継された数(中継回数)をサービス監視要求に含める。なお、転送を受けた他サーバ管理装置は、サービス監視応答にパス遅延フィールドの値を含めて返すため、監視要求元のサーバ管理装置は、遠隔サーバ装置までの遅延を見積もることができる。
【0030】
さらに、サービス監視要求転送部3は、中継数がある設定値を超えた場合、中継を行わないようにする。さらに、中継の際、パス上の遅延を計算するため、転送先のサーバ管理装置までの遅延をパス遅延フィールドに足す。
【0031】
サービス監視通知部4は、サーバ性能判定部9が判定した障害発生を、通信端末C1に直接、或いは他のサーバ管理装置を経由して間接的に通知するものである。
【0032】
サーバ装置性能測定部5は、そのサービス監視要求に基づいて(タイマなどを利用しつつ)、サーバ装置の性能を測定し、サーバ性能記憶部10に記録する。記録の際、サーバ障害判定部が呼び出され、サーバ性能が異常状態や障害状態でないかを判定する。障害の場合、サービス監視通知部が呼び出され、サービス監視要求に基づくアクションが実行される。例えば、要求元の通信端末やサーバ装置にその障害が通知される。
【0033】
他管理装置性能測定部6は、他のサーバ管理装置と通信を行い、他のサーバ管理装置における遅延やスループットを測定し、測定に係るサーバ管理装置の識別子と、遅延時間、スループット、測定時刻などの性能情報とを関連付けて、1つのレコードとして、サーバ性能記憶部10に記録する。なお、他管理装置性能測定部6は、サービス監視要求を他のサーバ管理装置に転送した際に、この他のサーバ管理装置の応答速度を測定することにより他サーバ管理装置の性能を測定する。
【0034】
なお、サーバ装置性能測定部5及び他管理装置性能測定部6は、タイマにより周期的に起動されてもよいし、サーバ装置から登録要求を受け付けたときに起動されてもよい。そして、サーバ装置性能測定部5や他管理装置性能測定部6が起動されたときには、これらが保持する他のサーバ管理装置との遅延情報に基づき、サーバ性能記憶部10に蓄積されたサーバ装置の遅延情報を更新する。例えば、ある遠隔のサーバ装置の遅延情報が50msとして受信し、そのサーバ装置が登録されているサーバ管理装置N1までの遅延が100msであった場合、そのサーバ装置の遅延情報は150msとして更新される。
【0035】
マッピング部8は、図4に示すように、サーバ性能記憶部10に対してデータの入出力を行うインターフェース部81と、性能情報の閾値を記憶する閾値記憶手段82と、サーバ性能記憶部10に登録された各サーバの性能情報と閾値とを比較する比較部84と、比較部84による比較結果に応じて、自機に登録されたサーバ装置に関する情報を、他のサーバ管理装置に対して登録の移管を依頼する移管依頼部85とを有している。
【0036】
さらに、本実施形態に係るマッピング部8は、自機に登録された各サーバの識別子と他のサービス管理システムに登録された各サーバの識別子とを照合し、重複して登録されているサーバを特定する重複検出部83と、重複して登録されているサーバ装置の性能情報を比較し、この比較結果に応じて、管轄する近傍のサーバ装置を決定する管轄決定部86と、管轄決定部86の決定結果に応じて、自機における登録の削除又は他のサーバ管理装置における登録の削除を依頼する重複排除部87とを備えている。
【0037】
サーバ障害判定部9は、サーバ性能記憶部10から、サービス監視要求に合致する種別のサーバ装置を抽出し、要求された品質に基づいてサーバ装置を選択し、選択されたサーバに関連付けられた性能情報をサービス監視通知部4に渡す。
【0038】
サーバ性能記憶部10は、サーバの識別子、サーバのアドレス、サーバ管理装置からサーバ装置までの遅延、サーバ装置の応答時間、サーバ装置の負荷、この情報の有効期間などの性能情報を蓄積したレコードを格納するデータベースである。例えば、サーバ管理装置N1のサーバ性能記憶部10には、サーバ装置S1aの遅延や負荷、サーバ管理装置N2との遅延、サーバ管理装置N4との遅延が記録され、サーバ管理装置N2のサーバ性能記憶部10には、サーバ装置S2aとS2bの遅延や負荷、サーバ管理装置N1,N4との遅延が記録されている。
【0039】
なお、上記各サーバ装置の性能情報は、サーバ装置性能測定部5により、各サーバ装置からの登録を受け付ける際に、測定が行われ、記録される。
【0040】
また、このサーバ性能記憶部10は、タイマ11に接続されており、このタイマ11の計時結果を利用して、有効期間が過ぎたレコードを削除する機能を備えている。
【0041】
管理部7は、上記各部1〜6,8〜11の動作を管理し、制御する管理サーバであり、システム管理者の操作端末等の接続され、システム全体の集中管理が可能となっている。また、本実施形態に係る管理部7は、マッピング部12の移管依頼部85や重複排除部87からの要求に応じて、各他のサーバ管理装置に対して、登録の移管や排除の依頼を送信する。
【0042】
(サーバ装置の構成)
次いで、図3にサーバ装置S1a,S1b,S2a,S2bの構成を示す。同図に示すように、各サーバ装置S1a,S1b,S2a,S2bは、通信部21と、サービス登録部22と、サービス処理部23と、性能測定要求受信/応答部24と、サーバ負荷等獲得部25と、サーバ性能記憶部20と、通信部21とを備えている。
【0043】
サーバ性能記憶部20は、サーバ負荷等獲得部25による自機の負荷測定結果を蓄積し、性能測定要求受信/応答部24を通じたサーバ管理装置からの測定要求に応じて、蓄積された負荷情報を出力するものである。なお、本実施形態においては、サービス処理部23が、ある処理を行ったときの処理時間や、通信端末や他のサーバ装置からの受信や送信の際のスループット等の性能情報を、処理の度に、或いは一定時間ごとにサーバ性能記憶部20に記録することで、性能測定要求受信/応答部24はより詳細な性能情報を与えることができる。
【0044】
通信部21は、サーバ管理装置と他の機器が通信を行うためのモジュールであり、通信手段は有線・無線、或いはパケット交換、回線交換など方式を問わない。
【0045】
サービス登録部22は、近傍のサーバ管理装置に対して自機の登録を要求し、登録に際し必要な情報(自機の識別子、性能情報、登録有効期間等)を登録先に送信するものである。
【0046】
サービス処理部23は、通信端末C1からの要求に応じて、サーバ装置が提供するサービスの処理を行う部分であり、通信部21を介して通信端末C1やサーバ装置と相互にやりとりする。
【0047】
性能測定要求受信/応答部24は、サーバ管理装置からの性能測定要求に対し、応答を返す部分である。例えば、遅延測定は、サーバ管理装置が発行するpingパケット(TCP/IPのICMP)に対して、性能測定要求受信/応答部24がpingパケットを送り返すというように実装することができる。サーバ装置の応答時間は、例えば、性能測定要求受信/応答部24がダミーの処理か、サービス処理部の一部の処理を行い、その処理時間を応答時間として返すことができる。
【0048】
サーバ負荷等獲得部25は、サーバ装置の負荷について、現在のCPU使用率やメモリ使用率など計測するものである。この測定結果は、負荷情報として、性能測定要求受信/応答部24を介して、管轄するサーバ管理装置に応答される。
【0049】
(サービス管理システムを用いたサービス管理方法)
以上の構成を有するサービス管理システムを用いたサービス管理方法は以下の手順で行われる。図5は、サービス管理システムの動作を示すシーケンス図である。なお、ここでは、通信端末C1がサービスの提供を受けるにあたり、サーバ装置S2aと連携して処理を行っているものとする。
【0050】
先ず、通信端末C1よりサーバ装置S2aに対するサービス監視要求を、近傍のサーバ装置であるサーバ管理装置N1に発行する(S101)。このとき、近傍のサーバ管理装置のアドレス情報は、手動で静的に、或いはDHCPサービス等を使って動的に、通信端末C1に設定される。
【0051】
このサービス監視要求を受けたサーバ管理装置N1は(S201)、自分が管理しているサーバ装置か否かを判断し(S202)、自分が管理しているサーバ装置ではないと判断した場合には、そのサーバ装置S2aを管理しているサーバ管理装置N2にサービス監視要求を転送する(S203)。
【0052】
本実施形態では、この判断は、マッピング部によって作成されたマップに従って行われる。なお、この判断については、サーバ装置を管理しているサーバ管理装置の情報は、サーバ装置自身が保持しているか、或いは各サーバ管理装置が互いに管理しているサーバ装置の情報を交換することにより、取得するようにしてもよい。
【0053】
このステップS203におけるサービス監視要求の転送は、直接的に送信してもよいし、他のサーバ管理装置を経由して行ってもよい。転送の方式は、自分宛以外で新規に受け取ったサービス監視要求を、単純に隣接するサーバ管理装置に転送するフラッディング方式や、各サーバ管理装置が宛先までの経路を知っていてサービス監視要求内にその経路を指定する経路指定方式などいずれの方式も採用することができる。
【0054】
ステップS202において自分が管理しているサーバ装置であると判断した場合には、ステップS204に移行し、監視時間か、或いは監視回数が超過していないかについて判断を行い(S204)、監視時間外であるときや監視回数を超過しているときには、処理を終了する(S205)。
【0055】
ステップS204において、監視時間である、或いは監視回数以内であると判断したときには、他管理装置とのパス性能を測定し(S206)、次いで、サーバ装置の性能を測定し(S207)、測定結果を記録する(S208)。
【0056】
なお、上記ステップS207の性能記録に際しては、他のサーバ管理装置と重複してサーバ装置を登録しないように、マッピング処理が行われる。すなわち、サーバ管理装置は、サーバ装置の登録に際して、他のサーバ管理装置に登録されたサーバ装置の情報を取得し、重複登録がないか、或いは、自機よりもより近傍のサーバ管理装置がないかを判断し、重複している場合には、最も近傍のサーバ管理装置へ登録を依頼したり、自機における登録を抹消したり、既に自機に登録されている場合には、自機に登録された情報を他のサーバ管理装置に転送し、登録の移管を行う。
【0057】
そして、この記録された測定結果に基づいて、障害が発生していないかどうかを判断し(S209)、障害が発生している場合には、サービス監視要求で指定されたアクションに従い、通信端末C1に対して障害通知を送信する(S210及びS102)。障害通知を受信した通信端末C1は、サーバ装置の障害通知に対して、代替となる利用可能なサーバを監視して他のサーバ装置を利用したり、サーバ装置が提供するサービスを使わないようにすることで障害から回復できる。
【0058】
サーバ管理装置N1が、サーバ管理装置N2とN1の間のネットワークパスの障害を検出して通信端末C1に通知した場合、通信端末C1は、サーバ管理装置N2以外のサーバ管理装置N1と通信可能なサーバ管理装置が管理しているサーバ装置を監視し、例えばサーバ管理装置N3が管理しているサーバ装置S2cを代替サーバとして利用することができる。
【0059】
サーバ管理装置N1が通信端末C1との間のパスの障害を検出した場合は、通信端末C1に通知できないが、その通信端末が連携処理しているサーバ装置に通知して処理を停止することも可能である。
【0060】
ステップS209において障害が発生していないと判断した場合には、監視周期タイマにより所定時間待機状態を維持した後(S211)、上記S204〜S210までの処理をループ処理により繰り返す。
【0061】
一方、ステップS203において、サーバ管理装置N1からサーバ装置S2aに対するサービス監視要求を受け取ったサーバ管理装置N2は(S301)、サーバ監視手順へ移行し(S302)、サービス監視応答を送信する(S303)。
【0062】
次いで、監視時間か、或いは監視回数が超過していないかについて判断を行い(S304)、監視時間外であるときや監視回数を超過しているときには、処理を終了する(S305)。
【0063】
ステップS304において、監視時間である、或いは監視回数以内であると判断したときには、サーバ装置の性能を測定し(S306)、測定結果を記録する(S307)。そして、この記録された測定結果に基づいて、障害が発生していないかどうかを判断し(S308)、障害が発生している場合には、通信端末C1に対して障害通知を送信する(S309及びS102)。ステップS308において障害が発生していないと判断した場合には、監視周期タイマにより所定時間待機状態を維持した後(S310)、上記S304〜S309までの処理をループ処理により繰り返す。
【0064】
(変更例)
なお、本実施形態では、通信端末が監視要求を発行するモデルを説明したが、サーバ装置が他のサーバ装置の提供するサービスを利用して連携処理を行う場合も、そのサーバ装置の監視が必要になる。この場合も、同様にしてサーバ装置を効率的に監視可能である。すなわち、監視要求元のサーバ装置が監視要求を、監視対象サーバ装置を管理するサーバ管理装置に送り、障害の通知を受けることができる。
【0065】
【発明の効果】
以上説明したように、本発明のサービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置によれば、サーバ管理装置が各々管理するサーバの監視を行うことで、無線リンク,ネットワーク,複数のサーバのどこで障害が起きたかの切り分けが容易となる。また、各サーバの障害監視は近傍のサーバ管理装置との間で行われ、障害検出時のみ通信端末に対して通知が行われるため、頻繁な監視をしてもトラフィックの増加を抑えることができ、障害検出を早めることができる。さらに、障害の切り分けにより、サーバ障害の場合は異なるサーバ機器上のサーバ、ネットワーク障害の場合、異なる経路上のサーバなど、障害に影響されない代替サーバを選択することが可能になり、確実な障害回復を実現することができる。
【図面の簡単な説明】
【図1】実施形態に係るサービス管理システムの全体構成を模式的に示す説明図である。
【図2】実施形態に係るサーバ管理装置の構成例を示すブロック図である。
【図3】実施形態に係るサーバ装置の構成例を示すブロック図である。
【図4】実施形態に係るマッピング部の内部構成を示すブロック図である。
【図5】実施形態に係る通信端末がサーバ装置の監視要求を発行して受信するまでの、サーバ装置の監視手順におけるシーケンス図である。
【符号の説明】
C1…通信端末
N1〜N4…サーバ管理装置
S1a,S1b,S2a,S2b…サーバ装置
1…通信部
2…サービス監視要求受信部
3…サービス監視要求転送部
4…サービス監視通知部
5…サーバ装置性能測定部
6…他管理装置性能測定部
7…管理部
8…マッピング部
9…サーバ障害判定部
10…サーバ性能記憶部
11…タイマ
12…マッピング部
20…サーバ性能記憶部
21…通信部
22…サービス登録部
23…サービス処理部
24…応答部
25…サーバ負荷等獲得部
81…インターフェース部
82…閾値記憶手段
83…重複検出部
84…比較部
85…移管依頼部
86…管轄決定部
87…重複排除部
Claims (28)
- サービスを提供する複数のサーバ装置と、
前記複数のサーバ装置の中から該当するサーバ装置を監視する旨のサーバ監視要求を発行する通信端末と、
前記サーバ監視要求に応じて該当するサーバ装置を監視するサーバ管理装置とを備え、前記サーバ管理装置は、
近傍のサーバ装置の登録を受け付けるとともに、そのサーバ装置の性能を測定し、測定結果の性能情報として該サーバ装置を特定する識別子に関連付けて保持するサーバ性能記憶手段と、
前記監視要求に応じて、監視要求に該当する各サーバ装置の性能情報に基づいてサーバ装置の障害を判定するサーバ障害判定手段と
前記サーバ障害判定手段による判定結果を前記通信端末に通知する通知手段とを有することを特徴とするサービス管理システム。 - 前記通信端末や他のサーバ管理装置から受け取った監視要求を、他のサーバ管理装置に転送する監視要求転送手段と、
転送先のサーバ管理装置が管理するサーバ装置の識別子とその性能情報を含む応答を受け取る応答受信手段と
を備え、
前記サーバ障害判定手段は、自身が管理するサーバ装置で障害が発生していると判定した場合に、前記監視要求転送手段に監視要求を他のサーバ管理装置に転送させるとともに、前記応答受信手段が受信した転送先のサーバ管理装置が管理するサーバ装置の性能情報を監視要求元に送信することを特徴とする請求項1に記載のサービス管理システム。 - 他のサーバ管理装置との間の遅延を測定し、その測定結果を保持する他管理装置性能測定手段を備え、
前記サーバ性能記憶手段は、前記他管理装置性能測定手段が保持する測定結果と、前記応答受信手段が受信した性能情報とを、遠隔サーバ装置の性能情報として保持し、
前記サーバ障害判定手段は、前記遠隔サーバ装置の性能情報に基づいて、該遠隔サーバ装置までの通信経路上における障害の発生を判定し、
前記通知手段は、上記遠隔サーバ装置までの通信経路上における障害発生を監視要求元に通知する
ことを特徴とする請求項1又は2に記載のサービス管理システム。 - 前記サーバ障害判定手段は、
前記監視要求で指定された監視時間が経過するか、該監視要求で指定された監視回数が終了するか、監視要求元から終了の通知を受けるかのいずれかの時点で前記判定を終了することを特徴とする請求項1乃至3に記載のサービス管理システム。 - 前記サーバ障害判定手段は、
前記監視要求で指定された監視周期に基づいて、周期的に前記監視を行うことを特徴とする請求項1乃至4に記載のサービス管理システム。 - 前記各サーバ装置の性能情報は、応答処理時間や通信遅延、処理負荷を含むことを特徴とする請求項1乃至5に記載のサービス管理システム。
- 前記性能情報の閾値を記憶する閾値記憶手段と、
前記サーバ性能記憶手段に登録された各サーバの性能情報と前記閾値とを比較する比較手段と、
前記比較手段による比較結果に応じて、自機に登録されたサーバ装置に関する情報を、他のサーバ管理装置に対して登録の移管を依頼する移管依頼部と
を有するマッピング手段を備えることを特徴とする請求項1乃至6に記載のサービス管理システム。 - 前記マッピング手段は、
自機に登録された各サーバの識別子と、他のサービス管理システムに登録された各サーバの識別子とを照合し、重複して登録されているサーバを特定する重複検出手段と、
重複して登録されているサーバ装置の性能情報を比較し、この比較結果に応じて、管轄する近傍のサーバ装置を決定する管轄決定手段と、
管轄決定手段の決定結果に応じて、自機における登録の削除又は他のサーバ管理装置における登録の削除を依頼する重複排除手段と
を備えることを特徴とする請求項7に記載のサービス管理システム。 - 複数のサーバ管理装置により、サービスを提供する複数のサーバ装置の中から該当するサーバ装置を、通信端末からの監視要求に応じて監視するサービス管理方法であって、
前記サーバ管理装置において、通信端末から、近傍のサーバ装置の登録を受け付けるとともに、そのサーバ装置の性能を測定し、測定結果を性能情報として該サーバ装置を特定する識別子に関連付けて保持するステップ(1)と、
前記監視要求に応じて、監視要求に該当する各サーバ装置の性能情報に基づいてサーバ装置の障害を判定するステップ(2)と、
前記ステップ(2)よる判定結果を前記通信端末に通知するステップ(3)とを有することを特徴とするサービス管理方法。 - 前記通信端末や他のサーバ管理装置から受け取った監視要求を、他のサーバ管理装置に転送するステップ(4)と、
転送先のサーバ管理装置が管理するサーバ装置の識別子とその性能情報を含む応答を受け取るステップ(5)とをさらに備え、
前記ステップ(3)では、自身が管理するサーバ装置で障害が発生していると判定した場合に、自機が受信した監視要求を他のサーバ管理装置に転送するとともに、前記ステップ(2)で受信した転送先のサーバ管理装置が管理するサーバ装置の性能情報を監視要求元に送信することを特徴とする請求項9に記載のサービス管理方法。 - 他のサーバ管理装置との間の遅延を測定し、その測定結果を保持するステップ(6)を備え、
前記ステップ(1)において、前記ステップ(6)で保持された測定結果と、前記ステップ(5)で受信した性能情報とを、遠隔サーバ装置の性能情報として保持することを特徴とする請求項10に記載のサービス管理方法。 - 前記ステップ(2)において、
前記監視要求で指定された監視時間が経過するか、該監視要求で指定された監視回数が終了するか、監視要求元から終了の通知を受けるかのいずれかの時点で前記判定を終了することを特徴とする請求項9乃至11に記載のサービス管理方法。 - 前記ステップ(2)においては、
前記監視要求で指定された監視周期に基づいて、周期的に前記監視を行うことを特徴とする請求項9乃至12に記載のサービス管理方法。 - 前記各サーバ装置の性能情報は、応答処理時間や通信遅延、処理負荷を含むことを特徴とする請求項9乃至13に記載のサービス管理方法。
- 前記性能情報の閾値と、登録された各サーバの性能情報と前記閾値とを比較し、この比較結果に応じて、自機に登録されたサーバ装置に関する情報を、他のサーバ管理装置に対して登録の移管を依頼するステップを有することを特徴とする請求項9乃至14に記載のサービス管理方法。
- 自機に登録された各サーバの識別子と、他のサービス管理システムに登録された各サーバの識別子とを照合し、重複して登録されているサーバを特定するステップと、
重複して登録されているサーバ装置の性能情報を比較し、この比較結果に応じて、管轄する近傍のサーバ装置を決定するステップと、
この決定に応じて、自機における登録の削除又は他のサービス管理システムにおける登録の削除を依頼するステップと
を有することを特徴とする請求項15に記載のサービス管理方法。 - サービスを提供する複数のサーバ装置の中から該当するサーバ装置を、通信端末からの監視要求に応じて監視するサーバ管理装置であって、
近傍のサーバ装置の登録を受け付けるとともに、そのサーバ装置の性能を測定し、測定結果を性能情報として該サーバ装置を特定する識別子に関連付けて保持するサーバ性能記憶手段と、
前記監視要求に応じて、監視要求に該当する各サーバ装置の性能情報に基づいてサーバ装置の障害を判定するサーバ障害判定手段と
前記サーバ障害判定手段による判定結果を前記通信端末に通知する通知手段とを有することを特徴とするサーバ管理装置。 - 前記通信端末や他のサーバ管理装置から受け取った監視要求を、他のサーバ管理装置に転送する監視要求転送手段と、
転送先のサーバ管理装置が管理するサーバ装置の識別子とその性能情報を含む応答を受け取る応答受信手段と
を備え、
前記サーバ障害判定手段は、自身が管理するサーバ装置で障害が発生していると判定した場合に、前記監視要求転送手段に監視要求を他のサーバ管理装置に転送させるとともに、前記応答受信手段が受信した転送先のサーバ管理装置が管理するサーバ装置の性能情報を監視要求元に送信することを特徴とする請求項17に記載のサーバ管理装置。 - 他のサーバ管理装置との間の遅延を測定し、その測定結果を保持する他管理装置性能測定手段を備え、
前記サーバ性能記憶手段は、前記他管理装置性能測定手段が保持する測定結果と、前記応答受信手段が受信した性能情報とを、遠隔サーバ装置の性能情報として保持し、
前記サーバ障害判定手段は、前記遠隔サーバ装置の性能情報に基づいて、該遠隔サーバ装置までの通信経路上における障害の発生を判定し、
前記通知手段は、上記遠隔サーバ装置までの通信経路上における障害発生を監視要求元に通知する
ことを特徴とする請求項17又は18に記載のサーバ管理装置。 - 前記サーバ障害判定手段は、
前記監視要求で指定された監視時間が経過するか、該監視要求で指定された監視回数が終了するか、監視要求元から終了の通知を受けるかのいずれかの時点で前記判定を終了することを特徴とする請求項17乃至19に記載のサーバ管理装置。 - 前記サーバ障害判定手段は、
前記監視要求で指定された監視周期に基づいて、周期的に前記監視を行うことを特徴とする請求項17乃至20に記載のサーバ管理装置。 - 前記各サーバ装置の性能情報は、応答処理時間や通信遅延、処理負荷を含むことを特徴とする請求項17乃至21に記載のサーバ管理装置。
- 前記性能情報の閾値を記憶する閾値記憶手段と、
前記サーバ性能記憶手段に登録された各サーバの性能情報と前記閾値とを比較する比較手段と、
前記比較手段による比較結果に応じて、自機に登録されたサーバ装置に関する情報を、他のサーバ管理装置に対して登録の移管を依頼する移管依頼部と
を有するマッピング手段を備えることを特徴とする請求項17乃至22に記載のサーバ管理装置。 - 前記マッピング手段は、
自機に登録された各サーバの識別子と、他のサービス管理システムに登録された各サーバの識別子とを照合し、重複して登録されているサーバを特定する重複検出手段と、
重複して登録されているサーバ装置の性能情報を比較し、この比較結果に応じて、管轄する近傍のサーバ装置を決定する管轄決定手段と、
管轄決定手段の決定結果に応じて、自機における登録の削除又は他のサーバ管理装置における登録の削除を依頼する重複排除手段と
を備えることを特徴とする請求項23に記載のサーバ管理装置。 - サーバ装置からサービスの提供を受ける通信端末であって、
前記複数のサーバ装置の中から該当するサーバ装置を監視する旨のサーバ監視要求を発行する手段と、
前記監視要求に応じて、サーバ管理装置に登録されたサーバ装置の性能の測定結果である性能情報に基づいて判定され、該サーバ装置に発生した障害に関する通知を受信する手段と
を備えたことを特徴とする通信端末。 - 前記検索要求には、サーバ装置の種別、応答時間又は負荷のいずれかを指定した性能指標が含まれ、
前記サーバ管理装置からの応答は、前記性能指標に適合する前記性能情報に基づいてなされることを特徴とする請求項25に記載の通信端末。 - 通信端末からの要求に応じてサービスを提供するサーバ装置であって、
前記サーバ検索要求に応じて該当するサーバ装置を検索するサーバ管理装置に対して、登録を要求する手段と、
前記サーバ管理装置との間における通信遅延や、自機の処理時間、自機のCPUやメモリ等のハード資源の利用率などの負荷情報に基づいて、自機のアービス性能を測定する性能測定手段と、
前記サーバ管理装置からの性能測定の要求に応じてサービス性能を応答する手段と
を有することを特徴とするサーバ装置。 - 前記登録を要求するに際し、有効に登録されている期間を指定する手段と、
該期間が満了する前に再登録処理を行う手段と
を有することを特徴とする請求項27に記載のサーバ装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002218682A JP2004062441A (ja) | 2002-07-26 | 2002-07-26 | サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002218682A JP2004062441A (ja) | 2002-07-26 | 2002-07-26 | サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004062441A true JP2004062441A (ja) | 2004-02-26 |
Family
ID=31939800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002218682A Pending JP2004062441A (ja) | 2002-07-26 | 2002-07-26 | サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004062441A (ja) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005121989A1 (en) * | 2004-06-11 | 2005-12-22 | Lg Electronics Inc. | Device management method for device management system |
JP2007531949A (ja) * | 2004-06-25 | 2007-11-08 | アプル・コンピュータ・インコーポレーテッド | 長命のdnsクエリを円滑にするための方法および装置 |
JP2008158051A (ja) * | 2006-12-21 | 2008-07-10 | Canon Inc | 画像形成装置、および画像形成装置の管理システム |
JP2009514079A (ja) * | 2005-10-27 | 2009-04-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | リソースの仮想化ヘルスモニタの方法およびシステム |
JP2013037655A (ja) * | 2011-08-11 | 2013-02-21 | Fujitsu Ltd | 情報処理プログラムおよび情報処理装置 |
JP2016062431A (ja) * | 2014-09-19 | 2016-04-25 | コニカミノルタ株式会社 | 印刷システム及び画像形成装置 |
JP2017130152A (ja) * | 2016-01-22 | 2017-07-27 | セイコーエプソン株式会社 | ネットワークシステム、印刷装置、及び、印刷装置の制御方法 |
WO2020105287A1 (ja) * | 2018-11-20 | 2020-05-28 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム |
KR20200086393A (ko) * | 2019-01-08 | 2020-07-17 | 주식회사 코레토 | 클라우드 서버의 자동 스케일링 방법, 장치 및 컴퓨터-판독가능기록매체 |
CN113868067A (zh) * | 2021-09-27 | 2021-12-31 | 青岛海信智慧生活科技股份有限公司 | 故障检测设备、方法及通信*** |
-
2002
- 2002-07-26 JP JP2002218682A patent/JP2004062441A/ja active Pending
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4664977B2 (ja) * | 2004-06-11 | 2011-04-06 | エルジー エレクトロニクス インコーポレイティド | 装置管理システムのための装置管理方法 |
JP2008502075A (ja) * | 2004-06-11 | 2008-01-24 | エルジー エレクトロニクス インコーポレイティド | 装置管理システムのための装置管理方法 |
WO2005121989A1 (en) * | 2004-06-11 | 2005-12-22 | Lg Electronics Inc. | Device management method for device management system |
US7747722B2 (en) | 2004-06-11 | 2010-06-29 | Lg Electronics Inc. | Device management method for device management system |
JP2007531949A (ja) * | 2004-06-25 | 2007-11-08 | アプル・コンピュータ・インコーポレーテッド | 長命のdnsクエリを円滑にするための方法および装置 |
JP2009514079A (ja) * | 2005-10-27 | 2009-04-02 | インターナショナル・ビジネス・マシーンズ・コーポレーション | リソースの仮想化ヘルスモニタの方法およびシステム |
JP2008158051A (ja) * | 2006-12-21 | 2008-07-10 | Canon Inc | 画像形成装置、および画像形成装置の管理システム |
JP2013037655A (ja) * | 2011-08-11 | 2013-02-21 | Fujitsu Ltd | 情報処理プログラムおよび情報処理装置 |
JP2016062431A (ja) * | 2014-09-19 | 2016-04-25 | コニカミノルタ株式会社 | 印刷システム及び画像形成装置 |
JP2017130152A (ja) * | 2016-01-22 | 2017-07-27 | セイコーエプソン株式会社 | ネットワークシステム、印刷装置、及び、印刷装置の制御方法 |
WO2020105287A1 (ja) * | 2018-11-20 | 2020-05-28 | ソニー株式会社 | 情報処理装置、情報処理方法、プログラム |
KR20200086393A (ko) * | 2019-01-08 | 2020-07-17 | 주식회사 코레토 | 클라우드 서버의 자동 스케일링 방법, 장치 및 컴퓨터-판독가능기록매체 |
KR102150016B1 (ko) * | 2019-01-08 | 2020-09-01 | 주식회사 코레토 | 클라우드 서버의 자동 스케일링 방법, 장치 및 컴퓨터-판독가능기록매체 |
CN113868067A (zh) * | 2021-09-27 | 2021-12-31 | 青岛海信智慧生活科技股份有限公司 | 故障检测设备、方法及通信*** |
CN113868067B (zh) * | 2021-09-27 | 2024-04-09 | 青岛海信智慧生活科技股份有限公司 | 故障检测设备、方法及通信*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20150381447A1 (en) | Service coordination for a data center | |
CN107357571B (zh) | 设备组件程序的维护方法及*** | |
WO2014166265A1 (en) | Method, terminal, cache server and system for updating webpage data | |
US20140310372A1 (en) | Method, terminal, cache server and system for updating webpage data | |
JP2002271833A (ja) | 移動通信システムにおけるサービスエリアの通信品質維持方法ならびにその移動通信端末装置、管理サーバシステム | |
JP2004062441A (ja) | サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置 | |
WO2017206943A1 (zh) | 一种光网络终端及其工作方法、及通信***、存储介质 | |
CN102307194B (zh) | 一种通用协议进程平滑重启方法和装置 | |
JP6007988B2 (ja) | 予備系装置、運用系装置、冗長構成システム、及び負荷分散方法 | |
JP2004062443A (ja) | サービス管理システム、サービス管理方法、サーバ管理装置、通信端末及びサーバ装置 | |
CN108900441B (zh) | 网络切换方法、第一电子设备及可读存储介质 | |
US11652682B2 (en) | Operations management apparatus, operations management system, and operations management method | |
JP2009253403A (ja) | ログレベル収集装置およびログレベル収集方法 | |
WO2007059667A1 (fr) | Procede d'obtention de donnees d'alarme des elements de reseau | |
JP2009206731A (ja) | 監視システム、監視装置、監視方法、およびプラグラム | |
Rangarajan et al. | A fault-tolerant protocol for location directory maintenance in mobile networks | |
TWI727519B (zh) | 終端裝置、通信系統及通信方法 | |
JP2016158070A (ja) | 基地局輻輳管理システム、及び基地局輻輳管理方法 | |
JP2015170878A (ja) | ネットワーク内の複数データ通信装置を管理する運用管理装置 | |
US20230007511A1 (en) | Wireless network device and information collection method for wireless network device | |
CN113794639B (zh) | 一种通信方法及装置 | |
JP2017225005A (ja) | 情報処理装置、情報処理方法、プログラム及び情報処理システム | |
US20210306891A1 (en) | Network monitoring system | |
JP2009151388A (ja) | 監視処理プログラム、方法及び装置 | |
KR0139722B1 (ko) | 이동통신시스템의 데이터베이스에서 중복된 데이터의 일치성 유지를 위한 감사 방법 |