JP5532053B2 - 運用管理装置及び運用管理方法 - Google Patents

運用管理装置及び運用管理方法 Download PDF

Info

Publication number
JP5532053B2
JP5532053B2 JP2011539221A JP2011539221A JP5532053B2 JP 5532053 B2 JP5532053 B2 JP 5532053B2 JP 2011539221 A JP2011539221 A JP 2011539221A JP 2011539221 A JP2011539221 A JP 2011539221A JP 5532053 B2 JP5532053 B2 JP 5532053B2
Authority
JP
Japan
Prior art keywords
data
common
elements
unit
occurred
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2011539221A
Other languages
English (en)
Other versions
JPWO2011055436A1 (ja
Inventor
透 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JPWO2011055436A1 publication Critical patent/JPWO2011055436A1/ja
Application granted granted Critical
Publication of JP5532053B2 publication Critical patent/JP5532053B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B23/00Testing or monitoring of control systems or parts thereof
    • G05B23/02Electric testing or monitoring
    • G05B23/0205Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults
    • G05B23/0218Electric testing or monitoring by means of a monitoring system capable of detecting and responding to faults characterised by the fault detection method dealing with either existing or incipient faults
    • G05B23/0224Process history based detection method, e.g. whereby history implies the availability of large amounts of data
    • G05B23/0227Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions
    • G05B23/0237Qualitative history assessment, whereby the type of data acted upon, e.g. waveforms, images or patterns, is not relevant, e.g. rule based assessment; if-then decisions based on parallel systems, e.g. comparing signals produced at the same time by same type systems and detect faulty ones by noticing differences among their responses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本件は、装置の運用を管理する技術に関する。
企業などのように多くの情報処理システムを利用する場所では、システムの利用者とは別に、システムの管理者が存在し、故障や処理異常など、システムの運用を妨げる或いはその恐れのある問題の監視や、当該問題の対処を行っている。
情報処理システムは、演算や記憶、表示、通信などの処理を行うハードウェアと、当該処理に用いられるOS(Operating System)、アプリケーションプログラム、ファームウェアなどのソフトウェアに大別される多くの構成要素を有している。このため、システムの管理者は、故障や処理異常などの問題が発生した場合に、何れの構成要素が原因となっているのかを調査する作業が負担となっていた。
そこで、管理作業の負担を軽減することを目的として、運用管理ソフトウェアが開発され、管理者に利用されている。
例えば、管理対象の情報処理システムに問題が発生した場合、運用管理ソフトウェアはポップアップメッセージやメールなどのアラームによって管理者に問題を通知する機能を備えている。
図1は、ポップアップメッセージによるアラームの例を示す。図1に示すように、運用管理ソフトウェアは、問題が発生したノードや日時、重要性、アラームの内容といった情報を表示する。
アラームによって問題の発生を知った管理者は、運用管理ソフトウェアのログ参照機能を用いて、問題の内容や原因を調査する。図2は、運用管理ソフトウェアによって採取したログを参照した例を示す。当該ログは、図2に示すように、イベントが発生した日時、発生したノード、イベントの内容を示すメッセージテキスト、イベントが発生したモジュール、エラーコード、イベントの重要性、発生したコンポーネント、ユーザ、識別情報等の情報を表示する。ここで、イベントとは、例えば、運用管理ソフトウェアが検知した情報処理システム内の様々な現象である。
また、運用管理ソフトウェアは、ログを参照する際、蓄積した多数のログを絞り込む機能やキーワードで検索する機能によって、管理者の調査を支援する。
図3は、ログの絞込み条件の設定例を示す。例えば、図3に示すように、日時が08/10/08 04:15PM以降で、重要性がWarningのイベントを検索する。
しかし、ログの参照だけでは、管理者が問題の現象や発生箇所を知るにとどまり、原因を突き止めるには至らない場合も多い。この場合に、管理者は、問題が発生しているシステムと問題が発生していないシステムを比較し、その差分から、問題の原因を突き止めるための手がかりを探すことがある。問題が発生しているシステムに在り、問題が発生していないシステムに無い構成要素が、問題の発生に関与していることがあるためである。
このため、管理者は、運用管理ソフトウェアの機能を用いて、問題が発生しているシステムと問題が発生していないシステムについてそれぞれシステムの構成要素や属性値を表示させ、比較する。
図4はハードウェア構成の表示例、図5はソフトウェア構成の表示例、図6は属性値の表示例を示す。
例えばハードウェア構成は、図4のように、ノード(Partiton#1_0.124.22.70)に、筐体(Chassis components)やシステムボード(SB#1)などのコンポーネントの存在が示される。また、当該筐体に電源(ACPDBH#0-#7)やファン(FAN_A#0-A#5,B#0,B#1)などのユニットの存在が示される。
また、ソフトウェア構成は、図5のように、ソフトウェアの構成として、ソフトウェアのパッケージ名、ソフトウェアの属するノード名、ソフトウェアの概要、カテゴリー、アーキテクチャ、バージョン等が示される。
また、属性は、図6のように、ノードの属性値として、ノード名、通信アドレス、システムID、ハードウェア名、OS名とOSのバージョン、ハードウェアの状態、通信状態等が示される。
システムの構成要素や属性は数が多く、2つあるいは複数のシステムを比較した場合に、どこに違いがあるかを人(管理者)が抽出するのは、手間と時間のかかる作業となる。
このため、2つのシステム間の差分を抽出するソフトウェアがあり、当該ソフトウェアを用いることにより、比較作業の効率化が図られている。
図7は、2つのシステムを比較した場合の差分箇所の表示例を示す。図7では、システムの名称、モデル、プロセッサタイプ、メモリ容量、OS、設置場所などの項目を比較している。なお、2つのシステムで同じ項目は、1行にその内容を表示し、背景色を無しにしている。例えば、図7において、モデル、プロセッサタイプ、キャッシュ容量が同じ項目である。また、2つのシステムで差がある項目は、それぞれ1行ずつその内容を表示し、背景色を変えている。例えば、図7において、システムの名称、メモリ容量、OSが異なっており、SLES10SP1の項目の背景色を斜線、pq−rhl4u4の項目の背景色をクロスラインとしている。
特開2002−55717号公報 特開2004−101203号公報 特開2005−63332号公報
市瀬他:階層的知識間の調整規則の学習、人工知能学会論文誌、17巻、3号F、PP.230-238(2002年)
システム間の差分を抽出したとしても、数ある違いの中から調査対象の問題の発生に関与しそうなものと、そうでないものを選別するには、やはり多くの手間と時間がかかり、また、管理者に高いスキルが求められる。
例えば、図8に示すように、問題が発生しているAシステムと、問題が発生していないBシステムがあった場合に、管理者が問題の発生にOSが関与しているという仮説を立てたとする。その観点でAシステムとBシステムを比較した結果、OSの版数に違いがあれば、OSの版数が問題の発生に関与している可能性が考えられる。しかし、Aシステムと問題が発生していないCシステムを比較したところ、それらのOS版数が同じであったとすれば、問題の発生がOSの版数に依存していない可能性がある。この場合、調査を進めるには、観点を変えてシステムの比較を行い、問題が発生しているシステムに見られる特徴を探し出す必要がある。
この調査方法から問題発生の原因或いはその仮説を導き出すためには、より多くのシステムを比較することが有効である。しかし、手間と時間を考えると、人(管理者)がシステムの比較を行う場合には、どのシステムを比較対象とし、どのような観点で比較するのが効果的であるかを推論し、比較対象と比較の観点を適切に設定することが重要である。よって、調査の進展は管理者のスキルに依存することになる。
そこで、開示の一実施形態は、問題が発生したシステムの特徴を容易に抽出する技術を提供する。
課題を解決する一形態としての運用管理装置は、
複数の管理対象の装置が備える要素の管理データを受信する収集部と、
受信した前記管理データのうち、問題が発生した装置のデータである問題データの従属関係を前記要素間の従属関係を定義した定義情報に従って求める一方、問題が発生していない装置のデータである非問題データの従属関係を前記定義情報から求める分析部と、
前記問題データと非問題データとを比較して、共通する要素の管理データを求め、該共通する要素に従属する要素の管理データについて前記問題データと前記非問題データとの差分を抽出する比較部と、を備える。
開示の一実施形態は、問題が発生したシステムの特徴を容易に抽出する技術を提供できる。
ポップアップメッセージによるアラームの例を示す図 運用管理ソフトウェアによって採取したログを参照した例を示す図 ログの絞込み条件の設定例を示す図 ハードウェア構成の表示例を示す図 ソフトウェア構成の表示例を示す図 図6は属性値の表示例を示す図 システムを比較した場合の差分箇所の表示例を示す図 問題が発生しているシステムと問題が発生していないシステムの比較例を示す図 問題が発生しているシステムと問題が発生していないシステムの比較例を示す図 運用管理装置の概略構成図 管理データの木構造の説明図 ログデータのデータ構造を示す図 クライアントのブロック図 監視対象システムの機能ブロック図 マネージャが管理データをデータ格納部へ書き込む処理の説明図 エージェントによる管理データの送信処理の説明図 クライアントによる分析結果の受信及び出力処理の説明図 マネージャによる分析及び分析結果の送信処理の説明図 データ分析処理の説明図 問題発生共通木の作成処理の具体例を示す図 ノードのデータ構造を示す図 問題発生木の一例を示す図 問題が発生したシステムの特徴を抽出する処理の説明図 属性ノードの説明図 運用管理システムのブロック図 スキーマの説明図 分析結果の表示例を示す図
以下、図面を参照して本発明を実施するための形態について説明する。以下の実施の形態の構成は例示であり、本発明は実施の形態の構成に限定されない。
実施形態1の情報処理システムは、問題の発生したシステムと問題の発生していないシステムの単なる差分を抽出するのではなく、問題の原因の検出に貢献しそうな差分を見つけ出す。ここで、原因の検出に貢献しそうな差分は、例えば、問題の発生したシステムと一部の構成や属性に共通点がある問題が発生していないシステムと、問題の発生したシステムとの構成などの差分と考えることができる。
図9を例にして、発生した問題の原因の検出に貢献しそうな差分について説明する。図9の例では、問題の発生したシステムAと問題の発生していないシステムB、Cがある。ここで、システムAに発生している問題は、OSに含まれるソフトウェアに依存する問題であったとする。その場合、AシステムとBシステムとのように適用するOSが異なると、それぞれのOSに含まれるソフトウェアは違うので、OSの違いから派生して検出されるOS版数や構成ソフトウェアの違いは意味のない情報である。
一方で、AシステムとCシステムとでは同じOSが使われている。その場合に、OSに含まれるソフトウェアの差分には意味があると考えることが出来る。図9の例では、AシステムとCシステムとの比較結果として、Aシステムには「Y packageがある」、「Z packageがない」という特徴が抽出できる。このように、問題の原因調査においては、問題が発生したシステムと類似性を持っていながら問題の発生していないシステムと、問題が発生したシステムとを比較して、その差分を抽出することが有効である。
即ち、Aシステムとシステムとで共通に用いられているOS「XOS」のように、問題の発生したシステムと問題の発生していないシステムとで共通するデータを抽出した上で、OSに従属するソフトウェアである「Y package」等のように、共通するデータに従
属するデータについて、問題が発生したシステムと問題の発生していないシステムとの構成の差分を抽出する。
本実施形態1では、運用管理装置が、原因調査の対象である問題が発生したシステムが複数ある場合には、管理するすべてのシステムのうち、まずこれら問題の発生したシステムに共通する構成や属性のデータ(問題発生共通データ)を抽出する。次に運用管理装置が、管理するすべてのシステムのうち、問題が発生しないシステムの構成や属性のデータ(問題非発生データ)を全て抽出する。そして、運用管理装置は、問題発生共通データと問題非発生データとを比較し、両者で共通するデータ(上記XOS等)を抽出し、抽出した共通するデータに従属するデータ(上記Y package等)の差分を抽出する。この方法により得られた結果つまり差分は、問題の発生したシステムと、問題発生するシステムに類似した問題の発生していないシステムとの差分であり、単なるシステム間の構成などの差分よりも端的に問題が発生したシステムの特徴を示すことになる。
〈システム構成〉
図25は、運用管理システムのブロック図である。本実施形態1の運用管理システムは、ネットワークやケーブル等の回線を介して接続した運用管理装置10、クライアント20、監視対象システム30を有している。
運用管理装置10は、図10に示すように、データの演算処理を行うデータ処理部1と、他の装置との通信を行う通信処理部2と、演算処理の為のデータやソフトウェアを記憶するデータ格納部3とを備えたコンピュータであり、以下マネージャとも称す。
通信処理部2は、ネットワークやケーブル等の回線を介して他のコンピュータと通信を行う。
データ格納部3は、ハードディスクやSolid State Drive、Solid State Disk(SSD)といった記憶部であり、オペレーティングシステム(OS)やアプリケーションプログラム(一例として運用管理ソフトウェア)を記憶している。また、データ格納部3は、監視対象システム30のエージェントから受信した構成データやログデータ、分析結果、データのスキーマを格納する。
データ処理部1は、CPUやメインメモリを有し、OSやアプリケーションソフトといったプログラムをデータ格納部3からメインメモリに読み出し、読み出したプログラムに従ってCPUが、通信処理部2で受信したデータ等の演算処理を行う。この演算処理により、CPUは、情報収集部11や、描画部12、アラーム部13、ログフィルタ部14、比較部15、分析部16としても機能する。
情報収集部11は、クライアント20からの要求に応じて、監視対象の装置、即ち監視対象システム30のエージェントへ管理データを要求し、当該エージェントから監視対象システム30の管理情報を受信即ち収集する。また、情報収集部11は、監視対象システム30のエージェントから自発的に送信された管理データを受信する。なお、本実施形態において、管理データは構成データ或いはログデータを含むデータであり、構成データは監視対象システム30が備える各構成要素の情報、ログデータは監視対象システム30のログのデータである。
描画部12は、分析部16の分析結果等を表示装置(不図示)に表示させる。
アラーム部13は、情報収集部11で収集したデータが所定条件を満たし、問題が発生した或いは問題が発生する恐れがあると判定した場合にアラームを出力する。例えばアラーム部13は、発生した問題と対応するメッセージをアラームとし、通信処理部2を介してクライアント20に通知する。また、アラーム部13は、アラームを電子メールとして管理者等の所定のアドレス宛てに送信しても良い。
ログフィルタ部14は、情報収集部11で収集したデータのうちログデータを、クライアント20によって指定された条件に応じて抽出(フィルタリング)する。
分析部16は、情報収集部11で受信したデータに基づいて問題が発生した装置を判別し、受信したデータのうち構成データを問題が発生した装置のデータである問題データと問題が発生していない装置のデータである非問題データに分類する。そして分析部16は、問題データに分類されている各要素の構成データの従属関係を所定の定義情報に基づいて決定すると共に、非問題データに分類されている各要素の構成データの従属関係を所定の定義情報に基づいて決定する。分析結果は、通信処理部2を介してクライアント20に送信される。
比較部15は、問題データと非問題データとを比較して、共通する要素の構成データを求め、共通する要素の構成データに従属する構成データについて問題データと非問題データの差分を抽出する。
本実施形態1において、情報収集部11で収集するデータは、構成データとログデータを含む。なお、構成データは、分析部16により、所定の定義情報に基づいて他の構成データとの従属関係が決定され、図11に示すように、木構造にマッピングされる。
図11において、丸で示したノードが構成データによって示されるシステムの構成を表し、図11の最上部に位置するノードがルートノード、このルートノードとリンクして図11の下方に位置するノードが、ルートノードに従属するノードである。例えばノードN2,N3は、ルートノードN1に従属するノード、ノードN4,N5はノードN2に従属するノードである。なお、図11において、一本線のリンクは、従属するノードが上位ノードの属性を示すノードであることを示し、二本線のリンクは、従属するノードが、システムに含まれる構成のうち、上位ノードと関連する構成を示すノードであることを示している。即ち、ノードN2はノードN1と関連する構成であり、ノードN3はノードN1の属性を示すノードである。例えば、OSを示すノードとOSのバージョン(OSの属性)を示すノードとのリンクは一本線で示され、OSを示すノードとOS用のパッケージ(OSに関連する構成)を示すノードとのリンクは二本線で示される。
一方、本実施形態1のログデータは、例えば、図12に示すように、ログID、問題のデータ、システムのデータ、付帯データを有している。ここで、ログIDは、ログを特定するための識別情報である。問題のデータは、システムに発生した問題を示すデータであり、監視対象システム30に発生したイベントがエラーなのか警告なのか等を示すイベントタイプや、発生したイベントを特定するイベントID、イベントが発生したモジュールを示すイベントソース、イベントに応じたメッセージ等を含む。システムのデータは、当該ログを出力した監視対象システムを示す識別情報であり、例えばGlobally Unique Identifier (GUID)である。また、付帯情報は、問題の発生時刻といった、発生した問題に付帯するその他の情報である。
構成データおよびログデータは、マネージャ10からの要求に対する応答としてエージェントから送信される場合と、エージェントから自発的に送信される場合とがある。
図13は、クライアント20のブロック図である。クライアント20は、図13に示すように、データの演算処理を行うデータ処理部21、他の装置との通信を行う通信処理部22、演算処理の為のデータやソフトウェアを記憶する記憶部23、入力部24、出力部(図13の例では表示装置)25を備えたコンピュータである。
通信処理部22は、ネットワークやケーブル等の回線を介して他のコンピュータと通信を行う。
記憶部23は、ハードディスクやSSDといった補助記憶装置であり、オペレーティングシステム(OS)やアプリケーションプログラム(クライアントプログラム等)を記憶している。
入力部24は、データ処理部21へ情報を入力する手段であり、キーボードやポインティングデバイスといったユーザインタフェースや、メモリカードやCD−ROM等の記憶媒体から情報を読み取るデバイスを有している。
出力部25は、データ処理部21の処理結果を出力する手段であり、分析結果等を表示する表示装置や、アラーム等の音を出力するスピーカ、ログ等のデータを印刷するプリンターを有している。
データ処理部21は、CPUやメインメモリを有する。CPUは、前記OSやアプリケーションプログラムを記憶部23からメインメモリに読み出し、読み出したOSやアプリケーションプログラムに従って、通信処理部22で受信したデータ等の演算処理を行う。この演算処理により、CPUは、入力解析部211や、ポップアップ部212、ログ表示部213、フィルタ指定部214、ハード表示部215、ソフト表示部216、属性表示部217、差分表示部218、特徴表示部219としても機能する。
入力解析部211としてCPUは、管理者の操作によって入力部24から入力された入力情報を解析し、対応する命令を各部へ送る。例えば、入力情報が問題の発生したシステムの分析を要求するものであれば、入力解析部211は、通信処理部22を介してマネージャ10に問題の発生したシステムの特徴を要求する。また、入力解析部211は、入力情報がログやハードウェア、ソフトウェア、属性の表示を要求するものであれば、これらの表示要求をマネージャ10に送信する。
ポップアップ表示部212としてCPUは、マネージャ10から受信した情報を表示装置にポップアップ表示する。例えばマネージャ10から、問題が発生した旨のメッセーバを受信した場合に、当該メッセージをポップアップ表示する。
ログ表示部213としてCPUは、マネージャ10からログデータを受信した場合に、当該ログデータに基づいて監視対象システムのログを表示装置上に表示する。
フィルタ指定部214としてCPUは、ログ表示や、ハード表示、ソフト表示を行う際に、表示する項目を絞り込むため、管理者が選択したフィルタ(条件)をマネージャ10に送信することでフィルタを指定する。
ハード表示部215としてCPUは、マネージャ10からハードウェアのデータを受信した場合に、当該データに基づいて管理対象システムに備えられたハードウェアに関する情報を表示する。
ソフト表示部216としてCPUは、マネージャ10からソフトウェアのデータを受信した場合に、当該データに基づいて管理対象システムに用いられているソフトウェアに関する情報を表示する。
属性表示部217としてCPUは、マネージャ10から属性のデータを受信した場合に、当該データに基づいて管理対象システムに用いられている要素の属性に関する情報を表示する。
差分表示部218としてCPUは、マネージャ10から差分のデータを受信した場合に、当該データに基づいて管理対象システムに用いられている要素間の差分を表示する。
特徴表示部219としてCPUは、マネージャ10から特徴のデータを受信した場合に、当該データに基づいて問題を発生するシステムの特徴を表示する。
図14は、監視対象システム30のブロック図である。監視対象システム30は、図14に示すように、データの演算処理を行うデータ処理部31、他の装置との通信を行う通信処理部32、演算処理の為のデータやソフトウェアを記憶する記憶部33、入力部34、出力部35を備えたコンピュータである。
通信処理部32は、ネットワークやケーブル等の回線を介して他のコンピュータと通信を行う。
記憶部33は、ハードディスクやSSDといった補助記憶装置であり、オペレーティングシステム(OS)やアプリケーションプログラム(エージェントプログラム)を記憶している。エージェントプログラムは、管理対象の情報処理システムに、もともと組み込まれているファームウェアの形態でもよいし、システムにインストールするソフトウェアの形態でもよい。
入力部34は、データ処理部31へ情報を入力する手段であり、キーボードやポインティングデバイスといったユーザインタフェースや、メモリカードやCD−ROM等の記憶媒体から情報を読み取るデバイスを有している。
出力部35は、データ処理部31の処理結果を出力する手段であり、分析結果等を表示する表示装置や、アラーム等の音を出力するスピーカ、ログ等のデータを印刷するプリンターを有している。
データ処理部31は、CPUやメインメモリを有する。CPUは、前記OSやアプリケーションプログラムを記憶部33からメインメモリに読み出し、読み出したOSやアプリケーションプログラムに従って、通信処理部32で受信したデータ等の演算処理を行う。この演算処理により、CPUは、ログ収集部311や、ハード情報収集部312、ソフト情報収集部313としても機能する。なお、エージェントプログラムを実行するCPU、即ち機能部311−313をエージェントとも称する。図14には、エージェントプログラムに従って実行される機能部311−313を示したが、管理対象システム30は、データベースやウエブサーバ、ファイルサーバなど、他の機能も実現する。
ログ収集部311は、自システムのログを収集し、ログデータとして通信処理部32を介してマネージャ10へ送信する。例えばログ収集部311は、新たなログが出力される毎に或いは定期的に、収集したログデータをマネージャ10に送信する。また、ログ収集部311は、マネージャ10からログデータの要求を受信した場合に、システムのログをメインメモリから読み出し、通信処理部32を介してマネージャ10へ送信する。
ハード情報収集部312は、マネージャ10からハードウェアの情報の要求を受信した場合に、自システムに備えられている各ハードウェアから夫々の情報を読み出し、ハードウェアの情報としてマネージャ10に返信する。なお、ハードウェアの情報の収集は、マネージャ10からの要求時に限らず、当該システムにハードウェアを接続したときに行っても良い。例えば、ハード情報収集部312は、プラグアンドプレイの機能により当該システムにハードウェアが接続されたことを検知した場合に、この接続したハードウェアに備えられたROMから当該ハードウェアの情報を読み出してメインメモリに記憶させておく。そして、マネージャ10からハードウェアの情報の要求を受信した場合に、ハード情報収集部312は、メインメモリからハードウェアの情報を読み出してマネージャ10へ返信しても良い。なお、ハード情報収集部312は、各ハードウェアの構成関連の情報のほか、各ハードウェアの属性も収集し、ハードウェアの情報としてマネージャ10に送信する。
また、ハード情報収集部312は、マネージャ10からの要求によらずに、ハードウェアの情報を収集してマネージャ10に送信しても良い。例えばハードウェアを着脱した場合や、ハードウェアのドライバを更新した場合、所定の周期で、ハード情報収集部312がハードウェアの情報を収集してマネージャ10に送信しても良い。
ソフト情報収集部313は、マネージャ10からソフトウェアの情報の要求を受信した場合に、自システムに備えられている各ソフトウェアの情報を所定の記憶領域、例えばレジストリから読み出し、ソフトウェアのデータとしてマネージャ10に返信する。なお、ソフト情報収集部313は、各ソフトウェアの構成関連の情報のほか、各ソフトウェアの属性も収集し、ソフトウェアの情報としてマネージャ10に送信する。
また、ソフト情報収集部313は、マネージャ10からの要求によらず、ソフトウェアの情報をマネージャ10に送信しても良い。例えば、ソフトウェアをインストールした場合や、アンインストールした場合、ソフトウェアを更新した場合、所定の周期で、ソフト情報収集部313がソフトウェアの情報を収集してマネージャ10に送信しても良い。
〈運用管理方法の説明〉
図15は、マネージャ10が監視対象システム30のエージェントから管理データを受信してデータ格納部3へ書き込む処理の説明図である。
マネージャ10の情報収集部11は、管理データ即ち構成データやログデータを受信するための所定条件を満たしているか否かを判定し(S1)、条件を満たしていなければ一定時間スリープし(S2)、条件を満たすまで待機する(S1,S2)。本例において、S1の条件は、定期ポーリングの実行時刻に達したか、クライアント20から管理データの更新或いは分析の要求を受けたか、またはエージェントから管理データが送られて来たか、である。
監視対象システム30のエージェントから管理データが送られて来た場合、情報収集部11は、受信した管理データをデータ格納部3へ格納する(S3)。
また、S1で、ポーリングの実行時刻に達した場合、或いは情報更新の要求を受けた場合、情報収集部11は、エージェントに管理データの送信を要求する、即ち管理対象システム宛てに管理データのリクエストを送信する(S4)。情報収集部11は、この情報収集部11からのリクエストに応じてエージェントから送信された管理データを受信して、データ格納部3へ格納する(S3)。
図16は、監視対象システム30のエージェントが、管理データをマネージャ10に送信する処理の説明図である。
エージェントは、管理データ即ち構成データ又はログデータを送信するための所定条件を満たしているか否かを判定し(S11)、条件を満たしていなければ一定時間スリープし(S12)、条件を満たすまで待機する(S11,S12)。本例において、S11の条件は、管理データのリクエストを受信したか、ログデータに追加があるか、構成データに変更があるか、である。
S11の条件を満たした場合(S11,Yes)、エージェントは管理データを収集する(S13)。即ち、S11で、構成データのリクエストを受信した場合、リクエストされた構成データをハード情報収集部312又はソフト情報収集部313が収集する。また、構成データの変更があった場合、変更があった構成データをハード情報収集部312又はソフト情報収集部313が収集する。また、ログデータに追加があった場合、ログ収集部311がログを収集する。
そして、エージェントは、S13で収集した管理データをマネージャ10に送信する(S14)。
なお、図16では、管理データのリクエスト(S11)に応じて管理データを収集し(S13)、マネージャ10に送信する例を示したが(S14)、予め管理データを収集しておき、リクエストに応じて管理データを送信しても良い。
図17は、クライアント20が分析を要求し、分析結果を受信して出力する処理の説明図である。
管理者は、クライアント20のログ表示部213によりログを一覧表示させて問題の発生を示すログを選択し、当該ログを出力したシステム、即ち問題の発生したシステムの分析の要求をクライアント20に入力する。
クライアント20の入力解析部211は、管理者から問題の発生したシステムの分析の要求を受け付けると(S22)、管理者が選択したログのログIDを含む分析のリクエストをマネージャ10に送信する(S23)。
そして、クライアント20は、通信処理部22を介してマネージャ10から分析結果を受信し(S24)、特徴表示部219が当該分析結果を表示装置に表示させる(S25)。
図18は、マネージャ10が要求に応じて分析を行い、分析結果をクライアントに送信する処理の説明図である。
マネージャ10の分析部16は、分析の要求があるか否かを判定し(S31)、要求がなければ(S31,No)、一定時間スリープして(S32)、要求があるまで待機する。
分析の要求があった場合(S31,Yes)、分析部16は、エージェントから受信した管理データに基づいて分析処理を行い(S33)、分析結果をクライアントに送信する(S34)。
図19は、図18における分析処理S33を詳細に示す図である。
マネージャ10の分析部16は、クライアント20から受信したリクエストに含まれるログIDから分析対象のログを求め、当該分析対象のログと、データ格納部3に保持されているログとを順次比較する(S41)。
比較の結果、分析部16は、分析対象のログと同じ問題が、データ格納部3に保持されているログに存在しているか否かを判定する(S42)。ここで分析部16は、分析対象のログに問題のデータとして含まれるイベントIDが、データ格納部3に保持されているログに存在すれば、分析対象のログとデータ格納部3に保持されているログとの間で同じイベントが生じている、即ち同じ問題が存在すると判定する。即ち、分析部16は、分析対象のログに問題のデータとして含まれるイベントIDが、データ格納部3に保持されているログに存在しなければ、分析対象のログとデータ格納部3に保持されているログとの間で同じ問題が存在しないと判定する。なお、分析部16は、イベントIDに限らず、イベントタイプやイベントソースなど、他の情報を用いて判定しても良い。
分析対象のログと、データ格納部内のログとに同じ問題が存在しなければ(S42,No)、分析部16は、比較するデータ格納部内のログを次にシフトして、分析対象ログとの比較を繰り返す(S43,S41)。
また、分析対象ログとデータ格納部内のログとに同じ問題が存在すれば(S42,Yes)、分析部16は、当該分析対象ログからシステムの識別情報を抽出し、メモリ或いはデータ格納部3内に格納した問題発生リストに抽出したシステムの識別情報を書き込む。なお、既に問題発生リストに書き込まれている識別情報と重複する識別情報は書き込み対象から除外される。
そして、分析部16は、データ格納部3内の全てのログと分析対象のログとの比較が完了したか否かを判定し(S45)、完了していなければ(S45,No)、比較するデータ格納部内のログを次にシフトして比較を繰り返す(S43,S41)。
全てのログの比較を終え、問題発生リストが完成した場合(S45,Yes)、分析部16は、当該問題発生リストに記載された識別情報、即ち問題が発生したことがあるシステムの識別情報と対応する管理データをデータ格納部3から抽出する。そして、分析部16は、図20を用いて後述するように、問題が発生したことがあるシステム全てに共通するデータをスキーマに従い1つの木構造にマッピングし、問題発生共通木を作成する(S46)。ここで、木構造のスキーマは、運用管理システムにあらかじめ定義されているものでもよいし、分析に際して管理者が定義したものでもよい。データのマッピングにおいて、もし、あるノードに対して共通するデータがなかった場合は、当該ノードおよびそれ以下の子ノードは削除する。
図20は、問題発生共通木の作成処理の具体例を示す図である。
分析部16は、問題発生リストに記載された識別番号に基づき、互いに問題が発生したことがあるシステムAの管理データ101とシステムBの管理データ102をデータ格納部3から抽出し、比較する。
管理データ同士の比較の結果、分析部16は、Machine:X series, CPU:X cpu, OS:X OS, Soft:Y packageをシステムAとシステムBとの共通の構成として抽出する。なお、図20において、管理データの各項目は、(構成の種別:データ値)の形式で示されている。例えばMachine, CPU, OSが構成の種別であり、X series, X cpu, X OSがデータ値である。
スキーマ103は、図20に示すように、構成の従属関係を木構造に定義している。そして、分析部16は、スキーマ103の定義に従い、当該データ値と対応する構成のノードに管理データのデータ値を設定し、対応するデータ値が無いノードを削除して、問題発生共通木104を作成する。即ち、分析部16は、X cpuをCPUのノードに設定し、X seriesをMachineのノードに設定し、X OSをOSのノードに設定する。また、分析部16は、対応するデータ値が無いMEM、OSverのノードをスキーマ103から削除する。
なお、スキーマ103は、例えばノード毎に図21に示すように、構成の種別とデータ値、子ノードを示すポインタリストを有することで、ノード間の従属関係が特定できるので図20や図22に示した木構造を定義できる。構成の種別は、MachineやOSといった木構造のノードとなる構成を示す情報であり、子ノードを示すポインタリストは子ノードのデータが格納されているメモリ領域のアドレスである。図21では、OSのノードに従属する三つの子ノードのアドレスの例が示されている。
次に分析部16は、データ格納部3から抽出した問題が発生したことがあるシステムの管理情報の全てをスキーマに従い1つの木構造にマッピングした問題発生木を作成する(S47)。
図22は、問題発生木の例を示す。問題発生木105は、問題発生共通木104と比べて木構造にマッピングするデータを共通点で絞り込まない点が異なり、スキーマ103や管理データは同じである。分析部16は、問題発生リストに記載された識別番号に基づき、問題が発生したことがあるシステムAの管理データ101とシステムBの管理データ102をデータ格納部3から抽出し、絞り込まずに全てのデータをスキーマ103に従い木構造にマッピングする。図22に示すように、問題発生木では、データを共通点で絞りこまないため、Y mem, X memのように、データ値が異なる同じデータ種別のノードが複数存在し得る。
更に、分析部16は、S44で作成した問題発生リストに記載されていない識別番号、即ち問題が発生していないシステムの識別情報と対応する管理データをデータ格納部3から抽出する。また、分析部16は、この問題が発生していないシステムの管理情報の全てをスキーマ103に従い1つの木構造にマッピングした問題非発生木を作成する(S48)。
そして、比較部15は、問題発生共通木、問題発生木及び問題非発生木を比較して、問題の解析に意味のある差分、即ち問題が発生するステムの特徴を抽出し、分析結果として前述のリストに加える(S49)。
マネージャ10の比較部15は、ノードを比較して特徴を探索する際の起点となるノードを1つ決定し、そのノードの子ノードについて差分を抽出していく。木構造の探索は、問題発生共通木のルートノードから始め、リーフに向かって進めていく。探索順序に関するアルゴリズムは、特に制限されない。例えば、代表的な幅優先探索や深さ優先探索などの方法が用いられる。所定のアルゴリズムに従って比較部15は、問題発生共通木、問題発生木及び問題非発生木の何れか2つの木構造が共通して持っているノードに対して探索を進めていき、その先にある差分を特徴として抽出する。
図23は、図19のS49で行う問題が発生したシステムの特徴を抽出する処理の説明図である。
比較部15は、先ず、問題発生共通木のルートノードを探索の起点とするノード、即ち探索対象ノードに設定する(S51)。
比較部15は、探索対象ノードに子ノードがあるか否かを判定する(S52)。
探索対象ノードに子ノードがある場合(S52,Yes)、比較部15は、問題発生共通木の探索対象ノードの子ノード群のうちの1つを比較の対象とするノード、即ち比較対象ノードとし、当該比較対象ノードと問題非発生木にある同じ種別のノード群とを比較する(S53)。
比較部15は、比較の結果、比較対象ノードと同じデータ値のノードが問題非発生木にあるか否かを判定し(S54)、同じデータ値のノードが見つかった場合(S54,Yes)、当該ノードを次回以降の探索対象ノードを選択するためのリスト、即ち探索対象リストに記録する(S55)。
一方、同じデータ値のノードが問題非発生木から見つからなかった場合(S54,No)、比較部15は、当該子ノード、即ち同じデータ値のノードが問題非発生木から見つからなかった比較対象ノードを問題の発生したシステムの特徴として分析結果のリストに記録する(S56)。
次に、比較部15は、S53で比較対象としている問題非発生木の子ノードが親ノードと関連する構成であるか否かを判定する(S57)。問題非発生木の子ノードと親ノードとが関連する構成であった場合、比較部15は、当該問題非発生木の子ノードとデータ値が一致するノードが問題発生木に存在するかを検索する。そして比較部15は、当該問題非発生木の子ノードとデータ値が一致するノードが問題発生木に存在しなければ、「問題が発生したシステムに当該問題非発生木の子ノードがない」ことを特徴として分析結果のリストに記録する(S58)。
ここで、問題発生木と比較するのはS57で問題非発生木の親ノードと関連する構成と判定した子ノードであり、属性のノードは問題発生木との比較対象としていない。この理由は、同じデータ種別の属性ノードを特徴として抽出する場合、その属性ノードが問題の発生したシステムの全てに共通していることに意味があり、その他の属性ノードの情報は不要なためである。例えば、OSの版数を比較対象のデータ種別としている図24を例にすると、問題発生共通木では、問題の発生したシステムで共通するデータで絞り込まれているため、版数を示すノードは一つである。一方、問題非発生木は、問題の発生していないシステムのすべてのデータから作成されている。図24の例では、問題発生共通木に存在する「V3」を問題の発生したシステムの特徴として抽出すれば十分な情報となる。「V3」に加えて、「V4でない」、「V5でない」という特徴を抽出しても冗長となる。
S57で子ノードが親ノードと関連する構成でなかった場合(S57,No)、あるいはS55,S58の処理実行後、比較部15は、問題発生共通木の探索対象ノードの下に問題非発生木のノードと比較していない子ノードが有るか否かを判定する(S59)。比較していない子ノードがあれば(S59,Yes)、比較部15は、次の子ノードを選択して(S60)、S53に戻り比較処理を繰り返す。
そして、比較していない子ノードがないと判定された場合(S59,No)や、子ノードが無いと判定された場合(S52,No)、比較部15は、探索対象リストにS52以降の処理をしていない探索対象ノードがあるか否かを判定する(S61)。S52以降の処理をしていない探索対象ノードがある場合(S61,Yes)、探索対象リストから次の探索対象ノードを選択してS52へ戻る。そして、S52以降の処理をしていない探索対象ノードが無い場合(S61,No)、比較部15は、探索の処理を終了する。
マネージャ10のデータ格納部3に保持するデータ形態として、ここではリレーショナルデータベースで実現した例を示す。図26は、データスキーマ130をInfomation Engineering形式のER図(entity-relationship diagram)で表した例である。
各テーブルは、システムに含まれる構成を示すデータ、即ち構成データを記憶したテーブルや、ログデータを記憶したテーブルである。例えば、システムを示す構成情報(System ID)を記憶したSystemテーブルや、コンピュータ等の設備(Machine)を示す構成情報を記憶したMachineテーブル、CPUを示す構成情報を記憶したCPUテーブル、メモリを示す構成情報を記憶したMemoryテーブル、OSを示す構成情報を記憶したOSテーブル、ソフトウェアを示す構成情報を記憶したsoftwareテーブル、ログを記憶したLogテーブルである。これらのテーブルに記憶されている各構成データは、他の構成データとの識別するためのIDをプライマリキー41として有する。例えば、MachineテーブルのMachine_IDは、当該Machine_IDが付されたMachinのデータと他のMachineのデータとを識別するための識別情報であり、また、Machine_IDは、従属関係を特定するための情報であり、CPUやメモリの親ノードを識別する識別情報である。各テーブルは、プライマリキー以外に、テーブルがモデリングしている構成の属性、例えば:MachineテーブルのMachine_Name, Model_Noを有することができる。また、ルートノード以外のテーブルは、当該テーブルがモデリングしている構成と関連する構成、本例では親ノードを示す外部キー42を含む。例えば、System tableが外部キー42を含まないことで、ルートノードであることを示し、MachineテーブルがSystem_IDを格納していることで、MachineがSystemの構成物であることを示す。
また、Logテーブルは、ログデータを表すためのテーブルであり、System_IDによってログを出力した情報システムを特定できるようにする。エージェントのログ収集部311は、所属するシステムがマネージャ10の管理対象としてマネージャ10に登録される際にマネージャから送信されるSystem_IDを保持しておき、LogテーブルにSystem_IDを書き込む。エージェントのログ収集部311は、所属するシステムのログを監視し、新規にログがシステムから出力された際に、スキーマが示すフォーマットでログデータをマネージャ10に送信する。マネージャ10は、エージェントから受信したログデータを蓄積して保持する。
構成データは、マネージャ10が定期的にポーリングして取得する形態でもよいが、本例では、エージェントのハード情報収集部312及びソフト情報収集部313がマネージャ10に送信するものとする。エージェントは、OSやファームウェアにアクセスすることで、管理対象としているシステムの構成データを取得する。そして、監視しているシステム情報に変化が生じた場合に、変化のあった構成データをマネージャ10に送信する。
マネージャ10は、エージェントから受信した構成データでデータ格納部3内の既存のデータを上書きする。しかし、データ格納部3の容量を十分に確保できる場合は、受信したデータを蓄積して保持し、1つのシステムから時系列で複数の構成データを取れるようにすることもできる。このように複数の構成データを保持することで、データ分析の際に多くのサンプリングデータを対象にできるので、分析結果の信頼性の向上が期待できる。
管理者は、クライアント20が表示する図2のようなログ参照画面により、管理対象システムで発生している問題を認識する。そして、管理者が、ログ一覧の中からデータ分析の対象とするログを選択し、問題の発生しているシステムの特徴を表示するようにコマンドを実行すると、クライアント20は、当該システムについての分析の要求をマネージャ10に送信する。
マネージャ10の分析部16によるデータ分析は、リレーショナルデータベースの演算を利用することで、実現できる。
問題を発生したことがあるシステムの抽出は、次のSQL文を実行する。
SELECT DISTINCT System_ID FROM Log
WHERE Log_ID = <管理者が選択したログのLog_ID>
ここで、分析部16は、前記のSQL文の実行結果をTROUBLE_SYSTEMSという名前の一時テーブルに保存する。
問題を発生したことがないシステムの抽出は、次のSQL文を実行する。
SELECT System_ID FROM System
WHERE System_ID NOT IN
(SELECT System_ID FROM TROUBLE_SYSTEMS)

ここで、分析部16は、前記のSQL文の実行結果をNON_TROUBLE_SYSTEMSという名の一時テーブルに保存する。
次に、分析部16は、問題発生共通木、問題発生木および問題非発生木を作成するために、Logテーブル以外のテーブルを結合させ、システムの一覧表、即ちシステムに含まれる構成の一覧を作成する。ここでは、Systemテーブル、OSテーブルおよびSoftwareテーブルを結合する場合のSQL文を例として示すが、実際には、分析部16が、同様の式でLogテーブル以外の全てのテーブルを結合する。
SELECT System.System_ID, OS_Name, OS_Ver, Soft_Name, Soft_Ver
FROM System, OS, Software
WHERE System.System_ID = OS.System_ID AND OS.OS_ID = Software.OS_ID

分析部16は、ここで、得られるシステムの一覧表をSYSTEM_LISTという名の一時テーブルに保存する。
問題発生木は、システム一覧表SYSTEM_LISTから、TROUBLE_SYSTEMSに記憶されているSystem IDを有するシステム、即ち問題が発生したシステムを抽出することで得ることができる。
SELECT * FROM SYSTEM_LIST
WHERE System_ID IN (SELECT System_ID FROM TROUBLE_SYSTEMS)

分析部16は、前記のSQL文の実行結果として得られる問題発生木、即ち問題が発生したシステムに含まれる構成を示す構成データとその従属関係示すプライマリキー41及び外部キー42とをTROUBLE_SYSTEM_TREEという名の一時テーブルに保存する。
問題発生共通木は、問題発生木の一時テーブルTROUBLE_SYSTEM_TREEの列毎に、構成データの種類が保存されている場合に、当該テーブルの列の要素が1種類であるもの、即ち問題が発生したシステム全てに共通した構成の構成データであって、TROUBLE_SYSTEM_TREEに1種類のみが保存された構成データを抜き出すことで作成することができる。分析部16は、列の要素が1種類かどうかを以下のSQL文で調べることができる。この例では、OS_Nameの種類数が調べられる。
SELECT COUNT(DISTINCT OS_Name) FROM TROUBLE_SYSTEM_TREE

前記の結果が1である場合、分析部16は、以下のSQL文で得られる結果を問題発生共通木の構成要素とする。
SELECT DISTINCT OS_Name FROM TROUBLE_SYSTEM_TREE

分析部16は、TROUBLE_SYSTEM_TREEの各列に対して同様の式を実行して得られる結果から、問題発生共通木を作成することができる。

問題非発生木は、システム一覧表SYSTEM_LISTから、TROUBLE_SYSTEMSに記憶されていないSystem IDを有するシステム、即ち問題が発生したことがないシステムを抽出することで得ることができる。
SELECT * FROM SYSTEM_LIST
WHERE System_ID IN (SELECT System_ID FROM NON_TROUBLE_SYSTEMS)

以上により得られたデータをもとに、図23に示す手順で問題が発生したシステムの特徴を抽出することができる。図27は、問題が発生したシステムの特徴を受信したクライアント20が、管理者に向けて示す結果画面の例である。図27の例は、問題の発生したシステムの特徴を、OSとして「X OS」を導入しており、ソフトウェアとして「X package」と「Y package」を持っていないこととしている。
以上のように、本実施形態によれば、問題が発生したシステムの特徴を容易に抽出する技術を提供できる。
特に、本実施形態によれば、問題の発生したシステムと類似していながら問題が発生しないシステムと、問題の発生したシステムとの差分を抽出するので、原因の検出に貢献する可能性が高い差分を抽出することができる。このため、経験の浅い管理者であっても問題の原因を特定することが容易になる。
なお、本実施形態では、図23に示すように、探索対象ノードの子ノードの差異、即ち、問題発生共通木と問題非発生共通木とに共通する構成(探索ノード)に、従属する構成(子ノード)の差異を特徴として抽出する。ここで、従属する構成(子ノード)とは、共通する構成(探索ノード)の為だけに用いられるものに限らず、スキーマによって従属関係が定義されたものであれば、ユーザが任意に追加可能な汎用的な構成等であっても良い。
〈その他〉
本発明は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
例えば、前述の運用管理ソフトウェアや、クライアントプログラム、エージェントプログラムは、コンピュータが読み取り可能な記録媒体に記録されたものでも良い。
ここで、コンピュータが読み取り可能な記録媒体とは、データやプログラム等の情報を電気的、磁気的、光学的、機械的、または化学的作用によって蓄積し、コンピュータから読み取ることができる記録媒体をいう。このような記録媒体の内コンピュータから取り外し可能なものとしては、例えばフレキシブルディスク、光磁気ディスク、CD-ROM、CD-R/W、DVD、DAT、8mmテープ、メモリカード等がある。
また、コンピュータに固定された記録媒体としてハードディスクやROM(リードオンリーメモリ)等がある。

Claims (9)

  1. 複数の管理対象の装置が備えるハードウェア又はソフトウェアである複数の要素に関する構成データを含み運用を妨げる又は妨げるおそれのある問題の発生の有無を示す管理データを受信する収集部と、
    前記要素の種別間の従属関係を定義した定義情報に従い、前記収集部が受信した前記管理データを用いて、前記問題が発生した装置が備える前記要素間の従属関係を示す問題データを求める一方、前記問題が発生していない装置が備える前記要素間の従属関係を示す非問題データを求める分析部と、
    前記問題データと非問題データとを比較して、共通する要素を求め、該共通する要素に従属する要素について前記問題データと前記非問題データとの差分を抽出する比較部と、を備える運用管理装置。
  2. 前記分析部が、前記複数の管理対象の装置のうち、問題が発生した装置の全てに共通する要素を問題共通データとして分類し、
    前記比較部が、前記問題共通データと前記非問題データとを比較して、前記問題共通データと前記非問題データの差分を抽出する請求項1に記載の運用管理装置。
  3. 前記比較部が、前記共通する要素に従属する要素であって、前記非問題データに存在し、前記問題データに存在しない要素を抽出する請求項1又は2に記載の運用管理装置。
  4. 複数の管理対象の装置が備えるハードウェア又はソフトウェアである複数の要素に関する構成データを含み運用を妨げる又は妨げるおそれのある問題の発生の有無を示す管理データを受信するステップと、
    前記要素の種別間の従属関係を定義した定義情報に従い、前記管理データを用いて、前記問題が発生した装置が備える前記要素間の従属関係を示す問題データを求めるとともに、前記問題が発生していない装置が備える前記要素間の従属関係を示す非問題データを求めるステップと、
    前記問題データと非問題データとを比較して共通する要素を求めるステップと、
    前記共通する要素に従属する要素について前記問題データと前記非問題データの差分を抽出するステップと、
    をコンピュータが実行する運用管理方法。
  5. 前記複数の管理対象の装置のうち、問題が発生した装置の全てに共通する要素を問題共通データとして分類し、
    前記問題共通データと前記非問題データとを比較して、前記問題共通データと前記非問題データの差分を抽出する請求項4に記載の運用管理方法。
  6. 前記共通する要素に従属する要素であって、前記非問題データに存在し、前記問題データに存在しない要素を抽出する請求項4又は5に記載の運用管理方法。
  7. 複数の管理対象の装置が備えるハードウェア又はソフトウェアである複数の要素に関する構成データを含み運用を妨げる又は妨げるおそれのある問題の発生の有無を示す管理データを受信するステップと、
    前記要素の種別間の従属関係を定義した定義情報に従い、前記管理データを用いて、前記問題が発生した装置が備える前記要素間の従属関係を示す問題データを求めるとともに、前記問題が発生していない装置が備える前記要素間の従属関係を示す非問題データを求めるステップと、
    前記問題データと非問題データとを比較して共通する要素を求めるステップと、
    前記共通する要素に従属する要素について前記問題データと前記非問題データの差分を抽出するステップと、
    をコンピュータに実行させるための運用管理プログラム。
  8. 前記複数の管理対象の装置のうち、問題が発生した装置の全てに共通する要素を問題共通データとして分類し、
    前記問題共通データと前記非問題データとを比較して、前記問題共通データと前記非問題データの差分を抽出する請求項7に記載の運用管理プログラム。
  9. 前記共通する要素に従属する要素であって、前記非問題データに存在し、前記問題データに存在しない要素を抽出する請求項7又は8に記載の運用管理プログラム。
JP2011539221A 2009-11-04 2009-11-04 運用管理装置及び運用管理方法 Expired - Fee Related JP5532053B2 (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2009/068850 WO2011055436A1 (ja) 2009-11-04 2009-11-04 運用管理装置及び運用管理方法

Publications (2)

Publication Number Publication Date
JPWO2011055436A1 JPWO2011055436A1 (ja) 2013-03-21
JP5532053B2 true JP5532053B2 (ja) 2014-06-25

Family

ID=43969681

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2011539221A Expired - Fee Related JP5532053B2 (ja) 2009-11-04 2009-11-04 運用管理装置及び運用管理方法

Country Status (6)

Country Link
US (1) US8650444B2 (ja)
EP (1) EP2498186A4 (ja)
JP (1) JP5532053B2 (ja)
KR (1) KR101436033B1 (ja)
CN (1) CN102597966B (ja)
WO (1) WO2011055436A1 (ja)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101104165B1 (ko) * 2009-11-26 2012-01-13 애니포인트 미디어 그룹 사용자 애플리케이션의 테스트가 가능한 미디어 재생 장치 및 이를 이용한 사용자 애플리케이션의 테스트 방법
US9311176B1 (en) * 2012-11-20 2016-04-12 Emc Corporation Evaluating a set of storage devices and providing recommended activities
US20140157184A1 (en) * 2012-11-30 2014-06-05 International Business Machines Corporation Control of user notification window display
US10274946B2 (en) * 2012-12-12 2019-04-30 Mitsubishi Electric Corporation Monitoring control apparatus and monitoring control method
SG11201600589RA (en) * 2013-08-28 2016-03-30 Mitsubishi Electric Corp Data processing apparatus, data processing method, and program
WO2015095974A1 (en) 2013-12-27 2015-07-02 Metafor Software Inc. System and method for anomaly detection in information technology operations
US11442919B2 (en) 2015-07-31 2022-09-13 Accenture Global Services Limited Data reliability analysis
CN105138612B (zh) * 2015-08-07 2019-03-15 北京思特奇信息技术股份有限公司 数据一致性差异原因的分析和定位的方法及***
CN113448795B (zh) * 2020-03-26 2024-06-28 伊姆西Ip控股有限责任公司 用于获取***诊断信息的方法、设备和计算机程序产品
US11323306B2 (en) * 2020-08-27 2022-05-03 Cox Communications, Inc. Systems and methods for accelerated network impairment mapping
US12014156B2 (en) * 2020-09-04 2024-06-18 Mitsubishi Electric Corporation Program creation support program to provide log data on device values and dependency relationships between devices

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5682523A (en) * 1993-12-15 1997-10-28 International Business Machines Corporation System and method for collecting and retrieving network problem determination data with a generic collection subsystem reporting to an agent on demand
US5655074A (en) * 1995-07-06 1997-08-05 Bell Communications Research, Inc. Method and system for conducting statistical quality analysis of a complex system
JP2002055717A (ja) 2000-08-10 2002-02-20 Mitsubishi Electric Corp 故障診断システム
US8041541B2 (en) * 2001-05-24 2011-10-18 Test Advantage, Inc. Methods and apparatus for data analysis
US7225107B2 (en) * 2001-05-24 2007-05-29 Test Advantage, Inc. Methods and apparatus for data analysis
JP2004101203A (ja) 2002-09-04 2004-04-02 Oki Electric Ind Co Ltd ロジックlsiの不良解析システム及び不良解析方法
JP4451624B2 (ja) 2003-08-19 2010-04-14 富士通株式会社 情報体系対応付け装置および対応付け方法
JP4354314B2 (ja) * 2004-03-16 2009-10-28 株式会社日立製作所 サーバ差分管理システム及び情報処理装置の制御方法
JP2006068208A (ja) * 2004-09-01 2006-03-16 Kao Corp 清掃用シート
JP4356634B2 (ja) * 2005-03-23 2009-11-04 日本電気株式会社 故障診断回路とこの故障診断回路を備えた情報処理装置、故障診断システム及び故障診断プログラム
WO2006114871A1 (ja) * 2005-04-20 2006-11-02 Mitsubishi Denki Kabushiki Kaisha データ収集装置及びゲートウェイ装置
JP4618185B2 (ja) * 2006-04-07 2011-01-26 富士ゼロックス株式会社 故障診断システム及び故障診断プログラム
JP4172807B2 (ja) * 2006-09-08 2008-10-29 インターナショナル・ビジネス・マシーンズ・コーポレーション 障害発生の原因箇所の発見を支援する技術
JP4162250B2 (ja) * 2006-10-05 2008-10-08 インターナショナル・ビジネス・マシーンズ・コーポレーション 分散した部品木から故障部品の組み合わせを求める方法、システム
US7747551B2 (en) * 2007-02-21 2010-06-29 Neurovista Corporation Reduction of classification error rates and monitoring system using an artificial class
JP2008225681A (ja) * 2007-03-09 2008-09-25 Oki Electric Ind Co Ltd クライアント端末の動作確認方法、通信システム、クライアント端末及び動作確認サーバ

Also Published As

Publication number Publication date
JPWO2011055436A1 (ja) 2013-03-21
KR20120052415A (ko) 2012-05-23
KR101436033B1 (ko) 2014-09-01
WO2011055436A1 (ja) 2011-05-12
EP2498186A4 (en) 2013-04-10
US20120192008A1 (en) 2012-07-26
US8650444B2 (en) 2014-02-11
EP2498186A1 (en) 2012-09-12
CN102597966A (zh) 2012-07-18
CN102597966B (zh) 2014-08-20

Similar Documents

Publication Publication Date Title
JP5532053B2 (ja) 運用管理装置及び運用管理方法
US11308092B2 (en) Stream processing diagnostics
US9612932B2 (en) System, method, and computer program product for monitoring computer system infrastructure and assets
US8533193B2 (en) Managing log entries
US9262248B2 (en) Log configuration of distributed applications
US7912947B2 (en) Monitoring asynchronous transactions within service oriented architecture
JP6048038B2 (ja) 情報処理装置,プログラム,情報処理方法
US7979267B2 (en) Specifying a subset of dynamic inter-related data
US20200201699A1 (en) Unified error monitoring, alerting, and debugging of distributed systems
US8635596B2 (en) Model-based event processing
JP5886712B2 (ja) 分散環境におけるトランザクション別に区別されたメトリックの効率的収集
US8095514B2 (en) Treemap visualizations of database time
US10423509B2 (en) System and method for managing environment configuration using snapshots
US20080215601A1 (en) System monitoring program, system monitoring method, and system monitoring apparatus
JP2017539031A (ja) テスト実行からのテスト検証の分離
US11803439B2 (en) Enriched high fidelity metrics
US20180314734A1 (en) Partially typed semantics optimization
JP6798340B2 (ja) 運用仕様分析装置、運用仕様分析方法及び運用仕様分析プログラム
JP5970882B2 (ja) 構成情報管理装置,構成情報管理プログラム
US9563647B1 (en) Method and system for generating a state profile report
JP2010146154A (ja) 障害対応手段判定装置及びコンピュータプログラム及び障害対応手段判定方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130409

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130610

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20131029

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131225

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140325

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140407

R150 Certificate of patent or registration of utility model

Ref document number: 5532053

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees