JP4473766B2 - 計算機システム、ログ収集方法、及びコンピュータプログラム - Google Patents

計算機システム、ログ収集方法、及びコンピュータプログラム Download PDF

Info

Publication number
JP4473766B2
JP4473766B2 JP2005108076A JP2005108076A JP4473766B2 JP 4473766 B2 JP4473766 B2 JP 4473766B2 JP 2005108076 A JP2005108076 A JP 2005108076A JP 2005108076 A JP2005108076 A JP 2005108076A JP 4473766 B2 JP4473766 B2 JP 4473766B2
Authority
JP
Japan
Prior art keywords
time
log
virtual
host computer
computer
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005108076A
Other languages
English (en)
Other versions
JP2006285875A (ja
Inventor
悦太郎 赤川
隆裕 中野
友矢 安齋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2005108076A priority Critical patent/JP4473766B2/ja
Priority to US11/144,770 priority patent/US20060225073A1/en
Publication of JP2006285875A publication Critical patent/JP2006285875A/ja
Application granted granted Critical
Publication of JP4473766B2 publication Critical patent/JP4473766B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3419Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment by assessing time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/52Program synchronisation; Mutual exclusion, e.g. by means of semaphores
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/36Monitoring, i.e. supervising the progress of recording or reproducing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/805Real-time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/815Virtual

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Debugging And Monitoring (AREA)

Description

本発明は計算機システム、ログ収集方法、及びコンピュータプログラムに関し、特に、ホスト計算機上で複数の仮想計算機が動作する計算機システムのログ収集技術に関する。
近年、サーバ毎に分散配置されていたストレージを一箇所に集約し、この集約されたストレージをSAN(Storage Area Network)等のストレージ専用ネットワークを介してサーバ群に接続するストレージコンソリデーションが普及している。ストレージに関する構築、運用、保守等のサービスを提供するストレージ・サービス・プロバイダは、ストレージコンソリデーションの運用形態として、例えば、1台のストレージシステムを複数の顧客に貸し出す等のサービスを提供している。このようなストレージ・サービスを提供するデータセンタでは、大容量のストレージシステムを論理的に分割してなる論理ボリュームを、SAN等を介してそれぞれの顧客のサーバに接続することで、ストレージ管理の集約化と管理コストの低減を図っている。更に、データセンタのストレージシステムにNAS(Network Attached Storage)機能を搭載することで、各顧客にNFS(Network File System)やCIFS(Common Interface File System)等のファイル転送プロトコルを利用したファイルアクセスサービスを提供するためのファイルシステムを構築することもできる。
特許文献1には、各顧客にストレージ・サービスを提供するデータセンタの計算機上で動作するホストOS(Operating System)を仮想的に分割して、同一ハードウェア資源上に複数の仮想計算機(Virtual Machine)を動作させ、それぞれの仮想計算機を各顧客のサーバに割り当てる技術が開示されている。
特開2004−227127号
仮想計算機を導入することで、ハードウェアの一元管理が可能になる。仮想計算機は通常の計算機と変わらない動作が可能である。例えば、仮想計算機で発生した障害や警告のログは仮想計算機内に保存される。また、仮想計算機の時刻はホスト計算機の時刻とは独立に進行する。また、仮想計算機に接続するネットワークと、ホスト計算機に接続するネットワークには、セキュリティ上の観点からそれぞれ異なるネットワークが用いられる。
このような計算機システムにおいては、計算機システムに不正な操作やデータの改竄等が行われていないかどうかをチェックする監査の目的で、或いは障害発生時や保守時のログ解析の目的で、仮想計算機のログを収集する必要が生じる。例えば、ドメインネームサーバのネットワーク名前解決タイムアウト等によるネットワーク障害が生じると、ホスト計算機のログだけでは、障害解析を行うことはできないため、仮想計算機のログが必要になる。仮想計算機のログを収集する手段として、従来では、ログサーバと呼ばれるログ収集用サーバをネットワーク上に設置し、ログサーバにログが到着した時刻をタイムスタンプとしてログに記録していた。
しかし、仮想計算機のネットワークとホスト計算機のネットワークが異なるネットワーク環境下では、仮想計算機のログとホスト計算機のログをネットワーク経由でログサーバに送信することができない。両者のネットワークを接続すると、ネットワークの独立性が損なわれて、セキュリティ上問題がある。
また、各仮想計算機にログを保存しておき、障害発生時又は定期的にホスト計算機から仮想計算機のログを取り出す構成では、ホスト計算機の時刻と仮想計算機の時刻に時差があるため、仮想計算機から取り出したログのタイムスタンプには時刻差分が含まれる。ログのタイムスタンプにこのような時刻差分があると、障害解析のためにログを収集したとしても、ホスト計算機と各仮想計算機の時間体系が一致していないので、障害解析が困難になる。
複数の仮想計算機が動作する計算機システムにおいては、ハードウェアの一元管理だけでなく、ログの一元管理も望まれる。
本発明は、上記の問題点に鑑みてなされたもので、本発明の目的は、仮想計算機とホスト計算機の時刻差分を修正したログを取り出せる計算機システム、ログ収集方法、及びコンピュータプログラムを提供することにある。
上記の課題を解決するため、本発明の計算機システムは、ホスト計算機上で複数の仮想計算機が動作する計算機システムであって、ホスト計算機は、各仮想計算機との時刻差分を格納する時刻差分テーブルと、各仮想計算機のログを取得するログ取得部と、を備え、ログには、少なくともログ出力時刻を示すタイムスタンプが含まれており、ログ取得部は、時刻差分テーブルに格納された時刻差分に基づいて、各仮想計算機から取得したログのタイムスタンプを修正する。かかる構成により、ホスト計算機の時間体系とは異なる時間体系で動作する仮想計算機のログを、ホスト計算機の時間体系に統一させた上で、取得できる。
時刻差分テーブルには、更に、仮想計算機との時刻差分を取得した差分取得時刻が格納されており、ログ取得部は、時刻差分テーブルに格納された差分取得時刻の中からタイムスタンプの時刻よりも新しく、且つ前記タイムスタンプの時刻に最も近い差分取得時刻における時刻差分を基に前記タイムスタンプを修正してもよい。ホスト計算機と仮想計算機との時刻差分は一定とは限らず、例えば、ホスト計算機と仮想計算機のそれぞれが各自で時刻合わせをするためにNTPサーバから時刻情報を取得して時刻を変更する場合や、不正操作によって仮想計算機の時刻が改竄された場合等に変動し得る。タイムスタンプの時刻よりも新しく、且つ前記タイムスタンプの時刻に最も近い差分取得時刻における時刻差分を基に前記タイムスタンプを修正することで、より精度の高いタイムスタンプ修正を行うことができる。
ログ取得部は、複数の仮想計算機のタイムスタンプ修正後のログをまとめて一括出力してもよい。これにより、各仮想計算機のログを同一時間軸上に並べ直して、解析することができるので、障害解析に好適である。
ログには、タイムスタンプに加えて、更に、ログメッセージが含まれており、ログ取得部は、タイムスタンプ修正前のログ出力時刻をログメッセージに含ませてもよい。
ログ取得部は、仮想計算機にログ収集命令を送信することにより、仮想計算機からログを取得してもよい。ホスト計算機が仮想計算機のログを直接取り出すのではなく、仮想計算機を介してログを取り出すことにより、仮想計算機のセキュリティ機能を高めることができる。
仮想計算機は、仮想計算機の時刻が変更される都度に、ホスト計算機に時刻変更通知を行ってもよい。また、ログ取得部は、時刻変更通知を受信すると、仮想計算との時刻差分を取得してもよい。これにより、ホスト計算機は、仮想計算機との間の最新の時刻差分を保持することができ、より精度の高いタイムスタンプ修正を行うことができる。
複数の仮想計算機と、ホスト計算機のそれぞれは、異なるネットワークに接続されていてもよい。ログサーバを用いてネットワーク経由で仮想計算機からログを収集する従来方式と比較すると、本発明では、仮想計算機間をネットワーク接続する必要がないので、セキュリティに優れている。
本発明のログ収集方法は、ホスト計算機上で複数の仮想計算機が動作する計算機システムのログを収集する方法であって、ホスト計算機が仮想計算機との時刻差分を取得し、ホスト計算機が仮想計算機のログを取得し、ホスト計算機が時刻差分に基づいて仮想計算機から取得したログのタイムスタンプを修正する。
本発明のコンピュータプログラムは、ホスト計算機上で複数の仮想計算機が動作する計算機システムに、本発明のログ収集方法を実行させるためのコンピュータプログラムである。このコンピュータプログラムは、コンピュータ読み取り可能な記録媒体等に記録することができる。記録媒体として、例えば、光記録媒体(CD−RAM、CD−ROM、DVD−RAM、DVD−ROM、DVD−R、PDディスク、MDディスク、MOディスク等の光学的にデータの読み取りが可能な記録媒体)や、磁気記録媒体(フレキシブルディスク、磁気カード、磁気テープ等の磁気的にデータの読み取りが可能な記録媒体)、或いはメモリ素子(DRAM等の半導体メモリ素子、FRAM等の強誘電体メモリ素子等)などが好適である。
本発明によれば、ホスト計算機の時間体系とは異なる時間体系で動作する仮想計算機のログを、ホスト計算機の時間体系に統一させた上で、取得できる。また、仮想計算機の時刻が不正に改竄されたとしても、ホスト計算機上では、正しい時刻で仮想計算機のログを取得できる。これにより、仮想計算機のログの一元管理が可能となる。
以下、各図を参照して、本発明の実施形態について説明する。
図1は本発明のログ収集方式の概要を示している。計算機システム10は、一台のホスト計算機(実計算機)40上に複数の仮想計算機50,60を論理的に構築することにより、それぞれの仮想計算機50,60上でゲストOSや各種アプリケーションプログラムを動作させている。ホスト計算機40と仮想計算機50,60は、それぞれ異なるネットワークに接続しており、それぞれが各ネットワーク上のNTP(Network Time Protocol)サーバ(図示せず)から時刻情報を取得することにより、時刻合わせをしている。しかしながら、ホスト計算機40の時刻と仮想計算機50,60の時刻には、時刻差分が生じ得る。この時刻差分は必ずしも一定とは限らず、例えば、ホスト計算機40と仮想計算機50,60のそれぞれが各自で時刻合わせをするためにNTPサーバから時刻情報を取得して時刻を変更する場合や、不正操作によって仮想計算機50,60の時刻が改竄された場合等に変動し得る。
ホスト計算機40は、(1)各仮想計算機50,60とホスト計算機40との時刻差分を予め取得しておき、(2)各仮想計算機50,60からログを取得すると、(3)時刻差分を加味した上で、各仮想計算機50,60のログ出力時刻(タイムスタンプ)をホスト計算機40の時間体系に合わせる(同一時間軸上に並べ直す)ように修正し、(4)時刻差分修正済みのログを一括して管理ネットワーク21上の管理計算機(図示せず)に出力する。本ログ収集方式によれば、各仮想計算機50,60のタイムスタンプをホスト計算機40の時間体系に合わせることができるので、時刻差分を修正したログを取り出すことができる。このため、計算機システム10の監査、障害解析、保守等に好適である。
尚、計算機システム10の用途は、特に限定されるものではなく、複数の仮想計算機50,60の動作環境を備えた計算機システム一般に用いることができる。例えば、ワークステーション、メインフレームコンピュータ、ネットワークサーバ、パーソナルコンピュータ等の各種コンピュータシステムに適用できる。
本実施例では、ホスト計算機上に複数の仮想計算機を動作させる動作環境を備えた計算機システム10の具体例として、ネットワーク経由でファイルサービスを提供するNASのファイルサーバを例示する。
図2は各顧客にストレージ・サービスを提供するデータセンタ内の計算機システム10を中心とするネットワーク構成を示している。計算機システム10は、CPU11、メモリ12、ネットワークインターフェース13,14,15、及びストレージインターフェース16を備える。ネットワークインターフェース13には、管理ネットワーク21を介して管理計算機22と管理NTPサーバ23とが接続している。ネットワークインターフェース14には、運用ネットワーク24を介して複数のクライアント装置25と運用NTPサーバ26が接続している。ネットワークインターフェース15には、運用ネットワーク27を介して複数のクライアント装置28と運用NTPサーバ29が接続している。
計算機システム10上には、A社用のファイルサービスを提供する仮想計算機50と、B社用のファイルサービスを提供する仮想計算機60とが動作している(図3参照)。ディスクドライブ31には、例えば、管理計算機22が計算機システム10のシステム監査、障害管理、保守管理等を行うためのプログラム及びデータが格納されている。ディスクドライブ32,33には、例えば、それぞれA社用、B社用のファイルサービスを提供するためのデータが格納される。テープ装置34には、例えば、ディスクドライブ32,33のバックアップデータが格納される。
システム管理者は、管理計算機22を入力操作して計算機システム10にアクセスし、計算機システム10の監査、障害管理、保守管理等を行うことができる。A社の顧客は、クライアント装置25から運用ネットワーク24を介して仮想計算機50に、ファイル名を指定してファイル単位でのデータ入出力要求(ファイルアクセス要求)を行うことができる。同様に、B社の顧客は、クライアント装置28から運用ネットワーク27を介して仮想計算機60にファイルアクセス要求を行うことができる。運用ネットワーク24,27が、例えば、LAN(Local Area Network)である場合には、クライアント装置25,28から仮想計算機50,60へのファイルアクセス要求は、TCP/IP(Transmission Control Protocol/Internet Protocol)の通信プロトコルが用いられる。
尚、ディスクドライブ31,32,33としては、単体のハードディスクでもよく、或いはRAID(Redundant Array of Independent Inexpensive Disks)構成された複数のハードディスクから成るディスクアレイ装置でもよい。また、ディスクドライブ32,33に複数の論理ボリュームを形成しておき、これらの論理ボリュームにA社用、B社用のファイルサービスを提供するためのデータを格納してもよい。ハードディスクとしては、例えば、ファイバチャネル・ディスクドライブ、ATA(Advanced Technology Attachment)ディスクドライブ、SCSI(Small Computer System Interface)ディスクドライブ等を用いることができる。
図3は計算機システム10の機能構成を示している。図2に示したハードウェアと同一符号のハードウェアは同一のものを示すものとしてその詳細な説明は省略する。仮想計算機50は、ネットワークインターフェース14、仮想計算機用記憶部51、時刻設定部52、ログ出力部53、外部記憶部54、仮想CPU55、及び仮想アダプタ56を備えている。
仮想計算機用記憶部51は、仮想計算機50に割り当てられたメモリ12上の記憶領域である。時刻設定部52は、運用NTPサーバ26から時刻情報を取得し、仮想計算機50の時刻を設定する。仮想計算機50の時刻変更は、仮想アダプタ56を介してホスト計算機40に通知される。ログ出力部53は、時刻設定部52又はその他の構成部分からログ出力命令とログ内容を受け取ってログを生成し、外部記憶部54にログを出力する。ログ出力部53が生成するログとして、例えば、仮想計算機50の時刻が変更されたことを示すログ、アプリケーションがインストールされたことを示すログ、パスワードが変更されたことを示すログ、不正操作によりシステムに障害が発生したことを示すログ、ネットワーク障害又はその他のシステム障害によりシステムが停止したことを示すログ等の各種のログがある。
外部記憶部54は、仮想計算機50の外部記憶装置として機能する記憶領域であり、本実施例では、ディスクドライブ32がこれに該当する。仮想CPU55は、CPU11の時分割動作により、仮想計算機50のプロセスに割り当てられた仮想的なCPUである。仮想アダプタ56は、仮想計算機50とホスト計算機40との間の通信を接続する仮想的なアダプタである。仮想アダプタ56は、ホスト計算機40からログ収集命令を受けると、外部記憶部54から取り出したログをホスト計算機40に送信する。上述の説明において、時刻設定部52、ログ出力部53、及び仮想アダプタ56は、仮想CPU55がプロセスを実行することによって実現される機能を示している。
尚、説明の便宜上、仮想計算機60の機能構成として、仮想アダプタ66のみが図示されているが、仮想計算機60の機能構成は、仮想計算機50の機能構成と同様である。
ホスト計算機40は、ネットワークインターフェース13、ホスト計算機用記憶部41、時刻設定部42、ログ出力部43、仮想計算機ログ取得部44、外部記憶部45、仮想CPU46、及び仮想アダプタ47を備える。
ホスト計算機用記憶部41は、ホスト計算機40に割り当てられたメモリ12上の記憶領域である。時刻設定部42は、管理NTPサーバ23から時刻情報を取得し、ホスト計算機40の時刻を設定する。ログ出力部43は、時刻設定部42又はその他の構成部分からログ出力命令とログ内容を受け取ってログを生成し、外部記憶部45にログを出力する。また、ログ出力部43は、ホスト計算機40のログを、管理ネットワーク21を経由して管理計算機22に送信することもできる。
仮想計算機ログ取得部44は、主として、以下に示す4つの処理を行う。(a)仮想計算機50,60のログを取得する命令を管理計算機22から受信する処理。(b)仮想計算機50,60とホスト計算機40の時刻差分を取得する処理。(c)仮想アダプタ47を介して仮想計算機50,60のログを取得する処理。(d)(c)の処理で取得した仮想計算機50,60のログのタイムスタンプを、(b)の処理で取得した時刻差分を用いて修正する処理。
外部記憶部45は、ホスト計算機40の外部記憶装置として機能する記憶領域であり、本例では、ディスクドライブ31がこれに該当する。仮想CPU46は、CPU11の時分割動作により、ホスト計算機40のプロセスに割り当てられた仮想的なCPUである。仮想アダプタ47は、ホスト計算機40と仮想計算機50,60との間の通信を接続する仮想的なアダプタである。上述の説明において、時刻設定部42、ログ出力部43、仮想計算機ログ取得部44、及び仮想アダプタ47は、仮想CPU46がプロセスを実行することによって実現される機能を示している。
管理計算機22は、管理画面表示部71、及びログ収集処理部72を備える。管理画面表示部71は、管理計算機22と管理者との間のユーザインターフェースを提供するものであり、例えば、管理者にログ収集処理の指示を案内する画面を表示したり、或いは計算機システム10から取得したログを表示したりする。ログ収集処理部72は、管理者の指示に応答して、仮想計算機50,60のログを収集する命令をホスト計算機40に送信する。
図4はログメッセージの構造を示している。ログには、ログ出力時刻(タイムスタンプ)が含まれる他、ログ出力元、ログレベル、ログメッセージ等も適宜含まれる。ログ出力時刻は、ログ生成元でログが生成された時刻を示す。ログ生成元の時間体系の時刻がログ出力時刻として記録される。同図に示す例では、ログ出力元として、仮想計算機50,60上で動作するアプリケーションプログラムが例示されている。ログレベルは、ログの種類を示すものであり、例えば、Errorは、障害発生や不正操作等が発生したことを示し、Informationは、その他の通常の処理を示す。メッセージには、テキスト形式でログ内容が簡潔に示される。ホスト計算機40及び仮想計算機50,60のログは、何れも同図に示すメッセージ構造を有する。
図5は時刻差分テーブルの構造を示している。仮想計算機ログ取得部44は、仮想計算機50,60から時刻変更の通知を受けると、仮想計算機50,60の時刻を取得し、ホスト計算機40の時刻と仮想計算機50,60の時刻との差分(時刻差分)を時刻差分テーブルに格納するとともに、仮想計算機50,60の時刻を取得した時刻(以下、差分取得時刻と称する。)を、時刻差分に対応付けて格納する。同図において、Virtual_Machine1は仮想計算機50を示し、Virtual_Machine2は仮想計算機60を示している。以降の説明においては、仮想計算機50をVirtual_Machine1又はVM1と称し、仮想計算機60をVirtual_Machine2又はVM2と称する場合がある。
図6は仮想計算機50,60に保存されたログのうち、ホスト計算機40がどのログを収集するのかを示したテーブル(以下、ログテーブルと称する。)の構造を示している。例えば、Virtual_Machine1のログは、ディスクドライブ32の/var/log/syslogと指定されるディレクトリに格納されており、Virtual_Machine2のログは、ディスクドライブ33の/var/log/dmesgと指定されるディレクトリに格納されている。仮想計算機ログ取得部44は、管理計算機22からログ収集命令を受けると、ログテーブルに指定されているディレクトリに所在する仮想計算機50,60のログを収集し、時刻差分テーブルに従って、ログ出力時刻を修正する。例えば、仮想計算機ログ取得部44は、Virtual_Machine1のログを収集するように、管理計算機22からログ収集命令を受けると、ログテーブルに指定されているディレクトリに格納されたログを取り出して、これを仮想計算機ログ取得部44に転送するように、仮想計算機50にログ収集命令を送信する。
図7は管理計算機22の管理画面表示部71に表示される管理用インターフェース画面である。管理用インターフェース画面には、各仮想計算機のログの所在が表示される。
尚、セキュリティの関係上、仮想計算機50,60のログを取得する手段として、上述の如く、ホスト計算機40が仮想計算機50,60を介して、ログを取得するのが好ましいが、ホスト計算機40は、ログテーブル(図6)を保持することにより、仮想計算機50,60のログの格納場所を把握しているので、ホスト計算機40が仮想計算機50,60のログを直接取り出すように構成してもよい。
図8はホスト計算機40が仮想計算機50,60との時刻差分を取得する処理手順を記述したフローチャートである。仮想計算機50,60が運用NTPサーバ26,29から時刻情報を取得することにより、仮想計算機50,60の時刻が変更する(S11)。すると、仮想計算機50,60は、ホスト計算機40に時刻変更通知を行う(S12)。ホスト計算機40は、仮想計算機50,60の時刻を取得し、時刻差分テーブルに時刻差分と差分取得時刻を格納する(S13)。時刻差分は、仮想計算機50,60から時刻変更通知がされる都度に、或いは常時ある一定の間隔で取得しておくことが好ましい。
図9はホスト計算機40が仮想計算機50,60からログを収集する処理を記述したフローチャートである。まず、管理者は、管理計算機22からホスト計算機40にログ収集命令を送信する(S21)。仮想計算機50,60のログを収集するタイミングは、定期的でもよく、或いは障害発生時でもよい。
ホスト計算機40は、管理計算機22からログ収集命令を受信すると(S22)、ログテーブルを参照して、仮想計算機50,60から収集すべきログを決定する(S23)。そして、ホスト計算機40は、仮想計算機50,60にログの取得を依頼する。仮想計算機50,60はディスクドライブ32,33から取り出したログをホスト計算機40に送信する。かかる手順を経て、ホスト計算機40は、仮想計算機50,60のログを取得する(S24)。
次いで、ホスト計算機40は、時刻差分テーブルに格納された時刻差分を用いて、仮想計算機50,60のタイムスタンプを修正し(S25)、タイムスタンプ修正済みのログをホスト計算機40に保存する(S26)。ホスト計算機40は、仮想計算機50,60のログを取得し終えてない場合には(S27:NO)、S23〜S26を再度繰り返す。一方、仮想計算機50,60のログを取得し終えた場合には(S27:YES)、ホスト計算機40は、仮想計算機50,60から収集したログを管理計算機22に送信する(S28)。複数の仮想計算機50,60から収集したログは、例えば、ホスト計算機40上の時間体系に並べ直した上で、これらのログを一つのログにまとめて、管理計算機22に一括送信してもよい。
図10はホスト計算機40が仮想計算機50,60のログに含まれるタイムスタンプを修正するサブルーチンを示している。同サブルーチンが呼び出されると、ホスト計算機40は、仮想計算機50,60から取得したログに含まれるログ出力時刻と、時刻差分テーブルに格納されている差分取得時刻とを比較し(S31)、そして、ログ出力時刻より新しく、かつログ出力時刻に最も近い差分取得時刻を選択する(S32)。次いで、ホスト計算機40は、選択した差分取得時刻における時刻差分を用いて、ログ出力時刻を修正する(S33)。
尚、ログ出力時刻の修正に用いられる時刻差分は、必ずしも最新の差分取得時刻における時刻差分が良いとは限らない。ログ出力時刻より新しく、かつログ出力時刻に最も近い差分取得時刻における時刻差分を用いてログ出力時刻を修正するのが好ましい。また、タイムスタンプ修正前のログ出力時刻は、ログメッセージに含ませてもよい。
次に、仮想計算機50,60のログ出力時刻をホスト計算機40の時間体系に合わせる利点について、説明を加える。
図11は障害解析の目的でVM1,VM2のログを同一時間軸上に並べ直す例を示している。VM1から取り出したログと、VM2から取り出したログをそれぞれ対比すると、ほぼ同時刻において、メモリ不足が生じていることが解かる。同一ハードウェア資源上に複数の仮想計算機が動作する環境下では、一方の仮想計算機に生じたシステム障害は、他方の仮想計算機の動作環境にも影響を与える場合がある。複数の仮想計算機にほぼ同時刻に障害が生じると、それぞれの仮想計算機から取り出したログ(タイムスタンプ修正前)を解析するだけでは、ログ出力時刻に時差が含まれているため、正確な障害解析を行うことが困難になる。そこで、VM1,VM2から取り出したログのログ出力時刻を同一時間軸上に並べ直すことにより、正確な障害解析を行うことができる。図11に示す例では、VM1にメモリ不足が生じた後に、続いて、VM2にメモリ不足が生じていることが解かる。VM2のメモリ不足の原因は、VM1のメモリ不足にある。
図12は不正操作を解析する目的でVM1のログを同一時間軸上に並べ直す例を示している。例えば、VM1上で動作するソフトウェアの試用期間(1年)が終了した後に、VM1の時刻が1年前の時刻に改竄され、当該ソフトウェアがVM1に不正にインストールされ、その後、VM1の時刻が元の時刻に戻された場合を考える。VM1から取り出したログ(タイムスタンプ修正前)を解析するだけでは、ソフトウェアのインストールは適法に行われていることが解かる。しかし、時刻差分テーブルを見ると、VM1の時刻は、Feb 16 2005 11:00:00のときに1年前に戻された後、Feb 16 2005 11:11:00のときに再び元の時刻に戻されていることが解かる。そこで、VM1から取り出したログのログ出力時刻をホスト計算機40の時間軸上に並べ直すと、Feb 16 2005 10:10:00のときにソフトウェアの試用期限が切れ、Feb 16 2005 10:05:00のときにソフトウェアが不正にインストールされていることが解かる。このように、本実施例によれば、仮想計算機50の時刻が不正に改竄されても、ホスト計算機40上では、正しい時刻で仮想計算機50のログを取得できる。
本実施例によれば、ホスト計算機40の時間体系とは異なる時間体系で動作する仮想計算機50,60のログを、ホスト計算機40の時間体系に統一させた上で、一括取得できる。また、仮想計算機50,60の時刻が不正に改竄されたとしても、ホスト計算機40上では、正しい時刻で仮想計算機50,60のログを取得できる。これにより、仮想計算機50,60のログの一元管理が可能となる。また、ログサーバを用いてネットワーク経由で仮想計算機からログを収集する従来方式と比較すると、仮想計算機間をネットワーク接続する必要がないので、セキュリティに優れている。更には、ホスト計算機40と仮想計算機50,60との間の時刻差分に依存せずに、ホスト計算機40上で各仮想計算機50,60の監査、障害解析、保守等を行うことができる。管理コストの低減にも資する。
尚、上述の説明では、同一ハードウェア資源上にホスト計算機40と仮想計算機50,60が動作する例を示したが、本発明は、ディスクアレイ装置とその保守端末から成るストレージシステムのように、異なるハードウェアが集約されて成るシステムにおいて、それぞれのハードウェアが異なる時間体系で動作している場合にも適用できる。前述の例では、保守端末は、ディスクアレイ装置の時間体系に依存せずに、ディスクアレイ装置のログを保守端末の時間体系に合わせた上で取得することができる。
本発明は上述した実施例に限定されない。当業者であれば、本発明の範囲内で種々の追加や変更等を行うことができる。
本実施形態のログ収集方式の概要図である。 本実施形態の計算機システムを中心とするネットワーク構成図である。 本実施形態の計算機システムの機能構成図である。 ログメッセージの構造図である。 時刻差分テーブルの構造図である。 ログのテーブル構造図である。 管理計算機に表示される管理用インターフェースである。 ホスト計算機が仮想計算機との時刻差分を取得する処理フローである。 ホスト計算機が仮想計算機からログを収集する処理フローである。 ホスト計算機がタイムスタンプを修正する処理フローである。 仮想計算機のログに含まれるログ出力時刻の修正例である。 仮想計算機のログに含まれるログ出力時刻の修正例である。
符号の説明
10…計算機システム 22…管理計算機 40…ホスト計算機 42…時刻設定部 44…仮想計算機ログ取得部 50…仮想計算機 52…時刻設定部 53…ログ出力部 60…仮想計算機

Claims (5)

  1. ホスト計算機上で複数の仮想計算機が動作する計算機システムであって、
    前記ホスト計算機は、
    各仮想計算機との時刻差分を格納する時刻差分テーブルと、
    各仮想計算機のログを取得するログ取得部と、
    各仮想計算機との通信を行うホスト計算機用仮想アダプタと、
    管理ネットワークに接続された管理サーバから、前記管理ネットワークを介して送信された時刻情報を受信し、前記受信した時刻情報を基に前記ホスト計算機の時刻を設定するホスト計算機用時刻設定部と、
    を備え、
    前記仮想計算機は、
    前記管理ネットワークとは異なる運用ネットワークに接続された運用サーバから、前記運用ネットワークを介して時刻情報を受信し、前記受信した時刻情報を基に前記仮想計算機の時刻を設定するともに、前記設定した時刻を変更する毎に、前記ホスト計算機に時刻変更通知を行う仮想計算機用時刻設定部と、
    前記時刻設定部からの時刻変更通知を前記ホスト計算機用仮想アダプタに送信する仮想計算機用仮想アダプタと、
    ログを生成するとともに、前記生成したログに、前記生成したログのログ出力時刻を示すタイムスタンプを付加して出力するログ出力部と、
    を備え、
    前記ログ取得部は、前記時刻変更通知を前記ホスト計算機用仮想アダプタが受信したときに、前記ホスト計算機の時刻と前記各仮想計算機の時刻との時刻差分を前記時刻差分テーブルに格納し、前記管理サーバからログ収集命令を受信したときには、前記各仮想計算機からログを取得し、前記各取得したログのタイムスタンプを、前記時刻差分テーブルに格納された時刻差分に基づいて修正する、計算機システム。
  2. 請求項1に記載の計算機システムであって、
    前記ログ取得部は、複数の仮想計算機のタイムスタンプ修正後のログをまとめて一括出力する、計算機システム。
  3. ホスト計算機上で複数の仮想計算機が動作する計算機システムのログを収集する方法であって、
    前記ホスト計算機は、
    各仮想計算機との時刻差分を格納する時刻差分テーブルと、
    各仮想計算機のログを取得するログ取得部と、
    各仮想計算機との通信を行うホスト計算機用仮想アダプタと、
    管理ネットワークに接続された管理サーバから、前記管理ネットワークを介して送信された時刻情報を受信し、前記受信した時刻情報を基に前記ホスト計算機の時刻を設定するホスト計算機用時刻設定部と、
    を備え、
    前記仮想計算機は、
    前記管理ネットワークとは異なる運用ネットワークに接続された運用サーバから、前記運用ネットワークを介して時刻情報を受信し、前記受信した時刻情報を基に前記仮想計算機の時刻を設定するともに、前記設定した時刻を変更する毎に、前記ホスト計算機に時刻変更通知を行う仮想計算機用時刻設定部と、
    前記時刻設定部からの時刻変更通知を前記ホスト計算機用仮想アダプタに送信する仮想計算機用仮想アダプタと、
    ログを生成するとともに、前記生成したログに、前記生成したログのログ出力時刻を示すタイムスタンプを付加して出力するログ出力部と、
    を備え、
    前記ログ取得部は、前記時刻変更通知を前記ホスト計算機用仮想アダプタが受信したときに、前記ホスト計算機の時刻と前記各仮想計算機の時刻との時刻差分を前記時刻差分テーブルに格納するステップと、
    前記管理サーバからログ収集命令を受信したときには、前記各仮想計算機からログを取得するステップと、
    前記各取得したログのタイムスタンプを、前記時刻差分テーブルに格納された時刻差分に基づいて修正するステップを備えてなる、ログ収集方法。
  4. 請求項に記載のログ収集方法であって、
    前記複数の仮想計算機のタイムスタンプ修正後のログをまとめて一括出力するステップを更に含む、ログ収集方法。
  5. ホスト計算機上で複数の仮想計算機が動作する計算機システムに、請求項に記載のログ収集方法を実行させるためのコンピュータプログラム。
JP2005108076A 2005-04-04 2005-04-04 計算機システム、ログ収集方法、及びコンピュータプログラム Active JP4473766B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005108076A JP4473766B2 (ja) 2005-04-04 2005-04-04 計算機システム、ログ収集方法、及びコンピュータプログラム
US11/144,770 US20060225073A1 (en) 2005-04-04 2005-06-06 Computer system, log collection method and computer program product

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005108076A JP4473766B2 (ja) 2005-04-04 2005-04-04 計算機システム、ログ収集方法、及びコンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2006285875A JP2006285875A (ja) 2006-10-19
JP4473766B2 true JP4473766B2 (ja) 2010-06-02

Family

ID=37072147

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005108076A Active JP4473766B2 (ja) 2005-04-04 2005-04-04 計算機システム、ログ収集方法、及びコンピュータプログラム

Country Status (2)

Country Link
US (1) US20060225073A1 (ja)
JP (1) JP4473766B2 (ja)

Families Citing this family (40)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7949666B2 (en) 2004-07-09 2011-05-24 Ricoh, Ltd. Synchronizing distributed work through document logs
US7761426B2 (en) * 2005-12-07 2010-07-20 International Business Machines Corporation Apparatus, system, and method for continuously protecting data
US20070174641A1 (en) * 2006-01-25 2007-07-26 Cornwell Michael J Adjusting power supplies for data storage devices
US7702935B2 (en) * 2006-01-25 2010-04-20 Apple Inc. Reporting flash memory operating voltages
US7861122B2 (en) * 2006-01-27 2010-12-28 Apple Inc. Monitoring health of non-volatile memory
US7958557B2 (en) * 2006-05-17 2011-06-07 Computer Associates Think, Inc. Determining a source of malicious computer element in a computer network
US7836212B2 (en) * 2006-07-20 2010-11-16 Oracle America, Inc. Reflecting bandwidth and priority in network attached storage I/O
US8006094B2 (en) * 2007-02-21 2011-08-23 Ricoh Co., Ltd. Trustworthy timestamps and certifiable clocks using logs linked by cryptographic hashes
JP4933303B2 (ja) 2007-02-23 2012-05-16 株式会社日立製作所 ストレージシステム並びに情報処理装置及び接続方法
US20080221461A1 (en) * 2007-03-05 2008-09-11 Triage Wireless, Inc. Vital sign monitor for cufflessly measuring blood pressure without using an external calibration
US8996483B2 (en) 2007-03-28 2015-03-31 Ricoh Co., Ltd. Method and apparatus for recording associations with logs
US8108856B2 (en) 2007-03-30 2012-01-31 Intel Corporation Method and apparatus for adaptive integrity measurement of computer software
US8464251B2 (en) * 2007-03-31 2013-06-11 Intel Corporation Method and apparatus for managing page tables from a non-privileged software domain
JP4804408B2 (ja) * 2007-04-17 2011-11-02 株式会社日立製作所 ログ解析方法及び装置
US20080288712A1 (en) * 2007-04-25 2008-11-20 Cornwell Michael J Accessing metadata with an external host
US7913032B1 (en) 2007-04-25 2011-03-22 Apple Inc. Initiating memory wear leveling
JP2009093257A (ja) * 2007-10-04 2009-04-30 Sony Corp 電子機器およびログ出力方法
US7778974B2 (en) * 2007-10-14 2010-08-17 International Business Machines Corporation Apparatus and method to archive log entries formed by a data storage system
JP5053918B2 (ja) * 2008-04-17 2012-10-24 日本電信電話株式会社 パケット測定における後処理時刻補正による精度改善方法、および補正システムならびにそのプログラム
US10521265B2 (en) * 2008-09-19 2019-12-31 Microsoft Technology Licensing, Llc Coalescing periodic timer expiration in guest operating systems in a virtualized environment
JP5176837B2 (ja) * 2008-09-30 2013-04-03 富士通株式会社 情報処理システム及びその管理方法、制御プログラム並びに記録媒体
US9405347B2 (en) 2009-02-26 2016-08-02 Microsoft Technology Licensing, Llc Power-saving operating system for virtual environment
US8955108B2 (en) * 2009-06-17 2015-02-10 Microsoft Corporation Security virtual machine for advanced auditing
JP5381843B2 (ja) * 2010-03-19 2014-01-08 富士通株式会社 情報処理装置及び情報処理装置の起動方法
US8839240B2 (en) * 2010-11-29 2014-09-16 International Business Machines Corporation Accessing vendor-specific drivers for configuring and accessing a self-virtualizing input/output device
CN102479146A (zh) * 2010-11-30 2012-05-30 金蝶软件(中国)有限公司 一种场景测试监控方法、装置及场景测试监控***
US10678602B2 (en) * 2011-02-09 2020-06-09 Cisco Technology, Inc. Apparatus, systems and methods for dynamic adaptive metrics based application deployment on distributed infrastructures
US9218195B2 (en) 2011-05-17 2015-12-22 International Business Machines Corporation Vendor-independent resource configuration interface for self-virtualizing input/output device
US8806005B2 (en) * 2011-09-12 2014-08-12 Microsoft Corporation Cross-machine event log correlation
TWI514174B (zh) * 2013-08-28 2015-12-21 Univ Nat Cheng Kung 分散式多重傳輸協定之跨層日誌搜集系統與方法
JP6040894B2 (ja) * 2013-09-02 2016-12-07 三菱電機株式会社 ログ生成装置、及びログ生成方法
JP6179331B2 (ja) * 2013-10-09 2017-08-16 富士通株式会社 ログ出力条件設定プログラム、装置、および方法
WO2015186220A1 (ja) * 2014-06-05 2015-12-10 株式会社日立製作所 ストレージ装置及びストレージ装置の動作解析方法
US10228958B1 (en) * 2014-12-05 2019-03-12 Quest Software Inc. Systems and methods for archiving time-series data during high-demand intervals
JP6510430B2 (ja) * 2016-01-18 2019-05-08 株式会社日立製作所 トレースデータ編集装置及び方法
WO2017147045A1 (en) * 2016-02-22 2017-08-31 Hubbell Incorporated Auto-adjusting data log record timestamps
US11150973B2 (en) * 2017-06-16 2021-10-19 Cisco Technology, Inc. Self diagnosing distributed appliance
JP7135903B2 (ja) * 2019-02-01 2022-09-13 株式会社デンソー 車両用装置、車両用装置の時刻同期方法
JP7280849B2 (ja) * 2020-03-19 2023-05-24 株式会社日立製作所 ログ統合装置、ログ統合システムおよびログ統合方法
DE112021006527T5 (de) * 2020-12-14 2024-01-11 Panasonic Intellectual Property Management Co., Ltd. Informationsverarbeitungssystem, informationsverarbeitungsvorrichtung, informationsverarbeitungsverfahren und informationsverarbeitungsprogramm

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3351318B2 (ja) * 1997-11-07 2002-11-25 株式会社日立製作所 計算機システムの監視方法
US6751573B1 (en) * 2000-01-10 2004-06-15 Agilent Technologies, Inc. Performance monitoring in distributed systems using synchronized clocks and distributed event logs
CA2315449A1 (en) * 2000-08-10 2002-02-10 Ibm Canada Limited-Ibm Canada Limitee Generation of runtime execution traces of applications and associated problem determination
US20030079205A1 (en) * 2001-10-22 2003-04-24 Takeshi Miyao System and method for managing operating systems
JP4567293B2 (ja) * 2003-01-21 2010-10-20 株式会社日立製作所 ファイルサーバ
KR100513290B1 (ko) * 2003-06-30 2005-09-09 삼성전자주식회사 멀티미디어 컨텐츠와 세그먼트 메타데이터간의 시간 동기화를 위한 시스템 및 방법

Also Published As

Publication number Publication date
JP2006285875A (ja) 2006-10-19
US20060225073A1 (en) 2006-10-05

Similar Documents

Publication Publication Date Title
JP4473766B2 (ja) 計算機システム、ログ収集方法、及びコンピュータプログラム
JP4762693B2 (ja) ファイルサーバ、ファイルサーバのログ管理システム及びファイルサーバのログ管理方法
US7685171B1 (en) Techniques for performing a restoration operation using device scanning
US8082231B1 (en) Techniques using identifiers and signatures with data operations
US7725704B1 (en) Techniques for performing a prioritized data restoration operation
CN1229725C (zh) 提供对多个快照提供方的公共协调和管理的方法和***
AU2016203740B2 (en) Simultaneous state-based cryptographic splitting in a secure storage appliance
US10007807B2 (en) Simultaneous state-based cryptographic splitting in a secure storage appliance
US7779300B2 (en) Server outage data management
US10747732B2 (en) Virtual database administrator
JP3830389B2 (ja) インターネット基盤の遠隔データ及びファイル復旧システム及びその方法
US7567994B2 (en) Method and apparatus to proactively capture and transmit dense diagnostic data of a file system
US20100162032A1 (en) Storage availability using cryptographic splitting
WO2010057196A2 (en) Secure storage availability using cryptographic splitting
US8135980B2 (en) Storage availability using cryptographic splitting
US8793371B1 (en) Common configuration warehouse for a storage system
US9817834B1 (en) Techniques for performing an incremental backup
CN111522499A (zh) 运维数据读取装置及其读取方法
KR101072056B1 (ko) 데이터 스토리지 시스템의 서비스 워크로드 식별자
US20160275293A1 (en) Information processing system and control method of the information processing system
US7613888B2 (en) Maintain owning application information of data for a data storage system
JP7424052B2 (ja) 制御プログラム、制御方法および制御装置
EP3629180B1 (en) Method and system for reliably restoring virtual machines
JP2023145248A (ja) 管理システム、ストレージシステム及び管理処理方法
Windows Optimizing and Troubleshooting

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071011

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090217

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090820

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090902

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090903

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20091029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100226

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20100305

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130312

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150