JP2019144785A - Monitoring program, monitoring apparatus and monitoring method - Google Patents
Monitoring program, monitoring apparatus and monitoring method Download PDFInfo
- Publication number
- JP2019144785A JP2019144785A JP2018027525A JP2018027525A JP2019144785A JP 2019144785 A JP2019144785 A JP 2019144785A JP 2018027525 A JP2018027525 A JP 2018027525A JP 2018027525 A JP2018027525 A JP 2018027525A JP 2019144785 A JP2019144785 A JP 2019144785A
- Authority
- JP
- Japan
- Prior art keywords
- monitoring
- information
- abnormality
- virtual machine
- result
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、監視プログラム、監視装置及び監視方法に関する。 The present invention relates to a monitoring program, a monitoring apparatus, and a monitoring method.
利用者に対してサービスを提供する事業者(以下、サービス事業者とも呼ぶ)は、例えば、サービスの提供を実現するために業務システム(以下、情報処理システムとも呼ぶ)を構築する。具体的に、サービス事業者は、例えば、クラウドコンピューティングサービスを提供する事業者(以下、クラウド事業者とも呼ぶ)から仮想マシン等のリソース(以下、単に仮想マシンとも呼ぶ)を借り受け、サービスの提供を実現する業務システムの構築を行う。 For example, a business provider (hereinafter also referred to as a service business) that provides a service to a user constructs a business system (hereinafter also referred to as an information processing system) in order to provide the service. Specifically, a service provider, for example, borrows a resource such as a virtual machine (hereinafter simply referred to as a virtual machine) from a provider that provides a cloud computing service (hereinafter also referred to as a cloud provider) and provides the service. Build a business system that realizes
この場合、クラウド事業者は、サービス事業者に対して貸し出した仮想マシンを動作させるハイパーバイザ等(以下、単に監視対象とも呼ぶ)の監視を行う。これにより、クラウド事業者は、例えば、監視対象において発生した異常(障害)によって仮想マシンに影響が及ぶことを防止することが可能になる(例えば、特許文献1及び2参照)。
In this case, the cloud provider monitors a hypervisor or the like (hereinafter also simply referred to as a monitoring target) that operates a virtual machine lent to the service provider. Thereby, the cloud operator can prevent the virtual machine from being affected by, for example, an abnormality (failure) occurring in the monitoring target (see, for example,
ここで、上記のようなクラウド事業者は、一般的に、サービス事業者に貸し出した仮想マシンに対して自由にアクセスを行うことができず、仮想マシンに関する情報(例えば、仮想マシンの動作状態を示す情報)を取得することができない。 Here, in general, a cloud operator as described above cannot freely access a virtual machine lent to a service operator, and information regarding the virtual machine (for example, the operating state of the virtual machine). Information) cannot be obtained.
そのため、クラウド事業者は、例えば、監視対象において発生した異常を検知した場合であっても、その異常が仮想マシンに与える影響を特定することができない。また、クラウド事業者は、例えば、監視対象において発生した異常を検知できなかった場合、その異常が仮想マシンに影響を与えている場合であっても、これを検知することができない。 Therefore, for example, even when a cloud operator detects an abnormality that has occurred in the monitoring target, it cannot identify the effect of the abnormality on the virtual machine. In addition, for example, when a cloud operator cannot detect an abnormality that has occurred in a monitoring target, it cannot detect the abnormality even if the abnormality affects the virtual machine.
そこで、一つの側面では、本発明は、監視対象において発生した異常に起因する影響を特定する監視プログラム、監視装置及び監視方法を提供することを目的とする。 In view of this, an object of one aspect of the present invention is to provide a monitoring program, a monitoring apparatus, and a monitoring method for identifying an influence caused by an abnormality that occurs in a monitoring target.
実施の形態の一態様では、仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、取得した前記結果から前記仮想マシンの異常有無を判定し、前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、処理をコンピュータに実行させる。 In one aspect of the embodiment, a virtual machine for monitoring used for monitoring a plurality of monitoring targets including the virtualization software is arranged on the virtualization software, and the predetermined virtual machine executed by the virtual machine at a predetermined interval Obtain a test result, determine whether or not the virtual machine is abnormal from the acquired result, and if the virtual machine is abnormal, acquire a predetermined state of the plurality of monitoring targets, and determine whether or not the virtual machine is abnormal And a process for outputting the determination result and the predetermined states of the plurality of monitoring targets.
一つの側面によれば、監視対象において発生した異常に起因する影響を特定することを可能とする。 According to one aspect, it is possible to identify an influence caused by an abnormality occurring in a monitoring target.
[情報処理システムの構成]
図1は、情報処理システム10の構成を示す図である。図1に示す情報処理システム10は、例えば、監視装置1と、監視者端末1aと、物理マシン2と、ストレージ装置3と、APIサーバ4と、ネットワーク機器5とを有する。
[Configuration of information processing system]
FIG. 1 is a diagram illustrating a configuration of the
監視装置1及び物理マシン2は、例えば、それぞれ1台以上の物理マシンから構成される。各物理マシンは、CPU(Central Computing Unit)、メモリ(DRAM:Dynamic Random Access Memory)及びハードディスク(HDD:Hard Disk Drive)等の物理リソースを有する。
The
物理マシン2で動作するハイパーバイザ2c(以下、仮想化ソフトウェア2cとも呼ぶ)は、物理マシン2やストレージ装置3の物理リソースを割り当てることによって、1台以上の仮想マシンを生成する。具体的に、ハイパーバイザ2cは、この場合、サービス事業者に対して貸し出す仮想マシン(以下、利用者VM2aとも呼ぶ)を生成する。
The
APIサーバ4は、例えば、サービス事業者が利用者端末(図示しない)に対して新たな利用者VM2aの生成や生成済の利用者VM2aの削除等を行う旨の入力を行った場合、物理マシン2等の物理リソースの管理を行うコントローラ(図示しない)に対し、新たな利用者VM2aの生成や生成済の利用者VM2aの削除等を行う旨の指示を行う。そして、コントローラは、この場合、ハイパーバイザ2cに対して、新たな利用者VM2aの生成や生成済の利用者VM2aの削除等を行う旨の指示を行う。
For example, when the service provider inputs to the user terminal (not shown) that a
ネットワーク機器5は、例えば、監視装置1や物理マシン2等の各装置を接続する物理スイッチである。
The
監視装置1は、例えば、物理マシン2において動作するハイパーバイザ2c、ストレージ装置3、APIサーバ4及びネットワーク機器5の監視を行う。そして、クラウド事業者は、監視者端末1aを介して監視装置1による監視結果の閲覧等を行う。
The
これにより、クラウド事業者は、例えば、ハイパーバイザ2cやストレージ装置3等の監視対象において発生した異常によって、サービス事業者に貸し出しているリソースである利用者VM2aの動作状態に影響が及ぶことを防止することが可能になる。
This prevents the cloud operator from affecting the operating state of the
ここで、上記のような監視装置1は、一般的に、サービス事業者に貸し出した利用者VM2aに対して自由にアクセスを行うことができず、利用者VM2aに関する情報(例えば、利用者VM2aの動作状態を示す情報)を取得することができない。
Here, the
そのため、クラウド事業者は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合であっても、その異常が利用者VM2aに与える影響を特定することができない。また、クラウド事業者は、例えば、ハイパーバイザ2cにおいて発生した異常を検知できなかった場合、その異常が利用者VM2aに影響を与えている場合であっても、これを検知することができない。
Therefore, for example, even when the cloud operator detects an abnormality that has occurred in the
そこで、本実施の形態における監視装置1は、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用の仮想マシン(以下、監視用VMとも呼ぶ)を配置する。
Therefore, the
そして、監視装置1は、所定間隔において、監視用VM2cによって実行された所定のテストの結果を取得し、取得した結果から監視用VM2cの異常有無を判定する。その結果、監視用VM2cが異常であると判定した場合、監視装置1は、複数の監視対象の所定の状態を取得し、監視用VM2cの異常有無の判定結果と、複数の監視対象の所定の状態とを出力する。
Then, the
すなわち、本実施の形態における監視装置1は、例えば、監視装置1が情報を取得することができない利用者VM2aが動作するハイパーバイザ2c上に、監視装置1が情報を取得することができる仮想マシンである監視用VMを配置する。そして、監視装置1は、監視用VMから取得した動作状態を、利用者VM2aにおける現在の動作状態として推定する。
That is, the
これにより、監視装置1は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合、監視用VMから取得した動作状態を参照することによって、発生した異常が利用者VM2aに与えている影響度合いを推定することが可能になる。また、監視装置1は、例えば、監視用VMから取得した動作状態を参照することによって、ハイパーバイザ2cにおいて検知できなかった異常(ハイパーバイザ2cに起因する異常)についても検知することが可能になる。
Thus, for example, when the
[情報処理システムのハードウエア構成]
次に、情報処理システム10のハードウエア構成について説明する。図2は、監視装置1のハードウエア構成を示す図である。
[Hardware configuration of information processing system]
Next, the hardware configuration of the
監視装置1は、図2に示すように、プロセッサであるCPU101と、メモリ102と、外部インターフェース(以下、I/Oユニットとも呼ぶ)103と、記憶媒体104とを有する。各部は、バス105を介して互いに接続される。
As illustrated in FIG. 2, the
記憶媒体104は、例えば、記憶媒体104内のプログラム格納領域(図示しない)に、監視対象の監視を行う処理(以下、監視処理とも呼ぶ)を行うためのプログラム110を記憶する。記憶媒体104は、例えば、HDDであってよい。
The
また、記憶媒体104は、例えば、監視処理を行う際に用いられる情報を記憶する記憶部130(以下、情報格納領域130とも呼ぶ)を有する。
In addition, the
CPU101は、記憶媒体104からメモリ102にロードされたプログラム110を実行して監視処理を行う。
The
外部インターフェース103は、例えば、ネットワーク(図示しない)を介して物理マシン2、ストレージ装置3、APIサーバ4及びネットワーク機器5と通信を行う。
The
[監視装置の機能]
次に、監視装置1の機能について説明する。図3は、監視装置1の機能のブロック図である。
[Monitoring device functions]
Next, functions of the
監視装置1は、CPU101やメモリ102等のハードウエアとプログラム110とが有機的に協働することにより、図3に示すように、仮想マシン配置部111と、テスト結果取得部112と、異常有無判定部113と、状態取得部114と、実行指示部115と、結果出力部116とを含む各種機能を実現する。
As shown in FIG. 3, the
また、監視装置1は、図3に示すように、テスト結果情報131と、対応情報132と、状態情報133と、通知情報134と、API結果情報135とを情報格納領域130に記憶する。
Further, as illustrated in FIG. 3, the
仮想マシン配置部111は、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VMを配置する。具体的に、仮想マシン配置部111は、例えば、ハイパーバイザ2cに対し、利用者VM2aと同様の処理を行うことが可能な監視用VMの配置を指示する。
The virtual
テスト結果取得部112は、所定間隔において監視用VMによって実行された所定のテスト結果を示すテスト結果情報131を取得する。所定のテストは、クラウド事業者によって予め定められた各種テストであり、例えば、監視用VMのCPUがメモリやディスクに対して行うアクセス速度が所定の閾値以上であるか否かを判定するテストである。
The test result
異常有無判定部113は、テスト結果取得部112が取得したテストの結果から、監視用VMにおいて異常が発生しているか否かの判定を行う。
The abnormality presence /
状態取得部114は、異常有無判定部113が監視用VMにおいて異常が発生していると判定した場合、複数の監視対象(例えば、図1で説明したストレージ装置3やAPIサーバ4)の所定の状態を示す状態情報133を取得する。所定の状態は、例えば、各監視対象が行う通常処理を正常に実行しているか否かを示す情報を含む。
When the abnormality presence /
実行指示部115は、APIサーバ4に対して所定の処理を指示する。所定の処理は、例えば、物理マシン2における新たな利用者VM2aの生成や生成済の利用者VM2aの削除である。そして、状態取得部114は、この場合、例えば、実行指示部115が指示した所定の処理の実行結果を示すAPI結果情報135を、APIサーバ4の状態を示す情報として取得する。
The
結果出力部116は、例えば、異常有無判定部113における監視用VMの異常有無の判定結果と、状態取得部114が取得した状態情報133やAPI結果情報135とを含む通知情報134を出力する。具体的に、結果出力部116は、例えば、監視者端末1aの出力装置(図示しない)に対して通知情報134の出力を行う。対応情報132についての説明は後述する。
The
[第1の実施の形態の概略]
次に、第1の実施の形態の概略について説明する。図4及び図5は、第1の実施の形態における監視処理の概略を説明するフローチャート図である。図6から図8は、第1の実施の形態における監視処理の概略を説明する図である。図6から図8を参照しながら、図4及び図5の監視処理の詳細を説明する。なお、図6から図8では、図1で説明したネットワーク機器5についての記載及び説明を省略する。
[Outline of First Embodiment]
Next, an outline of the first embodiment will be described. 4 and 5 are flowcharts for explaining an overview of the monitoring process in the first embodiment. 6 to 8 are diagrams for explaining the outline of the monitoring process in the first embodiment. Details of the monitoring process of FIGS. 4 and 5 will be described with reference to FIGS. 6 to 8, the description and description of the
監視装置1は、図4に示すように、仮想マシン配置タイミングまで待機する(S1のNO)。仮想マシン配置タイミングは、例えば、クラウド事業者が監視者端末1aに対して利用者VM2aの監視を開始する旨の入力を行ったタイミングであってよい。
As shown in FIG. 4, the
そして、仮想マシン配置タイミングになった場合(S1のYES)、監視装置1は、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置する(S2)。
When the virtual machine placement timing comes (YES in S1), the
具体的に、監視装置1は、例えば、図6に示すように、利用者VM2aが配置されたハイパーバイザ2c上に、利用者VM2a等を監視するための監視用VM2bを配置する。
Specifically, for example, as illustrated in FIG. 6, the
その後、監視装置1は、図5に示すように、異常判定タイミングになるまで待機する(S11のNO)。異常判定タイミングは、例えば、クラウド事業者によって予め定められた所定間隔ごとのタイミングであってよい。
Thereafter, as shown in FIG. 5, the
そして、異常判定タイミングになった場合(S11のYES)、監視装置1は、監視用の仮想マシンによって実行された所定のテストの結果を取得する(S12)。さらに、監視装置1は、S12の処理で取得した結果から監視用の仮想マシンの異常有無を判定する(S13)。
When the abnormality determination timing is reached (YES in S11), the
具体的に、監視装置1は、例えば、図7に示すように、監視用VM2bから所定のテストの結果(例えば、テスト結果情報131)を取得し、取得した結果から監視用VM2bの異常有無を判定する。
Specifically, for example, as illustrated in FIG. 7, the
その結果、監視用の仮想マシンに異常があると判定した場合(S14のYES)、監視装置1は、複数の監視対象の所定の状態を取得する(S15)。その後、監視装置1は、S13の処理における監視用の仮想マシンの異常有無についての判定結果と、S15の処理で取得した複数の監視対象の所定の状態とを出力する(S16)。
As a result, when it is determined that there is an abnormality in the monitoring virtual machine (YES in S14), the
具体的に、監視装置1は、例えば、図8に示すように、監視対象に含まれるストレージ装置3やAPIサーバ4からそれぞれ状態(例えば、状態情報133)を取得する。そして、監視装置1は、例えば、監視用VM2bが異常であったか否かを示す情報と、ストレージ装置3やAPIサーバ4等の状態を示す情報とを監視者端末1aに出力する。
Specifically, for example, as illustrated in FIG. 8, the
一方、監視用の仮想マシンに異常がないと判定した場合(S14のNO)、監視装置1は、S15及びS16の処理を行わない。
On the other hand, when it is determined that there is no abnormality in the monitoring virtual machine (NO in S14), the
すなわち、本実施の形態における監視装置1は、例えば、監視装置1が情報を取得することができない利用者VM2aが動作するハイパーバイザ2c上に、監視装置1が情報を取得することができる監視用VM2bを配置する。そして、監視装置1は、監視用VM2bから取得した動作状態を、利用者VM2aにおける現在の動作状態として推定する。
That is, the
これにより、監視装置1は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合、監視用VM2bから取得した動作状態を参照することによって、発生した異常が利用者VM2aに与えている影響度合いを推定することが可能になる。また、監視装置1は、例えば、監視用2bVMから取得した動作状態を参照することによって、ハイパーバイザ2cにおいて検知できなかった異常(ハイパーバイザ2cに起因する異常)についても検知することが可能になる。
Thus, for example, when the
そのため、監視装置1は、利用者VM2aに対して直接アクセスを行うことができず、利用者VM2aの動作状態を示す情報を取得することができない場合であっても、クラウド事業者の監視対象における異常に起因するサービス事業者のリソースへの影響度合いを特定することが可能になる。したがって、クラウド事業者は、例えば、クラウド事業者の監視対象において異常が発生した場合、サービス事業者のリソースにおける実際の影響度合いに応じた対処を行うことが可能になる。
Therefore, even if the
[第1の実施の形態の詳細]
次に、第1の実施の形態の詳細について説明する。図9から図12は、第1の実施の形態における監視処理の詳細を説明するフローチャート図である。また、図13から図21は、第1の実施の形態における監視処理の詳細を説明する図である。図13から図21を参照しながら、図9から図12の監視処理の詳細を説明する。なお、以下、利用者VM2aの監視を行う監視用の仮想マシンが監視用VM2bであるものとして説明を行う。
[Details of First Embodiment]
Next, details of the first embodiment will be described. 9 to 12 are flowcharts for explaining details of the monitoring processing in the first embodiment. FIGS. 13 to 21 are diagrams for explaining the details of the monitoring process in the first embodiment. Details of the monitoring process of FIGS. 9 to 12 will be described with reference to FIGS. 13 to 21. FIG. In the following description, it is assumed that the monitoring virtual machine that monitors the
[監視用VMを配置する処理]
初めに、監視処理のうち、監視用VM2bを配置する処理について説明を行う。
[Process of allocating monitoring VM]
First, of the monitoring processing, processing for arranging the
監視装置1の仮想マシン配置部111は、図9に示すように、仮想マシン配置タイミングまで待機する(S21のNO)。そして、仮想マシン配置タイミングになった場合(S21のYES)、仮想マシン配置部111は、1以上のハイパーバイザ2c上に、各ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bをそれぞれ配置する(S22)。
As shown in FIG. 9, the virtual
具体的に、仮想マシン配置部111は、例えば、情報格納領域130に記憶された情報のうち、各利用者VM2aが配置されているハイパーバイザ2cを示す情報(図示しない)を参照し、各利用者VM2aが配置されている1以上のハイパーバイザ2cをそれぞれ特定する。そして、仮想マシン配置部111は、特定したハイパーバイザ2cのそれぞれに対し、監視用VM2bの配置を指示する。
Specifically, for example, the virtual
その後、仮想マシン配置部111は、S22の処理で配置した監視用VM2bと、各監視用VM2bが配置されたハイパーバイザ2cとを対応付けた対応情報132を生成する(S23)。そして、仮想マシン配置部111は、生成した対応情報132を情報格納領域130に記憶する。以下、S23の処理で生成された対応情報132の具体例について説明を行う。
Thereafter, the virtual
[対応情報の具体例(1)]
図13は、対応情報132の具体例について説明する図である。
[Specific example of correspondence information (1)]
FIG. 13 is a diagram for describing a specific example of the
図13に示す対応情報132(以下、対応情報132aとも呼ぶ)は、各情報を識別する「項番」と、各ハイパーバイザ2cを識別する「HVID」と、各監視用VM2bを識別する「監視用VMID」とを項目として有する。
The correspondence information 132 (hereinafter also referred to as correspondence information 132a) illustrated in FIG. 13 includes “item number” for identifying each information, “HVID” for identifying each hypervisor 2c, and “monitoring” for identifying each
具体的に、図13に示す対応情報132aにおいて、「項番」が「1」である情報には、「HVID」として「001」が設定されており、「監視用VMID」として「xxx」が設定されている。また、図13に示す対応情報132aにおいて、「項番」が「2」である情報には、「HVID」として「002」が設定されており、「監視用VMID」として「yyy」が設定されている。図13に含まれる他の情報については説明を省略する。 Specifically, in the correspondence information 132a shown in FIG. 13, “001” is set as “HVID” and “xxx” is set as “monitoring VMID” in the information whose “item number” is “1”. Is set. Further, in the correspondence information 132a shown in FIG. 13, “002” is set as “HVID” and “yyy” is set as “monitoring VMID” in the information whose “item number” is “2”. ing. Description of other information included in FIG. 13 is omitted.
[監視用VMにおいて異常が検知された場合の処理]
次に、監視処理のうち、監視用VM2bにおいて異常が検知された場合の処理について説明を行う。
[Processing when abnormality is detected in monitoring VM]
Next, of the monitoring process, a process when an abnormality is detected in the
監視装置1のテスト結果取得部112は、図10に示すように、異常判定タイミングになるまで待機する(S31のNO)。そして、異常判定タイミングになった場合(S31のYES)、テスト結果取得部112は、各監視用VM2bに対して予め実行を指示した所定のテストの結果を示すテスト結果情報131を各監視用VM2bから取得する(S32)。その後、テスト結果取得部112は、各監視用VM2bから取得したテスト結果情報131を情報格納領域130に記憶する。以下、S32の処理で取得したテスト結果情報131の具体例について説明を行う。
As shown in FIG. 10, the test
[テスト結果情報の具体例(1)]
図14は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図14(A)は、テスト結果情報131の具体例について説明する図である。
[Specific example of test result information (1)]
FIG. 14 is a diagram for describing a specific example of the test result
図14(A)に示すテスト結果情報131(以下、テスト結果情報131a1とも呼ぶ)は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、各監視用VM2bに実行を指示した所定のテストの結果が設定される「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」とを項目として有する。「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」には、テスト結果が正常であったことを示す「OK」、テスト結果が異常であったことを示す「NG」、または、テスト結果を取得することができなかったことを示す「未取得」のいずれかが設定される。
The test result information 131 (hereinafter also referred to as test result information 131a1) shown in FIG. 14A includes “item number” for identifying each information, “monitoring VMID” for identifying each
具体的に、図14(A)に示すテスト結果情報131a1において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「テスト結果(第1テスト)」として「OK」が設定され、「テスト結果(第2テスト)」として「OK」が設定されている。すなわち、図14(A)に示すテスト結果情報131a1は、「監視用VMID」が「xxx」である監視用VM2bが正常であったことを示す情報を含んでいる。
Specifically, in the test result information 131a1 shown in FIG. 14A, “xxx” is set as “monitoring VMID” in the information whose “item number” is “1”, and “test result (first “OK” is set as “Test” ”, and“ OK ”is set as“ Test result (second test) ”. That is, the test result information 131a1 illustrated in FIG. 14A includes information indicating that the
一方、図14(A)に示すテスト結果情報131a1において、「項番」が「2」である情報には、「監視用VMID」として「yyy」が設定され、「テスト結果(第1テスト)」として「OK」が設定され、「テスト結果(第2テスト)」として「NG」が設定されている。すなわち、図14(A)に示すテスト結果情報131a1は、「監視用VMID」が「xxx」である監視用VM2bが異常であったことを示す情報を含んでいる。図14に示すテスト結果情報131a1に含まれる他の情報についての説明は省略する。
On the other hand, in the test result information 131a1 shown in FIG. 14A, “yyy” is set as “monitoring VMID” in the information whose “item number” is “2”, and “test result (first test)” "OK" is set as "", and "NG" is set as "Test result (second test)". That is, the test result information 131a1 illustrated in FIG. 14A includes information indicating that the
図10に戻り、監視装置1の異常有無判定部113は、情報格納領域130に記憶されたテスト結果情報131を参照し、異常がある監視用VM2bが存在するか否かを判定する(S33)。
Returning to FIG. 10, the abnormality presence /
具体的に、異常有無判定部113は、例えば、情報格納領域130に記憶されたテスト結果情報131(S32の処理において取得したテスト結果情報131)を参照し、「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」のいずれかに「NG」または「未取得」が設定されている情報が存在するか否かを判定する。そして、異常有無判定部113は、「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」のいずれかに「NG」または「未取得」が設定されている情報が存在しないと判定した場合、全ての監視用VM2bが正常であると判定する。また、異常有無判定部113は、「テスト結果(第1テスト)」及び「テスト結果(第2テスト)」のいずれかに「NG」または「未取得」が設定されている情報が存在すると判定した場合、存在すると判定した情報に対応する監視用VM2bが異常であると判定する。
Specifically, the abnormality presence /
その結果、異常があると判定された監視用VM2bが存在しないと判定した場合(S34のNO)、テスト結果取得部112は、S31以降の処理を再度行う。
As a result, when it is determined that there is no
一方、異常があると判定された監視用VM2bが存在すると判定した場合(S34のYES)、監視装置1の状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S34の処理で異常があると判定した監視用VM2bに対応する監視対象を特定する(S35)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S35)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、S35の処理で取得された状態情報133の具体例について説明を行う。
On the other hand, when it is determined that there is a
[状態情報の具体例(1)]
図14(B)は、状態情報133の具体例について説明する図である。
[Specific example of status information (1)]
FIG. 14B is a diagram for describing a specific example of the
図14(B)に示す状態情報133(以下、状態情報133a1とも呼ぶ)は、各情報を識別する「項番」と、各ハイパーバイザ2cを識別する「HVID」と、各ハイパーバイザ2cの状態を示す「状態」とを項目として有している。「状態」には、ハイパーバイザ2cの状態が正常であったことを示す「OK」、ハイパーバイザ2cの状態が異常であったことを示す「NG」、または、ハイパーバイザ2cから情報を取得できなかったことを示す「未取得」のいずれかが設定される。
The status information 133 (hereinafter also referred to as status information 133a1) shown in FIG. 14B includes “item number” for identifying each information, “HVID” for identifying each hypervisor 2c, and the status of each hypervisor 2c. As an item. In “Status”, “OK” indicating that the state of the hypervisor 2c is normal, “NG” indicating that the state of the hypervisor 2c is abnormal, or information can be acquired from the
具体的に、図14(B)に示す状態情報133a1において、「項番」が「1」である情報には、「HVID」として「002」が設定され、「状態」として「OK」が設定されている。 Specifically, in the status information 133a1 shown in FIG. 14B, “002” is set as “HVID” and “OK” is set as “status” in the information whose “item number” is “1”. Has been.
すなわち、図14(A)で説明したテスト結果情報131a1において、「項番」が「2」である情報(「監視用VMID」が「yyy」である情報)の「テスト結果(第2テスト)」には、「NG」が設定されている。そして、図13で説明した対応情報132aにおいて、「監視用VMID」に「yyy」が設定された情報の「HVID」には、「002」が設定されている。そのため、状態取得部114は、S35の処理において、「HVID」が「002」であるハイパーバイザ2cにアクセスし、図14(B)に示す状態情報133a1に含まれる情報を取得する。
That is, in the test result information 131a1 described with reference to FIG. 14A, the “test result (second test)” of the information whose “item number” is “2” (information whose “monitoring VMID” is “yyy”). "" Is set to "NG". In the correspondence information 132 a described with reference to FIG. 13, “002” is set in “HVID” of information in which “yyy” is set in “monitoring VMID”. Therefore, in the process of S35, the
その後、監視装置1の結果出力部115は、S34の処理に監視用VM2bの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とを出力する(S36)。
After that, the
具体的に、結果出力部115は、例えば、S34の処理に監視用VM2bの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。通知情報134の具体例については後述する。
Specifically, for example, the
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知が行われたか否かに依らず、監視用VM2bにおいて異常が検知された場合、その異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の検知漏れを防止することが可能になる。
Thereby, the
また、監視装置1は、監視用VM2bにおいて検知された異常の内容だけでなく、異常が検知された監視用VM2bに関連する監視対象の情報についても出力することにより、検知された異常の原因究明を行うために必要な情報を迅速に出力することが可能になる。
In addition, the
[クラウド事業者の監視対象において異常が検知された場合の処理]
次に、監視処理のうち、クラウド事業者の監視対象において異常が検知された場合の処理について説明を行う。
[Processing when an abnormality is detected in the monitoring target of the cloud service provider]
Next, of the monitoring processing, processing when an abnormality is detected in the monitoring target of the cloud operator will be described.
状態取得部114は、図11に示すように、異常判定タイミングまで待機する(S41のNO)。図11に示す異常判定タイミングは、例えば、図10において説明した異常判定タイミングと同じタイミングであってよい。
As shown in FIG. 11, the
そして、異常判定タイミングになった場合(S41のYES)、状態取得部114は、1以上の監視対象のそれぞれの状態を示す状態情報133を取得する(S42)。その後、状態取得部114は、各監視対象から取得した状態情報133を情報格納領域130に記憶する。以下、S42の処理で取得された状態情報133の具体例について説明を行う。
When the abnormality determination timing is reached (YES in S41), the
[状態情報の具体例(2)]
図15は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図15(B)は、状態情報133の具体例について説明する図である。
[Specific example of status information (2)]
FIG. 15 is a diagram for describing a specific example of the test result
図15(B)に示す状態情報133(以下、状態情報133a2とも呼ぶ)において、「項番」が「1」である情報には、「HVID」として「001」が設定され、「状態」として「OK」が設定されている。また、図15(B)に示す状態情報133a2において、「項番」が「3」である情報には、「HVID」として「003」が設定され、「状態」として「NG」が設定されている。図15(B)に含まれる他の情報についての説明は省略する。 In the status information 133 (hereinafter also referred to as status information 133a2) shown in FIG. 15B, “001” is set as “HVID” in the information whose “item number” is “1”, and “status” “OK” is set. In the status information 133a2 shown in FIG. 15B, “003” is set as “HVID” and “NG” is set as “status” in the information whose “item number” is “3”. Yes. Description of other information included in FIG.
図11に戻り、異常有無判定部113は、情報格納領域130に記憶された状態情報133を参照し、異常がある監視対象が存在するか否かを判定する(S43)。
Returning to FIG. 11, the abnormality presence /
具体的に、異常有無判定部113は、例えば、情報格納領域130に記憶された状態情報133(S42の処理において取得した状態情報133)を参照し、「状態」に「NG」または「未取得」が設定されている情報が存在するか否かを判定する。そして、異常有無判定部113は、「状態」に「NG」または「未取得」が設定されている情報が存在しないと判定した場合、全ての監視対象が正常であると判定する。また、異常有無判定部113は、「状態」のいずれかに「NG」または「未取得」が設定されている情報が存在すると判定した場合、存在すると判定した情報に対応する監視対象が異常であると判定する。
Specifically, the abnormality presence /
その結果、異常があると判定された監視対象が存在しないと判定した場合(S44のNO)、状態取得部114は、S41以降の処理を再度行う。
As a result, when it is determined that there is no monitoring target determined to be abnormal (NO in S44), the
一方、異常があると判定された監視対象が存在すると判定した場合(S44のYES)、テスト結果取得部112は、情報格納領域130に記憶された対応情報132を参照し、S44の処理で異常があると判定した監視対象に対応する監視用VM2bを特定する(S45)。そして、テスト結果取得部112は、特定した監視用VM2bのテスト結果情報131を取得する(S45)。以下、S45の処理で取得されたテスト結果情報131の具体例について説明を行う。
On the other hand, when it is determined that there is a monitoring target that is determined to be abnormal (YES in S44), the test
[テスト結果情報の具体例(2)]
図15(A)は、テスト結果情報131の具体例について説明する図である。
[Specific example of test result information (2)]
FIG. 15A is a diagram for describing a specific example of the test result
図15(A)に示すテスト結果情報131(以下、テスト結果情報131a2とも呼ぶ)において、「項番」が「1」である情報には、「監視用VMID」として「zzz」が設定され、「テスト結果(第1テスト)」として「OK」が設定され、「テスト結果(第2テスト)」として「OK」が設定されている。 In the test result information 131 (hereinafter also referred to as test result information 131a2) shown in FIG. 15A, “zzz” is set as “monitoring VMID” in the information whose “item number” is “1”. “OK” is set as “test result (first test)”, and “OK” is set as “test result (second test)”.
すなわち、図15(B)で説明した状態情報133a2において、「項番」が「3」である情報(「HVID」が「003」である情報)の「状態」には、「NG」が設定されている。そして、図13で説明した対応情報132aにおいて、「HVID」に「003」が設定された情報の「監視用VMID」には、「zzz」が設定されている。そのため、テスト結果取得部112は、S45の処理において、「監視用VMID」が「zzz」である監視用VM2bにアクセスし、図15(A)に示すテスト結果情報131a2に含まれる情報を取得する。
That is, in the status information 133a2 described in FIG. 15B, “NG” is set in the “status” of the information whose “item number” is “3” (information whose “HVID” is “003”). Has been. In the correspondence information 132a described with reference to FIG. 13, “zzzz” is set in “monitoring VMID” of information in which “003” is set in “HVID”. Therefore, in the process of S45, the test
図12に戻り、異常有無判定部113は、情報格納領域130に記憶されたテスト結果情報131を参照し、S45の処理でテスト結果情報131を取得した監視用VM2bに、異常がある監視用VM2bが存在するか否かを判定する(S51)。
Returning to FIG. 12, the abnormality presence /
その結果、異常があると判定された監視用VM2bが存在すると判定した場合(S51のYES)、結果出力部115は、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第1異常(例えば、緊急度が「高」である異常)であることを示す情報とを出力する(S52)。
As a result, when it is determined that there is a
具体的に、結果出力部115は、例えば、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第1異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
Specifically, for example, the
一方、異常があると判定された監視用VM2bが存在しないと判定した場合(S51のNO)、結果出力部115は、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第2異常(例えば、緊急度が「低」である異常)であることを示す情報とを出力する(S53)。
On the other hand, if it is determined that there is no
具体的に、結果出力部115は、例えば、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第2異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
Specifically, for example, the
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知された場合、監視用VM2bにおける異常の発生状況を考慮した上で、検知した異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の度合いに応じた情報を出力することが可能になる。したがって、クラウド事業者は、監視装置1によって出力された情報を参照することによって、サービス事業者のリソースに対する影響の度合いに応じた対処を行うことが可能になる。
As a result, when an abnormality is detected in the monitoring target (for example, the
[第1の実施の形態における他の具体例(1)]
次に、第1の実施の形態における他の具体例について説明を行う。図16から図18は、第1の実施の形態における他の具体例について説明する図である。
[Other Specific Example (1) in First Embodiment]
Next, another specific example in the first embodiment will be described. FIGS. 16 to 18 are diagrams for explaining other specific examples in the first embodiment.
仮想マシン配置部111は、図9に示すように、仮想マシン配置タイミングになった場合(S21のYES)、1以上のハイパーバイザ2c上に、各ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bをそれぞれ配置する(S22)。
As shown in FIG. 9, the virtual
具体的に、仮想マシン配置部111は、各利用者VM2aが配置されているハイパーバイザ2cをそれぞれ特定する。そして、仮想マシン配置部111は、特定したハイパーバイザ2cのそれぞれにおいて監視用VM2bの配置を行う。また、仮想マシン配置部111は、この場合、例えば、図1等で説明したストレージ装置3において、監視用VM2bのそれぞれに対応する監視用ボリュームを確保する。
Specifically, the virtual
そして、仮想マシン配置部111は、S22の処理で配置した監視用VM2bと、各監視用VM2bが配置されたハイパーバイザ2cとを対応付けた対応情報132を生成する(S23)。その後、仮想マシン配置部111は、生成した対応情報132を情報格納領域130に記憶する。以下、S23の処理で生成された対応情報132の具体例について説明を行う。
Then, the virtual
[対応情報の具体例(2)]
図16は、対応情報132の具体例について説明する図である。具体的に、図16(A)は、ストレージ装置3と監視用ボリュームとの対応を示す対応情報132(以下、対応情報132b1とも呼ぶ)を説明する図である。また、図16(B)は、監視用VM2bと監視用ボリュームとの対応を示す対応情報132(以下、対応情報132b2とも呼ぶ)を説明する図である。
[Specific example of correspondence information (2)]
FIG. 16 is a diagram for describing a specific example of the
図16(A)に示す対応情報132b1は、各情報を識別する「項番」と、各ストレージ装置3を識別する「ストレージID」と、各監視用ボリュームを識別する「監視用ボリュームID」とを項目として有する。
The correspondence information 132b1 shown in FIG. 16A includes an “item number” for identifying each information, a “storage ID” for identifying each
具体的に、図16(A)に示す対応情報132b1において、「項番」が「1」である情報には、「ストレージID」として「011」が設定されており、「監視用ボリュームID」として「vol_xxx」が設定されている。また、図16(A)に示す対応情報132b1において、「項番」が「2」である情報には、「ストレージID」として「012」が設定されており、「監視用ボリュームID」として「vol_yyy」が設定されている。図16(A)に含まれる他の情報については説明を省略する。 Specifically, in the correspondence information 132b1 shown in FIG. 16A, “011” is set as the “storage ID” in the information whose “item number” is “1”, and “monitoring volume ID” “Vol_xxx” is set. In the correspondence information 132b1 shown in FIG. 16A, “012” is set as the “storage ID” and “012” is set as the “monitoring volume ID” in the information whose “item number” is “2”. vol_yyy "is set. Description of other information included in FIG.
一方、図16(B)に示す対応情報132b2は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、各監視用ボリュームを識別する「監視用ボリュームID」とを項目として有する。
On the other hand, the correspondence information 132b2 shown in FIG. 16B includes an “item number” for identifying each information, a “monitoring VMID” for identifying each
具体的に、図16(B)に示す対応情報132b2において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定されており、「監視用ボリュームID」として「vol_xxx」が設定されている。また、図16(B)に示す対応情報132b2において、「項番」が「2」である情報には、「監視用VMID」として「yyy」が設定されており、「監視用ボリュームID」として「vol_yyy」が設定されている。図16(B)に含まれる他の情報については説明を省略する。 Specifically, in the correspondence information 132b2 shown in FIG. 16B, “xxx” is set as “monitoring VMID” in the information whose “item number” is “1”, and “monitoring volume ID” "Vol_xxx" is set. In the correspondence information 132b2 shown in FIG. 16B, “yyy” is set as the “monitoring VMID” in the information whose “item number” is “2”, and the “monitoring volume ID” is set as the “monitoring volume ID”. “Vol_yyy” is set. Description of other information included in FIG.
続いて、テスト結果取得部112は、図10に示すように、異常判定タイミングになった場合(S31のYES)、各監視用VM2bに対して予め実行を指示した所定のテストの結果を示すテスト結果情報131を各監視用VM2bや各監視用ボリュームから取得する(S32)。具体的に、テスト結果取得部112は、この場合、例えば、各監視用VM2bが各監視用ボリュームに対してアクセスを行う際のアクセス速度が所定の閾値以上であるか否かを判定するテストの結果を取得する。そして、テスト結果取得部112は、各監視用VM2bや監視用ボリュームから取得したテスト結果情報131を情報格納領域130に記憶する。以下、S32の処理で取得されたテスト結果情報131の具体例について説明を行う。
Subsequently, as shown in FIG. 10, the test
[テスト結果情報の具体例(3)]
図17は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図17(A)は、テスト結果情報131の具体例について説明する図である。
[Specific example of test result information (3)]
FIG. 17 is a diagram for describing a specific example of the test result
図17(A)に示すテスト結果情報131(以下、テスト結果情報131b1とも呼ぶ)は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、各監視用ボリュームを識別する「監視用ボリュームID」と、監視用VM2bに実行を指示したテストの結果が設定される「テスト結果(第3テスト)」及び「テスト結果(第4テスト)」とを項目として有する。
The test result information 131 (hereinafter also referred to as test result information 131b1) shown in FIG. 17A includes “item number” for identifying each information, “monitoring VMID” for identifying each
具体的に、図17(A)に示すテスト結果情報131b1において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「監視用ボリュームID」として「vol_xxx」が設定され、「テスト結果(第3テスト)」として「OK」が設定され、「テスト結果(第4テスト)」として「OK」が設定されている。すなわち、図17(A)に示すテスト結果情報131b1は、「監視用VMID」が「xxx」である監視用VM2b及び「監視用ボリュームID」が「vol_xxx」である監視用ボリュームが正常であったことを示す情報を含んでいる。
Specifically, in the test result information 131b1 shown in FIG. 17A, “xxx” is set as “monitoring VMID” in the information whose “item number” is “1”, and “monitoring volume ID” “Vol_xxx” is set, “OK” is set as “test result (third test)”, and “OK” is set as “test result (fourth test)”. That is, in the test result information 131b1 shown in FIG. 17A, the
一方、図17(A)に示すテスト結果情報131b1において、「項番」が「2」である情報には、「監視用VMID」として「yyy」が設定され、「監視用ボリュームID」として「vol_yyy」が設定され、「テスト結果(第3テスト)」として「OK」が設定され、「テスト結果(第4テスト)」として「NG」が設定されている。すなわち、図17(A)に示すテスト結果情報131b1は、「監視用VMID」が「yyy」である監視用VM2b及び「監視用ボリュームID」が「vol_yyy」である監視用ボリュームのうちの少なくともいずれかが異常であったことを示す情報を含んでいる。図17(A)に示すテスト結果情報131b1に含まれる他の情報についての説明は省略する。
On the other hand, in the test result information 131b1 shown in FIG. 17A, “yyy” is set as “monitoring VMID” and “monitoring volume ID” is set to “2” in the information whose “item number” is “2”. “vol_yyy” is set, “OK” is set as the “test result (third test)”, and “NG” is set as the “test result (fourth test)”. That is, the test result information 131b1 shown in FIG. 17A includes at least one of the
図10に戻り、異常有無判定部113は、情報格納領域130に記憶されたテスト結果情報131(S32の処理で取得したテスト結果情報131)を参照し、異常がある監視用VM2bや監視用ボリュームが存在するか否かを判定する(S33)。
Returning to FIG. 10, the abnormality presence /
その結果、異常があると判定された監視用VM2bや監視用ボリュームが存在する場合(S34のYES)、状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S34の処理で異常があると判定した監視用VM2bや監視用ボリュームに対応する監視対象を特定する(S35)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S35)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、S35の処理で取得された状態情報133の具体例について説明を行う。
As a result, when there is a
[状態情報の具体例(3)]
図17(B)は、状態情報133の具体例について説明する図である。
[Specific example of status information (3)]
FIG. 17B is a diagram for describing a specific example of the
図17(B)に示す状態情報133(以下、状態情報133b1とも呼ぶ)は、各情報を識別する「項番」と、各ストレージ装置3を識別する「ストレージID」と、各ストレージ装置3の状態を示す「状態」とを項目として有している。
The status information 133 (hereinafter also referred to as status information 133b1) shown in FIG. 17B includes “item number” for identifying each information, “storage ID” for identifying each
具体的に、図17(B)に示す状態情報133b1において、「項番」が「1」である情報には、「ストレージID」として「012」が設定され、「状態」として「OK」が設定されている。 Specifically, in the status information 133b1 shown in FIG. 17B, “012” is set as the “storage ID” and “OK” is set as the “status” in the information whose “item number” is “1”. Is set.
すなわち、図17(A)で説明したテスト結果情報131b1において、「項番」が「2」である情報(「監視用VMID」が「yyy」である情報)の「テスト結果(第4テスト)」には、「NG」が設定されている。そして、図16(A)で説明した対応情報132b1において、「監視用VMID」に「yyy」が設定された情報の「ストレージID」には、「012」が設定されている。そのため、状態取得部114は、S35の処理において、「ストレージID」が「012」であるストレージ装置3にアクセスし、図17(B)に示す状態情報133b1に含まれる情報を取得する。
That is, in the test result information 131b1 described with reference to FIG. 17A, the "test result (fourth test)" of the information whose "item number" is "2" (information whose "monitoring VMID" is "yyy") "" Is set to "NG". In the correspondence information 132b1 described with reference to FIG. 16A, “012” is set in the “storage ID” of the information in which “yyy” is set in the “monitoring VMID”. Therefore, in the process of S35, the
その後、結果出力部115は、S34の処理に監視用VM2bや監視用ボリュームの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とを出力する(S36)。
Thereafter, the
また、状態取得部114は、図11に示すように、異常判定タイミングになった場合(S41のYES)、1以上の監視対象のそれぞれの状態を示す状態情報133を取得する(S42)。その後、状態取得部114は、各監視対象から取得した状態情報133を情報格納領域130に記憶する。以下、S42の処理で取得された状態情報133の具体例について説明を行う。
Moreover, as shown in FIG. 11, when the abnormality determination timing is reached (YES in S41), the
[状態情報の具体例(4)]
図18は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図18(B)は、状態情報133の具体例について説明する図である。
[Specific example of status information (4)]
FIG. 18 is a diagram for describing a specific example of the test result
図18(B)に示す状態情報133(以下、状態情報133b2とも呼ぶ)において、「項番」が「1」である情報には、「ストレージID」として「011」が設定され、「状態」として「NG」が設定されている。また、図18(B)に示す状態情報133b2において、「項番」が「2」である情報には、「ストレージID」として「012」が設定され、「状態」として「OK」が設定されている。図18(B)に含まれる他の情報についての説明は省略する。 In the status information 133 (hereinafter also referred to as status information 133b2) shown in FIG. 18B, “011” is set as the “storage ID” for the information whose “item number” is “1”, and “status” "NG" is set. In the status information 133b2 shown in FIG. 18B, “012” is set as the “storage ID” and “OK” is set as the “status” in the information whose “item number” is “2”. ing. Description of other information included in FIG. 18B is omitted.
図11に戻り、異常有無判定部113は、情報格納領域130に記憶された状態情報133を参照し、異常がある監視対象が存在するか否かを判定する(S43)。
Returning to FIG. 11, the abnormality presence /
その結果、異常があると判定された監視対象が存在する場合(S44のYES)、テスト結果取得部112は、情報格納領域130に記憶された対応情報132を参照し、S44の処理で異常があると判定した監視対象に対応する監視用VM2bや監視用ボリュームを特定する(S45)。その後、テスト結果取得部112は、特定した監視用VM2bや監視用ボリュームのテスト結果情報131を取得する(S45)。以下、S45の処理で取得された状態情報133の具体例について説明を行う。
As a result, when there is a monitoring target determined to be abnormal (YES in S44), the test
[テスト結果情報の具体例(4)]
図18(A)は、テスト結果情報131の具体例について説明する図である。
[Specific example of test result information (4)]
FIG. 18A is a diagram for describing a specific example of the test result
図18(A)に示すテスト結果情報131(以下、テスト結果情報131b2とも呼ぶ)において、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「監視用ボリュームID」として「vol_xxx」が設定され、「テスト結果(第3テスト)」として「OK」が設定され、「テスト結果(第4テスト)」として「OK」が設定されている。
In the test result
すなわち、図18(B)で説明した状態情報133b2において、「項番」が「1」である情報(「ストレージID」が「011」である情報)の「状態」には、「NG」が設定されている。そして、図16(A)で説明した対応情報132b1において、「ストレージID」に「011」が設定された情報の「監視用ボリュームID」には、「vol_xxx」が設定されている。そのため、テスト結果取得部112は、S45の処理において、「監視用ボリュームID」が「vol_xxx」である監視用ボリュームにアクセスし、図18(A)に示すテスト結果情報131b2に含まれる情報を取得する。
That is, in the status information 133b2 described with reference to FIG. 18B, “NG” is set in the “status” of the information whose “item number” is “1” (information whose “storage ID” is “011”). Is set. In the correspondence information 132b1 described with reference to FIG. 16A, “vol_xxx” is set in the “monitoring volume ID” of the information in which “011” is set in the “storage ID”. Therefore, the test
図12に戻り、異常があると判定された監視用VM2bが存在する場合(S51のYES)、結果出力部115は、S44の処理における各監視対象の異常有無の判定結果と、S51の処理における各監視用VM2bの異常有無の判定結果と、S51の処理で検知した異常の程度が第1異常であることを示す情報とを出力する(S52)。
Returning to FIG. 12, when there is a
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ストレージ装置3)において異常の検知が行われたか否かに依らず、監視用VM2bや監視用ボリュームにおいて異常が検知された場合、その異常と関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の検知漏れを防止することが可能になる。
As a result, the
また、監視装置1は、クラウド事業者の監視対象において異常の検知された場合、監視用VM2bや監視用ボリュームにおける異常の発生状況を考慮した上で、検知した異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の度合いに応じた情報を出力することが可能になる。したがって、クラウド事業者は、監視装置1によって出力された情報を参照することによって、サービス事業者のリソースに対する影響の度合いに応じた対処を行うことが可能になる。
In addition, when an abnormality is detected in the monitoring target of the cloud operator, the
[第1の実施の形態における他の具体例(2)]
次に、第1の実施の形態における他の具体例について説明を行う。図19及び図20は、第1の実施の形態における他の具体例について説明する図である。
[Other Specific Example (2) in First Embodiment]
Next, another specific example in the first embodiment will be described. 19 and 20 are diagrams for explaining another specific example in the first embodiment.
仮想マシン配置部111は、図9に示すように、仮想マシン配置タイミングになった場合(S21のYES)、1以上のハイパーバイザ2c上に、各ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bをそれぞれ配置する(S22)。
As shown in FIG. 9, the virtual
そして、仮想マシン配置部111は、S22の処理で配置した監視用VM2bと、各監視用VM2bが配置されたハイパーバイザ2cとを対応付けた対応情報132を生成する(S23)。その後、仮想マシン配置部111は、生成した対応情報132を情報格納領域130に記憶する。以下、S23の処理で対応情報132について説明を行う。
Then, the virtual
[対応情報の具体例(3)]
図19は、対応情報132の具体例について説明する図である。具体的に、図19に示す対応情報132(以下、対応情報132cとも呼ぶ)は、図16で説明した対応情報132aに対して、監視用VM2bとスイッチ等のネットワーク機器5との関係を示す情報を追加した情報である。
[Specific example of correspondence information (3)]
FIG. 19 is a diagram illustrating a specific example of the
図19に示す対応情報132cは、各情報を識別する「項番」と、各ハイパーバイザ2cを識別する「HVID」と、各監視用VM2bを識別する「監視用VMID」とを項目として有する。また、図19に示す対応情報132cは、各ハイパーバイザ2cが使用する物理NIC(Network interface card)を識別する「NICID」と、各ネットワーク機器5を識別する「NW機器ID」と、各ネットワーク機器5が有する各ポートを識別する「ポートID」とを項目として有する。
The correspondence information 132c illustrated in FIG. 19 includes, as items, “item number” for identifying each information, “HVID” for identifying each hypervisor 2c, and “monitoring VMID” for identifying each
具体的に、図19に示す対応情報132cにおいて、「項番」が「1」である情報には、「HVID」として「001」が設定され、「監視用VMID」として「xxx」が設定され、「NICID」として「NIC_01」が設定され、「NW機器ID」として「1」が設定され、「ポート1−1」が設定されている。また、図19に示す対応情報132cにおいて、「項番」が「3」である情報には、「HVID」として「002」が設定され、「監視用VMID」として「yyy」が設定され、「NICID」として「NIC_11」が設定され、「NW機器ID」として「1」が設定され、「ポートID」として「ポート1−2」が設定されている。図19に含まれる他の情報については説明を省略する。 Specifically, in the correspondence information 132c shown in FIG. 19, “001” is set as “HVID” and “xxx” is set as “monitoring VMID” in the information whose “item number” is “1”. , “NIC_01” is set as “NICID”, “1” is set as “NW device ID”, and “Port 1-1” is set. In addition, in the correspondence information 132c shown in FIG. 19, “002” is set as “HVID”, “yyy” is set as “monitoring VMID”, and “yyy” is set as “HVID”. “NIC_11” is set as “NICID”, “1” is set as “NW device ID”, and “port 1-2” is set as “port ID”. Description of other information included in FIG. 19 is omitted.
図10に戻り、テスト結果取得部112は、異常判定タイミングになった場合(S31のYES)、各監視用VM2bに対して予め実行を指示した所定のテストの結果を示すテスト結果情報131を各監視用VM2bから取得する(S32)。その後、テスト結果取得部112は、各監視用VM2bから取得したテスト結果情報131を情報格納領域130に記憶する。以下、S32の処理で取得されたテスト結果情報131の具体例について説明を行う。
Returning to FIG. 10, when the abnormality determination timing is reached (YES in S31), the test
[テスト結果情報の具体例(5)]
図20は、テスト結果情報131及び状態情報133の具体例について説明する図である。具体的に、図20(A)は、テスト結果情報131の具体例について説明する図である。
[Specific example of test result information (5)]
FIG. 20 is a diagram for describing a specific example of the test result
図20(A)に示すテスト結果情報131(以下、テスト結果情報131cとも呼ぶ)は、各情報を識別する「項番」と、各監視用VM2bを識別する「監視用VMID」と、監視用VM2bに実行を指示したテストの結果が設定される「テスト結果(第5テスト)」及び「テスト結果(第6テスト)」とを項目として有する。
The test result information 131 (hereinafter also referred to as test result information 131c) shown in FIG. 20A includes “item number” for identifying each information, “monitoring VMID” for identifying each
具体的に、図20(A)に示すテスト結果情報131cにおいて、「項番」が「1」である情報には、「監視用VMID」として「xxx」が設定され、「テスト結果(第5テスト)」として「未取得」が設定され、「テスト結果(第6テスト)」として「未取得」が設定されている。すなわち、図20(A)に示すテスト結果情報131cは、「監視用VMID」が「xxx」である監視用VM2bから情報の取得を行うことができなかったこと(「監視用VMID」が「xxx」である監視用VM2bが異常であったこと)を示す情報を含んでいる。図20(A)に示すテスト結果情報131b1に含まれる他の情報についての説明は省略する。
Specifically, in the test result information 131c shown in FIG. 20A, “xxx” is set as “monitoring VMID” in the information whose “item number” is “1”, and “test result (fifth) “Not acquired” is set as “Test” ”, and“ Not acquired ”is set as“ Test result (sixth test) ”. That is, the test result information 131c shown in FIG. 20A cannot be acquired from the
図10に戻り、異常があると判定された監視用VM2bが存在する場合(S34のYES)、状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S34の処理で異常があると判定した監視用VM2bに対応する監視対象を特定する(S35)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S35)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、S35の処理で取得された状態情報133の具体例について説明を行う。
Returning to FIG. 10, when there is a
[状態情報の具体例(5)]
図20(B)は、ハイパーバイザ2cが使用する物理NICの状態情報133c1の具体例について説明する図である。また、図20(C)は、ハイパーバイザ2cと接続するネットワーク機器5が有するポートの状態情報133c2の具体例について説明する図である。
[Specific example of status information (5)]
FIG. 20B is a diagram for explaining a specific example of the state information 133c1 of the physical NIC used by the
図20(B)に示す状態情報133c1は、各情報を識別する「項番」と、各物理NICを識別する「NICID」と、各物理NICの状態を示す「状態」とを項目として有している。 The status information 133c1 illustrated in FIG. 20B includes, as items, “item number” that identifies each information, “NICID” that identifies each physical NIC, and “status” that indicates the status of each physical NIC. ing.
具体的に、図20(B)に示す状態情報133c1において、「項番」が「1」である情報には、「NICID」として「NIC_01」が設定され、「状態」として「OK」が設定されている。図20(B)に含まれる他の情報についての説明は省略する。 Specifically, in the status information 133c1 illustrated in FIG. 20B, “NIC_01” is set as “NICID” and “OK” is set as “status” in the information whose “item number” is “1”. Has been. Description of the other information included in FIG.
一方、図20(C)に示す状態情報133c2は、各情報を識別する「項番」と、各ポートを識別する「ポートID」と、各ポートの状態を示す「状態」とを項目として有している。 On the other hand, the status information 133c2 shown in FIG. 20C includes “item number” for identifying each information, “port ID” for identifying each port, and “status” indicating the status of each port as items. doing.
具体的に、図20(C)に示す状態情報133c2において、「項番」が「2」である情報には、「ポートID」として「ポート1−1」が設定され、「状態」として「OK」が設定されている。なお、図20(C)に示す状態情報133c2における「ポートID」に「機器体」が設定された情報は、各ポートを有するネットワーク機器5に関する情報を示している。図20(C)に含まれる他の情報についての説明は省略する。
Specifically, in the state information 133c2 shown in FIG. 20C, “port 1-1” is set as the “port ID” and “port 1-1” is set as the “state” in the information whose “item number” is “2”. “OK” is set. Note that information in which “device body” is set in “port ID” in the state information 133c2 illustrated in FIG. 20C indicates information regarding the
すなわち、図20(A)で説明したテスト結果情報131cにおいて、「項番」が「1」である情報(「監視用VMID」が「xxx」である情報)の「テスト結果(第5テスト)」及び「テスト結果(第6テスト)」には、「未取得」が設定されている。そして、図19で説明した対応情報132cにおいて、「監視用VMID」に「xxx」が設定された情報には、「NICID」に「NIC_01」が設定され、「NW機器ID」に「1」が設定され、「ポートID」に「ポート1−1」が設定された情報と、「NICID」に「NIC_02」が設定され、「NW機器ID」に「2」が設定され、「ポートID」に「ポート2−1」が設定された情報とが含まれている。そのため、状態取得部114は、S35の処理において、「NICID」が「NIC_01」であるNICと、「NICID」が「NIC_02」であるNICと、ネットワーク機器5自体と、「ポートID」が「ポート1−1」であるポートと、「ポートID」が「ポート2−1」であるポートとにアクセスし、図20(B)に示す状態情報133c1と、図20(C)に示す状態情報133c2とのそれぞれに含まれる情報を取得する。
That is, in the test result information 131c described in FIG. 20A, the “test result (fifth test)” of the information whose “item number” is “1” (information whose “monitoring VMID” is “xxx”) "And" Test result (sixth test) "are set to" Not acquired ". In the correspondence information 132c described with reference to FIG. 19, “NIC_01” is set in “NICID” and “1” is set in “NW device ID” in the information in which “xxx” is set in “monitoring VMID”. Is set, “Port 1-1” is set to “Port 1-1”, “NICID” is set to “NIC — 02”, “NW Device ID” is set to “2”, and “Port ID” is set to “Port ID”. Information in which “port 2-1” is set is included. Therefore, in the process of S35, the
図10に戻り、結果出力部115は、S34の処理における監視用VM2bの異常有無の判定結果と、S35の処理で取得した監視対象の状態情報133とを出力する(S36)。
Returning to FIG. 10, the
具体的に、図20(B)及び図20(C)における「状態」には、全て「OK」が設定されている。そのため、結果出力部115は、この場合、例えば、監視装置1と監視用VM2bとの間の通信が経由する機器等のうち、状態情報133c1及び状態情報133c2に情報が含まれていない仮想ブリッジにおいて異常が発生した可能性があることを示す情報を、通知情報134として出力するものであってよい。
Specifically, “OK” is set for all “states” in FIGS. 20B and 20C. Therefore, in this case, the
これにより、監視装置1は、例えば、監視用VM2bにおいて発生した異常を検知した場合、監視用VM2bによって実行されたテストの結果と、クラウド事業者の監視対象(例えば、ネットワーク機器5)の状態とに基づいて、監視用VM2bにおいて発生した異常の原因箇所の推定を行うことが可能になる。そのため、監視装置1は、監視用VM2bにおいて検知された異常の内容だけでなく、検知された異常の原因究明をより迅速に行うことを可能とする情報を出力することが可能になる。
Thus, for example, when the
[通知情報の具体例(1)]
次に、通知情報134の具体例について説明を行う。図21は、通知情報134の具体例について説明する図である。
[Specific example of notification information (1)]
Next, a specific example of the
図21に示す通知情報134(以下、通知情報134aとも呼ぶ)は、各情報(検知した異常に対応する情報)を識別する「項番」と、各異常の緊急度が設定される「緊急度」と、各異常を検知したリソースが設定される「対象リソース」と、各異常の内容が設定される「メッセージ」とを項目として有する。また、図21に示す通知情報134aは、各異常の原因被疑箇所が設定される「被疑箇所」と、「被疑箇所」に設定された箇所における異常状態(推定)が設定される「推定異常状態」と、各異常の影響範囲(推定)が設定される「推定影響範囲」とを項目として有する。 The notification information 134 (hereinafter also referred to as notification information 134a) illustrated in FIG. 21 includes an “item number” for identifying each piece of information (information corresponding to the detected abnormality), and an “emergency level” in which the urgency level of each abnormality is set. ”,“ Target resource ”in which the resource in which each abnormality is detected is set, and“ message ”in which the content of each abnormality is set. In addition, the notification information 134a illustrated in FIG. 21 includes an “estimated abnormal state” in which a “suspected place” in which a suspected place of each abnormality is set and an abnormal state (estimated) in a place set in the “suspected place” And “estimated influence range” in which the influence range (estimation) of each abnormality is set as items.
具体的に、結果出力部115は、S34の処理において監視用VM(3)に対するアクセスができないと判定されている場合、図21に示すように、例えば、「項番」が「1」である情報の「対象リソース」として「監視用VM(3)」を設定し、「メッセージ」として「アクセス不可」を設定する。また、結果出力部115は、S35の処理においてHV(3)及びNIC(1)から状態情報133を取得した場合、例えば、「被疑箇所」として「HV(3)」及び「NIC(1)」を設定する。また、結果出力部115は、「被疑箇所」に「NIC(1)」が設定された場合、例えば、「推定異常状態」として、「被疑箇所」に「NIC(1)」が設定された場合に対応する情報(予め定められた情報)である「ハード異常」を設定する。また、結果出力部115は、「被疑箇所」に「HV(3)」が設定された場合、例えば、「推定影響範囲」として、「被疑箇所」に「HV(3)」が設定された場合に対応する情報(予め定められた情報)である「HV(3)」を設定する。さらに、結果出力部115は、「対象リソース」に監視用VM2bが設定されている場合、例えば、「緊急度」として「高」を設定する。
Specifically, when it is determined that the monitoring VM (3) cannot be accessed in the process of S34, the
そして、結果出力部115は、S44の処理においてストレージ(1)に含まれるディスク(3)においてディスク故障が発生していると判定されている場合、図21に示すように、例えば、「項番」が「5」である情報の「対象リソース」として「ストレージ(1)」及び「ディスク(3)」を設定し、「メッセージ」として「ディスク故障」を設定する。また、結果出力部115は、「対象リソース」に「ストレージ(1)」及び「ディスク(3)」が設定されている場合、例えば、「被疑箇所」として「ストレージ(1)」及び「ディスク(3)」を設定する。また、結果出力部115は、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」が設定されている場合、例えば、「推定異常状態」として、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」が設定された場合に対応する情報(予め定められた情報)である「ハード故障」を設定する。また、結果出力部115は、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」のみが設定された場合、例えば、「推定影響範囲」として、「被疑箇所」に「ストレージ(1)」及び「ディスク(3)」のみが設定された場合に対応する情報(予め定められた情報)である「なし」を設定する。さらに、結果出力部115は、「推定影響範囲」に「なし」が設定されている場合、例えば、「緊急度」として「低」を設定する。
If the
[第2の実施の形態]
次に、第2の実施の形態について説明する。図22から図25は、第2の実施の形態における監視処理を説明するフローチャート図である。また、図26から図29は、第2の実施の形態における監視処理を説明する図である。図26から図29を参照しながら、図22から図25の監視処理を説明する。
[Second Embodiment]
Next, a second embodiment will be described. 22 to 25 are flowcharts for explaining the monitoring process in the second embodiment. FIGS. 26 to 29 are diagrams for explaining the monitoring process in the second embodiment. The monitoring process of FIGS. 22 to 25 will be described with reference to FIGS.
第2の実施の形態における監視装置1は、監視用VM2bを生成する代わりに、クラウド事業者の監視対象(例えば、図1等で説明したAPIサーバ4)に対して所定の処理の実行指示(以下、API(Application Programming Interface)とも呼ぶ)を送信する。そして、第2の実施の形態における監視装置1は、各監視対象から取得する状態情報133と、各監視対象に対して送信したAPIの実行結果とを参照することにより、各監視対象において発生した異常の検知を行う。
The
[APIの送信によって検知された場合の処理]
初めに、監視処理のうち、APIの送信によって異常が検知された場合の処理について説明を行う。
[Processing when detected by API transmission]
First, of the monitoring process, a process when an abnormality is detected by transmitting an API will be described.
監視装置1の実行指示部115は、図22に示すように、異常判定タイミングになるまで待機する(S61のNO)。そして、異常判定タイミングになった場合(S61のYES)、実行指示部115は、1以上のAPIサーバのそれぞれに対して所定の処理の実行を指示するAPIを送信する(S62)。
As shown in FIG. 22, the
その後、実行指示部115は、S62の処理で送信した実行指示に対応する所定の処理の実行が終了するまで待機する(S63のNO)。
Thereafter, the
具体的に、例えば、S62の処理において送信したAPIが同期型のAPI(以下、同期APIとも呼ぶ)である場合、実行指示部115は、S62の処理において送信したAPIの応答があるまで待機する。
Specifically, for example, when the API transmitted in the process of S62 is a synchronous API (hereinafter also referred to as a synchronous API), the
また、例えば、S62の処理において送信したAPIが非同期型のAPI(以下、非同期APIとも呼ぶ)である場合、実行指示部115は、S62の処理においてAPIを送信した後、所定時間ごとに処理状況を確認するためのAPI(以下、参照APIとも呼ぶ)を送信する。そして、実行指示部115は、参照APIの送信を行うことによって、S62の処理において送信したAPIに対応する処理の完了が確認できるまで待機する。なお、非同期APIによって行われる処理は、例えば、新たな利用者VM2aの生成を行う処理や生成済の利用者VM2aの削除を行う処理であってよい。
Further, for example, when the API transmitted in the process of S62 is an asynchronous API (hereinafter also referred to as an asynchronous API), the
そして、S62の処理で送信したAPIに対応する所定の処理の実行が終了した場合(S63のYES)、実行指示部115は、S63の処理で実行が終了した所定の処理の結果を示すAPI結果情報135を生成する(S64)。その後、実行指示部115は、例えば、生成したAPI結果情報135を情報格納領域130に記憶する。以下、S64の処理で生成されたAPI結果情報135の具体例について説明を行う。
When the execution of the predetermined process corresponding to the API transmitted in the process of S62 is completed (YES in S63), the
[API結果情報の具体例(1)]
図27は、第2の実施の形態におけるAPI結果情報135及び状態情報133の具体例について説明する図である。具体的に、図27(A)は、第2の実施の形態におけるAPI結果情報135の具体例について説明する図である。
[Specific example of API result information (1)]
FIG. 27 is a diagram illustrating specific examples of the API result
図27(A)に示すAPI結果情報135(以下、API結果情報135d1とも呼ぶ)は、各情報を識別する「項番」と、各APIサーバ4を識別する「APIID」と、各APIサーバ4における所定の処理の実行結果を示す「実行結果」とを項目として有している。「実行結果」には、APIサーバ4による実行結果が正常であったことを示す「OK」、APIサーバ4による実行結果が異常であったことを示す「NG」、または、APIサーバ4から実行結果を取得することができなかったことを示す「未取得」のいずれかが設定される。
The API result information 135 (hereinafter also referred to as API result information 135d1) shown in FIG. 27A includes an “item number” for identifying each information, an “API ID” for identifying each
具体的に、図27(A)に示すAPI結果情報135において、「項番」が「1」である情報には、「APIID」として「021」が設定され、「実行結果」として「OK」が設定されている。また、図27(A)に示すAPI結果情報135において、「項番」が「2」である情報には、「APIID」として「022」が設定され、「実行結果」として「NG」が設定されている。図27(A)に含まれる他の情報についての説明は省略する。
Specifically, in the API result
図22に戻り、異常有無判定部113は、情報格納領域130に記憶されたAPI結果情報135を参照し、実行結果に異常があるAPIが存在するか否かを判定する(S65)。
Returning to FIG. 22, the abnormality presence /
具体的に、異常有無判定部113は、例えば、情報格納領域130に記憶されたテスト結果情報131(S64の処理において生成したAPI結果情報135)を参照し、「実行結果」に「NG」が設定されている情報が存在するか否かを判定する。そして、異常有無判定部113は、「実行結果」に「NG」が設定されている情報が存在しないと判定した場合、全てのAPIの実行結果が正常であると判定する。また、異常有無判定部113は、「実行結果」に「NG」が設定されている情報が存在すると判定した場合、存在すると判定した情報に対応するAPIの実行結果が異常であると判定する。
Specifically, the abnormality presence /
その結果、図23に示すように、実行結果に異常があると判定されたAPIが存在しないと判定した場合(S71のNO)、実行指示部115は、S61以降の処理を再度行う。
As a result, as shown in FIG. 23, when it is determined that there is no API that is determined to be abnormal in the execution result (NO in S71), the
一方、実行結果に異常があると判定されたAPIが存在すると判定した場合(S71のYES)、状態取得部114は、情報格納領域130に記憶された対応情報132を参照し、S71の処理で実行結果に異常があると判定したAPIに対応する監視対象を特定する(S72)。そして、状態取得部114は、特定した監視対象の状態を示す状態情報133を取得する(S72)。その後、状態取得部114は、取得した状態情報133を情報格納領域130に記憶する。以下、情報格納領域130に予め記憶された対応情報132と、S72の処理で取得された状態情報133との具体例について説明を行う。
On the other hand, when it is determined that there is an API that is determined to be abnormal in the execution result (YES in S71), the
[対応情報の具体例(4)]
初めに、第2の実施の形態における対応情報132の具体例について説明を行う。図26は、第2の実施の形態における対応情報132の具体例を説明する図である。なお、第2の実施の形態における対応情報132(以下、対応情報132dとも呼ぶ)は、クラウド事業者によって生成され、情報格納領域130に予め記憶されている情報であるものとして説明を行う。
[Specific example of correspondence information (4)]
First, a specific example of the
図26に示す対応情報132dは、各情報を識別する「項番」と、各APIを識別する「APIID」と、クラウド事業者による各監視対象を識別する「監視対象ID」とを項目として有する。「監視対象ID」には、ハイパーバイザ2c、ストレージ装置3、APIサーバ4及びネットワーク機器5の他、新たな利用者VM2aの生成に要する物理リソースの確保等を行うコントローラ(図示しない)や、APIサーバ4に対して処理要求を振り分ける負荷分散サーバ(図示しない)や、コントローラに対する処理要求を蓄積するキューサーバ(図示しない)等を識別する情報が設定される。
The correspondence information 132d illustrated in FIG. 26 includes, as items, “item number” for identifying each information, “APIID” for identifying each API, and “monitoring target ID” for identifying each monitoring target by the cloud operator. . The “monitoring target ID” includes, in addition to the
具体的に、図26に示す対応情報132dにおいて、「項番」が「1」である情報には、「APIID」として「021」が設定され、「監視対象ID」として「1」及び「2」が設定されている。また、図26に示す対応情報132dにおいて、「項番」が「2」である情報には、「APIID」として「022」が設定され、「監視対象ID」として「4」、「8」及び「9」が設定されている。図26に含まれる他の情報についての説明は省略する。 Specifically, in the correspondence information 132d shown in FIG. 26, “021” is set as the “APIID” and “1” and “2” are set as the “monitoring target ID” in the information whose “item number” is “1”. "Is set. Also, in the correspondence information 132d shown in FIG. 26, “022” is set as “APIID” and “4”, “8” and “monitoring target ID” are set in the information whose “item number” is “2”. “9” is set. Description of other information included in FIG. 26 is omitted.
[状態情報の具体例(6)]
次に、第2の実施の形態における状態情報133(以下、状態情報133d1とも呼ぶ)の具体例について説明を行う。
[Specific example of status information (6)]
Next, a specific example of the state information 133 (hereinafter also referred to as state information 133d1) in the second embodiment will be described.
図27(B)に示す状態情報133d1は、各情報を識別する「項番」と、クラウド事業者による各監視対象を識別する「監視対象ID」と、各監視対象の状態を示す「状態」とを項目として有している。「状態」には、監視対象の状態が正常であったことを示す「OK」、監視対象の状態が異常であったことを示す「NG」、または、監視対象から情報を取得することができなかったことを示す「未取得」が設定される。 The state information 133d1 illustrated in FIG. 27B includes “item number” for identifying each information, “monitoring target ID” for identifying each monitoring target by the cloud operator, and “state” indicating the status of each monitoring target. As an item. In “Status”, “OK” indicating that the status of the monitoring target is normal, “NG” indicating that the status of the monitoring target is abnormal, or information can be acquired from the monitoring target. “Non-acquired” is set to indicate that there was not.
具体的に、図27(B)に示す状態情報133d1において、「項番」が「1」である情報には、「監視対象ID」として「4」が設定され、「状態」として「OK」が設定されている。また、図27(B)に示す状態情報133d1において、「項番」が「2」である情報には、「監視対象ID」として「8」が設定され、「状態」として「OK」が設定されている。図27(B)に含まれる他の情報についての説明は省略する。 Specifically, in the status information 133d1 shown in FIG. 27B, “4” is set as the “monitoring target ID” and “OK” is set as the “status” in the information whose “item number” is “1”. Is set. In the status information 133d1 shown in FIG. 27B, “8” is set as the “monitoring target ID” and “OK” is set as the “status” in the information whose “item number” is “2”. Has been. Description of other information included in FIG. 27B is omitted.
すなわち、図27(A)で説明したAPI結果情報135d1において、「項番」が「2」である情報(「APIID」が「022」である情報)の「実行結果」には、「NG」が設定されている。そして、図26で説明した対応情報132dにおいて、「APIID」に「022」が設定された情報の「監視対象ID」には、「4」、「8」及び「9」が設定されている。そのため、状態取得部114は、S71の処理において、「監視対象ID」が「4」、「8」及び「9」である監視対象にアクセスし、図27(B)に示す状態情報133d1に含まれる情報を取得する。
That is, in the API result information 135d1 described with reference to FIG. 27A, the “execution result” of the information whose “item number” is “2” (information whose “APIID” is “022”) is “NG”. Is set. In the correspondence information 132d described with reference to FIG. 26, “4”, “8”, and “9” are set in the “monitoring target ID” of the information in which “022” is set in the “APIID”. For this reason, the
図23に戻り、結果出力部115は、S71の処理におけるAPIの実行結果についての異常有無の判定結果と、S72の処理で取得した監視対象の状態情報133とを出力する(S73)。
Returning to FIG. 23, the
具体的に、結果出力部115は、S71の処理におけるAPIの実行結果についての異常有無の判定結果と、S72の処理で取得した監視対象の状態情報133とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
Specifically, the
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知が行われたか否かに依らず、各監視対象に送信したAPIに対応する実行結果において異常が検知された場合、その異常と関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の検知漏れを防止することが可能になる。また、監視装置1は、APIを送信することによって検知された異常の内容だけでなく、異常が検知されたAPIに対応する監視対象についての情報を出力することにより、検知された異常の原因究明を行うために必要な情報を迅速に出力することが可能になる。
As a result, the
[クラウド事業者の監視対象において異常が検知された場合の処理]
次に、監視処理のうち、クラウド事業者の監視対象において異常が検知された場合の処理について説明を行う。
[Processing when an abnormality is detected in the monitoring target of the cloud service provider]
Next, of the monitoring processing, processing when an abnormality is detected in the monitoring target of the cloud operator will be described.
状態取得部114は、図24に示すように、異常判定タイミングまで待機する(S81のNO)。そして、異常判定タイミングになった場合(S81のYES)、状態取得部114は、1以上の監視対象のそれぞれの状態を示す状態情報133を取得する(S82)。その後、状態取得部114は、各監視対象から取得した状態情報133を情報格納領域130に記憶する。以下、状態情報133の具体例について説明を行う。
As shown in FIG. 24, the
[状態情報の具体例(7)]
図28は、第2の実施の形態におけるAPI結果情報135及び状態情報133の具体例について説明する図である。具体的に、図28(B)は、第2の実施の形態における状態情報133の具体例について説明する図である。
[Specific example of status information (7)]
FIG. 28 is a diagram illustrating a specific example of the API result
図28(B)に示す状態情報133(以下、状態情報133d2とも呼ぶ)において、「項番」が「1」である情報には、「監視対象ID」として「1」が設定され、「状態」として「OK」が設定されている。また、図28(B)に示す状態情報133d2において、「項番」が「3」である情報には、「監視対象ID」として「3」が設定され、「状態」として「NG」が設定されている。図28(B)に含まれる他の情報についての説明は省略する。 In the status information 133 (hereinafter also referred to as status information 133d2) shown in FIG. 28B, “1” is set as the “monitoring target ID” for the information whose “item number” is “1”. "" Is set as "OK". In the status information 133d2 shown in FIG. 28B, “3” is set as the “monitoring target ID” and “NG” is set as the “status” in the information whose “item number” is “3”. Has been. Description of other information included in FIG.
図24に戻り、異常有無判定部113は、情報格納領域130に記憶された状態情報133(S82の処理で取得した状態情報133)を参照し、異常がある監視対象が存在するか否かを判定する(S83)。
Returning to FIG. 24, the abnormality presence /
その結果、異常があると判定された監視対象が存在しないと判定した場合(S84のNO)、状態取得部114は、S81以降の処理を再度行う。
As a result, when it is determined that there is no monitoring target determined to be abnormal (NO in S84), the
一方、異常があると判定された監視対象が存在すると判定した場合(S84のYES)、実行指示部115は、1以上のAPIサーバのそれぞれに対して、異常があると判定した監視対象に対応するAPIを送信する(S85)。
On the other hand, when it is determined that there is a monitoring target determined to be abnormal (YES in S84), the
その後、実行指示部115は、S85の処理で送信したAPIに対応する所定の処理の実行が終了するまで待機する(S86のNO)。
Thereafter, the
そして、S85の処理で送信したAPIに対応する所定の処理の実行が終了した場合(S86のYES)、実行指示部115は、図25に示すように、実行が終了した所定の処理の結果を示すAPI結果情報135を生成する(S91)。その後、実行指示部115は、例えば、生成したAPI結果情報135を情報格納領域130に記憶する。以下、S91の処理で生成されたAPI結果情報135の具体例について説明を行う。
When the execution of the predetermined process corresponding to the API transmitted in the process of S85 is completed (YES in S86), the
[API結果情報の具体例(2)]
図28は、API結果情報135及び状態情報133の具体例について説明する図である。具体的に、図28(A)は、API結果情報135の具体例について説明する図である。
[Specific example of API result information (2)]
FIG. 28 is a diagram for describing a specific example of the API result
図27(A)に示すAPI結果情報135(以下、API結果情報135d2とも呼ぶ)において、「項番」が「1」である情報には、「APIID」として「023」が設定され、「実行結果」として「OK」が設定されている。 In the API result information 135 (hereinafter also referred to as API result information 135d2) shown in FIG. 27A, “023” is set as “APIID” in the information whose “item number” is “1”, and “execute” “OK” is set as the “result”.
すなわち、図28(B)で説明した状態情報133d2において、「項番」が「3」である情報(「監視対象ID」が「3」である情報)の「状態」には、「NG」が設定されている。そして、図26で説明した対応情報132dにおいて、「監視対象ID」に「3」が設定された情報の「APIID」には、「023」が設定されている。そのため、実行指示部115は、S85の処理において、「APIID」が「3」であるAPIを送信する。そして、実行指示部115は、S91の処理において、図28(A)に示すAPI結果情報135d2を生成する。
That is, in the status information 133d2 described with reference to FIG. 28B, the “status” of the information whose “item number” is “3” (information whose “monitoring target ID” is “3”) is “NG”. Is set. In the correspondence information 132d described with reference to FIG. 26, “023” is set in “APIID” of information in which “3” is set in “monitoring target ID”. Therefore, the
図25に戻り、異常有無判定部113は、情報格納領域130に記憶されたAPI結果情報135を参照し、実行結果に異常があるAPIが存在するか否かを判定する(S92)。
Returning to FIG. 25, the abnormality presence /
その結果、実行異常があると判定されたAPIが存在すると判定した場合(S92のYES)、結果出力部115は、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第3異常(例えば、緊急度が「高」である異常)であることを示す情報とを出力する(S93)。
As a result, when it is determined that there is an API determined to have an execution abnormality (YES in S92), the
具体的に、結果出力部115は、例えば、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第3異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
Specifically, the
一方、実行異常があると判定されたAPIが存在しないと判定した場合(S92のNO)、結果出力部115は、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第4異常(例えば、緊急度が「低」である異常)であることを示す情報とを出力する(S94)。
On the other hand, if it is determined that there is no API that has been determined to have an execution abnormality (NO in S92), the
具体的に、結果出力部115は、例えば、S84の処理における各監視対象の異常有無の判定結果と、S92の処理におけるAPIの実行結果についての異常有無の判定結果と、S92の処理で検知した異常の程度が第4異常であることを示す情報とから通知情報134を生成し、生成した通知情報134を監視者端末1aに対して出力する。
Specifically, the
これにより、監視装置1は、クラウド事業者の監視対象(例えば、ハイパーバイザ2c)において異常の検知された場合、各監視対象に対して送信したAPIの実行結果を考慮した上で、検知した異常に関連する情報を出力することが可能になる。そのため、監視装置1は、クラウド事業者の監視対象における異常に起因する影響(サービス事業者のリソースに対する影響)の度合いに応じた情報を出力することが可能になる。そのため、クラウド事業者は、監視装置1によって出力された情報を参照することによって、サービス事業者のリソースに対する影響の度合いに応じた対処を行うことが可能になる。
Thereby, when an abnormality is detected in the monitoring target (for example, the
[通知情報の具体例(2)]
次に、第2の実施の形態における通知情報134(以下、通知情報134bとも呼ぶ)の具体例について説明を行う。図29は、第2の実施の形態における通知情報134を説明する図である。
[Specific example of notification information (2)]
Next, a specific example of the notification information 134 (hereinafter also referred to as notification information 134b) in the second embodiment will be described. FIG. 29 is a diagram illustrating the
結果出力部115は、S71の処理において「仮想NW一覧表示」を行うためのAPIの実行結果に異常があると判定されており、APIの応答に含まれていたエラーメッセージが「エラー503」であった場合、図29に示すように、例えば、「項番」が「1」である情報の「対象リソース」として「仮想NW一覧表示」を設定し、「メッセージ」として「エラー503」を設定する。また、結果出力部115は、S72の処理においてコントローラ(1)及び負荷分散サーバ(2)から状態情報133を取得した場合、例えば、「被疑箇所」として「コントローラ(1)」を設定する。また、結果出力部115は、「被疑箇所」に「コントローラ(1)」が設定された場合、例えば、「推定異常状態」として、「被疑箇所」に「コントローラ(1)」が設定された場合に対応する情報(予め定められた情報)である「仮想NWコントローラプロセスダウン」を設定する。また、結果出力部115は、「被疑箇所」に「コントローラ(1)」が設定された場合、例えば、「推定影響範囲」として、「被疑箇所」に「コントローラ(1)」が設定された場合に対応するAPIの一覧を示す情報(予め定められた情報)を設定する。さらに、結果出力部115は、「対象リソース」に「仮想NW一覧表示」が設定されている場合、例えば、「緊急度」として「高」を設定する。
The
そして、結果出力部115は、S84の処理においてAPIサーバ(1)においてプロセスダウンが発生していると判定されている場合、図29に示すように、例えば、「項番」が「4」である情報の「対象リソース」として「APIサーバ(1)」を設定し、「メッセージ」として「プロセスダウン」を設定する。また、結果出力部115は、「対象リソース」に「APIサーバ(1)」が設定されている場合、例えば、「被疑箇所」として「APIサーバ(1)」を設定する。また、結果出力部115は、「メッセージ」に「プロセスダウン」が設定された場合、例えば、「推定異常状態」として、「メッセージ」に「プロセスダウン」が設定された場合に対応する情報(予め定められた情報)である「プロセスダウン」を設定する。また、結果出力部115は、「被疑箇所」に「APIサーバ(1)」のみが設定された場合、例えば、「項番」が「1」である情報の「推定影響範囲」として、「被疑箇所」に「APIサーバ(1)」のみが設定された場合に対応する情報(予め定められた情報)である「なし」を設定する。さらに、結果出力部115は、「推定影響範囲」に「なし」が設定されている場合、例えば、「緊急度」として「低」を設定する。
If the
このように、本実施の形態における監視装置1は、例えば、ハイパーバイザ2c上に、ハイパーバイザ2cを含む複数の監視対象の監視に用いられる監視用VM2bを配置する。
As described above, the
そして、監視装置1は、所定間隔において監視用VM2bによって実行された所定のテストの結果を取得し、取得した結果から監視用VM2bの異常有無を判定する。その結果、監視用VM2bが異常である場合、監視装置1は、複数の監視対象の所定の状態を取得し、監視用VM2bの異常有無の判定結果と、複数の監視対象の所定の状態とを出力する。
Then, the
すなわち、本実施の形態における監視装置1は、例えば、サービス事業者に貸し出している利用者VM2aを動作させるハイパーバイザ2c上に、監視装置1がアクセスを行うことができる監視用VM2bを配置する。そして、監視装置1は、監視用VMに対してアクセスすることによって取得した動作状態を、利用者VM2a(監視装置1がアクセスを行うことができない仮想マシン)の動作状態として推定する。
That is, the
これにより、監視装置1は、例えば、ハイパーバイザ2cにおいて発生した異常を検知した場合、監視用VM2bから取得した動作状態を参照することによって、発生した異常が利用者VM2aに与えている影響度合いを推定することが可能になる。また、監視装置1は、例えば、監視用VM2aから取得した動作状態を参照することによって、ハイパーバイザ2cにおいて検知できなかった異常(ハイパーバイザ2cに起因する異常)についても検知することが可能になる。
Thus, for example, when the
以上の実施の形態をまとめると、以下の付記のとおりである。 The above embodiment is summarized as follows.
(付記1)
仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。
(Appendix 1)
On the virtualization software, a monitoring virtual machine used for monitoring a plurality of monitoring targets including the virtualization software is arranged,
Obtaining a result of a predetermined test executed by the virtual machine at a predetermined interval;
Determine whether the virtual machine is abnormal from the acquired results,
If the virtual machine is abnormal, obtain a predetermined state of the plurality of monitoring targets,
Outputting a determination result of whether or not there is an abnormality in the virtual machine and a predetermined state of the plurality of monitoring targets;
A monitoring program for causing a computer to execute processing.
(付記2)
付記1において、さらに、
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定する、
処理をコンピュータに実行させ、
前記出力する処理では、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
ことを特徴とする監視プログラム。
(Appendix 2)
In
Obtaining a predetermined state of each of the plurality of monitoring targets at a predetermined interval,
Determining the presence or absence of abnormalities of the plurality of monitoring targets from each of the acquired predetermined states;
If any of the monitoring targets is abnormal, obtain the result of the virtual machine;
Determining whether the virtual machine is abnormal from the acquired result;
Let the computer execute the process,
In the output process, when the virtual machine is abnormal, information indicating that the abnormality of any one of the monitoring targets is a first abnormality is output, and when the virtual machine is not abnormal, any of the monitoring is performed. Outputting information indicating that the target abnormality is the second abnormality;
A monitoring program characterized by that.
(付記3)
付記1において、
前記所定のテストは、前記仮想マシンによる監視用の記憶領域に対するアクセスを伴うテストを含み、
前記複数の監視対象は、前記記憶領域を有するストレージ装置を含み、
前記異常有無を判定する処理では、前記仮想マシンまたは前記記憶領域の異常有無を判定し、
前記所定の状態を取得する処理では、前記仮想マシンまたは前記記憶領域が異常である場合、前記ストレージ装置の所定の状態を取得し、
前記出力する処理では、前記仮想マシンまたは前記記憶領域の異常有無の判定結果と、前記ストレージ装置の所定の状態とを出力する、
ことを特徴とする監視プログラム。
(Appendix 3)
In
The predetermined test includes a test involving access to a storage area for monitoring by the virtual machine,
The plurality of monitoring targets include a storage device having the storage area,
In the process of determining whether or not there is an abnormality, it is determined whether or not there is an abnormality in the virtual machine or the storage area,
In the process of acquiring the predetermined state, when the virtual machine or the storage area is abnormal, the predetermined state of the storage device is acquired,
In the process of outputting, the determination result of the presence or absence of abnormality of the virtual machine or the storage area and a predetermined state of the storage device are output.
A monitoring program characterized by that.
(付記4)
付記1において、
前記所定のテストは、前記仮想マシンからの応答有無を判定するテストであり、
前記複数の監視対象は、前記仮想マシンとの通信を行う際に経由するネットワーク機器を含み、
前記異常有無を判定する処理では、前記仮想マシンからの応答有無を判定し、
前記所定の状態を取得する処理では、前記仮想マシンからの応答がない場合、前記ネットワーク機器の所定の状態を取得し、
前記出力する処理では、前記仮想マシンからの応答有無の判定結果と、前記ネットワーク機器の所定の状態とを出力する、
ことを特徴とする監視プログラム。
(Appendix 4)
In
The predetermined test is a test for determining whether or not there is a response from the virtual machine,
The plurality of monitoring targets include a network device through which communication with the virtual machine is performed,
In the process of determining whether there is an abnormality, it is determined whether there is a response from the virtual machine,
In the process of acquiring the predetermined state, when there is no response from the virtual machine, the predetermined state of the network device is acquired,
In the output process, the determination result of the presence or absence of a response from the virtual machine and a predetermined state of the network device are output.
A monitoring program characterized by that.
(付記5)
付記1において、さらに、
前記複数の監視対象は、複数の処理をそれぞれ実行する複数の情報処理装置を含み、
所定間隔において前記複数の情報処理装置に対して前記複数の処理の実行指示を行い、
前記実行指示に対応する前記複数の処理の実行結果から、前記複数の処理の実行結果についての異常有無をそれぞれ判定し、
前記複数の処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記複数の監視対象のうち、前記いずれかの処理に対応する監視対象の所定の状態を取得し、
前記複数の処理の実行結果についての異常有無の判定結果と、前記いずれかの処理に対応する監視対象の所定の状態とを出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。
(Appendix 5)
In
The plurality of monitoring targets include a plurality of information processing apparatuses that respectively execute a plurality of processes,
Instructing the plurality of information processing devices to execute the plurality of processes at a predetermined interval,
From the execution results of the plurality of processes corresponding to the execution instruction, determine whether there is an abnormality in the execution results of the plurality of processes, respectively.
When an execution result of at least one of the plurality of processes is abnormal, a predetermined state of the monitoring target corresponding to any one of the plurality of monitoring targets is acquired,
Outputting the determination result of the presence or absence of abnormality of the execution results of the plurality of processes and a predetermined state of the monitoring target corresponding to any of the processes;
A monitoring program for causing a computer to execute processing.
(付記6)
付記5において、
前記複数の処理は、仮想マシンの作成及び仮想マシンの削除を含む、
ことを特徴とする監視プログラム。
(Appendix 6)
In
The plurality of processes include virtual machine creation and virtual machine deletion,
A monitoring program characterized by that.
(付記7)
付記5において、さらに、
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象のそれぞれの異常有無を判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記複数の処理のうち、前記いずれかの監視対象に対応する処理の実行指示を前記複数の情報処理装置に対して行い、
前記いずれかの監視対象に対応する処理の実行結果から、前記いずれかの監視対象に対応する処理の実行結果についての異常有無をそれぞれ判定する、
処理をコンピュータに実行させ、
前記複数の処理の実行結果についての異常有無の判定結果を出力する処理では、前記いずれかの監視対象に対応する処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記いずれかの監視対象の異常が第3異常であることを示す情報を出力し、前記いずれかの監視対象に対応する処理の実行結果が異常でない場合、前記いずれかの監視対象の異常が第4異常であることを示す情報を出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。
(Appendix 7)
In
Obtaining a predetermined state of each of the plurality of monitoring targets at a predetermined interval,
Determining the presence or absence of each of the plurality of monitoring targets from each of the acquired predetermined states;
If any one of the plurality of monitoring targets is abnormal, an instruction to execute the processing corresponding to any one of the plurality of processing targets is given to the plurality of information processing apparatuses. ,
From the execution result of the process corresponding to any one of the monitoring targets, determine whether there is an abnormality in the execution result of the process corresponding to any of the monitoring targets,
Let the computer execute the process,
In the process of outputting the determination result of the presence / absence of abnormality of the execution results of the plurality of processes, if the execution result of at least one of the processes corresponding to any of the monitoring targets is abnormal, any of the above Information indicating that the monitoring target abnormality is the third abnormality, and if the execution result of the process corresponding to any of the monitoring targets is not abnormal, the monitoring target abnormality is the fourth abnormality Output information indicating that it is,
A monitoring program for causing a computer to execute processing.
(付記8)
仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置する仮想マシン配置部と、
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得するテスト結果取得部と、
取得した前記結果から前記仮想マシンの異常有無を判定する異常有無判定部と、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得する状態取得部と、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する結果出力部と、を有する、
ことを特徴とする監視装置。
(Appendix 8)
A virtual machine placement unit for placing a virtual machine for monitoring used for monitoring a plurality of monitoring targets including the virtualization software on the virtualization software;
A test result acquisition unit for acquiring a result of a predetermined test executed by the virtual machine at a predetermined interval;
An abnormality presence / absence determining unit that determines the presence / absence of an abnormality of the virtual machine from the acquired result;
When the virtual machine is abnormal, a state acquisition unit that acquires a predetermined state of the plurality of monitoring targets;
A result output unit that outputs a determination result of whether there is an abnormality in the virtual machine and a predetermined state of the plurality of monitoring targets;
A monitoring device characterized by that.
(付記9)
付記8において、
前記状態取得部は、所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
前記異常有無判定部は、取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
前記テスト結果取得部は、前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
前記異常有無判定部は、取得した前記結果から前記仮想マシンの異常有無を判定し、
前記結果出力部は、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
ことを特徴とする監視装置。
(Appendix 9)
In
The state acquisition unit acquires a predetermined state of each of the plurality of monitoring targets at a predetermined interval,
The abnormality presence / absence determination unit determines the presence / absence of abnormality of the plurality of monitoring targets from each of the acquired predetermined states,
The test result acquisition unit acquires the result of the virtual machine when any of the monitoring targets is abnormal,
The abnormality presence / absence determining unit determines whether the virtual machine is abnormal from the acquired result,
When the virtual machine is abnormal, the result output unit outputs information indicating that one of the monitoring target abnormalities is a first abnormality, and when the virtual machine is not abnormal, any of the monitoring is performed. Outputting information indicating that the target abnormality is the second abnormality;
A monitoring device characterized by that.
(付記10)
仮想化ソフトウェア上に、前記仮想化ソフトウェアを含む複数の監視対象の監視に用いられる監視用の仮想マシンを配置し、
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
ことを特徴とする監視方法。
(Appendix 10)
On the virtualization software, a monitoring virtual machine used for monitoring a plurality of monitoring targets including the virtualization software is arranged,
Obtaining a result of a predetermined test executed by the virtual machine at a predetermined interval;
Determine whether the virtual machine is abnormal from the acquired results,
If the virtual machine is abnormal, obtain a predetermined state of the plurality of monitoring targets,
Outputting a determination result of whether or not there is an abnormality in the virtual machine and a predetermined state of the plurality of monitoring targets;
A monitoring method characterized by that.
(付記11)
付記10において、さらに、
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記出力する工程では、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
ことを特徴とする監視方法。
(Appendix 11)
In
Obtaining a predetermined state of each of the plurality of monitoring targets at a predetermined interval,
Determining the presence or absence of abnormalities of the plurality of monitoring targets from each of the acquired predetermined states;
If any of the monitoring targets is abnormal, obtain the result of the virtual machine;
Determine whether the virtual machine is abnormal from the acquired results,
In the outputting step, when the virtual machine is abnormal, information indicating that any one of the monitoring target abnormalities is a first abnormality is output, and when the virtual machine is not abnormal, any of the monitoring is performed. Outputting information indicating that the target abnormality is the second abnormality;
A monitoring method characterized by that.
1:監視装置 1a:監視者端末
2:物理マシン 2a:利用者VM
2c:ハイパーバイザ 3:ストレージ装置
4:APIサーバ 5:ネットワーク機器
1: monitoring
2c: Hypervisor 3: Storage device 4: API server 5: Network device
Claims (9)
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。 On the virtualization software, a monitoring virtual machine used for monitoring a plurality of monitoring targets including the virtualization software is arranged,
Obtaining a result of a predetermined test executed by the virtual machine at a predetermined interval;
Determine whether the virtual machine is abnormal from the acquired results,
If the virtual machine is abnormal, obtain a predetermined state of the plurality of monitoring targets,
Outputting a determination result of whether or not there is an abnormality in the virtual machine and a predetermined state of the plurality of monitoring targets;
A monitoring program for causing a computer to execute processing.
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象の異常有無をそれぞれ判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記仮想マシンの前記結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定する、
処理をコンピュータに実行させ、
前記出力する処理では、前記仮想マシンが異常である場合、前記いずれかの監視対象の異常が第1異常であることを示す情報を出力し、前記仮想マシンが異常でない場合、前記いずれかの監視対象の異常が第2異常であることを示す情報を出力する、
ことを特徴とする監視プログラム。 The claim 1, further comprising:
Obtaining a predetermined state of each of the plurality of monitoring targets at a predetermined interval,
Determining the presence or absence of abnormalities of the plurality of monitoring targets from each of the acquired predetermined states;
If any of the monitoring targets is abnormal, obtain the result of the virtual machine;
Determining whether the virtual machine is abnormal from the acquired result;
Let the computer execute the process,
In the output process, when the virtual machine is abnormal, information indicating that the abnormality of any one of the monitoring targets is a first abnormality is output, and when the virtual machine is not abnormal, any of the monitoring is performed. Outputting information indicating that the target abnormality is the second abnormality;
A monitoring program characterized by that.
前記所定のテストは、前記仮想マシンによる監視用の記憶領域に対するアクセスを伴うテストを含み、
前記複数の監視対象は、前記記憶領域を有するストレージ装置を含み、
前記異常有無を判定する処理では、前記仮想マシンまたは前記記憶領域の異常有無を判定し、
前記所定の状態を取得する処理では、前記仮想マシンまたは前記記憶領域が異常である場合、前記ストレージ装置の所定の状態を取得し、
前記出力する処理では、前記仮想マシンまたは前記記憶領域の異常有無の判定結果と、前記ストレージ装置の所定の状態とを出力する、
ことを特徴とする監視プログラム。 In claim 1,
The predetermined test includes a test involving access to a storage area for monitoring by the virtual machine,
The plurality of monitoring targets include a storage device having the storage area,
In the process of determining the presence / absence of abnormality, it is determined whether there is an abnormality in the virtual machine or the storage area,
In the process of acquiring the predetermined state, when the virtual machine or the storage area is abnormal, the predetermined state of the storage device is acquired,
In the process of outputting, the determination result of the presence or absence of abnormality of the virtual machine or the storage area and a predetermined state of the storage device are output.
A monitoring program characterized by that.
前記所定のテストは、前記仮想マシンからの応答有無を判定するテストであり、
前記複数の監視対象は、前記仮想マシンとの通信を行う際に経由するネットワーク機器を含み、
前記異常有無を判定する処理では、前記仮想マシンからの応答有無を判定し、
前記所定の状態を取得する処理では、前記仮想マシンからの応答がない場合、前記ネットワーク機器の所定の状態を取得し、
前記出力する処理では、前記仮想マシンからの応答有無の判定結果と、前記ネットワーク機器の所定の状態とを出力する、
ことを特徴とする監視プログラム。 In claim 1,
The predetermined test is a test for determining whether or not there is a response from the virtual machine,
The plurality of monitoring targets include a network device through which communication with the virtual machine is performed,
In the process of determining whether there is an abnormality, it is determined whether there is a response from the virtual machine,
In the process of acquiring the predetermined state, when there is no response from the virtual machine, the predetermined state of the network device is acquired,
In the output process, the determination result of the presence or absence of a response from the virtual machine and a predetermined state of the network device are output.
A monitoring program characterized by that.
前記複数の監視対象は、複数の処理をそれぞれ実行する複数の情報処理装置を含み、
所定間隔において前記複数の情報処理装置に対して前記複数の処理の実行指示を行い、
前記実行指示に対応する前記複数の処理の実行結果から、前記複数の処理の実行結果についての異常有無をそれぞれ判定し、
前記複数の処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記複数の監視対象のうち、前記いずれかの処理に対応する監視対象の所定の状態を取得し、
前記複数の処理の実行結果についての異常有無の判定結果と、前記いずれかの処理に対応する監視対象の所定の状態とを出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。 The claim 1, further comprising:
The plurality of monitoring targets include a plurality of information processing apparatuses that respectively execute a plurality of processes,
Instructing the plurality of information processing devices to execute the plurality of processes at a predetermined interval,
From the execution results of the plurality of processes corresponding to the execution instruction, determine whether there is an abnormality in the execution results of the plurality of processes, respectively.
When an execution result of at least one of the plurality of processes is abnormal, a predetermined state of the monitoring target corresponding to any one of the plurality of monitoring targets is acquired,
Outputting the determination result of the presence or absence of abnormality of the execution results of the plurality of processes and a predetermined state of the monitoring target corresponding to any of the processes;
A monitoring program for causing a computer to execute processing.
前記複数の処理は、仮想マシンの作成及び仮想マシンの削除を含む、
ことを特徴とする監視プログラム。 In claim 5,
The plurality of processes include virtual machine creation and virtual machine deletion,
A monitoring program characterized by that.
所定間隔において前記複数の監視対象の所定の状態をそれぞれ取得し、
取得した前記所定の状態のそれぞれから前記複数の監視対象のそれぞれの異常有無を判定し、
前記複数の監視対象のうちのいずれかの監視対象が異常である場合、前記複数の処理のうち、前記いずれかの監視対象に対応する処理の実行指示を前記複数の情報処理装置に対して行い、
前記いずれかの監視対象に対応する処理の実行結果から、前記いずれかの監視対象に対応する処理の実行結果についての異常有無をそれぞれ判定する、
処理をコンピュータに実行させ、
前記複数の処理の実行結果についての異常有無の判定結果を出力する処理では、前記いずれかの監視対象に対応する処理のうちの少なくともいずれかの処理の実行結果が異常である場合、前記いずれかの監視対象の異常が第3異常であることを示す情報を出力し、前記いずれかの監視対象に対応する処理の実行結果が異常でない場合、前記いずれかの監視対象の異常が第4異常であることを示す情報を出力する、
処理をコンピュータに実行させることを特徴とする監視プログラム。 In claim 5, further:
Obtaining a predetermined state of each of the plurality of monitoring targets at a predetermined interval,
Determining the presence or absence of each of the plurality of monitoring targets from each of the acquired predetermined states;
If any one of the plurality of monitoring targets is abnormal, an instruction to execute the processing corresponding to any one of the plurality of processing targets is given to the plurality of information processing apparatuses. ,
From the execution result of the process corresponding to any one of the monitoring targets, determine whether there is an abnormality in the execution result of the process corresponding to any of the monitoring targets,
Let the computer execute the process,
In the process of outputting the determination result of the presence / absence of abnormality of the execution results of the plurality of processes, if the execution result of at least one of the processes corresponding to any of the monitoring targets is abnormal, any of the above Information indicating that the monitoring target abnormality is the third abnormality, and if the execution result of the process corresponding to any of the monitoring targets is not abnormal, the monitoring target abnormality is the fourth abnormality Output information indicating that it is,
A monitoring program for causing a computer to execute processing.
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得するテスト結果取得部と、
取得した前記結果から前記仮想マシンの異常有無を判定する異常有無判定部と、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得する状態取得部と、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する結果出力部と、を有する、
ことを特徴とする監視装置。 A virtual machine placement unit for placing a virtual machine for monitoring used for monitoring a plurality of monitoring targets including the virtualization software on the virtualization software;
A test result acquisition unit for acquiring a result of a predetermined test executed by the virtual machine at a predetermined interval;
An abnormality presence / absence determining unit that determines the presence / absence of an abnormality of the virtual machine from the acquired result;
When the virtual machine is abnormal, a state acquisition unit that acquires a predetermined state of the plurality of monitoring targets;
A result output unit that outputs a determination result of whether there is an abnormality in the virtual machine and a predetermined state of the plurality of monitoring targets;
A monitoring device characterized by that.
所定間隔において前記仮想マシンによって実行された所定のテストの結果を取得し、
取得した前記結果から前記仮想マシンの異常有無を判定し、
前記仮想マシンが異常である場合、前記複数の監視対象の所定の状態を取得し、
前記仮想マシンの異常有無の判定結果と、前記複数の監視対象の所定の状態とを出力する、
ことを特徴とする監視方法。 On the virtualization software, a monitoring virtual machine used for monitoring a plurality of monitoring targets including the virtualization software is arranged,
Obtaining a result of a predetermined test executed by the virtual machine at a predetermined interval;
Determine whether the virtual machine is abnormal from the acquired results,
If the virtual machine is abnormal, obtain a predetermined state of the plurality of monitoring targets,
Outputting a determination result of whether or not there is an abnormality in the virtual machine and a predetermined state of the plurality of monitoring targets;
A monitoring method characterized by that.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018027525A JP2019144785A (en) | 2018-02-20 | 2018-02-20 | Monitoring program, monitoring apparatus and monitoring method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018027525A JP2019144785A (en) | 2018-02-20 | 2018-02-20 | Monitoring program, monitoring apparatus and monitoring method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2019144785A true JP2019144785A (en) | 2019-08-29 |
Family
ID=67773788
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018027525A Pending JP2019144785A (en) | 2018-02-20 | 2018-02-20 | Monitoring program, monitoring apparatus and monitoring method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2019144785A (en) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102021123370A1 (en) | 2020-09-14 | 2022-03-17 | Panasonic Intellectual Property Management Co., Ltd. | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM |
WO2022185626A1 (en) * | 2021-03-01 | 2022-09-09 | パナソニックIpマネジメント株式会社 | Monitoring system |
WO2022239331A1 (en) * | 2021-05-12 | 2022-11-17 | 日立Astemo株式会社 | Electronic controller and abnormality determination method |
WO2022255247A1 (en) | 2021-05-31 | 2022-12-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Monitoring device, monitoring system, and monitoring method |
WO2023238438A1 (en) * | 2022-06-10 | 2023-12-14 | パナソニックIpマネジメント株式会社 | Monitoring device and monitoring method |
-
2018
- 2018-02-20 JP JP2018027525A patent/JP2019144785A/en active Pending
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE102021123370A1 (en) | 2020-09-14 | 2022-03-17 | Panasonic Intellectual Property Management Co., Ltd. | INFORMATION PROCESSING DEVICE, INFORMATION PROCESSING METHOD, AND PROGRAM |
WO2022185626A1 (en) * | 2021-03-01 | 2022-09-09 | パナソニックIpマネジメント株式会社 | Monitoring system |
WO2022239331A1 (en) * | 2021-05-12 | 2022-11-17 | 日立Astemo株式会社 | Electronic controller and abnormality determination method |
DE112022001480T5 (en) | 2021-05-12 | 2024-01-11 | Hitachi Astemo, Ltd. | ELECTRONIC CONTROL UNIT AND ANOMALY DETERMINATION METHOD |
WO2022255247A1 (en) | 2021-05-31 | 2022-12-08 | パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ | Monitoring device, monitoring system, and monitoring method |
WO2023238438A1 (en) * | 2022-06-10 | 2023-12-14 | パナソニックIpマネジメント株式会社 | Monitoring device and monitoring method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2019144785A (en) | Monitoring program, monitoring apparatus and monitoring method | |
KR101979363B1 (en) | Method, apparatus, and system for discovering application topology relationship | |
EP3281360B1 (en) | Virtualized network function monitoring | |
TWI544328B (en) | Method and system for probe insertion via background virtual machine | |
US20170357524A1 (en) | Automated software configuration management | |
US10298469B2 (en) | Automatic asynchronous handoff identification | |
EP2871553A1 (en) | Systems and methods for protecting virtualized assets | |
US20160224400A1 (en) | Automatic root cause analysis for distributed business transaction | |
US10452469B2 (en) | Server performance correction using remote server actions | |
WO2017016212A1 (en) | Testing method and device for desktop cloud system | |
US9135078B2 (en) | Configuration information management server, configuration information management method and configuration management program | |
CN113900834B (en) | Data processing method, device, equipment and storage medium based on Internet of things technology | |
GB2518739A (en) | Custom Correlation of a Distributed Business Transaction | |
CN110896362B (en) | Fault detection method and device | |
US20150067139A1 (en) | Agentless monitoring of computer systems | |
US10191844B2 (en) | Automatic garbage collection thrashing monitoring | |
CN113849356A (en) | Equipment testing method and device, electronic equipment and storage medium | |
JP2009176139A (en) | Apparatus and program for changing os priority | |
JP5623333B2 (en) | Monitoring server and monitoring evaluation method | |
US20150301877A1 (en) | Naming of nodes in net framework | |
JP2020038506A (en) | Information processing system, information processing method, and program | |
US9864650B2 (en) | Monitoring and responding to operational conditions of a logical partition from a separate logical partition | |
CN114020513A (en) | Method and device for processing log information | |
US9880917B2 (en) | Monitoring virtual machines for alert conditions | |
CN114266037B (en) | Sample detection method and device, electronic equipment and storage medium |