WO2023047450A1

WO2023047450A1 - ネットワーク管理装置、ネットワーク管理方法およびネットワーク管理システム

Info

Publication number: WO2023047450A1
Application number: PCT/JP2021/034521
Authority: WO
Inventors: ジャヨンオ; 正昭小杉
Original assignee: 楽天モバイル株式会社
Priority date: 2021-09-21
Filing date: 2021-09-21
Publication date: 2023-03-30
Also published as: US20240193033A1

Abstract

大規模ネットワークにおいて、全体の構築時間の短縮と、エラー対処に要する人的コストの削減とを実現する。　ネットワーク管理装置は、複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行した際に発生し得るエラーと、当該エラーの解消方法と、を対応付けた対応情報を記憶する対応情報記憶部と、ワークフローの実行に関するログを収集するログ収集部と、ワークフローの実行中にエラーが発生した場合、ワークフローの実行を停止するワークフロー停止部と、ワークフロー停止部によるワークフローの停止中に、ログ収集部により収集されたログをもとに、対応情報記憶部に記憶された対応情報を参照して、エラーに対する対処を決定して実行するエラー対処部と、エラー対処部により実行された対処によってエラーが解消された場合、複数の処理のうち、対処に応じた処理からワークフローを再開するワークフロー再開部と、を備える。

Description

ネットワーク管理装置、ネットワーク管理方法およびネットワーク管理システム

　本発明は、ネットワーク管理装置、ネットワーク管理方法およびネットワーク管理システムに関し、特に、モバイルネットワークの構築を自動化するための技術に関する。

　汎用サーバの性能向上、ネットワーク基盤の充実を背景として、サーバなどの物理リソース上に仮想化されたコンピューティングリソースをオンデマンドで使うクラウドコンピューティング（以下、「クラウド」という。）が広く普及している。また、ネットワーク機能を仮想化し、クラウド上で提供するＮＦＶ（Network Function Virtualization）が知られている。ＮＦＶとは、仮想化技術およびクラウド技術を用いて、これまで専用ハードウェア上で動いていた様々なネットワークサービスのハードウェアとソフトウェアとを分離し、ソフトウェアを仮想化された基盤上で動かす技術である。これによって運用の高度化やコスト削減が期待される。
　そして、近年、モバイルネットワークにおいても仮想化が進められている。
　ＥＴＳＩ（European Telecommunications Standards Institute）　ＮＦＶでは、ＮＦＶのアーキテクチャが定義されている（例えば、特許文献１参照）。

国際公開第２０１６／１２１８０２号

　近年のテレコムネットワークは仮想化基盤で構築された大規模ネットワークであり、このような大規模ネットワークにおいては、ネットワークの構築に効率化および自動化が求められている。
　従来、ネットワークの構築途中で何らかの問題が発生した場合には、作業者が、問題が起きた機器のログを解析して当該問題に対する対処を行ったり、関連部門（もしくは担当者、担当会社）に解析や対処を依頼したりしていた。しかしながら、テレコムネットワークは多様な構成要素によって成り立っており、また、多数の部門（人、会社）が連携して構築作業を行っている場合もあり、迅速に問題の原因を特定したり解析依頼先を選定したりすることが困難であった。問題対処に時間がかかると、その間の構築作業の停止時間も長くなり、結果として全体の構築作業時間が長くなる。
　このように、ネットワークの構築には、時間と人的コストとを要していた。

　そこで、本発明は、大規模ネットワークにおいて、全体の構築時間の短縮と、エラー対処に要する人的コストの削減とを実現することができるネットワーク管理装置、ネットワーク管理方法およびネットワーク管理システムを提供することを課題としている。

　上記課題を解決するために、本発明に係るネットワーク管理装置の一態様は、複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行した際に発生し得るエラーと、当該エラーの解消方法と、を対応付けた対応情報を記憶する対応情報記憶部と、前記ワークフローの実行に関するログを収集するログ収集部と、前記ワークフローの実行中にエラーが発生した場合、前記ワークフローの実行を停止するワークフロー停止部と、前記ワークフロー停止部による前記ワークフローの停止中に、前記ログ収集部により収集されたログをもとに、前記対応情報記憶部に記憶された対応情報を参照して、前記エラーに対する対処を決定して実行するエラー対処部と、前記エラー対処部により実行された対処によって前記エラーが解消された場合、前記複数の処理のうち、前記対処に応じた処理から前記ワークフローを再開するワークフロー再開部と、を備える。

　前記エラー対処部は、前記ログ収集部により収集されたログをもとに、前記対応情報記憶部に記憶された対応情報を参照して、前記ワークフローの実行中に発生したエラーを解消するための対処処理の自動実行が可能か否かを判定し、前記対処処理の自動実行が可能であると判定した場合、当該対処処理を自動実行し、前記対処処理の自動実行が不可能であると判定した場合、前記発生したエラーを解消するための対処を作業者に指示してよい。

　前記エラー対処部は、前記対処処理に人の介入が必要であると判定した場合、前記対処処理の自動実行が不可能であると判定し、前記対処として、前記作業者に前記対処処理の実行を指示してよい。

　前記エラー対処部は、前記対応情報記憶部に記憶された対応情報に、前記ワークフローの実行中に発生したエラーに対応付けられた前記解消方法が存在しない場合、前記対処処理の自動実行が不可能であると判定し、前記対処として、前記作業者に前記エラーの解析および当該エラーを解消するための対処処理の実行を指示してよい。

　前記対応情報記憶部は、前記対応情報として、前記ワークフロー再開部により再開する処理を特定するための情報を、前記エラーおよび前記エラーの解消方法に対応付けて記憶してよい。

　前記ワークフロー再開部は、前記対処に応じて、前記複数の処理のうち、最初に実行される処理、前記エラーが発生した処理、および、前記エラーが発生した処理の次の処理のいずれかの処理から前記ワークフローを再開してよい。

　前記エラー対処部は、前記ログ収集部により収集されたログのうち、前記エラーが発生した処理に関連するコンポーネントのログを解析してよい。

　前記エラー対処部は、前記エラーが発生した処理がスキップ可能な処理であると判定した場合、前記エラーに対する対処として何もせず、前記ワークフロー再開部は、前記複数の処理のうち、前記エラーが発生した処理の次の処理から前記ワークフローを再開してよい。

　ネットワーク管理装置は、前記エラー対処部において、前記エラーが発生した処理がスキップ可能な処理であると判定され、前記エラーに対する対処として何もしなかった場合、前記ワークフロー再開部により前記ワークフローが再開され、前記一連のネットワーク構築処理が終了した後、前記エラーが発生した処理に対する対処を行い、前記エラーが発生した処理を再実行するエラー処理再実行部をさらに備えてよい。

　また、本発明に係るネットワーク管理方法の一態様は、ネットワーク管理装置が実行するネットワーク管理方法であって、複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行した際に発生し得るエラーと、当該エラーの解消方法と、を対応付けた対応情報を取得するステップと、前記ワークフローの実行に関するログを収集するステップと、前記ワークフローの実行中にエラーが発生した場合、前記ワークフローの実行を停止するステップと、前記ワークフローの停止中に、前記ログをもとに、前記対応情報を参照して、前記エラーに対する対処を決定して実行するステップと、実行された前記対処によって前記エラーが解消された場合、前記複数の処理のうち、前記対処に応じた処理から前記ワークフローを再開するステップと、を含む。

　さらに、本発明に係るネットワーク管理システムの一態様は、複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行した際に発生し得るエラーと、当該エラーの解消方法と、を対応付けた対応情報を記憶する対応情報記憶部と、前記ワークフローの実行に関するログを収集するログ収集部と、前記ワークフローの実行中にエラーが発生した場合、前記ワークフローの実行を停止するワークフロー停止部と、前記ワークフロー停止部による前記ワークフローの停止中に、前記ログ収集部により収集されたログをもとに、前記対応情報記憶部に記憶された対応情報を参照して、前記エラーに対する対処を決定して実行するエラー対処部と、前記エラー対処部により実行された対処によって前記エラーが解消された場合、前記複数の処理のうち、前記対処に応じた処理から前記ワークフローを再開するワークフロー再開部と、を備える。

　本発明の一つの態様によれば、大規模ネットワークにおいて、全体の構築時間の短縮と、エラー対処に要する人的コストの削減とを実現することができる。
　上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。

図１は、本実施形態のネットワーク管理装置を含むモバイルネットワークの構成例を示す図である。図２は、ネットワーク管理システムの内部構成の一例を示す図である。図３は、ネットワーク管理部の機能ブロック図である。図４は、ワークフロー実行動作を示すシーケンス図である。図５は、自動再開が可能な場合の動作を示すシーケンス図である。図６は、ワークフロー制御部がログ収集部に渡すワークフロー情報の一例である。図７は、ワークフローで定義される処理内容の一例である。図８は、既知問題リストの一例である。図９は、エラー解消方法リストの一例である。図１０は、ユーザへの２次解析依頼が必要な場合の動作を示すシーケンス図である。図１１は、ユーザへのエラー対処依頼が必要な場合の動作を示すシーケンス図である。図１２は、ワークフロー制御部の動作の一部を示すフローチャートである。図１３は、中央データセンタを構成する一仮想化基盤の例である。図１４は、ネットワーク管理装置のハードウェア構成の一例を示すブロック図である。

　以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。

　以下、本実施形態に係るネットワーク管理装置が、仮想化基盤で構築されるモバイルネットワークにおけるネットワーク構築処理を自動で行うネットワーク管理機能を備える場合について説明する。
　具体的には、ネットワーク管理装置は、複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行する。そして、ネットワーク管理装置は、ワークフローの実行中にエラーが発生した場合、ワークフローの実行を停止してエラーに対する対処を行い、エラーが解消されたら、上記複数の処理のうち、対処に応じた処理からワークフローを再開する。

　ここで、ネットワーク構築処理は、ネットワーク装置（スイッチ等）の設定、仮想化プラットフォームのハードウェア設定、仮想化プラットフォームのソフトウェア設定、アプリケーション設定などを含む。

　より具体的には、ネットワーク管理装置は、ワークフローの実行中にワークフローの実行に関するログを収集しておき、エラーが発生してワークフローを停止した場合、収集されたログをもとに、エラーに対する対処を決定して実行する。このとき、ネットワーク管理装置は、ワークフローを実行した際に発生し得るエラーとエラー解消方法とを予め対応付けた対応情報を参照して、エラーに対する対処を決定して実行する。

　ネットワーク管理装置は、上記対応情報を参照して、エラーを解消するための対処処理の自動実行が可能か否かを判定し、対処処理の自動実行が可能であると判定した場合、当該対処処理を自動実行することでエラーを解消させる。
　一方、ネットワーク管理装置は、対処処理の自動実行が不可能であると判定した場合、エラーを解消するための対処を作業者（以下、「ユーザ」ともいう。）に指示する。ここで、ネットワーク管理装置は、エラーを解消するために人の介入が必要である場合、または、エラーを解消するための対処処理が確立していない場合に、対処処理の自動実行が不可能であると判定することができる。

　図１は、本実施形態のネットワーク管理装置を含むモバイルネットワーク１００のネットワーク構成例を示す図である。
　図１に示すモバイルネットワーク１００においては、スマートフォンなどのモバイル通信可能な端末と無線アクセスネットワーク（Radio Access Network：ＲＡＮ）とが無線通信し、その情報をバックホールネットワーク（モバイルバックホール：ＭＢＨ）を中継してコアネットワークに送って処理することで、インターネット２００に接続したり、他社のネットワークと接続して音声通話をしたりすることができる。

　具体的には、モバイルネットワーク１００は、基地局１１と、複数の収容局１２～１４と、を備えて構成される。ここで、収容局１２はエッジデータセンタ、収容局１３は地域データセンタ（Regional Data Center：ＲＤＣ）、収容局１４は中央データセンタ（Central Data Center：ＣＤＣ）である。エッジデータセンタ１２から中央データセンタ１４までの間でバックホールネットワークが構成される。
　本実施形態におけるモバイルネットワーク１００は、仮想化基盤で構築された仮想化ネットワークであってよい。このモバイルネットワーク１００では、汎用的なサーバ上に、基幹網の交換機から基地局の無線アクセス機能までをソフトウェアで実現している。

　基地局１１は、アンテナや配電盤、バッテリー等を備える。
　エッジデータセンタ１２は、基地局１１の近くに設置され、複数の基地局１１とそれぞれ光ファイバーケーブル等で接続されている。エッジデータセンタ１２では、ＲＡＮ関連の無線アクセス機能を実現する。
　地域データセンタ１３は、対象地域に配置される複数のエッジデータセンタ１２と接続されている。この地域データセンタ１３では、ファイアウォール／ＮＡＴ（Network Address Translation）、ＣＤＮ（Content Distribution Network）や、エッジコンピューティングのためのさまざまなアプリケーションをソフトウェアにより実現する。
　中央データセンタ１４は、複数の地域データセンタ１３と接続されている。この中央データセンタ１４では、ＥＰＣ（Evolved Packet Core）やＩＭＳ（IP Multimedia Subsystem）などのコア機能を実現する。

　なお、エッジデータセンタ１２、地域データセンタ１３、中央データセンタ１４といった各データセンタ（収容局）の数は、図１に示す数に限定されない。例えば図１では、地域データセンタ１３および中央データセンタ１４を１つずつしか図示していないが、地域データセンタ１３および中央データセンタ１４はそれぞれ複数設置されていてもよい。

　図２は、モバイルネットワーク１００を構成するネットワーク管理システムの内部構成の一例を示す図である。
　この図２に示す構成要素は、それぞれ参照点を有している。図２に示す構成要素間を結ぶ線は、互いに情報の送受信が可能であることを示している。
　ＮＦＶＩ（NFV Infrastructure）１１０は、ネットワーク機能仮想化基盤であり、物理資源、仮想化層、仮想化資源を含んで構成される。物理資源には、計算資源、記憶資源、伝送資源といったハードウェアリソースが含まれる。仮想化層は、物理資源を仮想化してＶＮＦ（Network Function Virtualization）１２０に提供するためのハイパーバイザー等の仮想化レイヤである。仮想化資源は、ＶＮＦ１２０に提供される仮想化されたインフラ資源である。

　即ち、ＮＦＶＩ１１０は、コンピューティング、ストレージ、ネットワーク機能といった物理サーバ（以下、単に「サーバ」ともいう。）のハードウェアリソースを、ハイパーバイザー等の仮想化レイヤで仮想化した仮想化コンピューティング、仮想化ストレージ、仮想化ネットワークといった仮想化ハードウェアリソースとして柔軟に扱えるようにした基盤である。

　ＮＦＶＩ１１０を構成するサーバは、複数まとめてデータセンタ（収容局）１２～１４に配置される。各データセンタ１２～１４に配置されるサーバの台数や配置位置、配線等は、データセンタのタイプ（収容局タイプ）によって予め定められている。各データセンタ１２～１４では、配置されたサーバが内部のネットワークによって接続されており、互いに情報の送受信を行うことができるようになっている。また、データセンタ間はネットワークで接続されており、異なるデータセンタに設けられたサーバは、当該ネットワークを介して互いに情報の送受信を行うことができるようになっている。

　ＶＮＦ１２０は、サーバ上の仮想マシン（Virtual Machine：ＶＭ）で動作するアプリケーションに対応し、ネットワーク機能をソフトウェア的に実現する。なお、特に図示しないが、ＶＮＦ１２０ごとにＥＭ（Element Manager）という管理機能が設けられていてもよい。
　図２におけるＮＦＶＩ１１０とＶＮＦ１２０とで仮想化環境を構成している。つまり、仮想化環境は、下層から順に、ハードウェア、仮想化レイヤ、仮想マシンの３レイヤで構成される。

　ＭＡＮＯ（Management and Orchestration）１３０は、仮想化環境の管理機能とオーケストレーション機能とを有する。ＭＡＮＯ１３０は、ＮＦＶＯ（NFV-Orchestrator）１３１、ＶＮＦＭ（VNF-Manager）１３２、ＶＩＭ（Virtualized Infrastructure Manager）１３３を備える。
　ＮＦＶＯ１３１は、ＮＦＶＩリソースのオーケストレーションや、ネットワークサービスのライフサイクル管理を行い、システム全体の統合的な運用管理を行う。このＮＦＶＯ１３１は、後述するＯＳＳ／ＢＳＳ（Operation Support System/Business Support System）１４０からの指示に応じた処理を行うことができる。

　ＶＮＦＭ１３２は、ＶＮＦ１２０のライフサイクル管理を行う。なお、ＶＮＦＭ１３２は、ＶＮＦ１２０毎に、それぞれ対応する専用ＶＮＦＭとしてＭＡＮＯ１３０に配置されていてもよい。または、１つのＶＮＦＭ１３２が、２以上のＶＮＦ１２０のライフサイクルを管理してもよい。この場合、ＶＮＦＭ１３２は、異なるベンダから提供されるＶＮＦ１２０に対応する汎用ＶＮＦＭであってもよい。
　ＶＩＭ１３３は、ＶＮＦ１２０が使用するリソースの運用管理を行う。

　ＯＳＳ／ＢＳＳ１４０は、モバイルネットワーク１００の統合管理システムである。
　ここで、ＯＳＳは、サービスを構築し、運営していくために必要なシステム（機器やソフトウェア、仕組みなど）であり、ＢＳＳは、利用料などの課金、請求、顧客対応などのために用いる情報システム（機器やソフトウェア、仕組みなど）である。

　ネットワーク管理部１５０は、複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行し、ワークフローの実行中にエラーが発生した場合、ワークフローの実行を停止してエラーに対する対処を行い、当該対処に応じた処理からワークフローを再開するネットワーク管理機能を実現する。このネットワーク管理部１５０が本実施形態に係るネットワーク管理装置を構成している。

　ネットワーク管理部１５０は、エラー対処データベース（エラー対処ＤＢ）１５０ａを備える。ネットワーク管理部１５０は、ワークフローの実行中にエラーが発生した場合、ワークフローの実行に関するログをもとにエラー対処データベース１５０ａを参照してエラーに対する対処を決定し実行する。
　エラー対処データベース１５０ａは、ワークフローを実行した際に発生し得るエラーと当該エラーの解消方法とを対応付けた対応情報を記憶する対応情報記憶部である。このエラー対処データベース１５０ａは、過去に実際に発生したエラーや、これから発生し得るエラーについての対応情報を格納することができる。

　なお、エラー対処データベース１５０ａは、上記対応情報を外部装置から取得し、一時的に記憶する揮発性メモリまたは不揮発性メモリ等であってもよい。この場合、対応情報を取得するタイミングは特に限定されない。
　さらに、ネットワーク管理部１５０は、図２に示すようにＯＳＳ／ＢＳＳ１４０やＭＡＮＯ１３０の外部機能である場合に限定されない。ネットワーク管理部１５０は、ＯＳＳ／ＢＳＳ１４０の内部に設けられていてもよいし、ＭＡＮＯ１３０の内部に設けられていてもよい。この場合、ネットワーク管理部１５０が有するネットワーク管理機能は、ＯＳＳ／ＢＳＳ１４０やＭＡＮＯ１３０の機能の一部となる。

　図３は、ネットワーク管理部１５０の機能ブロック図である。
　この図３に示すように、ネットワーク管理部１５０は、ログ収集部１５１と、ログ解析部１５２と、ワークフロー制御部１５３と、ユーザインタフェース（Ｉ／Ｆ）１５４と、を備える。ワークフロー制御部１５３は、ワークフロー停止部（ＷＦ停止部）１５３ａと、エラー対処実行部１５３ｂと、ワークフロー再開部（ＷＦ再開部）１５３ｃと、を備える。また、ネットワーク管理装置１５０は、エラー対処データベース（エラー対処ＤＢ）１５０ａを備える。

　ログ収集部１５１は、ワークフローの実行に関するログを収集する。ワークフローが実行された場合、例えばＯＳＳ１４０は、ＶＮＦＭ１３２やＶＩＭ１３３に命令を出してワークフローに定義された処理を順に実行していくことができる。この場合、ログ収集部１５１は、ＶＮＦＭ１３２やＶＩＭ１３３から直接、または、ＭＡＮＯ１３０やＯＳＳ１４０を介してログを収集することができる。
　ログ解析部１５２は、ワークフローの実行中にエラーが発生した場合、ログ収集部１５１により収集されたログをもとに、エラー対処データベース１５０ａを参照して、エラーを解消するための対処処理の自動実行が可能か否かを判定する。

　ワークフロー制御部１５３のワークフロー停止部１５３ａは、例えばＯＳＳ１４０からの停止依頼に従って、実行中のワークフローを停止する。ＯＳＳ１４０は、ワークフロー実行中にログ収集部１５１により収集されるログをもとにエラー発生の有無を判定し、エラー発生している場合、ワークフロー制御部１５３に対してワークフローの停止依頼を送信することができる。なお、ワークフロー実行中におけるエラー発生の有無は、ワークフロー制御部１５３が判定してもよい。

　エラー対処実行部１５３ｂは、ワークフローの実行中にエラーが発生してワークフロー停止部１５３ａによりワークフローが停止された場合、ログ解析部１５２によるログ解析結果をもとに、エラーに対する対処を決定して実行する。

　ワークフロー再開部１５３ｃは、エラー対処実行部１５３ｂにより実行された対処によってエラーが解消された場合、ワークフローを再開する。このとき、ワークフロー再開部１５３ｃは、ワークフローに定義された複数の処理のうち、エラー対処実行部１５３ｂにより実行された対処に応じた処理からワークフローを再開する。
　具体的には、ワークフロー再開部１５３ｃは、複数の処理のうち、最初に実行される処理、エラーが発生した処理、または、エラーが発生した処理の次の処理からワークフローを再開することができる。

　ユーザインタフェース１５４は、ユーザが操作可能な入出力装置であり、キーボードやマウス等のポインティングディバイス、モニタ、スピーカ等を含む。

　なお、図３に示したネットワーク管理部１５０の機能ブロックの構成は一例であり、複数の機能ブロックが１つの機能ブロックを構成するようにしてもよいし、いずれかの機能ブロックが複数の機能を行うブロックに分かれてもよい。例えば、ログ解析部１５２およびエラー対処実行部１５３ｂは、ワークフロー停止部１５３ａによるワークフローの停止中に、ログ収集部１５１により収集されたログをもとに、エラー対処データベース１５０ａを参照して、エラーに対する対処を決定して実行する１つの機能ブロックであるエラー対処部を構成してもよい。
　また、ネットワーク管理部１５０の複数の機能は、それぞれ、図２に示すネットワーク管理システムのＯＳＳ／ＢＳＳ１４０やＭＡＮＯ１３０の外部機能、ＯＳＳ／ＢＳＳ１４０の内部機能、ＭＡＮＯ１３０内部機能に分かれていてもよい。

　図４は、ワークフロー実行中の動作を示すシーケンス図である。
　まずステップＳ１において、ＯＳＳ１４０は、ワークフロー制御部（ＷＦ制御部）１５３に対してＷＦ実行依頼を送信し、ワークフローの実行を指示する。
　すると、ワークフロー制御部１５３は、ステップＳ２においてワークフロー実行を開始し、ステップＳ３において、ログ収集部１５１に対してログ収集依頼を送信する。

　ステップＳ４では、ログ収集部１５１は、ＮＦＶＩ１１０やＶＮＦ１２０に対してワークフローの実行に関するログを要求する。ステップＳ５では、ログ収集部１５１は、ＮＦＶＩ１１０やＶＮＦ１２０から送信された収集ログを取得し、これをワークフロー制御部１５３に送信する。
　ワークフロー制御部１５３は、ステップＳ６においてログ収集部１５１から収集ログを取得し、これをＯＳＳ１４０に送信する。ＯＳＳ１４０は、ステップＳ７においてワークフロー制御部１５３から収集ログを取得する。

　ＯＳＳ１４０は、取得された収集ログを解析し、ワークフローの実行中にエラーが発生しているか否かを判定することができる。そして、ＯＳＳ１４０は、ワークフローの実行中にエラーが発生していると判定した場合、ワークフロー制御部１５３に対してワークフローの停止依頼を送信することができる。このとき、ＯＳＳ１４０は、どのワークフローのどのステップでエラーが発生したかを示す情報等を含めて、ワークフロー制御部１５３にエラーが発生していることを通知してよい。

　なお、ログ収集部１５１は、図４に示すようにＮＦＶＩ１１０やＶＮＦ１２０から直接ログを収集する場合に限定されない。ログ収集部１５１は、上述したように、ＭＡＮＯ１３０やＯＳＳ１４０を介してＮＦＶＩ１１０やＶＮＦ１２０からログを収集してもよい。

　図５は、ワークフローの実行中にエラーが発生し、ワークフロー停止部１５３ａによりワークフローが停止された後の動作の一例を示すシーケンス図である。
　なお、以下の説明では、エッジデータセンタ１２のネットワーク構築処理を実行する例について説明する。なお、以下の説明では、エッジデータセンタを他のデータセンタと区別するためにＧＣ（Group unit Center）と呼ぶ。

　ワークフローが停止されると、まずステップＳ１１において、ワークフロー制御部（ＷＦ制御部）１５３は、エラー対処を行うためのログ解析用ワークフローを開始する。
　そして、ステップＳ１２において、ワークフロー制御部１５３は、ログ収集部１５１に対してログ解析依頼を送信する。このログ解析依頼には、図６に示すワークフロー情報４０１が含まれる。
　ワークフロー情報４０１は、図６に示すように、解析ＩＤ、ネットワーク構築対象のＧＣ名（ＧＣ　Ｎａｍｅ）、ＧＣコード（ＧＣ　ｃｏｄｅ）、処理に失敗したステップ番号（Ｆａｉｌｅｄ　ｓｔｅｐ　ｃｏｄｅ）、処理に失敗したワークフローＩＤ（ＷＦ　ＩＤ）を含んでよい。このワークフロー情報４０１を構成する情報は、ワークフロー制御部１５３がＯＳＳ１４０からワークフローの停止依頼とともに取得することができる。

　図５に戻って、ステップＳ１３では、ログ収集部１５１は、ログ解析部１５２に収集ログを送信する。このとき送信される収集ログは、エラーが発生した処理に関連するコンポーネントのログであってよい。ログ収集部１５１は、図６に示すワークフロー情報４０１に含まれる情報をもとに、エラーが発生した処理に関連するコンポーネントのログを選定し、ログ解析部１５２に送信することができる。

　具体的には、ログ収集部１５１は、ワークフロー情報４０１に含まれる「Ｆａｉｌｅｄ　ｓｔｅｐ　ｃｏｄｅ」をもとに、図７に示す処理リスト４０２を参照してエラーが発生した処理の内容を確認し、当該処理に関連するコンポーネントのログを解析対象のログとして選定することができる。例えばエラーが発生した処理が、ハードウェアに関連する処理である場合、ハードウェアに関連するログを解析対象のログとして選定することができる。

　なお、処理リスト４０２は、ワークフローごとに用意されていてよい。この場合、ログ収集部１５１は、ワークフロー情報４０１に含まれる「ＷＦ　ＩＤ」をもとに、エラーが発生したワークフローに対応する処理リスト４０２を参照することができる。
　また、ログ収集部１５１が処理リスト４０２を参照する場合に限定されるものではなく、例えば、ワークフロー制御部１５３が処理リスト４０２を参照し、ワークフロー情報４０１に図７に示す処理内容を含めてログ収集部１５１に送信してもよい。

　図５に戻って、ステップＳ１４では、ログ解析部１５２は、図８に示す既知問題リスト（Ｋｎｏｗｎ　ｉｓｓｕｅ　ｌｉｓｔ）４１１を参照して、ログ収集部１５１から受信した収集ログを解析し、エラーを解消するための対処処理の自動実行が可能か否かを判定する。既知問題リスト４１１は、エラー解消方法が確立している既知問題のリストであり、エラー対処データベース１５０ａに格納されている。

　既知問題リスト４１１は、図８に示すように、エラーＩＤ、キーワード、エラー解消コード、自動実行フラグを含んでよい。
　ここで、キーワードは、ログに含まれるエラーキーワードである。なお、図８に示すキーワードは一例であり、より詳細なキーワードであってよい。例えばキーワードが「ｔｉｍｅｏｕｔ」である場合、どのコンポーネント間でのタイムアウトであるといった具体的な内容が記述されたキーワードであってよい。
　また、自動実行フラグは、エラーを解消するための対処処理の自動実行が可能か否かを示すフラグであり、ｔｒｕｅは自動実行可能、ｆａｌｓｅは自動実行不可能であることを示す。
　このステップＳ１４では、ログ解析部１５２は、ログ収集部１５１から受信した収集ログをキーとして既知問題リスト４１１を検索する。

　そして、既知問題リスト４１１に該当するレコードが存在する場合、ログ解析部１５２は、ステップＳ１５において、該当するレコードのエラー解消コードと自動実行フラグとを含むログ解析結果をログ収集部１５１に送信する。一方、既知問題リスト４１１に該当するレコードが存在しない場合には、ログ解析部１５２は、ステップＳ１５において、該当するレコードが存在しないことを示す情報を含むログ解析結果をログ収集部１５１に送信する。
　なお、ワークフローによって発生し得るエラーやその解消方法が異なる場合もあるため、既知問題リスト４１１は、ワークフローごとに用意されていてもよい。

　ステップＳ１６では、ログ収集部１５１は、ログ解析部１５２から受信したログ解析結果をワークフロー制御部１５３にそのまま送信する。
　ステップＳ１７では、ワークフロー制御部１５３は、ログ収集部１５１から受信したログ解析結果をもとに、発生したエラーが、エラー解消方法が確立している既知問題であるか、エラー解消方法が確立していない未知問題であるかを判定し、既知問題である場合には、エラーを解消するための対処処理の自動実行が可能か否かを判断する判断処理を行う。そして、ワークフロー制御部１５３は、この判断処理の結果に応じて、エラーに対する対処を実行する。

　例えば、ステップＳ１３においてログ収集部１５１からログ解析部１５２に送信される収集ログに、エラーキーワード「ｔｉｍｅｏｕｔ」が含まれる場合、ログ解析部１５２は、図８のエラーＩＤ＝１００００００１のレコードに含まれるエラー解消コード（０１）と自動実行フラグ（ｔｒｕｅ）とをログ解析結果に含めてログ収集部１５１に送信する。そして、このログ解析結果をログ収集部１５１から受信したワークフロー制御部１５３は、発生したエラーが、エラー解消方法が確立している既知問題であり、かつ、エラーを解消するための対処処理の自動実行が可能であると判断する。

　そのため、ステップＳ１８において、ワークフロー制御部１５３は、対処処理を自動実行し、ワークフローを再開する。
　このとき、ワークフロー制御部１５３は、図９に示すエラー解消方法リスト４１２を参照してエラー解消方法を確認し、対処処理を自動実行する。エラー解消方法リスト４１２は、図９に示すように、エラー解消コード、エラー解消方法、ワークフロー再開時にどの処理から再開するかを特定するための再開ステップ番号（Ｓｔｅｐ　ｃｏｄｅ）、発生したエラーがハードウェア（ＨＷ）の問題であるのかソフトウェア（ＳＷ）の問題であるのかを示す情報を含んでよい。ここで、エラー解消方法リスト４１２のエラー解消コードは、図８に示す既知問題リスト４１１のエラー解消コードに対応している。

　ワークフロー制御部１５３は、上記の例のようにエラー解消コード＝０１を含むログ解析結果を受信した場合、図９に示すエラー解消方法リスト４１２をもとに、エラー解消方法が「リトライ」であることを確認することができる。
　この場合、ワークフロー制御部１５３は、ステップＳ１８において、ワークフローのリトライを実行する。つまり、ワークフロー制御部１５３は、ワークフローを再開する。このとき、ワークフロー制御部１５３は、図９に示すエラー解消方法リスト４１２を参照して、ログ解析結果に含まれるエラー解消コードに対応する再開ステップ番号を確認し、当該再開ステップ番号の処理からワークフローを再開する。

　このように、エラーを解消するための対処処理の自動実行が可能である場合には、対処処理を自動実行してからワークフローを自動再開する。
　なお、ここでは自動実行可能なエラー解消方法が「リトライ」である場合について説明したが、自動実行可能なエラー解消方法は上記に限定されない。エラー解消方法が、人の介入が不要な対処処理であれば、ワークフロー制御部１５３は、対処処理を自動実行してワークフローを自動再開することができる。
　ワークフロー制御部１５３は、ワークフローを自動再開した後は、図４のステップＳ３と同様にログ収集部１５１に対してログ収集依頼を送信し、ログ収集を再開する。

　次に、エラーを解消するための対処処理の自動実行が不可能である場合の動作について説明する。
　本実施形態では、発生したエラーが未知問題である、つまり、既知問題リスト４１１に発生したエラーに対応付けられたエラー解消方法が存在しない場合、または、エラー解消方法が存在するが、必ず人の介入が必要な対処処理である場合に、エラーを解消するための対処処理の自動実行が不可能であると判断する。

　図１０は、発生したエラーが未知問題である場合の動作を示すシーケンス図である。この図１０において、ステップＳ２１～Ｓ２６の処理は、図５のステップＳ１１～Ｓ１６と同様の処理である。
　例えば、過去に発生したことのないエラーや、過去に発生したがエラー解消方法が確立してないエラーについては、既知問題リスト４１１に登録されておらず、該当するレコードが存在しない。
　そのため、ステップＳ２６では、ワークフロー制御部１５３は、ログ収集部１５１から、既知問題リスト４１１に発生したエラーに該当するレコードが存在しないことを示す情報を含むログ解析結果を受信する。
　そして、ステップＳ２７において、ワークフロー制御部１５３は、発生したエラーが、エラー解消方法が確立していない未知問題であり、エラーを解消するための対処処理の自動実行が不可能であると判断する。

　すると、ワークフロー制御部１５３は、ステップＳ２８において、ユーザ３００に対してエラーの解析依頼とエラーを解消するための対処処理の実行指示とを含む２次解析依頼をユーザＩ／Ｆ１５４に送信する。ステップＳ２９では、ユーザ３００は、ユーザＩ／Ｆ１５４を介して２次解析依頼を確認する。
　これにより、ステップＳ３０において、ユーザ３００によるエラー解析が行われ、ステップＳ３１において、ユーザ３００による対処処理の実行が行われる。対処処理の実行後、ユーザ３００は、ユーザＩ／Ｆ１５４を介して、対処処理の実行が完了したことを示す完了通知をワークフロー制御部１５３に対して送信する（ステップＳ３２、Ｓ３３）。

　ワークフロー制御部１５３は、この完了通知を受信すると、ステップＳ３４においてワークフローを再開する。例えばユーザ３００は、完了通知に再開する処理を特定するための情報を含めて送信し、ワークフロー制御部１５３は、完了通知に含まれる情報をもとにワークフローを再開してよい。なお、ワークフロー制御部１５３は、ユーザ３００からの指定を受け付けず、ワークフローに定義された複数の処理のうち、最初に実行される処理からワークフローを再開してもよい。

　図１１は、発生したエラーが既知問題であるが、人の介入が必要な対処処理を要する場合の動作を示すシーケンス図である。この図１１において、ステップＳ４１～Ｓ４６の処理は、図５のステップＳ１１～Ｓ１６と同様の処理である。
　例えばワークフローの実行中にハードウェアの不具合等のエラーが発生した場合、ハードウェアの修理、交換といった人の介入が必要な対処処理が必要となり、対処処理の自動実行はできない。
　そのため、ステップＳ４６では、ワークフロー制御部１５３は、ログ収集部１５１から、既知問題リスト４１１から検索されたエラー解消コードと自動実行フラグ（ｆａｌｓｅ）とを含むログ解析結果を受信する。

　そして、ステップＳ４７において、ワークフロー制御部１５３は、発生したエラーが、エラー解消方法が確立している既知問題であるが、エラーを解消するための対処処理の自動実行が不可能であると判断する。
　すると、ワークフロー制御部１５３は、ステップＳ４８において、ユーザ３００に対してエラーを解消するための対処処理の実行指示を含むエラー対処依頼（アクション通知）をユーザＩ／Ｆ１５４に送信する。ステップＳ４９では、ユーザ３００は、ユーザＩ／Ｆ１５４を介してエラー対処依頼を確認する。

　これにより、ステップＳ５０では、ユーザ３００による対処処理の実行が行われる。対処処理の実行後、ユーザ３００は、ユーザＩ／Ｆ１５４を介して、対処処理の実行が完了したことを示す完了通知をワークフロー制御部１５３に対して送信する（ステップＳ５１、Ｓ５２）。
　ワークフロー制御部１５３は、この完了通知を受信すると、ステップＳ５３においてワークフローを再開する。このとき、ワークフロー制御部１５３は、図９のエラー解消方法リスト４１２を参照して、ログ解析結果に含まれるエラー解消コードに対応する再開ステップ番号を確認し、当該再開ステップ番号の処理からワークフローを再開する。

　このように、エラーを解消するための対処処理の自動実行が不可能である場合には、ユーザ３００による対処処理の実行が完了するまで待機し、ワークフローを再開する。

　以下、ワークフロー制御部１５３がログ解析結果を受信した後の動作について、図１２に示すフローチャートをもとに説明する。この図１２に示す処理は、図５のステップＳ１７およびＳ１８、図１０のステップＳ２７～Ｓ３４、図１１のステップＳ４７～Ｓ５３の処理に対応している。
　まずステップＳ１０１において、ワークフロー制御部１５３は、ログ解析結果を取得し、ステップＳ１０２に移行する。

　ステップＳ１０２では、ワークフロー制御部１５３は、ステップＳ１０１において取得されたログ解析結果に含まれる自動実行フラグをもとに、エラーを解消するための対処処理の自動実行が可能か否かを判定する。具体的には、ワークフロー制御部１５３は、自動実行フラグがｔｒｕｅである場合、自動実行が可能であると判定してステップＳ１０３に移行し、自動実行フラグがｆａｌｓｅである場合、自動実行が不可能であると判定してステップＳ１０４に移行する。

　ステップＳ１０３では、ワークフロー制御部１５３は、ログ解析結果に含まれるエラー解消コードをもとに、図９のエラー解消方法リスト４１２を参照し、エラー解消方法を確認して対処処理を自動実行する。ワークフロー制御部１５３は、対処処理を自動実行した後、ステップＳ１０８に移行する。
　ステップＳ１０４では、ワークフロー制御部１５３は、ログ解析結果をもとに、発生したエラーが既知問題であるか未知問題であるかを判定する。

　そして、ワークフロー制御部１５３は、ステップＳ１０４において、発生したエラーが未知問題であると判定した場合、ステップＳ１０５に移行し、ユーザＩ／Ｆ１５４にユーザ３００に対する２次解析依頼を送信してステップＳ１０７に移行する。
　一方、ワークフロー制御部１５３は、ステップＳ１０４において、発生したエラーが既知問題であると判定した場合、ステップＳ１０６に移行し、ユーザＩ／Ｆ１５４にユーザ３００に対するエラー対処依頼を送信してステップＳ１０７に移行する。

　ステップＳ１０７では、ワークフロー制御部１５３は、ユーザＩ／Ｆ１５４を介してユーザ３００からの完了通知を受信したか否かを判定し、完了通知を受信していない場合にはそのまま待機し、完了通知を受信するとステップＳ１０８に移行する。
　ステップＳ１０８では、ワークフロー制御部１５３は、停止していたワークフローを再開する。

　このワークフロー再開時には、ワークフロー制御部１５３は、発生したエラーに対して実行された対処に応じた処理からワークフローを再開する。
　具体的には、ワークフロー制御部１５３は、実行された対処に応じて、ワークフローに定義された複数の処理のうち、最初に実行される処理、エラーが発生した処理、エラーが発生した処理の次の処理のいずれかの処理からワークフローを再開する。

　例えば、エラーに対する対処処理として、後述するマネジメントノード（管理用サーバ）の筐体を交換する処理を行った場合、パラメータなどの情報が変更され、セットアップの元になるファイルの更新が必要になるため、ワークフローの最初から実行し直す必要がある。そのため、この場合には、ワークフローに定義された複数の処理のうち、最初に実行される処理からワークフローを再開する。

　一方、ネットワークに問題が発生して疎通不可となるエラーが発生し、当該エラーに対する対処を行ってネットワークが疎通された場合には、エラーが発生した処理からワークフローを実行し直せばよい。そのため、この場合には、ワークフローに定義された複数の処理のうち、エラーが発生した処理からワークフローを再開する。

　また、仮想マシンのイメージ（雛形）をオンボーディングする処理でエラーが発生し、当該エラーに対する対処処理として、ユーザがマニュアルでオンボーディングした場合、ユーザによる対処処理によってエラーが発生した処理は実行済みとなる。そのため、この場合には、ワークフローに定義された複数の処理のうち、エラーが発生した処理の次の処理からワークフローを再開する。

　なお、ワークフロー制御部１５３は、エラーが発生した処理がスキップ可能な処理であると判定した場合、エラーに対する対処として何もせず、ワークフローに定義された複数の処理のうち、エラーが発生した処理の次の処理からワークフローを再開してもよい。
　例えば、多数のノードに対して順にインストール等の構築処理を行うワークフローを実行した場合、エラーが発生したノードが、全体の構成に影響を与えないノードである場合には、当該ノードに対する処理をスキップし、先に他のノードに対する処理を進めてもよい。

　図１３は、中央データセンタ（ＣＤＣ）を構成する一仮想化基盤の例である。この図１３に示すように、一仮想化基盤は、マネジメントノード５１０や、コンピュートノード５０１、ストレージノード５０２、コントローラノード５０３等の物理サーバを含んで構成されている。
　ここで、マネジメントノード５１０は、各ノード５０１、５０２、５０３のソフトウェアのインストールやモニタリングの役割、および、各ノード５０１、５０２、５０３に対する操作を実現するためのユーザインタフェースを提供する役割を担う。
　また、コントローラノード５０３は、仮想マシンのライフサイクルに関わるオペレーションを司るものであり、３台で冗長構成を組んでいる。
　なお、エッジデータセンタ（ＧＣ）、地域データセンタ（ＲＤＣ）についても同様に、マネジメントノードや、３冗長構成を有するコントローラノードを含んで構成されている。

　上記のように、マネジメントノード５１０は各ノード５０１、５０２、５０３のソフトウェアのインストーラとしての役割を担う。そのため、マネジメントノード５１０はネットワーク構築に不可欠なノードである。
　また、３冗長構成を有するコントローラノード５０３は、２ノード以上で不具合が発生すると冗長構成を保てない。そのため、コントローラノード５０３は、２ノード以上が正常に動作している必要がある。

　つまり、マネジメントの役割をするノードや全体の構成に影響を与えるノードが故障している場合や、コントローラの役割をするノードが冗長構成を保てない数故障している場合には、ワークフロー全体を停止して筐体交換やハードウェア部品交換等の対処処理を行い、対処後にワークフローを再開する。
　一方、マネジメントの役割をしないノードや全体の構成に影響を与えないノードが故障している場合には、対象のノードを除外して先に他のノード対する処理を進めてよい。この場合、ワークフローの再開により一連のネットワーク構築処理が終了した後、エラーが発生した処理に対する対処として、上記対象ノードの筐体交換やハードウェア部品交換等を行い、エラーが発生した処理を再実行することができる。エラーが発生した処理を再実行するエラー処理再実行部は、ワークフロー制御部１５３が備えてよい。

　なお、マネジメントの役割をしないノードや全体の構成に影響を与えないノードが故障している場合であっても、例えばネットワーク構築のスケジュールに余裕がある場合などには、ワークフローを停止して対象のノードに対するエラー対処を行い、対処後にワークフローを再開することが好ましい。

　以上説明したように、本実施形態におけるネットワーク管理装置であるネットワーク管理部１５０は、複数の処理からなる一連のネットワーク構築処理を定義したワークフローの実行中にエラーが発生した場合、ワークフローの実行を停止し、エラーに対する対処を実行してワークフローを再開する。このとき、ネットワーク管理部１５０は、ワークフローの実行中に、ワークフローの実行に関するログを収集し、エラーが発生してワークフローが停止された場合、収集されたログをもとに、エラーに対する対処を決定して実行する。
　具体的には、ネットワーク管理部１５０は、収集されたログをもとに、ワークフローを実行した際に発生し得るエラーと当該エラーの解消方法とを対応付けた対応情報を参照して、エラーに対する対処を決定して実行する。そして、ネットワーク管理部１５０は、エラーに対する対処が実行されてエラーが解消された場合、ワークフローに定義された複数の処理のうち、上記対処に応じた処理からワークフローを再開する。

　このように、ワークフローの実行中にエラーが発生した場合には、ネットワーク管理部１５０が、ログをもとにエラーに対する対処を決定して実行する。そのため、ネットワーク構築作業を行う作業者が、通知されたアラートやログ等を解析して問題の原因を特定し、対処処理を行う必要が無い。

　テレコムネットワークは大規模であり、また、近年のテレコムネットワークは、マルチレイヤおよびマルチベンダで構築された仮想化ネットワークである。また、テレコムネットワークの構築作業には多数の部門（もしくは人、会社）が関わっている場合がある。そのため、問題の原因特定や解析依頼先の選定を人が行う場合、多大な時間と労力とを要する。
　本実施形態では、上述したように、ネットワーク管理部１５０が、ワークフロー実行中のログをもとにエラーに対する対処を決定して実行することができるので、作業者による作業（労力、時間）を削減することができる。このように、作業者の負担軽減を実現することで、人的コストが削減される。また、問題対処が完了までの時間を短縮することもできる。これにより、その間の構築作業の停止時間を短縮することができ、結果として全体の構築作業時間を短縮することができる。

　さらに、ネットワーク管理部１５０は、ワークフローを再開する際、エラーに対して実行した対処に応じた処理からワークフローを再開する。具体的には、ネットワーク管理部１５０は、エラーに対して実行した対処に応じて、ワークフローに定義された複数の処理のうち、最初に実行される処理、エラーが発生した処理、および、エラーが発生した処理の次の処理のいずれかの処理からワークフローを再開することができる。
　これにより、不必要に処理を重複して実行してしまうことを回避することができ、無駄な実行時間を削減することができる。そのため、全体の構築作業時間を適切に削減することができる。
　なお、どの処理からワークフローを再開するかは、対応情報においてエラーおよびエラー解消方法に対応付けられた再開ステップ番号をもとに判断することができる。これにより、容易かつ適切にワークフローを再開する処理を特定することができる。

　ここで、ネットワーク管理部１５０は、ワークフロー実行中に収集されたログをもとに、エラーとエラー解消方法とを対応付けた対応情報を参照して、ワークフロー実行中に発生したエラーを解消するための対処処理の自動実行が可能か否かを判定することができる。そして、ワークフロー管理部１５０は、対処処理の自動実行が可能であると判定した場合、当該対処処理を自動実行し、対処処理の自動実行が不可能であると判定した場合、エラーを解消するための対処をユーザ３００に指示することができる。

　具体的には、ネットワーク管理部１５０は、対応情報においてエラーに対応付けられたエラー解消方法が、人の介入が不要な対処処理の実行である場合、対処処理の自動実行が可能であると判定し、対処処理を自動実行することができる。
　一方、ネットワーク管理部１５０は、対応情報においてエラーに対応付けられたエラー解消方法が、人の介入が必要な対処処理の実行である場合、対処処理の自動実行が不可能であると判定する。そして、ネットワーク管理部１５０は、エラーを解消するための対処として、ユーザ３００に対処処理の実行を指示することができる。
　また、ネットワーク管理部１５０は、対応情報にエラーに対応付けられたエラー解消方法が存在しない場合には、対処処理の自動実行が不可能であると判定し、エラーを解消するための対処として、ユーザ３００にエラーの解析および当該エラーを解消するための対処処理の実行を指示することができる。

　このように、収集ログをもとに、対応情報を参照して、エラーに対する対処を自動的に決定し、適切に実行することができる。なお、対処処理の自動実行が可能であるか否かは、対応情報においてエラーに対応付けられた自動実行フラグを用いて判定することもできる。これにより、容易かつ適切に対処処理の自動実行が可能か否かを判定し、迅速かつ高精度に対処処理の自動実行またはユーザ３００への通知を行うことができる。
　また、ワークフロー実行中にエラーが発生した場合、エラーが発生した処理に関連するコンポーネントのログを解析するようにすれば、エラーに対する対処の決定を効率良く行うことができる。

　以上のように、本実施形態では、大規模ネットワークにおいて、全体の構築時間を短縮し、エラー対処に要する人的コストを削減することができる。

　本実施形態に係るネットワーク管理装置は、モバイルネットワーク１００のバックホールネットワークやコアネットワーク等を構成するいずれかの汎用サーバに実装されてよい。なお、ネットワーク管理装置は、専用サーバに実装されてもよい。また、ネットワーク管理装置は、単一または複数のコンピュータ上に実装されてもよい。
　ネットワーク管理装置が単一のコンピュータに実装される場合、図１４に示すように、ネットワーク管理装置１は、ＣＰＵ２、ＲＯＭ３、ＲＡＭ４、ＨＤＤ５、入力部（キーボード、ポインティングデバイス等）６、表示部（モニター等）７、通信Ｉ／Ｆ８等を備えることができる。この場合、図３に示すネットワーク管理部１５０の各要素の少なくとも一部の機能は、上記ＣＰＵ２がプログラムを実行することで実現することができる。ただし、図３に示すネットワーク管理部１５０の各要素のうちの少なくとも一部が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、上記ＣＰＵ２の制御に基づいて動作する。

　なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。

　１１…基地局、１２…エッジデータセンタ、１３…地域データセンタ、１４…中央データセンタ、１００…モバイルネットワーク、１１０…ＮＦＶＩ、１２０…ＶＮＦ、１３０…ＭＡＮＯ、１３１…ＮＦＶＯ、１３２…ＶＮＦＭ、１３３…ＶＩＭ、１４０…ＯＳＳ／ＢＳＳ、１５０…ネットワーク管理部、１５０ａ…エラー対処データベース１５１…ログ収集部、１５２…ログ解析部、１５３…ワークフロー制御部、１５３ａ…ワークフロー停止部、１５３ｂ…エラー対処実行部、１５３ｃ…ワークフロー再開部、１５４…ユーザインタフェース

Claims

　複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行した際に発生し得るエラーと、当該エラーの解消方法と、を対応付けた対応情報を記憶する対応情報記憶部と、
　前記ワークフローの実行に関するログを収集するログ収集部と、
　前記ワークフローの実行中にエラーが発生した場合、前記ワークフローの実行を停止するワークフロー停止部と、
　前記ワークフロー停止部による前記ワークフローの停止中に、前記ログ収集部により収集されたログをもとに、前記対応情報記憶部に記憶された対応情報を参照して、前記エラーに対する対処を決定して実行するエラー対処部と、
　前記エラー対処部により実行された対処によって前記エラーが解消された場合、前記複数の処理のうち、前記対処に応じた処理から前記ワークフローを再開するワークフロー再開部と、を備えることを特徴とするネットワーク管理装置。
　前記エラー対処部は、
　前記ログ収集部により収集されたログをもとに、前記対応情報記憶部に記憶された対応情報を参照して、前記ワークフローの実行中に発生したエラーを解消するための対処処理の自動実行が可能か否かを判定し、
　前記対処処理の自動実行が可能であると判定した場合、当該対処処理を自動実行し、
　前記対処処理の自動実行が不可能であると判定した場合、前記発生したエラーを解消するための対処を作業者に指示することを特徴とする請求項１に記載のネットワーク管理装置。
　前記エラー対処部は、
　前記対処処理に人の介入が必要であると判定した場合、前記対処処理の自動実行が不可能であると判定し、
　前記対処として、前記作業者に前記対処処理の実行を指示することを特徴とする請求項２に記載のネットワーク管理装置。
　前記エラー対処部は、
　前記対応情報記憶部に記憶された対応情報に、前記ワークフローの実行中に発生したエラーに対応付けられた前記解消方法が存在しない場合、前記対処処理の自動実行が不可能であると判定し、
　前記対処として、前記作業者に前記エラーの解析および当該エラーを解消するための対処処理の実行を指示することを特徴とする請求項２または３に記載のネットワーク管理装置。
　前記対応情報記憶部は、前記対応情報として、前記ワークフロー再開部により再開する処理を特定するための情報を、前記エラーおよび前記エラーの解消方法に対応付けて記憶していることを特徴とする請求項１から４のいずれか１項に記載のネットワーク管理装置。
　前記ワークフロー再開部は、
　前記対処に応じて、前記複数の処理のうち、最初に実行される処理、前記エラーが発生した処理、および、前記エラーが発生した処理の次の処理のいずれかの処理から前記ワークフローを再開することを特徴とする請求項１から５のいずれか１項に記載のネットワーク管理装置。
　前記エラー対処部は、
　前記ログ収集部により収集されたログのうち、前記エラーが発生した処理に関連するコンポーネントのログを解析することを特徴とする請求項１から６のいずれか１項に記載のネットワーク管理装置。
　前記エラー対処部は、
　前記エラーが発生した処理がスキップ可能な処理であると判定した場合、前記エラーに対する対処として何もせず、
　前記ワークフロー再開部は、前記複数の処理のうち、前記エラーが発生した処理の次の処理から前記ワークフローを再開することを特徴とする請求項１から７のいずれか１項に記載のネットワーク管理装置。
　前記エラー対処部において、前記エラーが発生した処理がスキップ可能な処理であると判定され、前記エラーに対する対処として何もしなかった場合、
　前記ワークフロー再開部により前記ワークフローが再開され、前記一連のネットワーク構築処理が終了した後、前記エラーが発生した処理に対する対処を行い、前記エラーが発生した処理を再実行するエラー処理再実行部をさらに備えることを特徴とする請求項８に記載のネットワーク管理装置。
　ネットワーク管理装置が実行するネットワーク管理方法であって、
　複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行した際に発生し得るエラーと、当該エラーの解消方法と、を対応付けた対応情報を取得するステップと、
　前記ワークフローの実行に関するログを収集するステップと、
　前記ワークフローの実行中にエラーが発生した場合、前記ワークフローの実行を停止するステップと、
　前記ワークフローの停止中に、前記ログをもとに、前記対応情報を参照して、前記エラーに対する対処を決定して実行するステップと、
　実行された前記対処によって前記エラーが解消された場合、前記複数の処理のうち、前記対処に応じた処理から前記ワークフローを再開するステップと、を含むことを特徴とするネットワーク管理方法。
　複数の処理からなる一連のネットワーク構築処理を定義したワークフローを実行した際に発生し得るエラーと、当該エラーの解消方法と、を対応付けた対応情報を記憶する対応情報記憶部と、
　前記ワークフローの実行に関するログを収集するログ収集部と、
　前記ワークフローの実行中にエラーが発生した場合、前記ワークフローの実行を停止するワークフロー停止部と、
　前記ワークフロー停止部による前記ワークフローの停止中に、前記ログ収集部により収集されたログをもとに、前記対応情報記憶部に記憶された対応情報を参照して、前記エラーに対する対処を決定して実行するエラー対処部と、
　前記エラー対処部により実行された対処によって前記エラーが解消された場合、前記複数の処理のうち、前記対処に応じた処理から前記ワークフローを再開するワークフロー再開部と、を備えることを特徴とするネットワークシステム。