JP5890545B1 - ノード装置、障害検出方法及びプログラム - Google Patents

ノード装置、障害検出方法及びプログラム Download PDF

Info

Publication number
JP5890545B1
JP5890545B1 JP2015030973A JP2015030973A JP5890545B1 JP 5890545 B1 JP5890545 B1 JP 5890545B1 JP 2015030973 A JP2015030973 A JP 2015030973A JP 2015030973 A JP2015030973 A JP 2015030973A JP 5890545 B1 JP5890545 B1 JP 5890545B1
Authority
JP
Japan
Prior art keywords
failure
node
slivers
link
occurred
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015030973A
Other languages
English (en)
Other versions
JP2016152608A (ja
Inventor
陽平 片山
陽平 片山
勇貴 南
勇貴 南
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015030973A priority Critical patent/JP5890545B1/ja
Application granted granted Critical
Publication of JP5890545B1 publication Critical patent/JP5890545B1/ja
Publication of JP2016152608A publication Critical patent/JP2016152608A/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】ノードスリバと、リンクスリバとによって構成される仮想ネットワークにおいて、ノードスリバ間の通信における障害の検知に要する時間を短縮することを目的とする。【解決手段】ノード装置上で動作するノードスリバと、リンク装置上で動作するリンクスリバとによって構成される仮想ネットワークにおけるノード装置は、ノードスリバ間で通信するときの仮想ポートに設けられた、障害を記録するための障害記録部と、ノードスリバ間の通信における障害を検出し、障害が検出された場合、障害が発生したことを示す識別情報を前記障害記録部に書き込む監視部とを有する。【選択図】図2

Description

本発明は、ノード装置、障害検出方法及びプログラムに関する。
ネットワークサービスやアプリケーションの利用拡大により、ネットワークの利用形態が拡大している。このため、品質、トラヒック、セキュリティ等が異なるサービスを共通のインフラストラクチャで提供できるネットワーク仮想化が注目されている(非特許文献1、2参照)。
ネットワーク仮想化では、リンク資源だけでなく、ノード上の計算資源やストレージ資源も含むインフラストラクチャ全体の資源が仮想化される。例えば、ルータやスイッチは、CPU(Central Processing Unit)やメモリを計算資源やストレージ資源として保持する一種の計算機とみなされる。このような資源を「スライス」と呼ばれる論理的に生成される仮想ネットワークに分離し、ユーザ又はアプリケーションは、ネットワークインフラストラクチャを直接利用するのではなく、スライスを利用する形態をとる。
スライスは、リンクスリバ(仮想リンク)、ノードスリバ(仮想ノード)及びインタフェースの集合体として考えられる。リンクスリバを生成管理するリダイレクタは、一般的にルータやスイッチのようなネットワーク機器により構成され、ノードスリバを生成管理するプログラマは、一般的にパーソナルコンピュータやワークステーションのようなコンピュータ機器により構成される。
山本猛仁、滝澤允、高橋紀之、中尾彰宏、"スライス提供を考慮した仮想化ネットワークの管理モデル"、電子情報通信学会ソサイエティ大会、2010 中尾彰宏、"新世代ネットワーク構想におけるネットワーク仮想化"、電子情報通信学会誌、Vol.94、No.5、pp.385−390、2011
非特許文献1及び2の技術は、スライスのリンクリソースであるリンクスリバに障害が生じた際に、ノードリソースであるノードスリバ上で動作するソフトウェアプログラムがこれを短時間で検知することができない。
例えば、ノードスリバ上で動作するソフトウェアプログラムは、通信のタイムアウトなど間接的な方式で障害を検出することができるが、誤検出や検出に時間がかかる等の問題がある。
本発明は、ノードスリバと、リンクスリバとによって構成される仮想ネットワークにおいて、ノードスリバ間の通信における障害の検知に要する時間を短縮することを目的とする。
本発明の一形態に係るノード装置は、
ノード装置上で動作するノードスリバと、リンク装置上で動作するリンクスリバとによって構成される仮想ネットワークにおけるノード装置であって、
ノードスリバ間で通信するときの仮想ポートに設けられた、障害を記録するための障害記録部と、
他のリンク装置または他のノード装置、もしくは該他のリンク装置または該他のノード装置に直接接続された装置から、障害が発生した旨の通知を受信することによって、ノードスリバ間の通信における障害を検出し、障害が検出された場合、障害が発生したことを示す識別情報を前記障害記録部に書き込む監視部と、
を有することを特徴とする。
また、本発明の一形態に係る障害検知方法は、
ノード装置上で動作するノードスリバと、リンク装置上で動作するリンクスリバとによって構成される仮想ネットワークにおける障害検出方法であって、
ノードスリバ間で通信するときの仮想ポートに、障害を記録するための障害記録部を設けるステップと、
他のリンク装置または他のノード装置、もしくは該他のリンク装置または該他のノード装置に直接接続された装置から、障害が発生した旨の通知を受信することによって、ノードスリバ間の通信における障害を検出し、障害が検出された場合、障害が発生したことを示す識別情報を前記障害記録部に書き込むステップと、
を有することを特徴とする。
また、本発明の一形態に係るプログラムは、
コンピュータを上記のノード装置を構成する各手段として機能させることを特徴とする。
本発明によれば、ノードスリバと、リンクスリバとによって構成される仮想ネットワークにおいて、ノードスリバ間の通信における障害の検知に要する時間を短縮することが可能になる。
仮想ネットワークにおけるスライスの概念図 本発明の実施例に係るネットワークシステムの構成図 本発明の実施例に係るネットワークシステムにおいて障害を検出する方法を示すフローチャート
以下、図面を参照して本発明の実施例について説明する。
本発明の実施例では、仮想ネットワークにおける障害検知について説明する。図1に、仮想ネットワークにおけるスライスの概念図を示す。
スライスは、ネットワークインフラストラクチャ上に論理的に生成される仮想ネットワークである。スライスは、仮想リンクであるリンクスリバと、仮想ノードであるノードスリバとによって構成される。また、ノードスリバとリンクスリバとはインタフェースによって接続される。
リンクスリバは、一般的にルータやスイッチのようなリンク装置上で動作し、ノードスリバは、一般的にパーソナルコンピュータやワークステーションのようなノード装置上で動作する。リンクスリバを実現する要素技術はリダイレクタ(R)と呼ばれ、ノードスリバを実現する要素技術はプログラマ(P)と呼ばれる。
ネットワークにおいて障害が発生した場合、ルータやスイッチのような物理的なノード装置で障害を検知することができる。一方、ノードスリバと、リンクスリバとによって構成される仮想ネットワークにおいて、ノードスリバ間の通信に障害が発生した場合、物理的なノード装置における障害の検知では、どのスライスに障害が発生しているのかを判断することができない。
このため、本発明の実施例では、ノードスリバ間で通信するときの仮想ポートに、障害を記録するための障害記録部を設け、ノードスリバ間の通信における障害が検出された場合、障害が発生したことを示す識別情報を障害記録部に書き込む。そして、ノードスリバ上で動作するソフトウェアプログラムが、障害記録部に書き込まれた識別情報により、ノードスリバ間の障害を短時間で検知可能にする。
図2は、本発明の実施例に係るネットワークシステムの構成図である。本発明の実施例に係るネットワークシステムは、物理的なネットワークインフラストラクチャとして、物理的なノード装置(物理ノード装置#1及び#2)100と、物理的なリンク装置200とによって構成される。実際のネットワークシステムには、複数のノード装置100と複数のリンク装置200が含まれるが、以下の説明では、1つのノード装置(物理ノード装置#1)100及び1つのリンク装置200に着目して説明する。
ノード装置100及びリンク装置200は、CPU(Central Processing Unit)やメモリを計算資源やストレージ資源として保持する一種の計算機としてみなされてもよい。ノード装置100及びリンク装置200の機能及び処理は、メモリ等に格納されているデータやプログラムをCPUが実行することによって実現される。
ノード装置100及びリンク装置200は、それぞれ物理ポートを介して接続されており、それぞれの物理ポートにおける障害を監視する監視部120及び220を有する。
一方、仮想ネットワークであるスライスは、ノード装置100上で動作するノードスリバ110と、リンク装置200上で動作するリンクスリバ210によって構成される。1つのスライスは、物理ノード装置#1及び#2上で動作するノードスリバ110と、物理リンク装置上で動作するリンクスリバ210との組み合わせによって構成される。複数のスライスが構成される場合、複数のノードスリバ及び複数のリンクスリバが生成される。
ノードスリバ110は、ノードスリバ上で動作してスライスにおける通信サービスを提供するためのソフトウェアプログラム111と、ノードスリバ間で通信するための仮想的なネットワークインタフェースである仮想ポート112とを含む。仮想ポート112は、ノード装置100の1つの物理ポートに関連付けられる。
本発明の実施例では、仮想ポート112に、障害を記録するための障害記録部113を設ける。監視部120は、ノードスリバ間の通信における障害を検出し、障害が検出された場合、障害が発生したことを示す識別情報を障害記録部113に書き込む。
このようにすることで、ソフトウェアプログラム111は、障害が発生したことを示す識別情報が障害記録部113に書き込まれたことを、例えばCPU割り込みによって短時間で検知することが可能になる。なお、障害が発生したことを示す識別情報が障害記録部113に書き込まれたことを検知するための障害検知部(図示せず)は、ソフトウェアプログラム111内に存在してもよく、ソフトウェアプログラム111とは別の機能部として設けられてもよい。
図3を参照して、より具体的な障害検出方法について説明する。図3は、本発明の実施例に係るネットワークシステムにおいて障害を検出する方法を示すフローチャートである。
まず、スライスの生成に伴い、仮想ポート112に、障害を記録するための障害記録部113が設けられる(ステップS101)。
次に、監視部120は、ノードスリバ間の通信における障害を検出する(ステップS102)。例えば、監視部120は、スライス毎に送信される所定のパケットを監視し、所定のパケットが予め指定した時間内に受信されない場合、ノードスリバ間の通信に障害が発生したことを検出する。より具体的には、ノード装置100の監視部120とリンク装置200の監視部220のそれぞれは、スライス毎にOAM(Operations, Administration, Maintenance)信号として、例えば、CC(Continuity check)パケットを送受信する。CCパケットは、例えば、3msec間隔で送信される。そして、物理ノード装置100の監視部120は、CCパケットが予め指定した時間内(例えば最後に到着したCCパケットから9msecの時間内等)に到着しない場合、ノードスリバ間の通信に障害が発生したことを検出する。
例えば、監視部120は、Ethernet(登録商標)デバイス等の既存の故障検出の仕組みによって物理ポートの障害を監視してもよい。また、例えば、監視部120は、他のリンク装置200の監視部220や他のノード装置の監視部から障害が発生したという通知を受信することにより、物理ポートの障害を監視してもよい。
監視部120は、ノードスリバ間の通信に障害が発生したことを検出した場合、障害が発生したことを示す識別情報を障害記録部113に書き込む(ステップS103)。例えば、監視部120は、スライス毎に送信される所定のパケットが予め指定した時間内に受信されないことにより障害が発生したことを検出した場合、該当するスライスに対応する仮想ポートの障害記録部113に、障害が発生したことを示す識別情報を書き込む。また、監視部120は、物理ポートの障害を検出した場合、障害が発生した物理ポートに対応する仮想ポートの障害記録部113に、障害が発生したことを示す識別情報を書き込む。例えば、障害記録部113の所定のビットを0から1に書き換えてもよい。
そして、ソフトウェアプログラム111の障害検知部又はソフトウェアプログラム111とは別の障害検知部は、障害が発生したことを示す識別情報が障害記録部113に書き込まれたことを検知する(ステップS104)。例えば、仮想ポートの障害記録部113に障害が発生したことを示す識別情報が書き込まれたことを、CPU割り込み等によって短時間で検知する。
以上のように、本発明の実施例によれば、ノードスリバと、リンクスリバとによって構成される仮想ネットワークにおいて、ノードスリバ間の通信における障害の検知に要する時間を短縮することが可能になる。
従来は、ノードスリバ間の通信に障害が発生したことをノードスリバ上で動作するソフトウェアプログラムが検知する情報伝達路がなく、ソフトウェアプログラムは、例えば、ソフトウェアプログラムの通信のタイムアウトなど間接的な方式で障害を検出していたため、誤検出や検出に時間がかかるなど問題がある。しかし、本発明の実施例では、故障が発生した装置や故障が発生した装置に直接接続された装置が検出した結果をソフトウェアプログラムがCPU割り込みなどによって短時間に検知可能な仮想ポートの障害記録部に書き込むため、誤検出なく従来に比べて短時間でソフトウェアプログラムがノードスリバ間の通信に障害が発生したことを検知できる。
例えば、CCパケットによって9msec程度で障害が検出できる場合には、障害が発生したことを通知するメッセージの到着までにかかる時間を合わせても数十msec以内でソフトウェアプログラム111が障害を検知できるようになる。
例えば、既存の専用線サービスのサービス品質保証制度においては、中継回線が異経路冗長構成をとり、稼動系に障害が発生した際に待機系への切替時間として50msec以内であることを保証するものがあるが、そのような切替時間もノードスリバ上で動作するソフトウェアプログラムによって実現可能である。
説明の便宜上、本発明の実施例に係るノード装置及びリンク装置は機能的なブロック図を用いて説明しているが、本発明の実施例に係るノード装置及びリンク装置は、ハードウェア、ソフトウェア又はそれらの組み合わせで実現されてもよい。例えば、本発明の実施例は、コンピュータに対して本発明の実施例に係るノード装置及びリンク装置の各機能を実現させるプログラム、コンピュータに対して本発明の実施例に係る方法の各手順を実行させるプログラム等により、実現されてもよい。また、各機能部が必要に応じて組み合わせて使用されてもよい。また、本発明の実施例に係る方法は、実施例に示す順序と異なる順序で実施されてもよい。
以上、ノードスリバと、リンクスリバとによって構成される仮想ネットワークにおいて、ノードスリバ間の通信における障害の検知に要する時間を短縮するための手法について説明したが、本発明は、上記の実施例に限定されることなく、特許請求の範囲内において、種々の変更・応用が可能である。
100 ノード装置
110 ノードスリバ
111 ソフトウェアプログラム
112 仮想ポート
113 障害記録部
120 監視部
200 リンク装置
210 リンクスリバ
220 監視部

Claims (5)

  1. ノード装置上で動作するノードスリバと、リンク装置上で動作するリンクスリバとによって構成される仮想ネットワークにおけるノード装置であって、
    ノードスリバ間で通信するときの仮想ポートに設けられた、障害を記録するための障害記録部と、
    他のリンク装置または他のノード装置、もしくは該他のリンク装置または該他のノード装置に直接接続された装置から、障害が発生した旨の通知を受信することによって、ノードスリバ間の通信における障害を検出し、障害が検出された場合、障害が発生したことを示す識別情報を前記障害記録部に書き込む監視部と、
    を有するノード装置。
  2. ノードスリバ上で動作し、障害が発生したことを示す識別情報が前記障害記録部に書き込まれたことを検知する障害検知部を更に有する、請求項1に記載のノード装置。
  3. 前記監視部は、物理ポートの障害を監視し、障害が発生した物理ポートに対応する仮想ポートの前記障害記録部に、障害が発生したことを示す識別情報を書き込む、請求項1又は2に記載のノード装置。
  4. ノード装置上で動作するノードスリバと、リンク装置上で動作するリンクスリバとによって構成される仮想ネットワークにおける障害検出方法であって、
    ノードスリバ間で通信するときの仮想ポートに、障害を記録するための障害記録部を設けるステップと、
    他のリンク装置または他のノード装置、もしくは該他のリンク装置または該他のノード装置に直接接続された装置から、障害が発生した旨の通知を受信することによって、ノードスリバ間の通信における障害を検出し、障害が検出された場合、障害が発生したことを示す識別情報を前記障害記録部に書き込むステップと、
    を有する障害検出方法。
  5. コンピュータを請求項1乃至のうちいずれか1項に記載のノード装置を構成する各手段として機能させるプログラム。
JP2015030973A 2015-02-19 2015-02-19 ノード装置、障害検出方法及びプログラム Active JP5890545B1 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015030973A JP5890545B1 (ja) 2015-02-19 2015-02-19 ノード装置、障害検出方法及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015030973A JP5890545B1 (ja) 2015-02-19 2015-02-19 ノード装置、障害検出方法及びプログラム

Publications (2)

Publication Number Publication Date
JP5890545B1 true JP5890545B1 (ja) 2016-03-22
JP2016152608A JP2016152608A (ja) 2016-08-22

Family

ID=55530530

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015030973A Active JP5890545B1 (ja) 2015-02-19 2015-02-19 ノード装置、障害検出方法及びプログラム

Country Status (1)

Country Link
JP (1) JP5890545B1 (ja)

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009105690A (ja) * 2007-10-24 2009-05-14 Alaxala Networks Corp レイヤ2冗長プロトコル相互接続装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009105690A (ja) * 2007-10-24 2009-05-14 Alaxala Networks Corp レイヤ2冗長プロトコル相互接続装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
JPN6015046719; 小倉 毅 他: '複数の仮想ネットワークを利用した輻輳回避手法に関する検討' 電子情報通信学会技術研究報告 第114巻 第28号, 20140508, 第51〜56頁 *
JPN6015046721; 中尾 彰宏: '情報爆発時代に向けた新たな通信技術 -限界打破への挑戦- 新世代ネットワーク構想におけるネットワーク' 電子情報通信学会誌 第94巻 第5号, 20110501, 第385〜390頁 *

Also Published As

Publication number Publication date
JP2016152608A (ja) 2016-08-22

Similar Documents

Publication Publication Date Title
Yamato et al. Fast and reliable restoration method of virtual resources on OpenStack
US10181987B2 (en) High availability of collectors of traffic reported by network sensors
Bailis et al. The network is reliable: An informal survey of real-world communications failures
JP6466003B2 (ja) Vnfフェイルオーバの方法及び装置
US10455412B2 (en) Method, apparatus, and system for migrating virtual network function instance
KR20200011956A (ko) Ipsec 지오그래픽 리던던시에 대한 분리 제어 및 데이터 평면 동기화
CN109960634A (zh) 一种应用程序监控方法、装置及***
US20190155632A1 (en) Self-managed virtual networks and services
CN104158707A (zh) 一种检测并处理集群脑裂的方法和装置
US10459922B2 (en) Unique identification generation for records in a data streaming processing system
WO2020121293A1 (en) Orchestration of activities of entities operating in a network cloud
JP6604336B2 (ja) 情報処理装置、情報処理方法、及び、プログラム
JP4964666B2 (ja) 冗長化された通信経路を切り替える計算機、プログラム及び方法
JP2010239593A (ja) パケット処理装置およびインタフェースユニット
JP6740543B2 (ja) 通信装置、システム、ロールバック方法及びプログラム
KR20160028247A (ko) 클라우드 서버 관리 방법, 이를 수행하는 클라우드 서버 관리 장치 및 클라우드 서비스 관리 시스템
JP5890545B1 (ja) ノード装置、障害検出方法及びプログラム
US20230056683A1 (en) Quantum Key Distribution Network Security Survivability
Lee et al. Fault localization in NFV framework
Muthumanikandan et al. Switch failure detection in software-defined networks
Menaceur et al. Fault Tolerance and Failure Recovery Techniques in Software-Defined Networking: A Comprehensive Approach
US10237122B2 (en) Methods, systems, and computer readable media for providing high availability support at a bypass switch
CN115484208A (zh) 一种基于云安全资源池的分布式引流***和方法
Akanbi et al. Fast fail-over technique for distributed controller architecture in software-defined networks
JP5653947B2 (ja) ネットワーク管理システム、ネットワーク管理装置、ネットワーク管理方法及びネットワーク管理プログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160216

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160218

R150 Certificate of patent or registration of utility model

Ref document number: 5890545

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150