JP5569984B2 - Network failure handling method, network and host - Google Patents

Network failure handling method, network and host Download PDF

Info

Publication number
JP5569984B2
JP5569984B2 JP2012024864A JP2012024864A JP5569984B2 JP 5569984 B2 JP5569984 B2 JP 5569984B2 JP 2012024864 A JP2012024864 A JP 2012024864A JP 2012024864 A JP2012024864 A JP 2012024864A JP 5569984 B2 JP5569984 B2 JP 5569984B2
Authority
JP
Japan
Prior art keywords
adapter
failure
host
switch
network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012024864A
Other languages
Japanese (ja)
Other versions
JP2013162446A (en
Inventor
達哉 坂本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Engineering Ltd
Original Assignee
NEC Engineering Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Engineering Ltd filed Critical NEC Engineering Ltd
Priority to JP2012024864A priority Critical patent/JP5569984B2/en
Publication of JP2013162446A publication Critical patent/JP2013162446A/en
Application granted granted Critical
Publication of JP5569984B2 publication Critical patent/JP5569984B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ファブリックスイッチが搭載されたパケット通信装置内での、ネットワーク障害対処方法、ネットワーク及びホストに関する。   The present invention relates to a network failure handling method, a network, and a host in a packet communication device equipped with a fabric switch.

近年、無線基地局装置では、装置内の通信データ量が飛躍的に増加している。また、通信データ量の増加に伴い無線基地局装置に格納されるカード間の通信速度が上昇している。よって、無線基地局装置内におけるカード間の通信障害を早期に検出し、その影響を最小限にする必要性が益々高まっている。   In recent years, in wireless base station devices, the amount of communication data in the devices has increased dramatically. Further, the communication speed between cards stored in the radio base station apparatus is increasing with an increase in the amount of communication data. Therefore, there is an increasing need to detect a communication failure between cards in the radio base station apparatus at an early stage and minimize the influence thereof.

今回の説明にあたり、まず、PICMG(PCI Industrial Computer Manufacturers Group)が規定した規格であり、コア・アプリケーション向け標準規格であるAdvancedTCA(Advanced Telecommunications Computing Architecture)と、MicroTCA(Micro Telecommunications Computing Architecture)の関係について説明する。   In this explanation, we first describe the relationship between Advanced Telecommunication Computing Architecture (Advanced TCA), which is a standard specified by PCI Industrial Computer Manufacturers Group (PICMG), and the standard for core applications, and Micro Telecommunications Computing Architecture (Micro TCA). To do.

通常は、AdvancedMC(以下、「AMCカード」と呼ぶ。)が、AdvancedTCAに準拠したボード上にメザニン・カードとして接続される。   Normally, AdvancedMC (hereinafter referred to as “AMC card”) is connected as a mezzanine card on a board compliant with AdvancedTCA.

もっとも、MicroTCAでは、AdvancedTCAに準拠していないボードであっても、AdvancedTCAの機能や特性を実現するためのアーキテクチャー規格を提供している。   However, MicroTCA provides an architecture standard for realizing the functions and characteristics of AdvancedTCA even if the board is not compliant with AdvancedTCA.

具体的には、MicroTCAを利用すれば、シェルフ内にAdvancedTCAに準拠したボードが無い場合であっても、AMCカードを直接バックプレーンと接続して、利用することができる。この場合、AdvancedTCAの機能や特性提供しながらも、物理的なサイズの小型化と導入コスト抑制を実現することができる。このような背景から、MicroTCAは、通信事業者向けの装置で多く使用されている。   Specifically, if the MicroTCA is used, the AMC card can be directly connected to the backplane and used even if there is no board compliant with the AdvancedTCA in the shelf. In this case, it is possible to reduce the physical size and reduce the introduction cost while providing the functions and characteristics of the AdvancedTCA. Against this background, MicroTCA is often used in devices for communication carriers.

ここで、MicroTCAに準拠したシェルフ内に接続される複数のAMCカードには、I2C(Inter-Integrated Circuit)ベースのIPMB(Intelligent Peripheral Management Bus)を活用した、IPMI(Intelligent Peripheral Management Interface)仕様のMMC(Module Management Controller)の機能が搭載されている。   Here, IPMC (Intelligent Peripheral Management Interface) specification MMC using IPMB (Intelligent Peripheral Management Bus) based on I2C (Inter-Integrated Circuit) is used for a plurality of AMC cards connected in a MicroTCA-compliant shelf. (Module Management Controller) function is installed.

MMCは、各AMCカードでの障害発生の有無を監視している。そしてMMCは、障害発生を検知した場合に、MCMC(Micro TCA Carrier Management Controller)に対して障害情報をI2Cで通知する。障害情報を受け取ったMCMCは、I2C経由でホストAMCカードへ障害内容を通知する。ここで、I2Cの通信レートとしては、100kbps、400kbps及び3.4Mbpsの3つが定義されている。   The MMC monitors whether or not a failure has occurred in each AMC card. When the MMC detects the occurrence of a failure, the MMC notifies the failure information to the MCMC (Micro TCA Carrier Management Controller) by I2C. The MCMC that has received the failure information notifies the host AMC card of the content of the failure via I2C. Here, three communication rates of 100 kbps, 400 kbps, and 3.4 Mbps are defined as I2C communication rates.

一方、各AMCカード間の主要データ通信インターフェースとしては高速シリアルインターフェースであるsRIO(Serial Rapid IO)が広く使用されている。「Rapid IO」は、Rapid IO Trade Associationの登録商標である。なお、sRIOに関しては非特許文献1に詳細な説明がある。   On the other hand, sRIO (Serial Rapid IO), which is a high-speed serial interface, is widely used as a main data communication interface between AMC cards. “Rapid IO” is a registered trademark of Rapid IO Trade Association. Note that sRIO is described in detail in Non-Patent Document 1.

sRIOは、AMCカード内部の各種デバイスとファブリックスイッチをシリアル回線で接続し、各デバイス間で最大10Gbpsの高速通信を可能にするための規格である。また、無線基地局装置で使用している各種デバイスとして、sRIOの規格に対応したものが実用化されている。   sRIO is a standard for connecting various devices in an AMC card and a fabric switch through a serial line, and enabling high-speed communication of up to 10 Gbps between the devices. As various devices used in the radio base station apparatus, devices corresponding to the sRIO standard have been put into practical use.

このようなMicroTCA規格に準拠したネットワークシステムの動作の一例について図8を参照して説明する。   An example of the operation of a network system compliant with such a MicroTCA standard will be described with reference to FIG.

本例におけるMicroTCAネットワークは、ホストAMC60、ファブリックスイッチ70、複数のアダプタAMC80及びMCMC90の機能ブロックを含む。   The MicroTCA network in this example includes functional blocks of a host AMC 60, a fabric switch 70, a plurality of adapters AMC 80, and MCMC 90.

ホストAMC60は、ネットワークを全体を管理する。ファブリックスイッチ70は、パケットを分配する。各アダプタAMC80には、sRIOの規格に対応したデバイスがAMCカードとして接続される。また、MCMC90は、ネットワーク全体の保守監視機能をまとめる。次に、個々の機能ブロックに関してより詳細に説明する。   The host AMC 60 manages the entire network. The fabric switch 70 distributes the packet. Devices corresponding to the sRIO standard are connected to each adapter AMC 80 as an AMC card. The MCMC 90 also collects maintenance monitoring functions for the entire network. Next, each functional block will be described in more detail.

ホストAMC60は、CPU61、MMC62、TXBFR63及びRXBFR64を含む。   The host AMC 60 includes a CPU 61, an MMC 62, a TXBFR 63, and an RXBFR 64.

CPU61は、ネットワーク全体を制御する演算処理装置である。MMC62は、ネットワークの保守監視機能を持つ。TXBFR63は、パケットの生成機能と送信機能を持つ送信バッファである。RXBFR64は、パケットの受信機能を持つ受信バッファである。   The CPU 61 is an arithmetic processing device that controls the entire network. The MMC 62 has a network maintenance monitoring function. The TXBFR 63 is a transmission buffer having a packet generation function and a transmission function. RXBFR64 is a reception buffer having a packet reception function.

また、ファブリックスイッチ70は、RXBFR71及びRXBFR74−1〜RXBFR74−n並びにTXBFR72及びTXBFR73−1〜XBFR73−nを含む。   The fabric switch 70 includes RXBFR71 and RXBFR74-1 to RXBFR74-n, TXBFR72 and TXBFR73-1 to XBFR73-n.

RXBFR71及びRXBFR74−1〜RXBFR74−nは、送信バッファである。   RXBFR71 and RXBFR74-1 to RXBFR74-n are transmission buffers.

一方、TXBFR72及びTXBFR73−1〜XBFR73−nは受信バッファである。これら受信バッファ及び送信バッファは、ホストAMC60と、複数のアダプタAMC80(アダプタAMC80−1〜アダプタAMC80−n)との間でパケットを分配する。   On the other hand, TXBFR72 and TXBFR73-1 to XBFR73-n are reception buffers. These reception buffers and transmission buffers distribute packets between the host AMC 60 and a plurality of adapters AMC 80 (adapter AMC 80-1 to adapter AMC 80-n).

複数のアダプタAMC80は、それぞれが、MMC81、RXBFR82及びTXBFR83を含む。   Each of the plurality of adapters AMC80 includes MMC81, RXBFR82, and TXBFR83.

MMC81は、ネットワークの保守監視機能を持つ。RXBFR82は、パケットの受信機能を持つ受信バッファである。TXBFR83は、パケットの生成機能と送信機能を持つ送信バッファである。なお、今回の例では2種類のデータが送受信される。1つはMMC81、MCMC90及びMMC62間で、I2Cにより送受信される障害通知用のデータである。また、もう1つは、ファブリックスイッチ70を介してホストAMC60とアダプタAMC80の間でsRIOにより送受信されるデータである。以下の説明では、前者を「I2C障害通知」と呼び、後者を「主要データ」と呼ぶことにより区別する。   The MMC 81 has a network maintenance monitoring function. The RXBFR 82 is a reception buffer having a packet reception function. The TXBFR 83 is a transmission buffer having a packet generation function and a transmission function. In this example, two types of data are transmitted and received. One is failure notification data transmitted / received between the MMC 81, MCMC 90, and MMC 62 by I2C. The other is data transmitted and received by sRIO between the host AMC 60 and the adapter AMC 80 via the fabric switch 70. In the following description, the former is called “I2C failure notification” and the latter is called “main data”.

まず、ネットワーク上での主要データのやり取りについて説明する。ネットワークシステム上でのホストAMC60からアダプタAMC80への主要データは、ホストAMC60のCPU11で生成され、TXBFR63に送られる。   First, the exchange of main data on the network will be described. Main data from the host AMC 60 to the adapter AMC 80 on the network system is generated by the CPU 11 of the host AMC 60 and sent to the TXBFR 63.

そして、主要データは、パケット単位に分割されてファブリックスイッチ70のRXBFR71に送信される。   Then, the main data is divided into packets and transmitted to the RXBFR 71 of the fabric switch 70.

ファブリックスイッチ70内では複数のアダプタAMC80のそれぞれ宛毎にパケットが分配され、個々のTXBFR73(TXBFR73−1〜TXBFR73−1n)に蓄積される。   Within the fabric switch 70, packets are distributed to each of the plurality of adapters AMCs 80 and stored in individual TXBFR 73 (TXBFR 73-1 to TXBFR 73-1n).

パケットは蓄積された順番に従って、アダプタAMC80のRXBFR82へ送られる。そして、パケットはアダプタAMC80に接続されたデバイスであるAMCカード内部にて処理される。   Packets are sent to RXBFR 82 of adapter AMC 80 in the order in which they are stored. The packet is processed inside the AMC card which is a device connected to the adapter AMC 80.

一方、アダプタAMC80からホストAMC60への主要データは、アダプタAMC80のTXBFR83でパケット化される。そしてパケットは、ファブリックスイッチ70の個々のRXBFR74(RXBFR74−1〜RXBFR74−n)に送信されて蓄積される。   On the other hand, main data from the adapter AMC 80 to the host AMC 60 is packetized by the TXBFR 83 of the adapter AMC 80. Then, the packet is transmitted to each RXBFR 74 (RXBFR 74-1 to RXBFR 74-n) of the fabric switch 70 and accumulated.

蓄積された個々のアダプタAMC80からのパケットはTXBFR72でまとめられてホストAMC60のRXBFR64へ送信される。その後、パケットはホストAMC60のCPU61にて処理される。   The accumulated packets from the individual adapters AMC 80 are collected by the TXBFR 72 and transmitted to the RXBFR 64 of the host AMC 60. Thereafter, the packet is processed by the CPU 61 of the host AMC 60.

以上が、主要データに関しての説明である。続いてI2C障害通知の送受信に関して説明をする。   This completes the explanation of the main data. Next, transmission / reception of an I2C failure notification will be described.

ネットワークシステム上の保守監視においては、個々のアダプタAMC80に含まれるMMC81(MMC81−1〜MMC81−n)にて状態監視を行う。そして、アダプタAMC80が障害の発生を検知した場合は、MMC81からI2CにてMCMC90へ報告を行う。   In maintenance monitoring on the network system, state monitoring is performed by the MMC 81 (MMC 81-1 to MMC 81-n) included in each adapter AMC 80. When the adapter AMC 80 detects the occurrence of a failure, the MMC 81 reports to the MCMC 90 through I2C.

報告を受けたMCMC90は、ネットワーク全体の状態通知として、障害が発生したという情報をI2C障害通知としてホストAMC60のMMC62へと送る。   The MCMC 90 that has received the report sends information indicating that a failure has occurred to the MMC 62 of the host AMC 60 as an I2C failure notification as a status notification of the entire network.

送られてきた、I2C障害通知はMMC62を介してCPU61へと送られる。これにより、CPU61は障害の発生を認識できる。   The sent I2C failure notification is sent to the CPU 61 via the MMC 62. Thereby, the CPU 61 can recognize the occurrence of the failure.

なお、上述したファブリックスイッチの動作を実現するための技術の一例が特許文献1に記載されている。特許文献1に記載のパケットスイッチング集積回路チップは、パケット、例えば、Rapid IO(登録商標)に準拠したパケットを複数の外部ソースから受信し、受信パケット内のデータを複数の外部受信装置に選択的に転送するように構成されている。さらにパケットスイッチング集積回路チップは、受信パケット内の宛先アドレスに基づいて、受信パケットを管理するように構成することができる。   An example of a technique for realizing the operation of the fabric switch described above is described in Patent Document 1. The packet switching integrated circuit chip described in Patent Document 1 receives a packet, for example, a packet conforming to Rapid IO (registered trademark) from a plurality of external sources, and selectively receives data in the received packet to a plurality of external receiving devices. Configured to forward to. Further, the packet switching integrated circuit chip can be configured to manage the received packet based on the destination address in the received packet.

特表2008−539613号公報Special table 2008-539613 gazette

「Rapid IO Interconnect Specification Rev1.3」[online]平成23年12月8日検索インターネット〈http://www.rapidio.org〉“Rapid IO Interconnect Specification Rev1.3” [online] December 8, 2011 Search Internet <http://www.rapidio.org>

しかしながら、上述した一般的なMicroTCAネットワークには、以下のような複数の問題点が存在した。   However, the above-described general MicroTCA network has the following problems.

第1の問題点は、一般的なMicroTCAの規格上、個々のアダプタAMC81(MMC81−1〜MMC81−n)の障害通知データの送受信にI2Cを使用しているため、障害が発生したことがホストAMC60に通知されるまでに時間を要することである。また、このように時間を要することからバッファにパケットが蓄積し続け、効率的なパケット送信ができなくなることである。   The first problem is that the I2C is used for transmission / reception of failure notification data of each adapter AMC81 (MMC81-1 to MMC81-n) according to the general MicroTCA standard. It takes time to notify the AMC 60. In addition, since time is required in this way, packets continue to be accumulated in the buffer, and efficient packet transmission cannot be performed.

この現象についての具体例を、図9及び図10を参照して説明する。今回の説明においては、ファブリックスイッチ70とアダプタAMC80−1間のsRIO経路にて障害が発生したものとする。   A specific example of this phenomenon will be described with reference to FIGS. In this description, it is assumed that a failure has occurred in the sRIO path between the fabric switch 70 and the adapter AMC 80-1.

sRIO経路にて障害が発生した場合、アダプタAMC80−1のMMC81−1にてsRIO経路障害が検出される。そして、MMC81−1にてI2C障害通知が生成され、I2CにてMCMC90へ通知される。   When a failure occurs in the sRIO path, the MMC 81-1 of the adapter AMC 80-1 detects the sRIO path failure. Then, the MMC 81-1 generates an I2C failure notification and notifies the MCMC 90 through I2C.

MCMC90で受信されたI2C障害通知は、ホストAMC60のMMC62を介してホストAMC60内のCPU61に通知される。   The I2C failure notification received by the MCMC 90 is notified to the CPU 61 in the host AMC 60 via the MMC 62 of the host AMC 60.

しかし、上述したようにI2Cの通信レートは、最大でも3.4Mbpsであり、sRIOと比較すると低速である。よって、図10に表すようにホストAMC60のCPU11が障害情報を検知するまでには数十[ms]の時間を要する。   However, as described above, the maximum communication rate of I2C is 3.4 Mbps, which is lower than that of sRIO. Therefore, as shown in FIG. 10, it takes several tens [ms] until the CPU 11 of the host AMC 60 detects the failure information.

一方、ホストAMC60と複数のアダプタAMC80(アダプタAMC80−1〜アダプタAMC80−n)間の主要データに関しては、ファブリックスイッチ70を介してsRIOにて高速パケット(通信レート:1Gbps以上)で通信を行っている。そのため、図10に表すようにホストAMC60のCPU11で障害が発生したことが検知されるまでの数十[ms]の時間には、ホストAMC60からアダプタAMC80(アダプタAMC80−1〜アダプタAMC80−n)宛に大量のパケットが送信できる状態にある。   On the other hand, the main data between the host AMC 60 and a plurality of adapters AMC 80 (adapter AMC 80-1 to adapter AMC 80-n) is communicated at high speed packets (communication rate: 1 Gbps or more) via sRIO via the fabric switch 70. Yes. Therefore, as shown in FIG. 10, the host AMC 60 to the adapter AMC 80 (adapter AMC 80-1 to adapter AMC 80-n) is taken for several tens of [ms] until it is detected that a failure has occurred in the CPU 11 of the host AMC 60. A large number of packets can be sent to the destination.

もっとも、ファブリックスイッチ70で受信したパケットは入力された順番にバッファに蓄積され、また蓄積された順番でパケットが送出されるというFIFO(First In, First Out)の構成である。つまりパケットの送出の順番が変わることはない。そのため、sRIO経路上で障害が発生した場合には、ファブリックスイッチ70内の経路障害の該当バッファ(TXBFR73−1)のパケットが出力できない状態となって、後続のパケットが蓄積していく。   Of course, the packets received by the fabric switch 70 are stored in the buffer in the input order, and the packets are sent out in the stored order. That is, the order of packet transmission does not change. Therefore, when a failure occurs on the sRIO path, the packet of the corresponding path failure buffer (TXBFR 73-1) in the fabric switch 70 cannot be output, and subsequent packets are accumulated.

その後、図9に表すように最初にファブリックスイッチ70内のTXBFR73−1が満杯となる。これによりRXBFR71からTXBFR73−1へのパケットも送信できなくなるため、次には、RXBFR71が満杯となる。最終的にはホストAMC60の送信バッファ63にも徐々にパケットが蓄積されていき、sRIO経路上へのパケットが効率的に送信できない状態となる。これが第1の問題点である。   Thereafter, as shown in FIG. 9, the TXBFR 73-1 in the fabric switch 70 is first filled. As a result, the packet from RXBFR 71 to TXBFR 73-1 cannot be transmitted, and RXBFR 71 becomes full. Eventually, packets are gradually accumulated in the transmission buffer 63 of the host AMC 60, and packets cannot be transmitted efficiently on the sRIO path. This is the first problem.

また、第2の問題点は、sRIOネットワーク上でファブリックスイッチ70に接続されているホストAMC60とアダプタAMC80(アダプタAMC80−1〜アダプタAMC80−n)は、自身以外のAMC80がファブリックスイッチ70と通信可能な状態であるか否かについて、sRIOの規格上、ファブリックスイッチ70内にあるレジスタをリードしない限りは、わからない点である。   The second problem is that the host AMC 60 and adapter AMC 80 (adapter AMC 80-1 to adapter AMC 80-n) connected to the fabric switch 70 on the sRIO network can communicate with the fabric switch 70 by the AMC 80 other than itself. Whether or not this is a state is not known unless the register in the fabric switch 70 is read according to the sRIO standard.

従って、ファブリックスイッチ70とアダプタAMC80(アダプタAMC80−1〜アダプタAMC80−n)間でsRIO経路上で障害が発生した場合には、常にファブリックスイッチ70のレジスタをダンプしていないとリアルタイムには障害の発生を検知することができない。そのため上述したようなパケットが蓄積してしまい、パケットが効率的に送信できないという第1の問題点がより顕著なものとなってしまう。   Therefore, when a failure occurs on the sRIO path between the fabric switch 70 and the adapter AMC 80 (adapter AMC 80-1 to adapter AMC 80-n), the failure of the fabric switch 70 register is not always dumped in real time. The occurrence cannot be detected. Therefore, the packets as described above are accumulated, and the first problem that the packets cannot be transmitted efficiently becomes more prominent.

そこで、本発明はファブリックスイッチと或るアダプタAMC間での通信を実現するための経路上で障害が発生した場合であっても、この或るアダプタAMC以外のAMC宛のパケットを適切に送信することが可能な、ネットワーク障害対処方法、ネットワーク及びホストを提供することを目的とする。   Therefore, the present invention appropriately transmits a packet addressed to an AMC other than a certain adapter AMC even when a failure occurs on a path for realizing communication between the fabric switch and the certain adapter AMC. An object of the present invention is to provide a network failure handling method, a network, and a host.

本発明の第1の観点によれば、複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークであって、前記ホストは、前記複数のアダプタにそれぞれ対応した複数の送信バッファと、データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるための手段と、障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するための手段と、を備え、前記アダプタに係る障害が発生した場合に該障害発生を前記ホストに通知する際と、前記スイッチと前記アダプタ間の経路で障害が発生した場合に該障害発生を前記ホストに通知する際とで、通知に使用するプロトコルを異ならせることを特徴とするネットワークが提供される。 According to a first aspect of the present invention, there is provided a network in which a plurality of adapters are connected to a host via a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters. The host includes a plurality of transmission buffers respectively corresponding to the plurality of adapters, a means for outputting data after passing through the transmission buffer corresponding to the adapter serving as the destination, and the failure Means for canceling writing to or reading from the buffer corresponding to the adapter, and notifying the host of the occurrence of a failure when the adapter has a failure. When a failure occurs in the path between the switch and the adapter, the failure is notified to the host. And, the network characterized by Rukoto with different protocols to be used for notification is provided.

本発明の第2の観点によれば、複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークにおける前記ホストであって、前記複数のアダプタにそれぞれ対応した複数の送信バッファと、データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるための手段と、障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するための手段と、を備え、前記アダプタに係る障害が発生した場合に該障害発生を前記ホストに通知する際と、前記スイッチと前記アダプタ間の経路で障害が発生した場合に該障害発生を前記ホストに通知する際とで、通知に使用するプロトコルを異ならせることを特徴とするホストが提供される。 According to a second aspect of the present invention, a plurality of adapters are connected to a host via a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters. A host, a plurality of transmission buffers respectively corresponding to the plurality of adapters, a means for outputting data after passing through the transmission buffer corresponding to the adapter serving as a destination thereof, and the adapter relating to a failure Means for stopping writing or reading data addressed to the buffer corresponding to the adapter and notifying the host of the occurrence of the failure when the failure relating to the adapter occurs. And when a failure occurs in the path between the switch and the adapter, the failure is notified to the host. That when in a host, wherein Rukoto with different protocols to be used for notification is provided.

本発明の第3の観点によれば、複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークにおけるネットワーク障害対処方法であって、前記ホストが、前記複数のアダプタにそれぞれ対応した複数の送信バッファによりデータをバッファリングするステップと、データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるためのステップと、障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するためのステップと、を備え、前記アダプタに係る障害が発生した場合に該障害発生を前記ホストに通知する際と、前記スイッチと前記アダプタ間の経路で障害が発生した場合に該障害発生を前記ホストに通知する際とで、通知に使用するプロトコルを異ならせることを特徴とするネットワーク障害対処方法が提供される。 According to a third aspect of the present invention, a network in a network in which a plurality of adapters are connected to a host via a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters. A method for coping with a failure, wherein the host buffers data by a plurality of transmission buffers respectively corresponding to the plurality of adapters, and the data passes through the transmission buffer corresponding to the adapter serving as a destination thereof. And a step for stopping writing data read from the buffer corresponding to the adapter or reading from the buffer to the adapter associated with the fault, When the failure is notified to the host, the switch The failure occurs when a line between the switch and the adapter fails for a time of notifying the host, the network troubleshooting wherein the Rukoto with different protocols to be used for notification is provided.

本発明によれば、ファブリックスイッチとアダプタAMC間での通信を実現するための経路上で障害が発生した場合に、この障害の発生を迅速に送信元のホストに通知することが可能となる。   According to the present invention, when a failure occurs on a path for realizing communication between the fabric switch and the adapter AMC, it is possible to promptly notify the transmission source host of the occurrence of the failure.

本発明の実施形態であるMicroTCAのネットワークシステムの基本的構成を表す図である。It is a figure showing the basic composition of the network system of MicroTCA which is an embodiment of the present invention. 本発明の実施形態におけるホストAMCの基本的構成を表す図である。It is a figure showing the basic composition of host AMC in the embodiment of the present invention. sRIO障害通知に用いるコントロールシンボル(NOP)のフォーマットを表す図である。It is a figure showing the format of the control symbol (NOP) used for a sRIO failure notification. 本発明の実施形態で送受信されるデータの流れを表す図である。It is a figure showing the flow of the data transmitted / received by embodiment of this invention. 本発明の実施形態の基本的動作を表すフローチャートである。It is a flowchart showing the basic operation | movement of embodiment of this invention. 本発明の実施形態において、ファブリックスイッチとアダプタAMC間で経路障害発生時の説明図である。In embodiment of this invention, it is explanatory drawing at the time of a path | route failure occurring between a fabric switch and adapter AMC. 本発明の実施形態において、ファブリックスイッチとアダプタAMC間で経路障害発生時のタイムチャートである。6 is a time chart when a path failure occurs between the fabric switch and the adapter AMC in the embodiment of the present invention. 一般的なMicroTCAのネットワークシステムの基本的構成を表す図である。It is a figure showing the basic composition of the network system of a general MicroTCA. 一般的なMicroTCAのネットワークシステムでの障害発生時の状況を説明する図である。It is a figure explaining the condition at the time of the failure occurrence in a general MicroTCA network system. 一般的なMicroTCAのネットワークシステムでのファブリックスイッチとアダプタAMC間で経路障害発生時のタイムチャートである。6 is a time chart when a path failure occurs between a fabric switch and an adapter AMC in a general MicroTCA network system.

次に、本発明の実施の形態について図面を参照して詳細に説明する。   Next, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本実施形態であるMicroTCAネットワークシステムのブロック図である。   FIG. 1 is a block diagram of a MicroTCA network system according to the present embodiment.

図1を参照すると、本実施形態は、ホストAMC10、ファブリックスイッチ20、複数のアダプタAMC30及びMCMC40の機能ブロックを含む。   Referring to FIG. 1, the present embodiment includes functional blocks of a host AMC 10, a fabric switch 20, a plurality of adapters AMC 30 and MCMC 40.

ホストAMC10は、ネットワークを全体を管理する。ファブリックスイッチ20は、パケットを分配する。各アダプタAMC30には、sRIOの規格に対応したデバイスがAMCカードとして接続される。また、MCMC40は、ネットワーク全体の保守監視機能をまとめる。次に、個々の機能ブロックに関してより詳細に説明する。   The host AMC 10 manages the entire network. The fabric switch 20 distributes the packet. A device corresponding to the sRIO standard is connected to each adapter AMC 30 as an AMC card. The MCMC 40 collects maintenance and monitoring functions for the entire network. Next, each functional block will be described in more detail.

ホストAMC10は、CPU11、MMC12、TXBFR13、RXBFR14及びsRIO障害処理部15を含む。   The host AMC 10 includes a CPU 11, an MMC 12, a TXBFR 13, an RXBFR 14, and an sRIO failure processing unit 15.

CPU11は、ネットワーク全体を制御する演算処理装置である。MMC12は、ネットワークの保守監視機能を持つ。TXBFR13は、パケットの生成機能と送信機能を持つ送信バッファである。RXBFR14は、パケットの受信機能を持つ受信バッファである。sRIO障害処理部15は、sRIO経路障害を処理する機能を持つ。   The CPU 11 is an arithmetic processing device that controls the entire network. The MMC 12 has a network maintenance monitoring function. The TXBFR 13 is a transmission buffer having a packet generation function and a transmission function. The RXBFR 14 is a reception buffer having a packet reception function. The sRIO failure processing unit 15 has a function of processing an sRIO path failure.

また、ファブリックスイッチ20は、RXBFR21及びRXBFR24−1〜RXBFR24−nと、TXBFR22及びTXBFR23−1〜XBFR23−nと、sRIO障害処理部25を含む。   The fabric switch 20 includes RXBFR 21 and RXBFR 24-1 to RXBFR 24-n, TXBFR 22 and TXBFR 23-1 to XBFR 23-n, and an sRIO failure processing unit 25.

RXBFR21及びRXBFR24−1〜RXBFR24−nは、送信バッファである。   RXBFR21 and RXBFR24-1 to RXBFR24-n are transmission buffers.

一方、TXBFR22及びTXBFR23−1〜XBFR23−nは受信バッファである。これら受信バッファ及び送信バッファは、ホストAMC10と、複数のアダプタAMC30(アダプタAMC30−1〜アダプタAMC30−n)との間でパケットを分配する。すなわち、本実施形態では、主要データがファブリックスイッチ20にて多重分離され、分離後の主要データがそれぞれ適切な送信バッファに割り振られる。   On the other hand, TXBFR22 and TXBFR23-1 to XBFR23-n are reception buffers. These reception buffers and transmission buffers distribute packets between the host AMC 10 and a plurality of adapters AMC 30 (adapter AMC 30-1 to adapter AMC 30-n). That is, in the present embodiment, the main data is demultiplexed by the fabric switch 20, and the main data after separation is allocated to appropriate transmission buffers.

sRIO障害処理部25は、sRIO経路障害を処理する機能を持つ。具体的には、障害発生を検知したsRIO障害処理部25は、障害発生通知をsRIOにてsRIO障害処理部15に通知する。   The sRIO failure processing unit 25 has a function of processing an sRIO path failure. Specifically, the sRIO failure processing unit 25 that detects the occurrence of a failure notifies the sRIO failure processing unit 15 of a failure occurrence notification by sRIO.

複数のアダプタAMC30は、それぞれが、MMC31、RXBFR32及びTXBFR33を含む。   Each of the plurality of adapters AMC30 includes an MMC31, an RXBFR32, and a TXBFR33.

MMC31は、ネットワークの保守監視機能を持つ。RXBFR32は、パケットの受信機能を持つ受信バッファである。TXBFR33は、パケットの生成機能と送信機能を持つ送信バッファである。   The MMC 31 has a network maintenance monitoring function. RXBFR 32 is a reception buffer having a packet reception function. The TXBFR 33 is a transmission buffer having a packet generation function and a transmission function.

一般的なMicroTCAネットワークシステムと比較すると、本実施形態では、sRIO障害処理部15及びsRIO障害処理部25を更に含んでいる点で相違する。   Compared with a general MicroTCA network system, this embodiment is different in that it further includes an sRIO failure processing unit 15 and an sRIO failure processing unit 25.

なお、図1ではアダプタAMC30−1、アダプタAMC30−2及びアダプタAMC30−nのみを図示しているが、これ以外のアダプタAMC30が存在していてもよい。すなわち、アダプタAMC30の数は任意の数とすることができる。また、アダプタAMC30の数が増加する場合には、それに伴いファブリックスイッチ20のTXBFR73及びRXBFR24の数も増加する。   Although only the adapter AMC 30-1, the adapter AMC 30-2, and the adapter AMC 30-n are illustrated in FIG. 1, other adapters AMC 30 may exist. That is, the number of adapters AMC30 can be any number. Further, when the number of adapters AMC 30 increases, the number of TXBFR 73 and RXBFR 24 of the fabric switch 20 increases accordingly.

また、本実施形態では3種類のデータが送受信される。   In this embodiment, three types of data are transmitted and received.

1つめはファブリックスイッチ20を介してホストAMC10とアダプタAMC30の間でsRIOにより送受信されるデータであり、「主要データ」と呼ぶ。   The first is data transmitted and received by the sRIO between the host AMC 10 and the adapter AMC 30 via the fabric switch 20 and is referred to as “main data”.

また、2つめは、MMC31、MCMC40及びMMC12間で、I2Cにより送受信される障害通知用のデータであり、「I2C障害通知」と呼ぶ。   The second is data for failure notification transmitted and received between the MMC 31, MCMC 40, and MMC 12 by I2C, and is called “I2C failure notification”.

最後の1つはファブリックスイッチ20のsRIO障害処理部25と、ホストAMC10のsRIO障害処理部15の間で送受信される障害通知用のデータであり、「sRIO障害通知」と呼ぶ。   The last one is failure notification data transmitted and received between the sRIO failure processing unit 25 of the fabric switch 20 and the sRIO failure processing unit 15 of the host AMC 10 and is referred to as “sRIO failure notification”.

次に、図2を参照してホストAMC10の構成についてより詳細に説明する。   Next, the configuration of the host AMC 10 will be described in more detail with reference to FIG.

図2を参照すると、TXBFR13は、送信バッファ制御部13−1、複数の送信バッファ13−2、セレクタ13−3及びパケット受信機能部13−4を含む。   Referring to FIG. 2, the TXBFR 13 includes a transmission buffer control unit 13-1, a plurality of transmission buffers 13-2, a selector 13-3, and a packet reception function unit 13-4.

また、RXBFR14は、パケット受信機能部14−1、受信バッファ14−2及び受信バッファ制御部14−3を含む。   The RXBFR 14 includes a packet reception function unit 14-1, a reception buffer 14-2, and a reception buffer control unit 14-3.

送信バッファ制御部13−1はCPU11から送信される主要データを送信バッファ13−2に格納する。ここで、送信バッファ13−2−1〜送信バッファ13−2−nはそれぞれ符号の末尾の数字が同一のアダプタAMC30と対応している。例えば、送信バッファ13−2−1はアダプタAMC30−1と対応している。よって送信バッファ制御部13−1は、宛先のアダプタAMC30に応じて送信バッファ13−2を選択し、主要データを格納する。   The transmission buffer control unit 13-1 stores the main data transmitted from the CPU 11 in the transmission buffer 13-2. Here, each of the transmission buffers 13-2-1 to 13-2-n corresponds to the adapter AMC30 having the same number at the end of the code. For example, the transmission buffer 13-2-1 corresponds to the adapter AMC 30-1. Therefore, the transmission buffer control unit 13-1 selects the transmission buffer 13-2 according to the destination adapter AMC30, and stores the main data.

送信バッファ13−2−1〜送信バッファ13−2−nは主要データを蓄積する為のバッファでありFIFOのバッファである。送信バッファ13−2−1〜送信バッファ13−2−nが蓄積した主要データはセレクタ13−3により読み出される。   The transmission buffers 13-2-1 to 13-2-n are buffers for accumulating main data and are FIFO buffers. The main data stored in the transmission buffer 13-2-1 to transmission buffer 13-2-n is read out by the selector 13-3.

セレクタ13−3は、何れの送信バッファ13−2から主要データを読み出すかを選択する。そして、セレクタ13−3は読み出した主要データをパケット送信機能部13−4に送る。   The selector 13-3 selects from which transmission buffer 13-2 main data is read. Then, the selector 13-3 sends the read main data to the packet transmission function unit 13-4.

パケット送信機能部13−4は、セレクタ13−3より受け取った主要データをsRIOによりファブリックスイッチ20に送信する。   The packet transmission function unit 13-4 transmits the main data received from the selector 13-3 to the fabric switch 20 by sRIO.

パケット受信機能部14−1は、ファブリックスイッチ20より送信されてきた主要データ又はsRIO障害通知を受け取る。そして、受け取った主要データを受信バッファ14−2に送る。また、受け取ったsRIO障害通知をsRIO障害処理部15に送る。   The packet reception function unit 14-1 receives main data or sRIO failure notification transmitted from the fabric switch 20. Then, the received main data is sent to the reception buffer 14-2. The received sRIO failure notification is sent to the sRIO failure processing unit 15.

受信バッファ14−2は、パケット受信機能部14−1より受け取った主要データを蓄積する為のバッファでありFIFOのバッファである。受信バッファ14−2は、蓄積した主要データを受信バッファ制御部14−3に送る。   The reception buffer 14-2 is a buffer for storing the main data received from the packet reception function unit 14-1, and is a FIFO buffer. The reception buffer 14-2 sends the accumulated main data to the reception buffer control unit 14-3.

受信バッファ制御部14−3は受信バッファ14−2から送り出される主要データを受け取る。そして、受信バッファ制御部14−3は受け取った主要データをCPU11に送る。   The reception buffer control unit 14-3 receives main data sent from the reception buffer 14-2. Then, the reception buffer control unit 14-3 sends the received main data to the CPU 11.

sRIO障害処理部15は、sRIO障害通知を受け取ると、CPU11に対してsRIO経路上で障害が発生した旨を通知する。CPU11はこの通知を受けてsRIO障害処理部15のレジスタを参照する。sRIO障害処理部15のレジスタには、sRIO障害通知が格納されている。そして、CPU11はこのsRIO障害通知を参照することにより、障害が発生した経路がどの経路であるかということを検知する。   Upon receiving the sRIO failure notification, the sRIO failure processing unit 15 notifies the CPU 11 that a failure has occurred on the sRIO path. Upon receiving this notification, the CPU 11 refers to the register of the sRIO failure processing unit 15. The register of the sRIO failure processing unit 15 stores an sRIO failure notification. Then, the CPU 11 refers to this sRIO failure notification to detect which route the failure has occurred.

その後、sRIO障害処理部15はCPU11においてsRIO経路障害情報が検知されたことの応答としてコントロールシンボルによるsRIO障害通知応答を生成する。そして、sRIO障害処理部15はsRIO障害通知応答をTXBFR13のパケット送信機能部13−4に送る。   After that, the sRIO failure processing unit 15 generates an sRIO failure notification response using a control symbol as a response when the CPU 11 detects sRIO path failure information. Then, the sRIO failure processing unit 15 sends an sRIO failure notification response to the packet transmission function unit 13-4 of the TXBFR 13.

次に、本実施形態全体での3種類のデータの送受信についてそれぞれ説明する。   Next, transmission / reception of three types of data in the entire embodiment will be described.

まず主要データの送受信について説明する。   First, transmission / reception of main data will be described.

ネットワークシステム上でのホストAMC10からアダプタAMC30への主要データは、ホストAMC10のCPU11で生成され、TXBFR13に送信される。   Main data from the host AMC 10 to the adapter AMC 30 on the network system is generated by the CPU 11 of the host AMC 10 and transmitted to the TXBFR 13.

TXBFR13では図2に表されるように送信バッファ制御部13−1によってアダプタAMC30宛て毎の送信バッファ13−2に蓄積される。その後、セレクタ13−3の制御によって主要データが送信バッファ13−2から読み出される。読み出された主要データはパケット送信制御部13−4にてパケット化されてファブリックスイッチ20のRXBFR21に送られる。   In TXBFR13, as shown in FIG. 2, the transmission buffer control unit 13-1 stores the data in the transmission buffer 13-2 for each adapter AMC30. Thereafter, main data is read from the transmission buffer 13-2 under the control of the selector 13-3. The read main data is packetized by the packet transmission controller 13-4 and sent to the RXBFR 21 of the fabric switch 20.

ファブリックスイッチ20内ではRXBFR21によりパケットを蓄積する。蓄積されたパケットは複数のアダプタAMC毎に分配され、個々のTXBFR23(TXBFR23−1〜TXBFR23−n)に蓄積される。TXBFR23(TXBFR23−1〜TXBFR23−n)のそれぞれに蓄積されたパケットはそれぞれに蓄積された順番に従ってそれぞれに対応するアダプタAMC30のRXBFR32へ送られる。そして、パケットはアダプタAMC30に接続されたデバイスであるAMCカード内部にて処理される。   In the fabric switch 20, packets are accumulated by the RXBFR 21. The accumulated packets are distributed for each of the plurality of adapters AMC and accumulated in each TXBFR 23 (TXBFR 23-1 to TXBFR 23-n). Packets accumulated in each of TXBFR 23 (TXBFR 23-1 to TXBFR 23-n) are sent to RXBFR 32 of corresponding adapter AMC 30 according to the order of accumulation. The packet is processed inside the AMC card which is a device connected to the adapter AMC 30.

一方、各アダプタAMC30からホストAMC10への主要データは、各アダプタAMC30のTXBFR33でパケット化され、ファブリックスイッチ20の対応するRXBFR24(RXBFR24−1〜RXBFR24−n)に送信されて蓄積される。   On the other hand, main data from each adapter AMC 30 to the host AMC 10 is packetized by the TXBFR 33 of each adapter AMC 30 and transmitted to and stored in the corresponding RXBFR 24 (RXBFR 24-1 to RXBFR 24-n) of the fabric switch 20.

蓄積された個々のアダプタAMC30からのパケットはTXBFR22でまとめられてホストAMC10のRXBFR14へ送信される。RXBFR14はパケットを受信して、受信したパケットをCPU11に送る。そして、パケットはCPU11にて処理される。   The accumulated packets from the individual adapters AMC 30 are collected by the TXBFR 22 and transmitted to the RXBFR 14 of the host AMC 10. RXBFR 14 receives the packet and sends the received packet to CPU 11. The packet is processed by the CPU 11.

次に、I2C障害通知の送受信について説明する。   Next, transmission / reception of an I2C failure notification will be described.

ネットワークシステム上の保守監視においては、個々のアダプタAMC30に含まれるMMC31が、アダプタAMC30内部のうちのsRIO経路に関連しない部分の状態監視を行う。例えば、アダプタAMC30に接続されたデバイスに障害が発生したか否かの監視を行う。そして、アダプタAMC30内部のうちのsRIO経路に関連しない部分で障害が発生した場合は、MCMC40宛てにI2C障害通知を行う。   In the maintenance monitoring on the network system, the MMC 31 included in each adapter AMC 30 monitors the state of the part not related to the sRIO path in the adapter AMC 30. For example, it is monitored whether a failure has occurred in a device connected to the adapter AMC 30. When a failure occurs in a portion not related to the sRIO path in the adapter AMC 30, an I2C failure notification is sent to the MCMC 40.

一方、本実施形態では、MMC31はsRIO経路に関連する障害発生に関しては監視を行わない。そのため、アダプタAMC30とファブリックスイッチ20間でのsRIO経路に障害が発生したとしてもMMC31は特定の処理を行わない。   On the other hand, in this embodiment, the MMC 31 does not monitor the occurrence of a failure related to the sRIO path. Therefore, even if a failure occurs in the sRIO path between the adapter AMC 30 and the fabric switch 20, the MMC 31 does not perform a specific process.

そして、アダプタAMC30内部のMMC31による状態監視下の部分で障害が発生した場合は、MMC31がI2CにてMCMC40へI2C障害通知を行う。   When a failure occurs in the portion under the status monitoring by the MMC 31 inside the adapter AMC 30, the MMC 31 notifies the MCMC 40 of the I2C failure through I2C.

通知を受けたMCMC40は、ネットワーク全体の状態通知として、障害が発生したという情報をI2C障害通知としてホストAMC10のMMC12へと送る。   The MCMC 40 that has received the notification sends information indicating that a failure has occurred to the MMC 12 of the host AMC 10 as an I2C failure notification as a status notification of the entire network.

送られてきた、I2C障害通知はMMC12を介してCPU11へと送られる。これにより、CPU11は障害の発生を認識できる。   The sent I2C failure notification is sent to the CPU 11 via the MMC 12. Thereby, the CPU 11 can recognize the occurrence of the failure.

次に、sRIO障害通知の送受信について説明する。   Next, transmission / reception of the sRIO failure notification will be described.

ネットワークシステム上でのsRIO経路障害に関しては、ファブリックスイッチ20内のsRIO障害処理部25で監視を行う。この監視について説明する。   An sRIO path failure on the network system is monitored by the sRIO failure processing unit 25 in the fabric switch 20. This monitoring will be described.

本実施形態におけるファブリックスイッチ20と各アダプタAMC30は、相互にアイドル信号を送受信している。そして、sRIO障害処理部25は、このアイドル信号を監視し、アイドル信号が受信できなくなった場合に、ファブリックスイッチ20と各アダプタAMC30間で障害が発生したことを検知する。障害発生を検知したsRIO障害処理部25は、障害発生通知をsRIOにてsRIO障害処理部15に通知する。   The fabric switch 20 and each adapter AMC 30 in this embodiment transmit and receive idle signals to each other. The sRIO failure processing unit 25 monitors this idle signal, and detects that a failure has occurred between the fabric switch 20 and each adapter AMC 30 when the idle signal cannot be received. The sRIO failure processing unit 25 that has detected the occurrence of a failure notifies the sRIO failure processing unit 15 of a failure occurrence notification by sRIO.

そして、sRIO障害処理部25は障害の発生を検知すると、コントロールシンボル(NOP)を使用してsRIO障害発生をホストAMC10へ通知する。   When the occurrence of the failure is detected, the sRIO failure processing unit 25 notifies the host AMC 10 of the occurrence of the sRIO failure using a control symbol (NOP).

ホストAMC10で受信されたsRIO経路障害は、sRIO障害処理部15を介してCPU11に通知される。   The sRIO path failure received by the host AMC 10 is notified to the CPU 11 via the sRIO failure processing unit 15.

sRIO経路障害通知に対する応答メッセージは、ホストAMC10のsRIO障害処理部15で生成される。具体的には、コントロールシンボルを生成し、このコントロールシンボル内に応答メッセージがマッピングされる。そして、応答メッセージは、TXBFR13とRXBFR21を介してファブリックスイッチ20のsRIO障害処理部25へ通知される。   A response message to the sRIO path failure notification is generated by the sRIO failure processing unit 15 of the host AMC 10. Specifically, a control symbol is generated, and a response message is mapped in this control symbol. Then, the response message is notified to the sRIO failure processing unit 25 of the fabric switch 20 via the TXBFR 13 and the RXBFR 21.

ここで、コントロールシンボルへのマッピングについて説明する。   Here, mapping to control symbols will be described.

図3を参照すると、コントロールシンボルの一例が表されている。Serial Rapid IOの経路上には、フロー制御、リトライ制御及びパケットの区切りの役割を持つコントロールシンボルが流れている。コントロールシンボルでは、種類に応じて、10bits K−CharacterのK28.0(K−code「SC」)またはK28.3(K−code「PD」)のいずれかが開始を示すマークとして用いられる。図3では、K28.0(K−code「SC」)が用いられる場合を例に取って説明する。   Referring to FIG. 3, an example of control symbols is shown. A control symbol having a role of flow control, retry control, and packet separation flows on the path of the Serial Rapid IO. In the control symbol, either K28.0 (K-code “SC”) or K28.3 (K-code “PD”) of 10 bits K-Character is used as a start mark depending on the type. In FIG. 3, a case where K28.0 (K-code “SC”) is used will be described as an example.

そして、この開始マークK28.0(K−code「SC」)に続くコントロールシンボルの実体は24ビットから成る。図3を参照すると、コントロールシンボルの実体は、stype0、param0、param1、stype1、CMD及びCRCを含む。なお各項目の括弧内の数字はビット数を表すものである。また、図3では今回利用する項目を網掛けとする。   The control symbol following the start mark K28.0 (K-code “SC”) is composed of 24 bits. Referring to FIG. 3, the control symbol entity includes type 0, param 0, param 1, type 1, CMD, and CRC. The numbers in parentheses for each item represent the number of bits. In FIG. 3, the item used this time is shaded.

コントロールシンボルはstype0とstype1の2つのステータス情報を持つことができる。stype0は、アダプタAMC30からホストAMC10へ伝えるステータス情報である。stype0は、パケットが到着した旨の応答や、パケット不着の応答等を伝えることができる。   The control symbol can have two pieces of status information, type 0 and type 1. Type 0 is status information transmitted from the adapter AMC 30 to the host AMC 10. The type 0 can transmit a response indicating that a packet has arrived, a non-delivery response, or the like.

一方、ホストAMC10からアダプタAMC30へ伝える情報はstype1となる。stype1では、例えばパケットの開始位置であること、パケットの終了位置であること、パケット送信のリトライ等を伝えることができる。   On the other hand, the information transmitted from the host AMC 10 to the adapter AMC 30 is type1. In type 1, for example, it can be notified that the start position of the packet, the end position of the packet, a retry of packet transmission, or the like.

そして、本実施形態ではコントロールシンボルのparam0,param1の領域に、障害が発生したという情報と、どの経路で障害が発生したかという情報を付加する。具体的には、障害が発生した経路にてアダプタAMC30と接続されているファブリックスイッチ20のポートのポート番号を付加する。CPU11は、sRIO障害処理部15に記憶されたコントロールシンボル内のparam0,param1の領域を参照することにより、どのアダプタAMC30と、ファブリックスイッチ20の間で障害が発生したかを把握できる。   In this embodiment, information indicating that a failure has occurred and information indicating on which route the failure has occurred are added to the areas of param0 and param1 of the control symbol. Specifically, the port number of the port of the fabric switch 20 connected to the adapter AMC 30 in the path where the failure has occurred is added. The CPU 11 can grasp which adapter AMC 30 and the fabric switch 20 have failed by referring to the areas of param 0 and param 1 in the control symbol stored in the sRIO failure processing unit 15.

なお、今回CMDは利用しないため、Null(000)となっている。また、CRCはエラーチェックに用いられる。   Since CMD is not used this time, it is Null (000). CRC is used for error checking.

続いて、図4及び図5を参照して本実施形態の動作について説明する。ここで、図4は本実施形態で送受信されるデータの流れを表す図である。また、図5は本実施形態の基本的動作を表すフローチャートである。   Next, the operation of this embodiment will be described with reference to FIGS. Here, FIG. 4 is a diagram showing the flow of data transmitted and received in the present embodiment. FIG. 5 is a flowchart showing the basic operation of this embodiment.

今回の説明ではアダプタAMC30−1とファブリックスイッチ20間のsRIO経路上で障害が発生した場合を例として説明する。   In this description, a case where a failure occurs on the sRIO path between the adapter AMC 30-1 and the fabric switch 20 will be described as an example.

まず、ファブリックスイッチ20内のsRIO障害処理部25は、ファブリックスイッチ20とアダプタAMC30(アダプタAMC30−1〜アダプタAMC30−n)間のsRIO経路が通信可能な状態であるかを常に監視する(図5のステップA101)。   First, the sRIO failure processing unit 25 in the fabric switch 20 always monitors whether the sRIO path between the fabric switch 20 and the adapter AMC 30 (adapter AMC 30-1 to adapter AMC 30-n) is communicable (FIG. 5). Step A101).

そして、もしsRIO経路上で障害が発生した場合は(図5のステップA102においてYes)、図3に示すコントロールシンボルを使用したsRIO障害通知(図4のS1)をTXBFR22に送る(図5のステップA103)。   If a failure occurs on the sRIO path (Yes in step A102 in FIG. 5), an sRIO failure notification (S1 in FIG. 4) using the control symbol shown in FIG. 3 is sent to the TXBFR 22 (step in FIG. 5). A103).

このsRIO障害通知に使用されるコントロールシンボルのparam0,param1の領域には、ファブリックスイッチ20でどの経路で障害が発生したかという情報と、障害発生フラグの情報が付加される。今回の例では、アダプタAMC30−1とファブリックスイッチ20間のsRIO経路上で障害が発生しているため、アダプタAMC30−1とファブリックスイッチ20間のsRIO経路で障害が発生したという情報と、障害発生フラグの情報が付加される。   Information on which path the failure has occurred in the fabric switch 20 and information on the failure occurrence flag are added to the param0 and param1 areas of the control symbols used for this sRIO failure notification. In this example, since a failure has occurred on the sRIO path between the adapter AMC 30-1 and the fabric switch 20, information indicating that a failure has occurred in the sRIO path between the adapter AMC 30-1 and the fabric switch 20, and the occurrence of the failure Flag information is added.

コントロールシンボルはsRIO上り経路(図4のS2)にてホストAMC10へ送信される。そして、コントロールシンボルは、RXBFR14を経由してsRIO障害メッセージ(図4のS3)としてsRIO障害処理部15にて受信される(図5のステップA104)。   The control symbol is transmitted to the host AMC 10 through the sRIO upstream path (S2 in FIG. 4). The control symbol is received by the sRIO failure processing unit 15 via the RXBFR 14 as an sRIO failure message (S3 in FIG. 4) (step A104 in FIG. 5).

sRIO障害処理部15では、コントロールシンボルのparam0,param1領域を参照する。そして、sRIO障害処理部15は、sRIO経路上で障害が発生したことを、経路障害発生通知(図4のS7)によってCPU11へ報告する(図5のステップA105)。   The sRIO failure processing unit 15 refers to the param0 and param1 areas of the control symbol. Then, the sRIO failure processing unit 15 reports that a failure has occurred on the sRIO route to the CPU 11 by a route failure occurrence notification (S7 in FIG. 4) (step A105 in FIG. 5).

CPU11は経路障害発生通知(図4のS7)の報告を受けて、障害発生経路に関する経路確認情報(図4のS8)をsRIO障害処理部15から取得する(図5のステップA106)。この取得はCPU11が、sRIO障害処理部15のレジスタを参照することにより行われる。今回の例では、アダプタAMC30−1とファブリックスイッチ20間のsRIO経路で障害が発生したという情報を取得する。   In response to the report of the path failure occurrence notification (S7 in FIG. 4), the CPU 11 acquires the route confirmation information (S8 in FIG. 4) regarding the failure occurrence path from the sRIO failure processing unit 15 (step A106 in FIG. 5). This acquisition is performed by the CPU 11 referring to the register of the sRIO failure processing unit 15. In this example, information that a failure has occurred in the sRIO path between the adapter AMC 30-1 and the fabric switch 20 is acquired.

そして、CPU11は、経路障害が発生したアダプタAMC30−1へのデータ送信処理を停止する。併せて、TXBFR13内のセレクタ部への経路選択指示信号(図4のS9)によって経路障害が発生したアダプタAMC30用の送信バッファ13−2からのデータ選択を禁止する制御を行う。今回の例では、アダプタAMC30−1用の送信バッファである送信バッファ13−2−1からのデータ選択を禁止する制御を行う(図5のステップA107)。   Then, the CPU 11 stops the data transmission process to the adapter AMC 30-1 in which the path failure has occurred. At the same time, control for prohibiting data selection from the transmission buffer 13-2 for the adapter AMC 30 in which a path failure has occurred is performed by a path selection instruction signal (S9 in FIG. 4) to the selector unit in the TXBFR 13. In this example, control for prohibiting data selection from the transmission buffer 13-2-1 which is a transmission buffer for the adapter AMC 30-1 is performed (step A107 in FIG. 5).

またsRIO障害処理部15では、CPU11においてsRIO経路障害情報が検知されたことの応答としてコントロールシンボルによるsRIO障害通知応答(図4のS4)をTXBFR13のパケット送信機能部13−4に送る(図5のステップA108)。   In addition, the sRIO failure processing unit 15 sends a sRIO failure notification response (S4 in FIG. 4) by the control symbol to the packet transmission function unit 13-4 of the TXBFR 13 as a response to the detection of the sRIO path failure information in the CPU 11 (FIG. 5). Step A108).

そして、パケット送信機能部13−4は、sRIO下り経路(図4のS5)を経由してsRIO障害通知応答をファブリックスイッチ20へ送信する(図5のステップA109)。   Then, the packet transmission function unit 13-4 transmits an sRIO failure notification response to the fabric switch 20 via the sRIO downlink path (S5 in FIG. 4) (step A109 in FIG. 5).

sRIO障害通知応答のコントロールシンボルはRXBFR21を介してsRIO障害処理部25へ通知され(図4のS6)、応答確認がsRIO障害処理部25で受け取られる。これによりsRIO障害処理部25は、ホストAMC10がsRIO障害通知を受け取ったことが確認できる。そして、sRIO障害処理部25でのsRIO障害通知(図4のS1)の送信が終了となる(図5のステップA110)。   The control symbol of the sRIO failure notification response is notified to the sRIO failure processing unit 25 via the RXBFR 21 (S6 in FIG. 4), and the response confirmation is received by the sRIO failure processing unit 25. Accordingly, the sRIO failure processing unit 25 can confirm that the host AMC 10 has received the sRIO failure notification. Then, the transmission of the sRIO failure notification (S1 in FIG. 4) in the sRIO failure processing unit 25 ends (step A110 in FIG. 5).

続いて、図6を参照してファブリックスイッチ20とアダプタAMC30−1間のsRIO経路で障害が発生した際の主要データの流れについて説明する。   Next, the flow of main data when a failure occurs in the sRIO path between the fabric switch 20 and the adapter AMC 30-1 will be described with reference to FIG.

本実施形態によるsRIO経路障害に関する処理によって、ホストAMC10内のTXBFR13においてアダプタAMC30−1用の送信バッファ13−2−1へのデータ送信が禁止される。またセレクタ13−3でアダプタAMC10用の送信バッファ13−2−1の選択が禁止される。これにより、他の正常なアダプタAMC30へのデータ送信への影響をなくすことができる。なお、ファブリックスイッチ20へのパケットの送信の停止のみを考えるのであればセレクタ13−3でアダプタAMC10用の送信バッファ13−2−1の選択を禁止するだけでもよい。もっとも、不要な処理を削減するという観点から言えば、上述したように送信バッファ13−2−1へのデータ送信の禁止も併せて行うことが好ましい。更に、障害発生を検知したCPU11は、検知以降はアダプタAMC30−1宛のパケットの生成自体を中止するようにしてもよい。また、送信バッファ制御部13−1は、CPU11の指示に応じて送信バッファ13−2−1へのデータ送信の禁止を行うようにしてもよい。   By the processing related to the sRIO path failure according to the present embodiment, data transmission to the transmission buffer 13-2-1 for the adapter AMC 30-1 is prohibited in the TXBFR 13 in the host AMC 10. The selector 13-3 prohibits selection of the transmission buffer 13-2-1 for the adapter AMC10. Thereby, the influence on the data transmission to the other normal adapter AMC30 can be eliminated. If only the stop of the transmission of the packet to the fabric switch 20 is considered, the selector 13-3 may only prohibit the selection of the transmission buffer 13-2-1 for the adapter AMC10. However, from the viewpoint of reducing unnecessary processing, it is preferable to prohibit data transmission to the transmission buffer 13-2-1 as described above. Further, the CPU 11 that has detected the occurrence of a failure may stop generating the packet addressed to the adapter AMC 30-1 after the detection. In addition, the transmission buffer control unit 13-1 may prohibit data transmission to the transmission buffer 13-2-1 in accordance with an instruction from the CPU 11.

また、図6においては、主要データの送信とは直接関係しないMMC12、RXBFR14及びsRIO障害処理部15の図示を省略した。
*「アダプタAMC30−1用の送信バッファ13−2−1へのデータ送信が禁止される」
次に、図7を参照して本実施形態の効果を具体的に説明する。本実施形態では、コントロールシンボルによる通知によって、sRIO経路障害通知がホストAMC10で検知されるまでの時間が、従来のI2Cによる数十[ms]から数[μS]に大幅に短縮される。
Further, in FIG. 6, illustration of the MMC 12, the RXBFR 14, and the sRIO failure processing unit 15 that are not directly related to the transmission of main data is omitted.
* "Data transmission to the transmission buffer 13-2-1 for the adapter AMC30-1 is prohibited"
Next, the effect of the present embodiment will be specifically described with reference to FIG. In this embodiment, the time until the sRIO path failure notification is detected by the host AMC 10 is greatly reduced from several tens [ms] by conventional I2C to several [μS] by the notification by the control symbol.

以上説明したように、本実施形態では、MicroTCAネットワークシステム上のsRIO経路障害が発生した場合に、ホストAMCで早期に障害を検知することができ、またsRIO経路障害による影響を受けることの無い安定したsRIO高速シリアル通信を実現することができる。   As described above, in this embodiment, when an sRIO path failure on the MicroTCA network system occurs, the host AMC can detect the failure at an early stage, and is stable without being affected by the sRIO path failure. SRIO high-speed serial communication can be realized.

なお、上記のホストAMC、ファブリックスイッチ、アダプタAMC及びMCMCは、ハードウェア、ソフトウェア又はこれらの組合わせにより実現することができる。また、上記のホストAMC、ファブリックスイッチ、アダプタAMC及びMCMCの何れか又は組合せにより行なわれるネットワーク障害対処方法も、ハードウェア、ソフトウェア又はこれらに組合わせにより実現することができる。ここで、ソフトウェアによって実現されるとは、コンピュータがプログラムを読み込んで実行することにより実現されることを意味する。   The host AMC, fabric switch, adapter AMC, and MCMC described above can be realized by hardware, software, or a combination thereof. In addition, a network failure handling method performed by any one or combination of the host AMC, fabric switch, adapter AMC, and MCMC can be realized by hardware, software, or a combination thereof. Here, “realized by software” means realized by a computer reading and executing a program.

プログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えば、フレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば、光磁気ディスク)、CD−ROM(Read Only Memory)、CD−R、CD−R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(random access memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。   The program may be stored using various types of non-transitory computer readable media and supplied to the computer. Non-transitory computer readable media include various types of tangible storage media. Examples of non-transitory computer readable media include magnetic recording media (for example, flexible disks, magnetic tapes, hard disk drives), magneto-optical recording media (for example, magneto-optical disks), CD-ROMs (Read Only Memory), CD- R, CD-R / W, semiconductor memory (for example, mask ROM, PROM (Programmable ROM), EPROM (Erasable PROM), flash ROM, RAM (random access memory)). The program may also be supplied to the computer by various types of transitory computer readable media. Examples of transitory computer readable media include electrical signals, optical signals, and electromagnetic waves. The temporary computer-readable medium can supply the program to the computer via a wired communication path such as an electric wire and an optical fiber, or a wireless communication path.

上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。   A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.

(付記1) 複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークであって、
前記ホストは、
前記複数のアダプタにそれぞれ対応した複数の送信バッファと、
データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるための手段と、
障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するための手段と、
を備えることを特徴とするネットワーク。
(Appendix 1) A network in which a plurality of adapters are connected to a host via a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters.
The host is
A plurality of transmission buffers respectively corresponding to the plurality of adapters;
Means for outputting data after passing through the transmission buffer corresponding to the adapter as the destination;
Means for stopping writing to or reading from the buffer corresponding to the adapter with data addressed to the adapter associated with the failure;
A network characterized by comprising:

(付記2) 付記1に記載のネットワークであって、
或る前記アダプタに係る障害が検出されたならば、該障害を前記スイッチから前記ホストに、これらの間のデータ通信に係るプロトコルを用いて、通知する手段を更に備えることを特徴とするネットワーク。
(Supplementary note 2) The network according to supplementary note 1, wherein
The network further comprising means for notifying the failure from the switch to the host by using a protocol relating to data communication between the switches if a failure related to the certain adapter is detected.

(付記3) 付記1又は2に記載のネットワークであって、
前記スイッチは前記複数のアダプタそれぞれとの間で通信状態を確認する為の信号を送受信しており、或るアダプタとの間で該信号が受信できない場合に該或るアダプタとの間の経路での障害発生を検知し、前記スイッチから前記ホスト間のデータ通信に係るプロトコルに準拠したコントロールシンボル内に該或るアダプタを特定する情報を挿入して前記ホストに送信することにより、前記ホストに障害を通知することを特徴とするネットワーク。
(Supplementary note 3) The network according to supplementary note 1 or 2,
The switch transmits / receives a signal for confirming a communication state with each of the plurality of adapters, and when the signal cannot be received with a certain adapter, By detecting the occurrence of a failure and inserting information identifying the certain adapter into a control symbol conforming to a protocol related to data communication between the hosts from the switch and transmitting the information to the host. A network characterized by notifying.

(付記4) 付記1乃至3の何れか1に記載のネットワークであって、
前記スイッチは、
受信バッファと、前記複数のアダプタにそれぞれ対応した複数の送信バッファを備え、
前記ホストから受信したデータを一旦受信バッファに格納した後に、各アダプタ宛のデータを該アダプタに対応する前記送信バッファに分配することにより前記多重分離を行なうことを特徴とするネットワーク。
(Appendix 4) The network according to any one of appendices 1 to 3,
The switch is
A reception buffer and a plurality of transmission buffers respectively corresponding to the plurality of adapters;
A network characterized in that after the data received from the host is temporarily stored in a reception buffer, the demultiplexing is performed by distributing the data addressed to each adapter to the transmission buffer corresponding to the adapter.

(付記5) 付記1乃至4の何れか1に記載のネットワークであって、
当該ネットワークは、
前記スイッチと前記アダプタ間の経路で障害が発生した際に前記アダプタが該障害を検知し、該アダプタが前記スイッチから前記ホスト間のデータ通信に係るプロトコルとは異なるプロトコルにて前記ホストに障害発生を通知する、という規格に準じていることを特徴とするネットワーク。
(Supplementary note 5) The network according to any one of supplementary notes 1 to 4,
The network
When a failure occurs in the path between the switch and the adapter, the adapter detects the failure, and the adapter detects a failure in the host using a protocol different from the protocol related to data communication between the switch and the host. A network characterized by conforming to the standard of notifying.

(付記6) 複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークにおける前記ホストであって、
前記複数のアダプタにそれぞれ対応した複数の送信バッファと、
データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるための手段と、
障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するための手段と、
を備えることを特徴とするホスト。
(Appendix 6) The host in a network in which a plurality of adapters are connected to a host via a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters,
A plurality of transmission buffers respectively corresponding to the plurality of adapters;
Means for outputting data after passing through the transmission buffer corresponding to the adapter as the destination;
Means for stopping writing to or reading from the buffer corresponding to the adapter with data addressed to the adapter associated with the failure;
A host characterized by comprising:

(付記7) 複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークにおけるネットワーク障害対処方法であって、
前記ホストが、
前記複数のアダプタにそれぞれ対応した複数の送信バッファによりデータをバッファリングするステップと、
データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるためのステップと、
障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するためのステップと、
を備えることを特徴とするネットワーク障害対処方法。
(Appendix 7) A network failure handling method in a network in which a plurality of adapters are connected to a host via a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters.
The host
Buffering data with a plurality of transmission buffers respectively corresponding to the plurality of adapters;
A step for outputting data after passing through the transmission buffer corresponding to the adapter as the destination;
A step for stopping writing to or reading from the buffer corresponding to the adapter with data addressed to the adapter associated with the failure;
A network failure handling method comprising:

本発明は、例えば携帯電話機基地局装置など、ネットワーク系路上で障害が発生した場合でも、遅延を許さないインフラ装置に好適である。   The present invention is suitable for an infrastructure device that does not allow a delay even when a failure occurs on a network path, such as a mobile phone base station device.

10、60 ホストAMC
11、61 CPU
12、62 MMC
13、63 TXBFR
13−1 送信バッファ制御部
13−2−1、13−2−2、13−2−n 送信バッファ
13−3 セレクタ
13−4 パケット受信機能部
14、64 RXBFR
14−1 パケット受信機能部
14−2 受信バッファ
14−3 受信バッファ制御部
15、25 sRIO障害処理部
20、70 ファブリックスイッチ
21、71 RXBFR
22、72 TXBFR
23−1、23−2、23−n、73−1、73−2、73−n TXBFR
24−1、24−2、24−n、74−1、74−2、74−n RXBFR
30−1、30−2、30−n、70−1、70−2、70−n アダプタAMC
31−1、31−2、31−n、71−1、71−2、71−n MMC
32−1、32−2、32−n、72−1、72−2、72−n RXBFR
33−1、33−2、33−n、73−1、73−2、73−n TXBFR
40、90 MCMC
10, 60 Host AMC
11, 61 CPU
12, 62 MMC
13, 63 TXBFR
13-1 Transmission buffer control unit 13-2-1, 13-2-2, 13-2-n Transmission buffer 13-3 Selector 13-4 Packet reception function unit 14, 64 RXBFR
14-1 Packet reception function unit 14-2 Reception buffer 14-3 Reception buffer control unit 15, 25 sRIO failure processing unit 20, 70 Fabric switch 21, 71 RXBFR
22, 72 TXBFR
23-1, 23-2, 23-n, 73-1, 73-2, 73-n TXBFR
24-1, 24-2, 24-n, 74-1, 74-2, 74-n RXBFR
30-1, 30-2, 30-n, 70-1, 70-2, 70-n Adapter AMC
31-1, 31-2, 31-n, 71-1, 71-2, 71-n MMC
32-1, 32-2, 32-n, 72-1, 72-2, 72-n RXBFR
33-1, 33-2, 33-n, 73-1, 73-2, 73-n TXBFR
40, 90 MCMC

Claims (7)

複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークであって、
前記ホストは、
前記複数のアダプタにそれぞれ対応した複数の送信バッファと、
データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるための手段と、
障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するための手段と、
を備え
前記アダプタに係る障害が発生した場合に該障害発生を前記ホストに通知する際と、前記スイッチと前記アダプタ間の経路で障害が発生した場合に該障害発生を前記ホストに通知する際とで、通知に使用するプロトコルを異ならせることを特徴とするネットワーク。
A plurality of adapters are connected to a host through a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters,
The host is
A plurality of transmission buffers respectively corresponding to the plurality of adapters;
Means for outputting data after passing through the transmission buffer corresponding to the adapter as the destination;
Means for stopping writing to or reading from the buffer corresponding to the adapter with data addressed to the adapter associated with the failure;
Equipped with a,
When notifying the host of the occurrence of a failure when the failure occurs in the adapter, and when notifying the host of the occurrence of a failure when a failure occurs in the path between the switch and the adapter, network characterized by Rukoto with different protocols to be used for notification.
請求項1に記載のネットワークであって、
前記スイッチと或る前記アダプタ間の経路で障害が検出されたならば、該障害を前記スイッチから前記ホストに、これらの間のデータ通信に係るプロトコルを用いて、通知する手段を更に備えることを特徴とするネットワーク。
The network of claim 1,
If a failure is detected on the path between the switch and the adapter, the device further comprises means for notifying the failure from the switch to the host using a protocol related to data communication between them. Characteristic network.
請求項1又は2に記載のネットワークであって、
前記スイッチは前記複数のアダプタそれぞれとの間で通信状態を確認する為の信号を送受信しており、或るアダプタとの間で該信号が受信できない場合に該或るアダプタとの間の経路での障害発生を検知し、前記スイッチから前記ホスト間のデータ通信に係るプロトコルに準拠したコントロールシンボル内に該或るアダプタを特定する情報を挿入して前記ホストに送信することにより、前記ホストに障害を通知することを特徴とするネットワーク。
The network according to claim 1 or 2, wherein
The switch transmits / receives a signal for confirming a communication state with each of the plurality of adapters, and when the signal cannot be received with a certain adapter, By detecting the occurrence of a failure and inserting information identifying the certain adapter into a control symbol conforming to a protocol related to data communication between the hosts from the switch and transmitting the information to the host. A network characterized by notifying.
請求項1乃至3の何れか1項に記載のネットワークであって、
前記スイッチは、
受信バッファと、前記複数のアダプタにそれぞれ対応した複数の送信バッファを備え、
前記ホストから受信したデータを一旦受信バッファに格納した後に、各アダプタ宛のデータを該アダプタに対応する前記送信バッファに分配することにより前記多重分離を行なうことを特徴とするネットワーク。
The network according to any one of claims 1 to 3,
The switch is
A reception buffer and a plurality of transmission buffers respectively corresponding to the plurality of adapters;
A network characterized in that after the data received from the host is temporarily stored in a reception buffer, the demultiplexing is performed by distributing the data addressed to each adapter to the transmission buffer corresponding to the adapter.
請求項1乃至4の何れか1項に記載のネットワークであって、
当該ネットワークは、
前記スイッチと前記アダプタ間の経路で障害が発生した際に前記アダプタが該障害を検知し、該アダプタが前記スイッチから前記ホスト間のデータ通信に係るプロトコルとは異なるプロトコルにて前記ホストに障害発生を通知する、という規格に準じているが、該アダプタは該アダプタに係る障害が発生した場合にのみ障害発生を前記ホストに通知することを特徴とするネットワーク。
A network according to any one of claims 1 to 4,
The network
When a failure occurs in the path between the switch and the adapter, the adapter detects the failure, and the adapter detects a failure in the host using a protocol different from the protocol related to data communication between the switch and the host. The network is characterized in that the adapter notifies the host of the failure only when a failure relating to the adapter occurs .
複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークにおける前記ホストであって、
前記複数のアダプタにそれぞれ対応した複数の送信バッファと、
データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるための手段と、
障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するための手段と、
を備え
前記アダプタに係る障害が発生した場合に該障害発生を前記ホストに通知する際と、前記スイッチと前記アダプタ間の経路で障害が発生した場合に該障害発生を前記ホストに通知する際とで、通知に使用するプロトコルを異ならせることを特徴とするホスト。
A plurality of adapters connected to a host via a switch, and the data in the network in which data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters;
A plurality of transmission buffers respectively corresponding to the plurality of adapters;
Means for outputting data after passing through the transmission buffer corresponding to the adapter as the destination;
Means for stopping writing to or reading from the buffer corresponding to the adapter with data addressed to the adapter associated with the failure;
Equipped with a,
When notifying the host of the occurrence of a failure when the failure occurs in the adapter, and when notifying the host of the occurrence of a failure when a failure occurs in the path between the switch and the adapter, host, wherein Rukoto with different protocols to be used for notification.
複数のアダプタがスイッチを介してホストと接続され、前記ホストから出力されたデータが前記スイッチで多重分離されて前記複数のアダプタに送信されるネットワークにおけるネットワーク障害対処方法であって、
前記ホストが、
前記複数のアダプタにそれぞれ対応した複数の送信バッファによりデータをバッファリングするステップと、
データをその宛先となる前記アダプタに対応する前記送信バッファを経由してから出力させるためのステップと、
障害に係る前記アダプタ宛のデータを該アダプタに対応する前記バッファに書き込むこと又は該バッファから読み出すことを中止するためのステップと、
を備え
前記アダプタに係る障害が発生した場合に該障害発生を前記ホストに通知する際と、前記スイッチと前記アダプタ間の経路で障害が発生した場合に該障害発生を前記ホストに通知する際とで、通知に使用するプロトコルを異ならせることを特徴とするネットワーク障害対処方法。
A network failure handling method in a network in which a plurality of adapters are connected to a host via a switch, and data output from the host is demultiplexed by the switch and transmitted to the plurality of adapters.
The host
Buffering data with a plurality of transmission buffers respectively corresponding to the plurality of adapters;
A step for outputting data after passing through the transmission buffer corresponding to the adapter as the destination;
A step for stopping writing to or reading from the buffer corresponding to the adapter with data addressed to the adapter associated with the failure;
Equipped with a,
When notifying the host of the occurrence of a failure when the failure occurs in the adapter, and when notifying the host of the occurrence of a failure when a failure occurs in the path between the switch and the adapter, network troubleshooting wherein the Rukoto with different protocols to be used for notification.
JP2012024864A 2012-02-08 2012-02-08 Network failure handling method, network and host Expired - Fee Related JP5569984B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012024864A JP5569984B2 (en) 2012-02-08 2012-02-08 Network failure handling method, network and host

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012024864A JP5569984B2 (en) 2012-02-08 2012-02-08 Network failure handling method, network and host

Publications (2)

Publication Number Publication Date
JP2013162446A JP2013162446A (en) 2013-08-19
JP5569984B2 true JP5569984B2 (en) 2014-08-13

Family

ID=49174335

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012024864A Expired - Fee Related JP5569984B2 (en) 2012-02-08 2012-02-08 Network failure handling method, network and host

Country Status (1)

Country Link
JP (1) JP5569984B2 (en)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE331369T1 (en) * 2000-03-06 2006-07-15 Ibm SWITCHING DEVICE AND METHOD
US7706255B1 (en) * 2007-01-29 2010-04-27 Solace Systems, Inc. Communications apparatus with redundant switching or backpressure mechanism
JP5028316B2 (en) * 2008-04-02 2012-09-19 アラクサラネットワークス株式会社 Cell distributed switch fabric
RU2543558C2 (en) * 2009-03-18 2015-03-10 РОКСТАР КОНСОРЦИУМ ЮЭс ЛП Input/output routing method and device and card

Also Published As

Publication number Publication date
JP2013162446A (en) 2013-08-19

Similar Documents

Publication Publication Date Title
US20110058777A1 (en) Form factor adapter module
CN103095568B (en) Rack switching equipment realizes stacking system and method
CN101877659B (en) Method, device and system for monitoring packet loss
EP3023880A1 (en) Method, device and computer storage medium for implementing interface cache dynamic allocation
CN104158586B (en) Switching realization method, sites and system
CN104092632B (en) A kind of network equipment
CN105656708A (en) Single-board testing method and device
CN1937782A (en) Frame device and its message transmitting method
JPWO2009144834A1 (en) Test apparatus and transmission apparatus
CN110417687B (en) Message sending and receiving method and device
CN101163038B (en) Ethernet equipment link protecting method
JP2017195555A (en) Communication device, communication system, and communication method
JP5569984B2 (en) Network failure handling method, network and host
JP5104631B2 (en) Transmission apparatus and dispersion management method for transmission apparatus
CN102857436A (en) Flow transmission method and flow transmission equipment based on IRF (intelligent resilient framework) network
EP2574012A1 (en) Bus control device and bus control method
CN109614354A (en) Interface assignment method, board, equipment and storage medium
CN106686474B (en) A kind of wavelength tuning method of passive optical network, system and ONU
US20130173969A1 (en) Transmission device, transmission system, and fault notification method
JP5881145B2 (en) Transceiver equipped with sub-line, communication system, and communication method
CN108023660B (en) A kind of optical transport network business access method and device
JP2009246507A (en) Transmission system
CN105677614B (en) A kind of more host controllers, more host control methods and system
KR100969881B1 (en) Apparatus for transmitting and receiving data
CN104734838A (en) Method, system and switching matrix for synchronizing data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20130610

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140220

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140228

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140425

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20140529

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140619

R150 Certificate of patent or registration of utility model

Ref document number: 5569984

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees