KR20080031397A - 인피니밴드 네트워크의 물리적 범위를 확장하기 위한 방법 - Google Patents

인피니밴드 네트워크의 물리적 범위를 확장하기 위한 방법 Download PDF

Info

Publication number
KR20080031397A
KR20080031397A KR1020087003373A KR20087003373A KR20080031397A KR 20080031397 A KR20080031397 A KR 20080031397A KR 1020087003373 A KR1020087003373 A KR 1020087003373A KR 20087003373 A KR20087003373 A KR 20087003373A KR 20080031397 A KR20080031397 A KR 20080031397A
Authority
KR
South Korea
Prior art keywords
infiniband
packet
wan
packets
credit
Prior art date
Application number
KR1020087003373A
Other languages
English (en)
Other versions
KR101290413B1 (ko
Inventor
제이슨 게리 건쏘프
데이빗 토마스 사우스웰
크리스토퍼 제스케
Original Assignee
오브시디안 리서치 코포레이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 오브시디안 리서치 코포레이션 filed Critical 오브시디안 리서치 코포레이션
Publication of KR20080031397A publication Critical patent/KR20080031397A/ko
Application granted granted Critical
Publication of KR101290413B1 publication Critical patent/KR101290413B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • H04L12/46Interconnection of networks
    • H04L12/4633Interconnection of networks using encapsulation techniques, e.g. tunneling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/14Multichannel or multilink protocols
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L12/00Data switching networks
    • H04L12/28Data switching networks characterised by path configuration, e.g. LAN [Local Area Networks] or WAN [Wide Area Networks]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/39Credit based
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L49/00Packet switching elements
    • H04L49/90Buffering arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/08Protocols specially adapted for terminal emulation, e.g. Telnet
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L2212/00Encapsulation of packets

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)
  • Computer And Data Communications (AREA)
  • Small-Scale Networks (AREA)

Abstract

인피니밴드 네트워크의 물리적 범위를 확장하기 위한 장치를 위한 시스템이 제공된다. 방법 및 장치는 완전한 10Gbit 인피니밴드 속도를 유지하고, 인피니밴드 구조(IBTA: InfiniBand Architecture)에 의해 특정된 시맨틱을 가지면서, 인피니밴드 네트워크를 긴 거리의 연결(가령, WAN)로 연결할 수 있다. 시스템은 인피니밴드 인터페이스와, 관리 블록과, 패킷 라우팅과, 캡슐화/역-캡슐화와, 벌크 메모리 버퍼와, WAN 인터페이스 로직 및 회로를 포함한다. 본 발명은 단일 전송 스트림을 이용하여 긴 거리를 통해 많은 양의 데이터를 효율적으로 이동시키기 위해 적용된다.

Description

인피니밴드 네트워크의 물리적 범위를 확장하기 위한 방법{A METHOD TO EXTEND THE PHYSICAL REACH OF AN INFINIBAND NETWORK}
본 발명은 인피니밴드 네트워크(InfiniBand network)의 물리적 범위를 인피니밴드 구조의 현재 가능한 범위 이상으로 확장시키는 장치에 관한 것이며, 특히, 인피니밴드 패킷이, 스스로는 인피니 구조에 순응되지 않는 네트워크를 통해 운반될 수 있게 한다. 이에 따라서, 인피니밴드 트래픽은 그 밖의 다른 표준 프로토콜, 가령 IPv6(Internet Protocol version 6), 또는 비동기 전송 모드(ATM) 셀 등과 물리적 네트워크를 공유할 수 있다. 덧붙이자면, 버퍼 오버플로우를 방지하기 위한 흐름 제어 크레딧(credit)의 사용과 연결되어 있는, 장치의 매우 큰 흐름제어 버퍼로 인하여, 본 발명에 의해, 수신기에서의 부적합한 자원 버퍼링으로 인해 어떠한 패킷도 손실되지 않는 것을 보장하면서, 많은 양의 데이터가 WAN(Wide Area Network) 내에서 전송될 수 있다. 어떠한 패킷도 WAN 내에서 폐기되지 않는 것이 보장되기 위해, 장치는 또한, 백 프레셔(back pressure)에 반응하여 데이터를 WAN으로의 유입율(rate of injection)을 제한하기 위해 기능하는 다수의 QoS(Quality of service) 기능을 포함할 수 있다. 또한 본 발명에 의해, 둘 이상의 장치가 WAN으로 연결되도록 하고, 따라서 최소한의 개수의 장치를 이용하여 인피니밴드 네트워크가 셋 이상의 물리적 장소로 확장될 수 있게 하는 방식으로 패킷의 경로가 설 정될 수 있다. 상기 장치 내에 포함되는 프로세서는 관리 기능, 가령, 인피니밴드 서브넷 관리 에이전트(InfiniBand subnet management agent) 및 장치 관리를 다룰 수 있다.
가상 레인(VL: virtual lane) 당 128KiB 이하로 허용된 크레딧의 인피니밴드 구조(InfiniBand Architecture) 내의 한계 때문에, 10Gbit 인피니밴드는 약 10㎞까지만 도달할 수 있다고 알려져 있다. 이러한 제한에 의해, 한 번에 전송될 수 있는 데이터의 양에 상한 한계가 존재한다. 왜냐하면, 표준 인피니밴드 송신기는 가용 크레딧 없이 송신할 것이기 때문이다. 덧붙이자면, 네트워크 경로의 대역폭 레이턴시 곱(bandwidth latency product) 이하로 송신될 수 있는 데이터의 양을 제한하는 것이 획득될 수 있는 최대 데이터 전송율을 직접 제한할 것이다.
예를 들어, 130 마이크로초의 왕복 레이턴시(round trip latency)를 갖는 10 Gbit 인피니밴드 링크가 128KiB의 대역폭 레이턴시 곱을 가지며, 이는 인피니밴드 링크 내의 단일 VL에 대하여 허용될 수 있는 최대 크레딧의 양이다.
통상적으로, 인피니밴드 링크는 인피니밴드 구조가 특정하는 둘 이상의 진입(ingress) 및 진출(egress) VL(최대 15개까지)을 가질 것이며, 라인 헤드 차단과 흐름 제어의 교착 상태를 방지하기 위해 각각은 독립적으로 버퍼링되고 흐름-제어되어야 한다. 일부 실시예에서, 인피니밴드 인터페이스가 WAN 클럭 도메인(clock domain)에서 인피니밴드 클럭 도메인으로의 변환을 위한 추가적인 흐름 제어 버퍼링 유닛을 포함한다.
물리적인 제한 때문에, 데이터는 광섬유를 통한 빛의 속도보다 더 느린 속도(rate)로 이동한다. 상기 섬유가 비트를 운반하는 도관이라고 간주되면, 단일 조각의 긴 섬유가 전송되는 많은 메가비트 수준의 데이터를 포함할 수 있는 것이 당연하다. 예를 들어, 10Gbit 데이터 스트림을 운반하는 특정 섬유에서의 빛의 속도가 5ns/meter이고, 섬유의 길이가 100㎞인 경우, 섬유는 각각의 방향으로 5메가비트의 데이터를 포함할 것이다. 또한 다수의 WAN 경로는 재생 장비, 광 멀티플렉스(optical multiplex), 분기/결합 멀티플렉서(add/drop multiplex), 라우터, 스위치 등의 대역 장비(band equipment)에서 추가되는 레이턴시를 포함한다. 이러한 부가적인 장비에 의해 추가적인 레이턴시가 추가되고, 경로의 대역폭 레이턴시 곱은 더 증가된다.
인피니밴드 구조에 의해 정의되는 바와 같이, 상기 인피니밴드의 전기적이고 광학적인 시그널링 프로토콜이 종래의 WAN 환경에 호환되지 못하거나, 적합하지 않을 수 있다. 통상의 WAN 환경에서는 긴 거리의 광섬유에 대하여 SONET(Synchronous Optical Network) 표준이 사용된다.
또한 인피니밴드 네트워크의 관리를 완화하기 위해, 인피니밴드 구조에서 서술된 대로 인피니밴드 패킷 상에서의 경로설정(routing)을 수행하는 것이 바람직하다. 라우팅에 의해, 그 밖의 다른 모든 가입자에게 실질적인 정책(policy)을 강요하지 않으면서, 각각의 멀리 떨어진 원격 장소에서, 더 큰 인피니밴드 네트워크에서의 그들의 부분에 대한 로컬 제어가 유지될 수 있다.
섬유의 물리적 한계와, 경로의 대역폭 레이턴시 곱 이상의 버퍼링 용량을 가질 필요성과, 인피니밴드 구조 내의 다수의 VL의 특징을 모두 고려할 때, 잘 관리되는 매우 큰 버퍼 메모리가 인피니밴드 네트워크를 매우 긴 거리로 확장시키는 것이 요구되는 것이 명백해질 것이다. 예를 들어, 15개의 VL을 갖는 5000㎞의 물리적 거리는 임의의 추가적인 레이턴시 오버헤드를 고려하지 않고 894MiB의 버퍼 메모리를 요구할 것이다.
장치의 기능의 한 부분은 통상적으로 8KiB인 짧은 로컬 인피니밴드 링크 상에서 광고되는 크레딧을, VL 당 통상적으로 512MiB인 WAN에 더욱 적합한 숫자로 확장시키는 것이다. 이는 로컬 인피니밴드 크레딧이 가용 상태일 때 비워지고, 인커밍 데이터(incoming data)가 도착할 때 채워지는 FIFO(first in first out) 버퍼를 이용하여 이뤄진다. 상기 장치는 각각의 활성 VL에 대하여 크레딧 광고 패킷(credit advertisement packet)을 통해 FIFO 내에 얼마나 많은 공간이 사용가능한지를 나머지 원격 장치에게 주기적으로 공지하고, 원격 장치들은 이 정보를 사용하여 FIFO 가 수용할 수 있는 것 이상의 데이터를 결코 전송하지 않음을 보장한다. 이는 인피니밴드 구조에서 사용되는 동일한 기본 흐름 제어 메커니즘(엔드-투-엔드 크레딧 정보 교환)이지만, 이는 기가바이트 단위의 버퍼를 다루기 위해, WAN 환경에 더욱 적합하도록 확장된다. 이러한 방식으로, 인피니밴드 스타일 흐름 제어 시맨틱(InfiniBand style flow control semantics)이 긴 거리에 걸쳐 유지되어, 혼잡(congestion)으로 인하여 어떠한 패킷도 폐기되지 않도록 보장된다.
또 다른 실시예에서, 벌크 버퍼 메모리가 다수의 FIFO 구조로부터, 패킷이 수신된 순서와 다른 순서로, 패킷을 가져올 수 있다.
로컬 인피니밴드 포트 상에서 크레딧 결핍(credit starvation)이 존재하면, FIFO가 채워질 것이지만, WAN을 통해 전송되는 크레딧 패킷 때문에, 송신기는 FIFO의 오버플로우(overflow) 상태 전에, 전송을 중단할 것이다. 크레딧 패킷은 IPv6 페이로드 구조로 삽입되거나, 또는 개선된 효율을 위해 IPv6 확장 헤더에 내장될 수 있다.
크레딧 정보, 또는 데이터가 56/64b 코드의 순서화된 세트(ordered set)로 인코딩된다. 인피니밴드 패킷이 IPv6, 또는 IPv4 패킷 내에 포함되는 UDP, 또는 DCCP 데이터그램의 페이로드 구조 내에 위치할 수 있다.
WAN 표준과의 호환성을 획득하기 위해, 또 다른 프로토콜, 가령 WAN을 통한 전송을 위해 SONET(POS)을 통하는 패킷 내의 IPv6 내에서 장치에 의해, 인피니밴드 패킷이 캡슐화된다. IBTA에서 나타난 바와 같이, 전이중(full duplex) 데이터 독립 송신 및 수신 경로가 링크 상태 머신에 의해 제어된다. WAN을 가로지르는 비-인피니밴드 패킷을 교환함으로써, 상기 인피니밴드 물리 링크 상태 머신은 유지될 수 있으며, 이를 수행함으로써, 엔드-투-엔드 경로가 WAN에 존재하게 되고, 이러한 패킷 교관은 PPP LCP(RFC 1661에 따름) 패킷, 이더넷 ARP(RFC826 및 RFC2461(IPv6 이웃 탐색)) 교환, TCP 세션 초기화(RFC 793에 따름), ATM SVC(ATM 포럼 사설네트워크 네트워크 인터페이스 표준기술문서에 따름)를 확립, 또는 세션 초기화의 그 밖의 다른 임의의 형태로 구성된다.
캡슐화된 후, 패킷은 WAN을 통해 송신되고, 수신 장치가 역-캡슐화 단계를 수행하여, 캡슐화 동안 추가된 데이터가 제거되고, 이에 따라서 원래의 인피니밴드 패킷이 복구된다.
이 캡슐화는 2가지 목적을 수행하는데, 첫째는 광학 시그널링 포맷(optical signaling format)을 WAN 연결, 가령 SONET을 통해 원시적으로 운반될 수 있는 무엇으로 변경하는 것이다. 이에 따라서, 장치는 큰 SONET 토폴로지의 일부분인 SONET 광학 장비로 직접 연결될 수 있고, 하나의 단일 원격 도착지로 운반될 수 있다. SONET 프로토콜, 가령 GFP(Generic Framing Protocol)은 이러한 종류의 캡슐화 작업을 위해 설계된다. 캡슐화 컴포넌트가 다수의 네트워크, 가령 IPv6, 또는 IPv6의 UDP, 또는 IPv6의 DCCP, 또는 ATM AAL5, 또는 GFP를 지원할 수 있다.
또한 이에 따라서, 장치는 개별적인 패킷, 또는 셀의 경로를 설정할 수 있는 WAN 내의 지능형 장비(intelligent equipment)와 인터페이싱할 수 있다. 또한 이에 따라서, WAN을 신뢰함으로써, 인피니밴드 트래픽이 다른 소스(source)로부터의 트래픽과 WAN 인트라구조를 공유하여, 다수의 연결의 집적(aggregation), 라우팅, 스위칭 중 하나 이상을 수행할 수 있다.
ATM 적응 계층 5(AAL5), POS를 통한 IPv6, 인터넷을 통한 IPv6 등의 프로토콜이 이를 가능하게 하기 위해 설계되었다.
WAN을 가로지르는 엔드-투-엔드 경로를 확립하고 유지하기 위한 목적을 위해, 캡슐화된 인피니밴드 패킷에 추가로 비-인피니밴드 패킷을 교환하기 위해 장치를 통신하는 것이 필이다.
장치에 의해 다수의 캡슐화가 가능하며, 예를 들어, ATM AAL5, POS를 통한 IPv6, 이더넷을 통한 IPv6, IPv6의 DCCP, IPv6의 UDP, GMPLS(generic multi-protocol label switching)를 통한 IPv6, GFP 등이 있다. 마찬가지로, 다수의 WAN 시그널링 표준 및 속도가 지원될 수 있으며, 예를 들어, SONET, 이더넷 LAN-PHY 및 이더넷 WAN-PHY가 있다. 단일 장치가 다수의 캡슐화와 시그널링 표준을 지원할 수 있고, 사용자는 설치 동안 사용될 것을 선택할 수 있다.
10㎞ 이하의 보다 짧은 거리에 대하여, 캡슐화가 생략되며, 인피니밴드 구조에 의해 정의된 광학 시그널링을 매우 큰 흐름 제어 버퍼와 조합하여 사용하여, 인피니밴드 구조로 완전하게 적응시키면서, 보통의 인피니밴드 장비의 범위를 확장할 수 있다. 이 경우, 캡슐화 프로세스는 널 캡슐화(null encapsulation)까지로 축소되어, 원래의 인피니밴드 패킷을 방출한다. 본래의 인피니밴드 통신 프로토콜은 여전히 관찰하면서, 범위를 10㎞ 넘어서까지로 확장하기 위해, 크레딧 블록의 개수와, 크레딧 블록 사이즈 중 하나 이상이 증가될 수 있다.
다수의 장치: 어드레싱(addressing)을 할 수 있는 캡슐화 프로토콜을 이용하여 장치가 지능형 WAN으로 연결될 때, 셋 이상의 장치가 통신하도록 하는 것이 가능하다. 이에 따라서, 인피니밴드 네트워크를 큰 메시(mesh)로 확장하고 링크하면서, 다수의 물리적 장소에 위치하는 장치가 동일한 WAN 연결 및 동일한 장치를 공유할 수 있다.
이 동작 모드에서, 장치는 각각의 들어오는(인커밍: incoming) 로컬 인피니밴드 패킷을 조사하여, 이들이 어느 장치로 전송되고, 이를 전달하기 위해 적정한 캡슐화를 형성하는지를 판단할 수 있다. 이는 인피니밴드 패킷 내에서 로컬 식별자(LID: Local Identifier)를 조사하고, 인피니밴드 표준기술문서(InfiniBand Specification)에 의해 정의된 스위칭 인프라구조를 사용함으로써, 또는 인피니밴드 패킷 내의 GID(Global Identifier)를 조사하고, 서브넷 프리픽스(subnet prefix)의 롱기스트 프리픽스 매치(longest prefix match)를 바탕으로 경로를 설정함으로써, 이뤄질 수 있다.
또한 각각의 장치는 자신의 흐름 제어 버퍼의 개별 부분을 각각의 가능한 원격 장치에 대하여 예약해야만 한다. 이는 버퍼 메모리에 대한 수요를 N-1배 증가시키며, 이때 N은 메시(mesh)에서의 장치의 개수이다.
멀티캐스트 인피니밴드 패킷이 수신될 때, 상기 장치는 이들을 적합한 WAN 멀티캐스트 어드레스로 매핑하거나, 패킷 복제(packet replication)를 수행하여, 상기 패킷의 다수의 복사본을 멀티캐스트 그룹에 종속되는 각각의 원격 장치로 전송할 수 있다.
인피니밴드 구조 릴리즈 1.2에 의해 특정되는 바와 같이, 인피니밴드 라우팅 동작은, GRH(Global Route Header)를 이용한 로컬 인피니밴드 네트워크 상에서의 송신을 위해, 장치가 128비트 IPv6 GID를 로컬 인피티밴드 경로 기술(path description), 16비트 로컬 식별자(LID), 24비트 파티션 키(partition key), 4비트 서비스 레벨로 해석하는 것을 필요로 한다.
포인트-투-포인트 구성보다는 지능형 네트워크에서 장치가 사용될 때, 상기 지능형 네트워크에서의 QoS(Quality of Service) 문제가 중요해진다. 상기 장치는 불충분한 버퍼링으로 인해 인피니밴드 패킷이 결코 폐기되지 않음을 보장할 뿐이며, 내부 혼잡 등으로 인해서 지능형 네트워크가 패킷을 폐기하지 않을 것이라는 어떠한 보장도 제공하지 않는다.
네트워크 내에서 패킷 손실을 최소로 하기 위한 주요 수단은 장치에 의해 네트워크로의 패킷의 유입율(injection rate)을 제어하는 것이다. 상기 장치는 패킷들이 WAN을 지나 수신 유닛으로 전송될 때 상기 패킷들 사이에 딜레이(delay)를 끼워 넣음으로써, 이를 수행한다.
상기 유입율은 사용자에 의해 설정되거나, 장치와 지능형 네트워크 간의 상호작용 및 프로토콜에 의해 동적으로 제어될 수 있다. 이러한 종류의 동적 제어를 위해, 다수의 프로토콜과 방법이 존재한다.
두 번째 접근법으로는, 지능형 네트워크가 손실을 최소화할 수 있도록, 장치가 패킷을 특수하게 태깅(tagging)하는 것이 있다. 이러한 접근법은 유입율 제어와 함께 사용될 수 있다.
장치의 관리 블록(Management Block) 내의 관리 소프트웨어가 범용 프로세서를 이용하는 WAN 네트워크를 통한 QoS 보장을 확립하는 것이 필수일 수 있는 임의의 프로토콜 및 방법을 운영할 수 있다.
도 1 내지 3은 라우트 패킷이 시스템 내에서 수집될 수 있는 데이터 흐름 다이어그램이다. 각각의 모서리가 각진 박스는 버퍼, 또는 변형 프로세서, 또는 결정 포인트를 나타낸다. 모서리가 둥근 더 큰 박스는 관련 기능들의 그룹을 나타낸다. 화살표는 패킷 흐름 방향을 나타낸다.
도 1은 프로토타입 장치를 위한 데이터 흐름 다이어그램이다. 이는 본 발명의 하나의 실시예에 대한 메이저 블록을 보여준다.
도 2는 다수의 WAN 시그널링 표준 및 프로토콜과 상호운영되도록 설계된 특정한 긴-범위의 구현에 대한 데이터 흐름 다이어그램으로서, 도 1의 기능 블록 중 다수를 공유한다.
도 3은 인피니밴드 구조가 WAN 프로토콜로서 사용될 수 있는 방법을 도시하는 특정한 감소된 특징부에 대한 데이터 흐름 다이어그램이다.
해당업계 종사자라면, 다양한 표준과 자원이 디지털 데이터의 종래의 체계에 내재되어 있음을 인지한다. 본원에서 공지기술로서 참조되는 일부 표준 및 동작 원리는
- 인피니밴드 협회(InfiniBand Trade Association). 인피니밴드 구조 공개 1.2(또한 “IBTA”라고 알려져 있음)
- IETF(internet engineering task force)(1998). RFC 2460 - 인터넷 프로토콜 버전 6(IPv6) 기술문서.
- IETF(internet engineering task force)(19989. RFC 2615 - PPP over SONET/SDH)
- ATM 포럼(1994). ATM 사용자-네트워크 인터페이스 기술문서 버전 3.1
- ITU(international telecommunication union). ITU-T 권고 1.432.1 일반 특징
- OSI(open system interconnection) - 기본 참조 모델: 기본 모델(1994). ISO 7498-1:1994
- IEEE802.3ae 조항 49; 66/64b 부호화 틀(coding scheme)
를 참조하면 발견될 수 있다.
도 1을 참조하면, 표준 장치에서의 데이터 흐름이 설명된다. 상기 장치는 6개의 주요한 블록을 포함하며, 인피니밴드 인터페이스(InfiniBand interface)와, 관리 블록(Management Block)과, 패킷 라우팅(Packet Routing)과, 캡슐화/역-캡슐화 컴포넌트(ENCAP)와, WAN 인터페이스와, 벌크 버퍼 메모리(Bulk Buffer Memory)가 그것이다. 이들 블록의 각각을 구현하기 위해 사용될 수 있는 많은 기법 및 기술이 존재한다. 이들 블록은 데이터 흐름 다이어그램의 논리 기능으로서 식별되며, 특정 구현예가 더 최적의 구현을 얻기 위해 여러 다른 물리적 블록 사이에 이들 논리적 기능을 펼치도록 선택할 수 있다. 상기 장치는 각각의 방향에서 동시에 인피니밴드 패킷의 초당 약 1 기기바이트의 전송율을 유지할 수 있다.
상기 인피니밴드 인터페이스는 로컬 IB 페브릭으로의 LAN 연결을 제공한다. 명료함을 위해, 상기 인피니밴드 인터페이스는, 나머지 부착된 블록에서의 데이터율을 중재하기 위한 2개의 작은 흐름-제어용 버퍼를 포함한다.
상기 관리 블록은 다양한 표준에서 필요로 하는 높은 수준의 다양한 관리 및 제어 프로토콜의 구현을 제공하며, 장치는 예를 들어, IB 서브넷 관리 에이전트(Subnet Management Agent), SONET을 통과하는 패킷에 대한 포인트-투-포인트 프로토콜(PPP)의 구현, ATM 동작 및 유지보수 셀(OAM), 이더넷을 위한 이웃 탐색 캐 싱/쿼리(caching/queries)를 고수할 수 있다. 이러한 블록은 임의의 낮은 레이턴시, 또는 높은 주파수 관리 패킷(가령 일종의 OAM 셀)용의 특수 로직과 조합되는 일부 형태의 일반적인 마이크로프로세서를 이용하여 구현될 것이다.
상기 패킷 라우팅은 앞서 설명된, 다수의 장치의 인피니밴드 라우팅에서 필요로 하는 기능 및 QoS(Quality of Service) 능력을 구현한다. 또한 거리 확장의 맥락에서 설명되는 WAN 크레딧 패킷을 제공한다. 또한 상기 패킷 라우팅 블록은 특수 처리 목적으로 관리 블록으로 전달되어야하는 패킷을 식별할 수 있다.
캡슐화/역-캡슐화 블록은 앞서 프로토콜 캡슐화의 맥락에서 설명된 캡슐화 프로세스를 구현한다. 하나의 실시예에서, 상기 프로토콜은 (ISO 7498-1:1994에서 정의되어 있는) OSI 7 레이어 참조 모델이고, 레이어 1(물리), 레이어 2(데이터 링크), 레이어 3(네트워크), 레이어 4(전송) 중에서 선택된다.
프로토타입 다이어그램은 몇 가지 여러 다른 가능한 틀을 보여준다. 상기 캡슐화 블록은 캡슐화의 정확한 형태를 결정하기 위해, 라우팅 블록으로부터의 추가적인 데이터에 의존한다. 역-캡슐화가 캡슐화된 데이터로부터 원래의 IB 패킷을 복구시킨다. 일부 패킷이 관리 패킷이라고 식별되는 경우, 이들은 관리 블록으로 경로가 정해며, 역-캡슐화 블록을 통해 전송되지 않을 수 있다.
WAN 인터페이스는 WAN 포트로의 일반적인 인터페이스이다. 본원에서 나타나는 바와 같이, 이는 광학 서브시스템(optical subsystem)을 포함하지만, WAN 인터페이스는 전기 시그널링을 사용할 수 있다. 프레이머(framer) 유닛, 또는 기능은 캡슐화 블록으로부터 패킷 데이터를 가져화서, 이를 선택된 WAN 프로토콜과 부합되 도록 포매팅한다. 예를 들어, 이더넷 기술문서(Ethernet specification)는 프레이머(framer)를 MAC(Media Access Controller), PCS(Physical coding sub-layer) 및 PMA(physical media attachment)의 조합이라고 일컫는다. 또한 상기 프레이머는 역(inverse)도 수행하며, 역-캡슐화 블록으로 통과될 WAN 인터페이스로부터 패킷을 추출한다.
지원되는 프레임 포맷으로는 SONET/SDH, 10GBASE-R, 인피니밴드, 10BASE-W 및 IEEE802.3ae 조항 49-10GBASE-R에 의해 정의되는 66/64b 부호화 틀이 있다.
벌크 버퍼 메모리가, 거리 확장에서 설명된 바와 같이 크레딧 관리 유닛(credit management unit)을 구현한다. 하층 메모리의 정확한 속성은 구현예에 따라서 달라질 수 있다.
도 2는 본 발명의 긴-범위 구성을 위한 바람직한 실시예 내에서의 데이터 흐름을 도시한다. 본 발명의 이 실시예는 FPGA(field programmable gate array) 내에서 구현되는 시스템온칩(System on a Chip)과, CX4 구리 4x 인피니밴드 커넥터와, SONET/이더넷 프레임/매퍼(mapper)와, 2 슬롯의 등록된 DDR2(double data rate 2) SDRAM(synchronous dynamic random access memory)와, 네트워크 검색 엔진과, 관리 프로세서 지지 소자와, MSA-300 기술문서에 순응된 가교환성 WAN 광학 모듈을 포함하는 인쇄 회로 기판(PCB: Printed Circuit Board) 조립체로 구성된다.
나머지 부품들이 산업 표준 파트인 반면에 상기 FPGA는 장치에 대하여 고유의 기능을 제공한다. 상기 FPGA는 메인 데이터 경로에 대하여 4개의 전기적 인터페이스, 즉 CX4 커넥터로 연결되는 2.6Gbit 4x 인피니밴드와, FIFO를 위해 사용되는 266㎒ DDR2 SDRAM과, 프레이머/매퍼로 연결되는 SPI-4.2와, 네트워크 검색 엔진으로 연결되는 LA-1을 구현한다.
표준 DDR2 SDRAM을 이용하여 FIFO 버퍼가 구현된다. 시 분할 멀티플렉싱(time division multiplexing)에 의해, 유효 듀얼 포트를 갖는 RAM에게, 10Gbit/sec 이상의 진출 대역폭을 유지하면서 동시에 10Gbit/sec 이상의 최대 진입(ingress) 대역폭이 제공되는, 메모리 액세스가 이뤄진다. 이에 따라서, FIFO 버퍼에 대하여 값 싼 메모리가 사용될 수 있다. FPGA 내의 제어 로직이 SDRAM을 다수의 VL로 분할하고, FIFO 기능을 제공하기 위해 SDRAM 메모리 버스를 동작시킨다.
OIF(Optical Internetworking Forum)가 정의한 기술문서에 따르는 부품을 사용하여 WAN으로의 액세스가 제공된다. 특히, MSA-300 기술문서가 정의하는 커넥터를 통해 광 모듈로 연결되기 위해 SFI-4.1 인터페이스가 사용된다. 또한 이러한 동일한 인터페이스는, 10G 이더넷 LAN PHY와 함께 사용하기 위해, IEEE 802.3ae XSBI 인터페이스로 전환될 수 있다. 가교환성 모듈(interchangeable module)에 의해, 사용자 요구조건과 설치되는 광학 모듈에 따라 달라지는 여러 다른 발진 파워(launch power)와 수신기 감도를 갖는 몇 가지 종류의 섬유에 따라서, 장치가 OC-192 SONET, 10G 이더넷 LAN PHY 및 10G 이더넷 LAN PHY를 지원할 수 있다.
상기 장치는 광학 WAN을 직접 가로질러 통신하거나, 추가적인 표준 네트워킹 설비, 가령 SONET/SDH 멀티플렉서, 광학 재생기(optical regenerator), 패킷 라우터, 셀 스위치를 통해 간접적으로 통신할 수 있다.
SFI-4.1/XSBI 인터페이스는 프레이머/매퍼(framer/mapper)로 연결되며, 상기 프레이머/매퍼는 낮은 레벨 시그널링 프로토콜(이더넷에서의 MAC/PCS/PMA 기능)을 내부에서 다룬다. 상기 FPGA가 전체 패킷(ATM 경우, 셀)을 SPI-4.2 인터페이스를 통해 프레이머/매퍼와 통신하며, 그 후 프레이머/매퍼가 요망 WAN 시그널링 프로토콜로 변형한다. 이러한 변형은 ITU(International Telecommunication Union), IETF(Internet Engineering Task Force), ATM 포럼, IEEE(Institute of Electrical and Electronic Engineers) 및 OIF(Optical Internetworking Forum)이 공개하는 표준에 의해 통제된다.
마지막 컴포넌트는 네트워크 검색 엔진(NSE)으로 연결되는 LA-1이다. 상기 NSE는 인커밍 IPv6 어드레스를 로컬 인피니밴드 경로 기술(path description)로 해석하기 위한 인피니밴드 라우팅 특징부의 일부분으로서 사용된다. 상기 FPGA는 WAN으로부터 도착하는 패킷에서 IPv6 패킷을 추출하고, 이를 NSE로 넘기며, 그 후, 일치하는 것을 찾기 위해 내부 테이블을 빠르게 검색하고, 그 후, 연계된 데이터(일치하는 IB 경로)를 FPGA로 복귀시킬 것이다. 새로운 데이터가 사용가능해짐에 따라서, FPGA 내의 관리 프로세서가 상기 새로운 데이터를 NSE 테이블에 업데이트할 것이 필수가 된다.
본 발명의 두 번째 실시예가 도 3에서 도시된다. 이 실시예는 도 2에서 나타난 동일한 프로토타입 장치의 비용 절약된 버전이다. 이 구현예의 주요 목적은, 인피니밴드 구조에서 정의되는 바와 같이, 단지 QDR(Quad data rate) 1x 인피니밴드만을 이용하여 10㎞까지의 거리 확장을 가능하게 하는 것이다.
상기 구현예는 FPGA, CX4 커넥터, QDR SRAM의 단일 칩, XFP 광학 모듈로 구 성된다. 상기 FPGA는 10Gbit 4x 인피니밴드(로컬)와, 10Gbit 1x 인피니밴드(WAN) 모두와 직접 인터페이싱한다.
긴-범위 실시예에서와 같이, 가교환성 모듈이 광학 WAN 인터페이스를 제공한다. 그러나 MSA-300 인터페이스 대신, 이 모듈은 (XFP MSA 그룹에 의해 정의된) XFP 기술문서로 순응되고, 10Gbit XFI 버스를 통해 FPGA와 직접 통신한다. 이에 따라서, 사용자는 그들의 로컬 환경에 가장 적합한 XFP 모듈을 선택할 수 있다.
QDR(또는 QDR2) SRAM을 이용하여 FIFO 버퍼가 구현되며, 상기 FIFO 버퍼는 작은 듀얼 포트를 갖는 메모리에 최적으로 설계된 메모리의 형태이다. FPGA의 제어기가 메모리를 다수의 VL 및 FIFO의 매니지드 오퍼레이션(managed operation)으로 분할한다.

Claims (41)

  1. 긴 거리 연결에 걸쳐 인피니밴드 패킷(InfiniBand packet)을 운반하기 위한 방법에 있어서, 상기 방법은
    다른 프로토콜 내의 인피니밴드 패킷을 캡슐화하는 단계,
    긴 거리 연결(WAN)에 걸쳐 캡슐화된 패킷을 송신하는 단계,
    캡슐화를 제거하고 상기 인피티밴드 패킷을 복구시킴으로써, 상기 인피니밴드 패킷을 역-캡슐화하는 단계,
    WAN에 걸쳐서 인피니밴드의 물리적 링크 상태 머신을 유지하는 단계, 그리고
    WAN에 걸쳐 인피니밴드 스타일 흐름 제어를 유지하는 단계
    를 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  2. 제 1 항에 있어서, 상기 프로토콜은 OSI 7 레이어 참조 모델이고, 레이어 1, 레이어 2, 레이어 3 및 레이어 4 중에서 선택되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  3. 제 1 항 또는 제 2 항에 있어서, 캡슐화된 인피니밴드를 송신하는 단계는, WAN에 걸쳐 인피니밴드 링크 거리를 100㎞ 이상의 거리로 확장하는 단계를 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  4. 제 3 항에 있어서, 링크 거리를 증가시키는 단계는 링크 상에서 광고되는 인피니밴드 크레딧(credit)을 12KiB/VL 이상으로 증가시키는 단계를 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  5. 제 4 항에 있어서, 가용 크레딧(credit)을 증가시키는 단계는 광고되는 크레딧 블록 당 바이트의 수를 증가시키는 단계를 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  6. 제 4 항에 있어서, 가용 크레딧을 증가시키는 단계는 광고 당 크레딧 블록의 개수를 증가시키는 단계를 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  7. 제 4 항에 있어서, 가용 크레딧을 증가시키는 단계는 각각의 광고에서의 크레딧 블록의 개수와, 블록 당 바이트의 수를 모두 증가시키는 단계를 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  8. 제 1 항 내지 제 7 항 중 어느 한 항에 있어서, 흐름 제어 시맨틱(flow control semantic)을 유지하는 단계는, 전송 유닛이 역-캡슐화된 인피니밴드 패킷을 위해 수신 유닛에서의 진출(egress) VL을 선택하는 단계를 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  9. 제 1 항 내지 제 8 항 중 어느 한 항에 있어서, 인피니밴드 물리 링크 상태 머신을 유지하는 단계는 WAN에서의 비-인피니밴드 패킷을 교환하는 단계를 더 포함하며, 이때, 이에 따라서, WAN에서 엔드-투-엔드 경로가 존재함이 확립되며, 패킷 교환은 PPP LCP 패킷, 이더넷 ARP 교환, TCP 세션 초기화, ATM SVC 확립으로부터 선택되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  10. 제 1 항 내지 제 9 항 중 어느 한 항에 있어서, 인피니밴드 스타일 흐름 제어를 유지하는 단계는 128KiB를 초과하는 버퍼 메모리에서, WAN 포트 상에서 수신되는 패킷을 버퍼링하는 단계를 더 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 방법.
  11. 논리 회로로 구성되는 인피니밴드(InfiniBand) 패킷을 운반하기 위한 장치에 있어서, 상기 장치는
    인피니밴드 라우팅 및 QoS 컴포넌트로 연결되는 인피니밴드 인터페이스
    를 포함하며, 이때, WAN 경로로의 상기 인피니밴드 라우팅 및 QoS 블록의 인피니밴드는 캡슐화/역-캡슐화 컴포넌트(ENCAP)로 연결되고,
    WAN 경로로의 상기 ENCAP 컴포넌트의 IB(인피니밴드)는 WAN 인터페이스로 연결되며,
    IB 경로로의 상기 WAN 인터페이스의 WAN은 ENCAP 컴포넌트로 연결되고,
    IB 경로로의 상기 ENCAP 컴포넌트의 WAN이 벌크 버퍼 메모리(Bulk Buffer Memory)로 연결되고,
    상기 벌크 버퍼 메모리는 인피니밴드 인터페이스의 IB 경로로의 WAN으로 연결되며,
    크레딧 관리 유닛(Credit Management Unit)이 WAN에 대한 크레딧을 생성하고, 인피니밴드 인터페이스 상에 백 프레셔(back pressure)를 생성하며,
    ENCAP 컴포넌트는 크레딧 데이터를 캡슐화하고, 역-캡슐화하기 위한 크레딧 관리 유닛으로 연결되며,
    관리 블록은 인피니밴드 서브넷 관리 에이전트(InfiniBand Subnet Management Agent), 엔드-투-엔드 협상, 관리 서비스를 제공하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  12. 제 11 항에 있어서, 상기 장치는 각각의 방향으로 동시에 초당 1기가바이트의 인피니밴드 패킷의 전송률을 유지하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  13. 제 11 항 또는 제 12 항에 있어서, 인피니밴드 인터페이스는 WAN 클럭 도메인(clock domain)으로부터 인피니밴드 클럭 도메인으로의 변환을 위한 추가적인 흐름 제어 버퍼링 유닛을 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  14. 제 11 항 또는 제 12 항 또는 제 13 항에 있어서, ENCAP 컴포넌트는 IPv6, 또는 IPv6의 UDP, 또는 IPv6의 DCCP, 또는 ATM AAL5, 또는 GFP 중 임의의 네트워크를 지원하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  15. 제 11 항 내지 제 14 항 중 어느 한 항에 있어서, WAN 인터페이스는
    SONET/SDH, 10GBASE-R, 인피니밴드, 10GBASE-W 중 임의의 것을 포함하는 다수의 네트워크 포맷을 지원하는 프레이머 유닛(framer unit),
    SONET/SDH, 10GBASE-R, 인피니밴드 중 임의의 것을 지원하는 광학 서브시스템(optical subsystem)
    을 더 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  16. 제 15 항에 있어서, 상기 광학 서브시스템은 홀로 사용되거나, 또는 SONET/SDH 멀티플렉서, 광학 재생기(optical regenerator), 패킷 라우터, 셀 스위치와 같은 다른 장비와 연결되는 경우, IBTA 인피니밴드 구조물 릴리즈 1.2에 의해 특정되는 것 이상의 거리에 도달하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  17. 제 11 항 내지 제 16 항 중 어느 한 항에 있어서, 벌크 버퍼 메모리(bulk buffer memory)는 다수의 FIFO 구조로부터 패킷이 수신된 순서와 다른 순서로 패킷 을 가져오는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  18. 제 11 항 내지 제 17 항 중 어느 한 항에 있어서, 상기 크레딧(credit) 관리 유닛은, 크레딧 블록 크기를 증가시키거나, 또는 광고 당 블록의 개수를 증가시키거나, 또는 크레딧 블록 크기도 증가시키고 광고 당 블록의 개수도 증가시킴으로써, 인피니밴드 표준기술문서(InfiniBand specification)가 정의하는 것보다 더 많은 크레딧을 광고하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  19. 제 11 항 내지 제 18 항 중 어느 한 항에 있어서, 청구항 제 10 항의 관리 블록(management block)은
    범용 프로세서,
    WAN과 IB 인터페이스 모두에 따라 패킷을 전송하고 수신하는 메커니즘
    을 더 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  20. 제 11 항 내지 제 19 항 중 어느 한 항에 있어서, 상기 벌크 버퍼 메모리는
    다수의 DDR2 메모리 모듈(DIMMS)
    을 더 포함하며, 이때, 제어 로직이 DDR2 메모리 내에 다수의 FIFO 구조를 유지하고,
    인피니밴드 VL로의 WAN을 버퍼링하기 위해 각각의 FIFO 구조가 사용되며,
    메모리 외부로의 패킷 흐름은, 인피니밴드 인터페이스에서의 혼 잡(congestion)으로 인하여 어떠한 패킷도 폐기되지 않음이 보장되도록 조정되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  21. 제 11 항에 있어서, 각각의 방향에서 동시에 초당 1기가바이트의 인피니밴드 패킷의 최대 송신율을 유지하기 위해,
    WAN 클럭 도메인으로부터 IB 클럭 도메인으로의 변환을 위한 추가적인 흐름 제어 버퍼링 유닛으로서, 이때, ENCAP 컴포넌트가 IPv6, IPv6의 UDP, IPv6의 DCCP, ATM AAL5, GFP 중 임의의 네트워크를 지원하는 상기 추가적인 흐름 제어 버퍼링 유닛,
    SONET/SDH, 10GBASE-R, 인피니밴드, 10GBASE-W의 네트워크 포맷을 지원하는 프레이머 유닛(framer unit),
    SONET/SDH, 10GBASE-R, 인피니밴드 중 임의의 것을 지원하도록 연결되는 광학 서브시스템(optical subsystem)
    을 더 포함하며, 이때 상기 광학 서브시스템은 홀로 사용되거나, SONET/SDH 멀티플렉서, 광학 재생기(optical regenerator), 패킷 라우터, 셀 스위치의 다른 설비와 연결될 때, IBTA 인피니밴드 구조 릴리즈 1.2에 의해 특정된 것 이상의 거리에 도달하고,
    벌크 버퍼 메모리(Bulk Buffer Memory)는, 패킷이 수신되었던 순서와는 다른 순서로 다수의 FIFO 구조로부터 패킷을 가져오며, 상기 벌크 버퍼 메모리는
    다수의 DDR2 메모리 모듈(DIMMS)
    을 더 포함하고, 이때, 제어 로직이 다수의 FIFO 구조를 상기 DDR2 메모리 내에 유지하며,
    각각의 FIFO 구조가 인피니밴드 VL로의 WAN을 버퍼링하기 위해 사용되며,
    인피니밴드 인터페이스에서의 혼잡(congestion)으로 인하여 어떠한 패킷도 폐기되지 않음이 보장되도록, 메모리 밖으로의 패킷 흐름이 조정되며,
    광고 당 크레딧 블록의 크기를 증가시키거나, 또는 블록의 개수를 증가시키거나, 또는 크레딧 블록의 크기를 증가시키고 블록의 개수를 증가시킴으로써, 크레딧 관리(Credit Management)는 인피니밴드 표준기술문서(InfiniBand specification)가 정의하는 것보다 더 많은 크레딧(credit)을 광고하며,
    관리 블록(management block)은
    범용 프로세서,
    WAN과 IB 인터페이스 모두에 따르는 패킷을 전송하고 수신하기 위한 메커니즘
    을 더 포함하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  22. 제 11 항 내지 제 21 항 중 어느 한 항에 있어서, ENCAP 컴포넌트가 널 캡슐화(null encapsulation)를 수행하고, 원래의 인피니밴드 패킷을 발행하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  23. 제 11 항 내지 제 22 항 중 어느 한 항에 있어서, 상기 벌크 버퍼 메모리는
    다수의 SRAM 메모리 칩
    을 더 포함하며, 이때 제어 로직이 QDR 메모리 내에 다수의 FIFO 구조를 유지하며,
    각각의 FIFO 구조는 인피니밴드 VL으로의 WAN을 버퍼링하기 위해 사용되고,
    인피니밴드 인터페이스에서의 혼잡(congestion)으로 인하여 어떠한 패킷도 폐기되지 않는 것이 보장되도록 메모리의 외부로의 패킷 흐름이 조정되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  24. 제 23 항에 있어서, SRAM 메모리 칩은 QDR2 SRAM인 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  25. 제 21 항에 있어서,
    벌크 버퍼 메모리는 다수의 SRAM 메모리 칩을 포함하며,
    제어 로직은 QDR 메모리 내에 다수의 FIFO 구조를 유지하고,
    인피니밴드 VL으로의 WAN을 버퍼링하기 위해 각각의 FIFO 구조가 사용되며,
    인피니밴드 인터페이스에서의 혼잡(congestion)으로 인하여 어떠한 패킷도 폐기되지 않는 것이 보장되도록 메모리의 외부로의 패킷 흐름이 조정되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  26. 제 11 항 내지 제 25 항 중 어느 한 항에 있어서, 인피니밴드 패킷은 IPv6 패킷의 페이로드 구조(payload structure) 내에 위치되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  27. 제 11 항 내지 제 26 항 중 어느 한 항에 있어서, 크레딧 데이터는 IPv6 헤더 내의 확장 헤더(extension header)에서 인코딩되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  28. 제 27 항에 있어서, 크레딧 데이터는 IPv6 헤더 내의 확장 헤더(extension header)에서 인코딩되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  29. 제 11 항 내지 제 28 항 중 어느 한 항에 있어서,
    ENCAP 컴포넌트는 IEEE802.3ae 조항 49에 의해 정의된 66/64b 부호화 틀(coding scheme)과 호환되는 방식으로 인피니밴드 패킷을 프레이밍(frame)하며,
    상기 ENCAP 컴포넌트는 프레이밍에 호환되는 조항 49를 제거하고, 원본 인피니밴드 패킷을 복구하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  30. 제 29 항에 있어서, 크레딧 데이터는 66/64b 코드에서의 순서 세트(ordered set)로 인코딩되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  31. 제 11 항 내지 제 30 항 중 어느 한 항에 있어서, 인피니밴드 패킷은, IPv6, 또는 IPv4 패킷 내에 포함되는 UDP, 또는 DCCP 데이터그램의 페이로드 구조(payload structure) 내에 위치하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  32. 제 11 항 내지 제 30 항 중 어느 한 항에 있어서, 상기 인피니밴드 패킷은 ATM 적응 계층 5(AAL 5)에 따르는 ATM 셀로 분할(segment)되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  33. 제 11 항 내지 제 30 항 중 어느 한 항에 있어서, 상기 인피니밴드 패킷은 GFP(Generic Framing Protocol) 패킷의 페이로드 구조 내에 위치하고, SONET/SDH 프레임 내에 위치하는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  34. 제 11 항 내지 제 33 항 중 어느 한 항에 있어서, 상기 크레딧 데이터는 캡슐화의 페이로드 구조에서 인코딩되는 것을 특징으로 하는 인피니밴드 패킷을 운반하기 위한 장치.
  35. 시스템에 있어서, 상기 시스템은
    - 제 1 인피니밴드 패브릭(InfiniBand fabric)으로서, 제 1 장치로 연결되는 상기 제 1 인피니밴드 패브릭,
    - 제 1 장치로서, 제 2 장치로 연결되는 상기 제 1 장치,
    - 제 2 장치로서, 제 2 인피니밴드 패브릭으로 연결되는 상기 제 2 장치
    를 포함하며, 이때, 상기 제 1 및 제 2 장치는
    인피니밴드 패킷을 또 다른 네트워크 프로토콜로 캡슐화 및 역-캡슐화하기 위한 로직 회로,
    상기 인피니밴드 패킷을 버퍼링하기 위한 로직 회로, 그리고
    캡슐화 인피니밴드 패킷을 운반하는 네크워크 인터페이스
    를 더 포함하는 것을 특징으로 하는 시스템.
  36. 제 35 항에 있어서, 제 1 장치 및 제 2 장치는 확장된 WAN 네트워크에 걸쳐 간접적으로 연결되며, 상기 확장된 WAN 네트워크는 SONET/SDH 멀티플렉서, 광학 재생기(optical regenerator), 패킷 라우터, 셀 스위치 중 하나 이상을 포함하는 것을 특징으로 하는 시스템.
  37. 제 35 항 또는 제 36 항에 있어서, 네트워크 내의 상태, 또는 관리자 구성(administrative configuration)을 기반으로 하여 장치에 의하여, ENCAP 컴포넌트로의 패킷의 흐름 속도(flow rate)가 최대 가능한 속도(rate) 이하이도록 제한되는 것을 특징으로 하는 시스템.
  38. 제 35 항 또는 제 36 항 또는 제 37 항에 있어서, 상기 시스템은
    두 개의 장치 사이에 존재하는, 패킷, 또는 셀 스위치되거나 라우팅되는 네트워크
    를 더 포함하고, 이때
    셋 이상의 장치가 상기 네트워크에 연결될 수 있고,
    각각의 종단 장치가 패킷을 캡슐화하여, 둘 이상의 도착지 장치로 어드레싱하는 것을 특징으로 하는 시스템.
  39. 제 35 항 내지 제 38 항 중 어느 한 항에 있어서, 청구항 제 21 항에 따르는 장치를 더 포함하는 것을 특징으로 하는 시스템.
  40. 제 35 항 내지 제 38 항 중 어느 한 항에 있어서, 청구항 제 25 항에 따르는 장치를 더 포함하는 것을 특징으로 하는 시스템.
  41. 제 35 항 내지 제 38 항 중 어느 한 항에 있어서,
    분리된 LID 어드레스 공간 및 여러 다른 서브넷 프리픽스(subnet prefix)를 갖는 2개의 인피니밴드 패브릭(InfiniBand fabric),
    장치로 일체되는 패킷 라우팅 컴포넌트
    를 더 포함하며, 이때,
    로직 회로가 GRH의 도착지 GID를 조사함으로써, 주어진 인피니밴드 패킷의 LID 어드레스를 판단하며,
    로직 회로는 인피니밴드 패킷의 LID, 또는 SL, 또는 VL, 또는 그 밖의 다른 구성요소를 GRH로부터의 정보를 이용하여 대체하는 것을 특징으로 하는 시스템.
KR1020087003373A 2005-07-17 2006-07-17 인피니밴드 네트워크의 물리적 범위를 확장하기 위한 방법 KR101290413B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US59557605P 2005-07-17 2005-07-17
US60/595,576 2005-07-17
PCT/CA2006/001161 WO2007009228A1 (en) 2005-07-17 2006-07-17 A method to extend the physical reach of an infiniband network

Publications (2)

Publication Number Publication Date
KR20080031397A true KR20080031397A (ko) 2008-04-08
KR101290413B1 KR101290413B1 (ko) 2013-07-26

Family

ID=37663469

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020087003373A KR101290413B1 (ko) 2005-07-17 2006-07-17 인피니밴드 네트워크의 물리적 범위를 확장하기 위한 방법

Country Status (11)

Country Link
US (1) US7843962B2 (ko)
EP (1) EP1905207B1 (ko)
JP (1) JP4933542B2 (ko)
KR (1) KR101290413B1 (ko)
CN (1) CN101258719B (ko)
AU (1) AU2006272404B2 (ko)
CA (1) CA2552414C (ko)
GB (1) GB2441950B (ko)
IL (1) IL188772A (ko)
RU (1) RU2461140C2 (ko)
WO (1) WO2007009228A1 (ko)

Families Citing this family (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8805195B2 (en) 2007-07-16 2014-08-12 Ciena Corporation High-speed optical transceiver for InfiniBand and Ethernet
US9191117B2 (en) * 1995-05-11 2015-11-17 Ciena Corporation High-speed optical transponder systems
US7730214B2 (en) * 2006-12-20 2010-06-01 International Business Machines Corporation Communication paths from an InfiniBand host
US20100202781A1 (en) * 2009-02-11 2010-08-12 Emcore Corporation Tunable Optical Transceiver in an XFP Package
JP5290434B2 (ja) 2010-01-08 2013-09-18 パナソニック株式会社 Ofdm送信装置、ofdm送信方法、ofdm受信装置及びofdm受信方法
US8665905B1 (en) * 2010-10-07 2014-03-04 Adtran, Inc. Systems and methods for centrally provisioning virtual circuit information
US8898222B2 (en) * 2012-01-19 2014-11-25 International Business Machines Corporation Processing STREAMS messages over a system area network
US9270489B1 (en) 2012-03-19 2016-02-23 Google Inc. Explicit congestion notification in mixed fabric networks
RU2606397C1 (ru) * 2012-12-17 2017-01-10 Хуавей Текнолоджиз Ко., Лтд. Способ установления сигнализации, когда электрический регенератор находится на электрическом сетевом элементе, оптический сетевой элемент и электрический сетевой элемент
CN103401775B (zh) * 2013-07-18 2017-07-21 杭州华为数字技术有限公司 源报文转换装置及其报文转换方法、目标报文转换装置及其报文转换方法
US10432470B2 (en) * 2015-09-23 2019-10-01 International Business Machines Corporation Distributed subnet manager for InfiniBand networks
US9692660B2 (en) 2015-09-23 2017-06-27 International Business Machines Corporation Election and use of configuration manager
US10360205B2 (en) 2015-09-23 2019-07-23 International Business Machines Corporation Cooperative MKEY locking for managing infiniband networks
US10581711B2 (en) 2016-01-28 2020-03-03 Oracle International Corporation System and method for policing network traffic flows using a ternary content addressable memory in a high performance computing environment
US10616118B2 (en) 2016-01-28 2020-04-07 Oracle International Corporation System and method for supporting aggressive credit waiting in a high performance computing environment
US10659340B2 (en) 2016-01-28 2020-05-19 Oracle International Corporation System and method for supporting VM migration between subnets in a high performance computing environment
US10630816B2 (en) 2016-01-28 2020-04-21 Oracle International Corporation System and method for supporting shared multicast local identifiers (MILD) ranges in a high performance computing environment
US10666611B2 (en) * 2016-01-28 2020-05-26 Oracle International Corporation System and method for supporting multiple concurrent SL to VL mappings in a high performance computing environment
US10057119B2 (en) 2016-08-23 2018-08-21 Oracle International Corporation System and method for supporting fast hybrid reconfiguration in a high performance computing environment
CN107948105B (zh) * 2018-01-02 2020-08-25 联想(北京)有限公司 控制设备的端口状态的方法和***
CN112333024B (zh) * 2020-11-06 2022-07-19 中国人民解放军国防科技大学 融合高速网链路层与100g以太网编码层的适配装置
CN114553801B (zh) * 2022-01-07 2023-05-16 山东省计算中心(国家超级计算济南中心) 实现InfiniBand网络长距离传输的设备及方法
CN115237036B (zh) * 2022-09-22 2023-01-10 之江实验室 一种针对晶圆级处理器***的全数字化管理装置

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5291545A (en) * 1990-10-02 1994-03-01 Intertex Data Ab Apparatus and method for determining the state of a telephone line
JP3512832B2 (ja) * 1993-05-26 2004-03-31 富士通株式会社 Lan間通信方法及びlan・wan接続装置
WO1998026349A2 (en) * 1996-12-13 1998-06-18 Maves International Software, Inc. Method, system and data structures for computer software application development and execution
US6799202B1 (en) * 1999-12-16 2004-09-28 Hachiro Kawaii Federated operating system for a server
US6922408B2 (en) * 2000-01-10 2005-07-26 Mellanox Technologies Ltd. Packet communication buffering with dynamic flow control
US20030152182A1 (en) * 2000-08-22 2003-08-14 Pai B. Anand Optical exchange method, apparatus and system for facilitating data transport between WAN, SAN and LAN and for enabling enterprise computing into networks
US20040213220A1 (en) * 2000-12-28 2004-10-28 Davis Arlin R. Method and device for LAN emulation over infiniband fabrics
US7039057B1 (en) 2001-07-19 2006-05-02 Advanced Micro Devices, Inc. Arrangement for converting ATM cells to infiniband packets
US7107344B2 (en) * 2001-08-16 2006-09-12 International Business Machines Corporation Connection allocation technology
US7404000B2 (en) * 2001-09-28 2008-07-22 Emc Corporation Protocol translation in a storage system
US7006527B1 (en) * 2001-10-12 2006-02-28 Cypress Semiconductor Corp. Multistage pipeline bit conversion
US7599360B2 (en) 2001-12-26 2009-10-06 Cisco Technology, Inc. Methods and apparatus for encapsulating a frame for transmission in a storage area network
US7020729B2 (en) 2002-05-16 2006-03-28 Intel Corporation Protocol independent data transmission interface
US6898752B2 (en) * 2002-05-31 2005-05-24 Agilent Technologies, Inc. Apparatus and methods for combinational error detection in an InfiniBand switch
JP3869769B2 (ja) * 2002-07-24 2007-01-17 株式会社日立製作所 ストレージ・ネットワーク用のスイッチングノード装置および遠隔ストレージ装置のアクセス方法
US7401157B2 (en) * 2002-07-30 2008-07-15 Brocade Communications Systems, Inc. Combining separate infiniband subnets into virtual subnets
US6928508B2 (en) 2002-09-12 2005-08-09 Sun Microsystems, Inc. Method of accessing a remote device from a host by mapping an address of the device to a memory address of the host
WO2004027580A2 (en) * 2002-09-20 2004-04-01 Nortel Networks Limited System and method for managing an optical networking service
US6904507B2 (en) * 2002-09-30 2005-06-07 Agilent Technologies, Inc. Buffer management architecture and method for an infiniband subnetwork
CN1238796C (zh) * 2002-10-30 2006-01-25 华为技术有限公司 一种实现接口转换的装置及方法
US7551645B2 (en) * 2003-01-31 2009-06-23 Broadcom Corporation Apparatus and method to receive and align incoming data including SPI data in a buffer to expand data width by utilizing a single read port and single write port memory device
US7051304B2 (en) 2003-05-01 2006-05-23 Sun Microsystems, Inc. Distributed infiniband verification protocol
JP2005064901A (ja) * 2003-08-13 2005-03-10 Nec Corp ファイバチャネル接続装置、ファイバチャネル接続装置によるファイバチャネル接続方法
US7385998B2 (en) * 2003-09-08 2008-06-10 Nortel Networks Limited Method and apparatus for encapsulating services for transportation over metallic physical mediums
US20050078704A1 (en) * 2003-10-14 2005-04-14 International Business Machines Corporation Method and apparatus for translating data packets from one network protocol to another
US20060268943A1 (en) * 2005-05-16 2006-11-30 International Business Machines Corporation Methods, systems, and storage media for data encapsulation in networks

Also Published As

Publication number Publication date
IL188772A (en) 2013-12-31
AU2006272404A1 (en) 2007-01-25
CN101258719A (zh) 2008-09-03
RU2461140C2 (ru) 2012-09-10
EP1905207B1 (en) 2018-04-25
GB0801276D0 (en) 2008-02-27
JP4933542B2 (ja) 2012-05-16
WO2007009228A1 (en) 2007-01-25
CA2552414A1 (en) 2007-01-17
AU2006272404A2 (en) 2008-05-29
CA2552414C (en) 2012-12-11
CN101258719B (zh) 2012-12-12
EP1905207A4 (en) 2012-12-05
RU2008105890A (ru) 2009-08-27
KR101290413B1 (ko) 2013-07-26
US7843962B2 (en) 2010-11-30
AU2006272404B2 (en) 2011-02-24
US20070014308A1 (en) 2007-01-18
EP1905207A1 (en) 2008-04-02
GB2441950A (en) 2008-03-19
GB2441950B (en) 2010-06-30
JP2009502059A (ja) 2009-01-22

Similar Documents

Publication Publication Date Title
KR101290413B1 (ko) 인피니밴드 네트워크의 물리적 범위를 확장하기 위한 방법
US6643292B2 (en) Efficient packet data transport mechanism and an interface therefor
JP3391291B2 (ja) 光波ネットワークデータ通信方式
CA2301853C (en) Device for performing ip forwarding and atm switching
US6985488B2 (en) Method and apparatus for transporting packet data over an optical network
US6009097A (en) System for routing packet switched traffic
US7756125B2 (en) Method and arrangement for routing pseudo-wire encapsulated packets
US20020083190A1 (en) Apparatus and method for GFP frame transfer
US20070140271A1 (en) Method and system for terminating SONET/SDH circuits in an IP network
US20030152182A1 (en) Optical exchange method, apparatus and system for facilitating data transport between WAN, SAN and LAN and for enabling enterprise computing into networks
JP2009502059A5 (ko)
JP3343906B2 (ja) 光波ネットワーク
Molinero-Fernández et al. TCP switching: exposing circuits to IP
US20070263661A1 (en) Wide area multi-service communication networks based on connection-oriented packet switching
CA2236085C (en) Efficient packet data transport mechanism and an interface therefor
JP2000253018A (ja) Atm優先制御ipゲートウェイ装置およびatm優先制御ipルーティング装置ならびにそれらの処理方法
Kachelmeyer A new router architecture for tomorrow's internet
Truchly et al. Transmission efficiency of current communications systems
Klovning et al. High speed networking in Internet and corporate Intranets
De Praetere et al. Data networks integration

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20160712

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20170711

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee