JP4627669B2 - パケット転送装置およびその転送制御方式 - Google Patents

パケット転送装置およびその転送制御方式 Download PDF

Info

Publication number
JP4627669B2
JP4627669B2 JP2005074250A JP2005074250A JP4627669B2 JP 4627669 B2 JP4627669 B2 JP 4627669B2 JP 2005074250 A JP2005074250 A JP 2005074250A JP 2005074250 A JP2005074250 A JP 2005074250A JP 4627669 B2 JP4627669 B2 JP 4627669B2
Authority
JP
Japan
Prior art keywords
packet
tcp
transfer device
packet transfer
protocol
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2005074250A
Other languages
English (en)
Other versions
JP2006261873A (ja
Inventor
稔 日高
善文 新
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alaxala Networks Corp
Original Assignee
Alaxala Networks Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alaxala Networks Corp filed Critical Alaxala Networks Corp
Priority to JP2005074250A priority Critical patent/JP4627669B2/ja
Priority to US11/207,709 priority patent/US8179904B2/en
Publication of JP2006261873A publication Critical patent/JP2006261873A/ja
Application granted granted Critical
Publication of JP4627669B2 publication Critical patent/JP4627669B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/19Flow control; Congestion control at layers above the network layer
    • H04L47/193Flow control; Congestion control at layers above the network layer at the transport layer, e.g. TCP related
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/20Traffic policing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2441Traffic characterised by specific attributes, e.g. priority or QoS relying on flow classification, e.g. using integrated services [IntServ]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/24Traffic characterised by specific attributes, e.g. priority or QoS
    • H04L47/2466Traffic characterised by specific attributes, e.g. priority or QoS using signalling traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L47/00Traffic control in data switching networks
    • H04L47/10Flow control; Congestion control
    • H04L47/40Flow control; Congestion control using split connections
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L69/00Network arrangements, protocols or services independent of the application payload and not provided for in the other groups of this subclass
    • H04L69/16Implementation or adaptation of Internet protocol [IP], of transmission control protocol [TCP] or of user datagram protocol [UDP]
    • H04L69/163In-band adaptation of TCP data exchange; In-band control procedures

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Security & Cryptography (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Description

本発明は、ネットワークを構成するパケット転送装置とそのパケット転送制御方式に関する。特にパケット転送装置等の転送制御方式において、TCP(Transmission Control Protocol)(非特許文献1参照。)やSCTP(Stream Control Transmission Protocol)(非特許文献5参照。)等の確認応答を必要とする転送制御方式に従ったパケット転送制御方式の当該プロトコルヘッダ情報を利用するパケット転送装置とそのパケット転送制御方式に関する。
イーサネット(イーサネットは登録商標)により構成されるネットワークの応用範囲は拡大しており、ストレージエリアネットワーク(SAN)へも応用され始めている。また、ギガビットイーサネットや10ギガビットイーサネット等、規格上のデータ転送速度は高速化してきた。そこで、TCPあるいはSCTP等の確認応答を必要とするプロトコル(以下、TCP等とする。)上の制限による実効的なデータ転送速度の問題が顕在化してくる。
TCP等の動作詳述は、非特許文献2あるいは非特許文献5に記載されている。ここでは、TCPコネクション確立動作とデータ転送状態の動作について説明する。
図3にTCP等に従った通信端末間のTCPコネクションにおけるパケット交換とTCPの制御情報の交換方式について示す。サーバ201とストレージ装置221が通信を行う場合を例として説明する。
サーバ201は、接続要求として、TCPのSYNフラグを設定したパケット(SYNパケット)をストレージ装置221に対して送信する。
ストレージ装置221は、サーバからSYNパケットを受信した確認応答として、ACKフラグを設定したパケット(ACKパケット)をサーバ201に送信する。同時にストレージ装置221は、ストレージ装置221からサーバ201への接続要求として、そのACKパケットにSYNフラグを設定することも行う。ここで、サーバ201が、ストレージ装置221からのSYNパケットを受信した確認応答として、ACKパケットをストレージ装置221に送信し、TCPコネクションが確立する。
TCPコネクションが確立すると、サーバ201とストレージ装置221とはデータ転送状態となる。データ転送状態では、通信端末がお互いに、送信側がデータを送信し、受信側がデータの送達確認応答をACKパケットで行う。ここでは簡単の為に、ストレージ装置221からサーバ201へ送信するデータのみがある場合を例とした。
TCP等による通信では、データを送信する側(この場合ストレージ装置221)は、確認応答が到着するまで次の送信データの送出を待機する為、データ送出時刻と確認応答到着時刻の差であるラウンドトリップタイム(RTT)は、送信データを送出可能な速度の上限を決める要因となる。また、確認応答が到着するまでに予め送信できるデータの量をウィンドウと呼ぶが、このウィンドウも送出可能な速度の上限を決める要因となる。
これらのパラメータを調整してTCP等のデータ転送スループットを向上するための従来技術として、送信側端末と受信側端末間にTCP等のコネクションを中継する装置を置き、受信側からの確認応答を待つことなく、確認応答を代行して送信することで、RTTを小さくでき、端末間でのデータ転送スループットを向上する方式がある。例えば、特許文献1に開示されているパケット中継装置や、非特許文献3、非特許文献4に開示されているTCPオーバレイネットワークなどである。
TCPコネクションを中継する装置は、ネットワーク上のスイッチやルータとして配置する。スイッチ211による確認応答の代行について、図4を用いて説明する。TCPコネクションが確立しデータ転送状態になると、ストレージ装置221からサーバ201へ送信されたデータに対する確認応答をスイッチ211がサーバ201に代行して送信する。この場合、ストレージ装置221はサーバ201からの確認応答を待つことなく、ウィンドウに従った量のデータを送信することができる。これを図3の場合と比べると、ウィンドウとRTTは同じであるが、TCPのデータ転送スループットを向上することができる。
以下では、TCP等のコネクションにおける確認応答を代行するパケット転送装置を、TCP等代行装置と呼ぶ。
特開2003−32295号公報
J. Postel, "Transmission Control Protocol", Request for Coments 793, 1981. W. Stevens, "TCP/IP Illustrated, Volume1: The Protocols", Addison-Wesley,1994. 村瀬勉、下西英之、長谷川洋平、"TCPオーバレイネットワークの提案"、電子情報通信学会ソサエティ大会、2002. 牧一之進、長谷川剛、村田正行、村瀬勉、"TCPオーバレイネットワークにおけるTCPコネクション分割機構の性能解析"、電子情報通信学会、IN03-198、2004. R. Stewart, Q. Xie, K. Morneault, C. Sharp, H. Schwarzbauer, T.Taylor, I. Rytina, M. Kalla, L. Zhang V. Paxson, "Stream Control Transmission Protocol", Request for Coments 2960, 2000.
従来のパケット転送装置では、確認応答を代行するTCP等のコネクションについて、通過するパケットを到着順に順次処理しており、確認応答の代行が必要な一連のパケットの群であるフロー(以下、送信元や宛先等が同一であり、同一のファイルデータ等を分割したパケットの群をフローと呼ぶ。)の効果的な選別処理手段を持つことが成されていなかった。ネットワークに配置されるルータやスイッチ等、フローが集約される装置では、記憶手段の容量やフローの処理能力などの制約から、全てのフローを処理することは困難となる。
従って、本発明が解決しようとする第一の課題は、多数のTCP等のフローから、確認応答を代行するフローを選び出し、ギガビットイーサネット等のネットワークインタフェースのスループットを損ねることなく処理を行うTCP等代行装置を提供することである。
また、従来のTCP代行装置がTCPコネクションを分割し、TCPのRTTを分割する方法では、TCP代行装置の効果を最大化するためには、通信端末間のRTTを等分割するようにTCP代行装置を配置する必要があった。実際にはネットワークのエッジ部には比較的配置し易いが、ネットワークの内部の適当な位置には配置が困難であった。
本発明が解決しようとする第二の課題は、ネットワークのエッジ部に配置することで、TCP等のスループットを向上することが可能なTCP等代行装置を提供することである。
本発明では、第一の課題を解決する為の手段として、パケットの帯域制御手段と転送パケットを格納する記憶手段と、該記憶手段に格納したパケットに対してパケットデータの解析手段と確認応答代行送信手段を備えたパケット転送装置に対して、
該帯域制御手段から通知される帯域遵守フロー識別結果を元に該確認応答代行送信手段が確認応答代行の要否を判断するフロー識別手段を提供する。
また本発明では、第二の課題を解決する為の手段として、パケット転送装置に、転送パケットを格納する記憶手段と、該記憶手段に格納したパケットに対してパケットデータの解析手段とを備えた上で、
格納したパケットをUDP等の確認応答を行わないプロトコルに変換する手段と
変換したパケットを対向するネットワークのエッジに配置したTCP等代行装置へ送信する手段を備えることで、TCP等のスループットを向上できる手段を提供することにある。
ここまでに述べた手段を備えることで、本発明によるパケット転送装置では、通信端末間のTCP等のコネクションを分割するために確認応答を代行するTCP等のフローを識別できるようになる。その結果、フローのスループットを向上させ、回線帯域を有効に利用できるようになる。
また、TCP等代行装置間をコネクションの確認応答が必要ない通信方式とすることで、比較的配置し易いネットワークのエッジ部へTCP等代行装置を配置するだけで、TCPフロー等、確認応答が必要なフローのスループットを向上できるようになる。
以下、本発明の第1の実施例について図面を参照して説明する。
初めに本発明を適用するネットワークの構成と、本発明による通信の方式を説明する。
ファイルサーバなどの計算機(サーバ)が、ストレージエリアネットワーク(SAN)を通じて、ストレージ装置とファイルデータの転送を行う場合を例とする。
図2に、パケット転送装置を用いたストレージネットワークの構成例を示す。ストレージ装置とサーバがスイッチによりそれぞれ接続されている。この時、ストレージネットワークは、広域イーサネットを含んでいてもよい。
サーバ201から、ストレージ装置221に対しファイルの読み出しを行う場合のTCPの動作を説明する。SCTP等のTCP以外のプロトコルでも同様の構成、動作となることから、本発明の実施例では、以下TCPを例にして説明する。
前提として通信端末にはそれぞれIPアドレスが割当てられているとする。TCPでは、通信端末間で交渉して、TCPコネクションを確立して通信を行う。この場合の通信端末とは、サーバ201とストレージ装置221のそれぞれを指す。通信端末であるサーバ201やストレージ装置221の上では、通信を行う複数のプログラムが動作するので、それらを区別する識別子として、TCPポート番号が割当てられる。
TCPコネクションは、一方の通信端末のネットワークアドレス(IPアドレス)とTCPポート番号、他方の通信端末のIPアドレスとTCPポートにより識別される。
通信端末同士が通信する場合に、送信側の通信端末から受信側の通信端末に、一つのファイルを構成する複数のパケットが送受信される時、それらのパケットは、TCPの場合は、宛先IPアドレスと送信元IPアドレスと宛先ポートと送信元ポート等の識別子の組を同一としている。このような通信プロトコルの宛先情報や送信元情報により一連のパケットと識別されるパケットの群をフローと呼ぶ。本実施例では、TCPの場合に宛先IPアドレスと送信元IPアドレス、および宛先ポートと送信元ポートをそれぞれ入れ替えたフローを互いに対向フローと呼ぶことにする。
確立したTCPコネクションでは、送信側は、送信データと送信データ量を表すTCPのシーケンス番号を送信する。受信側では、受信を確認したデータ量を表すために、受信している最新のシーケンス番号を確認応答番号として受信側から送信側へ逆向きに送信する。この逆向きの送信は、受信側から送信側への対向フローがある場合は、そのヘッダに重畳される。対向フローがない場合は、TCPヘッダのみを持つ対向フローを生成し送信される。
次に本発明を実施する為に必要なパケット転送装置の構成について説明する。
図5は、本発明によるパケット転送装置の機能ブロック構成例を示したブロック図である。本発明のパケット転送装置は、入力回線インタフェースと出力回線インタフェースと受信パケットに対して転送処理を行うパケット転送部と装置全体を制御する制御部と、パケット転送部と連携してパケット宛先検索を行うパケット検索制御部を持つ。前記パケット検索制御部には経路テーブルを備えている。また、前記パケット検索制御に連携したパケット記憶手段としてTCP転送制御部を備える。
また回線インタフェースには、帯域制御部を備える。帯域制御部は入力回線インタフェースと出力回線インタフェースのどちらかあるいは両方に備えてもよい。入力帯域制御部は受信するパケットの到着時刻を記録しパケットの到着時刻の間隔から入力回線の帯域を監視する手段を持つため、入力回線の設定帯域を超過したパケットが属するフローをTCP転送制御部に通知することができる。
出力帯域制御部は、送信するパケットの送信時刻を管理し出力回線の帯域を制御する手段を持つため、出力回線の設定帯域を超過したパケットが属するフローをTCP転送制御部に通知することできる。
ここで、入力回線インタフェースと出力回線インタフェースは、同一の基板上に実装されることが多いが、ここではパケット処理の流れ図を簡便化するため、機能的に分割して示した。
ここで、図7に通信に用いるパケット構造を示す。パケットは、OSI(Open System Interconnection)参照モデルの各レイヤのプロトコルに対応した階層化されたヘッダ情報とデータから構成される。具体的には、レイヤ2ヘッダ、レイヤ3ヘッダ、レイヤ4ヘッダデータ等から構成される。レイヤ2プロトコルとしては、Ethernet(Ethernetは登録商標)、ATM(Asynchronous Transfer Mode)、MPLS(Multi-Protocol Label Switching)等のプロトコルを用いることができる。レイヤ3のプロトコルとしては、Internet Protocol version 4(IPv4)、Internet Protocol version6(IPv6)等のプロトコルを用いることができる。レイヤ4のプロトコルとしては、TCP(Transmission Control Protocol)やUDP(User Datagram Protocol)等のプロトコルを用いることができる。
図8に、レイヤ2ヘッダの一例として、Ethernet version2(v2)フレームのヘッダフィールドを示す。Ethernet v2フレームヘッダには、フィールドとして、フレームの開始を示すプリアンブル/SFD、レイヤ2での宛先端末のMAC(Media Access Control)アドレス(宛先MACアドレス)、レイヤ2での送信元端末のMACアドレス(送信元MACアドレス)、レイヤ3のプロトコルを示すタイプ等がそれぞれヘッダフィールドとして定義されている。
図9は、レイヤ3ヘッダの一例として、IPv4データグラムのヘッダフィールドを示す。IPv4ヘッダには、フィールドとして、パケットの転送品質を示すToS、レイヤ4のプロトコルを示すプロトコル、送信元端末のIPアドレス(送信元IPアドレス)、宛先端末のIPアドレス(宛先IPアドレス)等がそれぞれヘッダフィールドとして定義されている。
図10は、レイヤ3ヘッダの一例として、IPv6データグラムのヘッダフィールドを示す。IPv6ヘッダには、フィールドとして、パケットの転送品質を示すクラス、このヘッダが階層的に格納する次のヘッダ種別を示す次ヘッダ番号、送信元端末のIPアドレス(送信元IPアドレス)、宛先端末のIPアドレス(宛先IPアドレス)等がそれぞれヘッダフィールドとして定義されている。
図11は、レイヤ4ヘッダの一例として、TCPセグメントのヘッダフィールドを示す。TCPヘッダには、フィールドとして、アプリケーション等の上位レイヤがTCPセグメントを識別する為の送信元ポート番号、宛先ポート番号、TCPの通信状態を示すTCPフラグ等がそれぞれヘッダフィールドとして定義されている。
図12にTCPフラグの詳細を示す。TCPフラグは、受信端末が緊急にアプリケーションに受信データを渡すことを指示する緊急フラグ(URG)、受信端末がデータを受信したことを送信端末へ通知する確認応答フラグ(ACK)、送信端末および受信端末において遅滞無くデータをアプリケーションへ渡すことを指示するフラグ(PUSH)、TCPコネクションのリセットを支持するフラグ(RST)、コネクションの終了を支持するフラグ(FIN)、コネクションの確立を指示するフラグ(SYN)の6つのフラグからなる。
図13は、レイヤ4ヘッダの一例として、UDPセグメントのヘッダフィールドを示す。UDPヘッダには、フィールドとして、アプリケーション等の上位レイヤがUDPセグメントを識別する為の送信元ポート番号、宛先ポート番号、チェックサム等がそれぞれヘッダフィールドとして定義されている。
図14は、フロー識別の条件を示す図である。
フロー識別は、レイヤ2ヘッダフィールドとレイヤ3ヘッダフィールドとレイヤ4ヘッダフィールドの情報を組み合わせるなどして、そのパケットのフロー識別を行いフロー番号の設定を行う。例えば、レイヤ2ヘッダフィールドでは、宛先MACアドレス、送信元MACアドレスなどが用いられ、レイヤ3ヘッダフィールドでは、宛先IPアドレス、送信元IPアドレス、上位プロトコル等が用いられ、また、レイヤ4ヘッダフィールドでは、宛先TCPポート、送信元TCPポート等が用いられる。
図14に示した構成例では、宛先IPアドレス、送信元IPアドレス、上位プロトコル、宛先TCPポート、送信元TCPポートを識別条件としている。
図1は、TCP転送制御部の構成例を示すブロック図である。
TCP転送制御部は、フロー識別部とTCPバッファ制御部とTCPバッファとTCPバッファ管理テーブルとTCP再送制御部と代行確認応答発生部と確認応答対向フロー識別部と確認応答代行判断テーブル制御部と確認応答代行判断テーブルから構成される。
本発明のパケット転送装置において、TCPコネクションの確認応答を代行可能とする方式について、図15から図19を用いて説明する。
フロー識別部では、パケット転送部から転送されたパケットのヘッダ構成を解析する。TCPヘッダを持つパケットが入力されるとTCPデータパケットか確認応答パケットかを判断する。TCPデータ部を持つパケットがTCPデータパケットである。TCPフラグのACKフラグが有効なパケットが確認応答パケットである。
TCPデータパケットの場合は、図18のフローチャートに従い、確認応答を代行するかどうかを判断する。
図15は、確認応答代行許可テーブルの構成例である。
フロー識別部は、TCPデータパケットに対しては、前記のヘッダフィールドの該当部分を図15に示した確認応答代行制御テーブルの確認応答代行許可テーブルに保持した値と比較することにより、検索結果を得る。検索結果には入力帯域の遵守を示す判定フラグと、出力帯域の遵守を示す判定フラグが設定されている。帯域を遵守しているフローを確認応答代行するフローとして識別する。また、確認応答代行するフローの識別は、パケットのTOSフィールドの優先度により識別してもよい。
TOSフィールドの優先度により識別する場合、本装置と回線により接続された外部装置により帯域制御を行い、その結果を受け取る構成を採ることも可能である。
また確認応答の代行の要否を示すフラグも設定されているので、入力されたパケットが許可フローであり確認応答代行を行うか、不許可なので通常転送を行うかを判定する。
図16は、確認応答代行不要テーブルの構成例である。
フロー識別部は、確認応答代行の不要フローであるかどうかを判別するために、前記のヘッダフィールドの該当部分を図16に示した確認応答代行不要テーブルに保持した値と比較することにより、検索結果を得る。検索結果には入力帯域の遵守を示す判定フラグと、出力帯域の遵守を示す判定フラグが設定されている場合がある。帯域を遵守していないフローを確認応答代行しないフローとして識別する。また、確認応答代行しないフローの識別は、パケットのTOSフィールドの優先度により識別してもよい。
TOSフィールドの優先度により識別する場合、本装置と回線により接続された外部装置により帯域制御を行い、その結果を受け取る構成を採ることも可能である。
TCPバッファ制御部は、図17に示したTCPバッファ管理テーブルを確認しTCPバッファがある設定値よりも少ない場合は、TCPバッファが枯渇したとみなし、このパケットの確認応答代行を中止し、このパケットの属するフローを確認応答代行不要テーブルに設定したり、あるいはこのパケットの属するフローを確認応答代行許可テーブルから削除したりすることにより、パケットを通常転送とすることができる。TCPバッファが枯渇している場合は、このパケットの確認応答代行を中止し、パケットを通常転送とする。
入力されたパケットの確認応答代行を行う場合は、図17に示したTCPバッファ管理テーブルに登録し、確認応答代行を開始する。
図17は、TCPバッファ管理テーブルの構成例である。TCPバッファ制御部は、受信回線インタフェース内のパケットメモリからパケット転送部で複製されたパケットデータをフロー識別部から受信して、TCPバッファに記憶し、バッファアドレスをTCPバッファ管理テーブルに登録する。
代行不要と登録されていれば、通常転送と判断する。通常転送と判断された際に、既にTCPバッファ管理テーブルに登録されているフローは、確認応答代行中止処理を行い、TCPバッファの開放を行う。
また、確認応答パケットの場合は、図19のフローチャートに従い、確認応答を代行したフローのTCP制御を行う。
フロー識別部は、確認応答パケットに対しては、そのパケットを確認応答識別部に送る。確認応答識別部では、受信した確認応答パケットの対向フローがTCPバッファ管理テーブルに登録されているかどうかを判断する。登録されている場合は、確認応答を代行したパケットをTCPバッファに保持しているのでTCP制御部により確認応答を受け取ったTCPパケットとしてバッファ開放処理を行う。
ここまでに述べた手段を備えることで、本発明によるパケット転送装置では、サーバとストレージ装置間のTCPコネクションを分割するために確認応答を代行するTCPフローを識別できるようになり、その結果、ネットワークの回線の帯域とTCPフローの利用帯域の状況に応じて、利用可能な帯域に余裕がある回線上のTCPフローのスループットを向上させ、回線帯域を有効に利用できるようになる。
本発明の第2の実施例について図面を参照して説明する。
第2の実施例では、図2に示したネットワーク構成において、サーバ202とストレージ装置222が通信を行う場合を例として説明する。第1の実施例と同様に、用いる通信プロトコルがSCTP等のTCP以外のプロトコルでも同様の構成、動作となることから、本発明の実施例では、以下TCPを例にして説明する。
図6は、TCP転送制御部の別の構成例である。図1の構成例に加えて、プロトコル変換部とプロトコル変更フロー識別テーブルを備える。
第1の実施例のパケット転送装置の構成に対して、TCP転送制御部を図6に示した構成に変更することで、TCP代行装置間のパケットデータの変換をUDPカプセル化処理の方式とした実施例である。
サーバ202がストレージ装置222に対して、TCPコネクションを確立する場合、サーバ202側のネットワークエッジに配置されたスイッチ212とストレージ装置222側のネットワークエッジに配置されたスイッチ213を通過するものとする。
TCPコネクションが確立すると、スイッチ213は、TCPデータパケットに対し、フローテーブルに登録されたプロトコル変換を示すフローエントリーを検索し、検索結果からスイッチ212へ送信する為のパケットヘッダ情報を得る。さらにスイッチ213は、ストレージ装置からのTCPデータパケットに新たなパケットヘッダを付加してUDPパケットに変換し、スイッチ212へ送信する。さらにスイッチ213では、スイッチ212からの確認応答がない為、確認応答を代行したパケットのTCPバッファへの登録は行わない。この時、UDPパケットをスイッチ213からスイッチ212へ送信するネットワークは、エラー訂正符号などを利用して送達時の通信エラーを回避する手段を備えていてもよい。
通信エラー回避手段を備えることで、スイッチ間のデータ転送時に生じるパケットロスによるデータ転送の遅れを低減でき、データ通信の高速化が可能となる。
スイッチ212は、フローテーブルに登録されたプロトコル変換を示すフローエントリーを検索し、スイッチ213が付加したUDPヘッダなどのパケットヘッダを取り外して、ストレージ装置が送信したTCPデータパケットを受信する。スイッチ212は、実施例1の場合と同様にTCPバッファに登録し、TCP代行装置とし、ストレージ装置が送信した元のTCPコネクションのパケットをサーバ202に送信する。
ここまでに述べた手段を備えることで、本発明によるパケット転送装置では、TCP代行装置間をTCPコネクションの確認応答が必要ない通信方式とすることで、比較的配置し易いネットワークのエッジ部へTCP代行装置を配置するだけで、TCPフローのスループットを向上できるようになる。
通信事業者、あるいは通信ネットワークを利用する他の分野の事業者が利用するパケット中継装置に対して利用可能な装置管理技術の一つである。
本発明のTCP転送制御部の機能ブロック構成を示す概念図。 本発明のパケット転送装置を用いたネットワーク構成を示す概念図。 TCP等に従ったコネクションにおけるパケットと制御情報の交換方式の概念図。 従来方式のTCP代行装置によるTCPスループット向上方式を適用したTCPコネクションにおけるパケットと制御情報の交換方式の概念図。 本発明のパケット転送装置の機能ブロック構成を示す概念図。 本発明のTCP転送制御部の機能ブロック構成を示す概念図。 通信に用いるパケット構造を示した構成図。 レイヤ2ヘッダの一例であるEthernet v2フレームのヘッダフィールド構成図。 レイヤ3ヘッダの一例であるIPv4データグラムのヘッダフィールド構成図。 レイヤ3ヘッダの一例であるIPv6データグラムのヘッダフィールド構成図。 レイヤ4ヘッダの一例であるTCPセグメントのヘッダフィールド構成図。 TCPヘッダフィールドのフラグフィールド構成図。 レイヤ4ヘッダの一例であるUDPセグメントのヘッダフィールド構成図。 フロー選別に用いるヘッダフィールドの構成図。 確認応答代行許可テーブルの構成例を示す図。 確認応答代行不要テーブルの構成例を示す図。 TCPバッファ管理テーブルの構成例を示す図。 TCPデータパケットの処理の実施例を示す流れ図。 TCP確認応答パケットの処理の実施例を示す流れ図。 本発明のTCP等代行装置によるTCPスループット向上方式を適用したTCPコネクションにおけるパケットと制御情報の交換方式の概念図。 プロトコル変更フロー識別テーブルの構成例を示す図。

Claims (6)

  1. 確認応答を必要とするプロトコルに従ったパケットを受信するパケット転送装置であって、
    受信したパケットに対する転送処理を行う転送処理部と、
    上記パケットに対して、上記パケットのヘッダ情報に基づいてフローを特定し、帯域遵守フローであるか識別し、帯域制御を行う帯域制御部と、
    上記パケットに対する選別処理を、前記帯域遵守フローであるか否かに基づいて行う選別処理部と、
    上記選別処理結果、前記パケットが前記帯域遵守フローでない場合は、前記パケットが前記帯域遵守フローでないことを特定する特定情報と、前記パケットが前記帯域遵守フローである場合は、上記パケットと、を保持する記憶部と、
    上記記憶部に保持した特定情報に基づいて対応するパケットを確認応答を必要としないプロトコルのパケットに変換する変換部と、
    上記記憶部に保持した上記パケットに対する確認応答を代行して上記パケットの送信元へ送信し、上記変換された前記確認応答を必要としないプロトコルのパケットを送信先に向けて転送する送受信部と、
    を有することを特徴とするパケット転送装置。
  2. 請求項1記載のパケット転送装置であって、
    さらに、前記特定情報は、上記パケットのヘッダ情報に関する情報と対応づけられている確認応答代行不要テーブルにより構成され、前記変換部は、前記テーブルに基づいて上記パケットを変換することを特徴とする、パケット転送装置。
  3. 請求項1記載のパケット転送装置であって、
    さらに、前記特定情報は、上記確認応答の代行を行うフローを特定する情報を記憶しており、
    上記選別処理部は、上記確認応答の代行の要否を決定する際に、さらに上記情報にも基づいて、要否を決定することを特徴とするパケット転送装置。
  4. 請求項1記載のパケット転送装置であって、
    受信したパケットのプロトコルは、TCP(Transmission Control Protocol)であって、確認応答を必要としないプロトコルは、UDP(UserDatagram Protocol)であることを、特徴とするパケット転送装置。
  5. 請求項1記載のパケット転送装置であって、
    上記パケット転送装置を介して接続される複数の装置間でTCPコネクションが確立されることを特徴とする、パケット転送装置。
  6. 請求項1記載のパケット転送装置である第一のパケット転送装置と、
    請求項1記載のパケット転送装置である第二のパケット転送装置と、
    上記第一のパケット転送装置に接続されるサーバと、
    上記第二のパケット転送装置に接続されるストレージ装置と、を有し、
    上記第一のパケット転送装置とサーバ間及び上記第二のパケット転送装置とストレージ装置間で通信されるパケットは、確認応答を必要とするプロトコルであって、
    上記第一のパケット転送装置と上記第二のパケット転送装置間で通信されるパケットは、前記特定情報に基づいて確認応答が必要としないプロトコルと前記確認応答が必要とするプロトコルのいずれかに従うパケットであって、
    上記サーバと上記ストレージ装置間でTCPコネクションが確立される、ことを特徴とするネットワークシステム。
JP2005074250A 2005-03-16 2005-03-16 パケット転送装置およびその転送制御方式 Active JP4627669B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005074250A JP4627669B2 (ja) 2005-03-16 2005-03-16 パケット転送装置およびその転送制御方式
US11/207,709 US8179904B2 (en) 2005-03-16 2005-08-22 Packet transfer device and transfer control method thereof

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005074250A JP4627669B2 (ja) 2005-03-16 2005-03-16 パケット転送装置およびその転送制御方式

Publications (2)

Publication Number Publication Date
JP2006261873A JP2006261873A (ja) 2006-09-28
JP4627669B2 true JP4627669B2 (ja) 2011-02-09

Family

ID=37010237

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005074250A Active JP4627669B2 (ja) 2005-03-16 2005-03-16 パケット転送装置およびその転送制御方式

Country Status (2)

Country Link
US (1) US8179904B2 (ja)
JP (1) JP4627669B2 (ja)

Families Citing this family (50)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8380854B2 (en) 2000-03-21 2013-02-19 F5 Networks, Inc. Simplified method for processing multiple connections from the same client
US7343413B2 (en) 2000-03-21 2008-03-11 F5 Networks, Inc. Method and system for optimizing a network by independently scaling control segments and data flow
US8788706B2 (en) * 2006-02-27 2014-07-22 Vudu, Inc. Method and system for managing data transmission between devices behind network address translators (NATs)
US20100306209A1 (en) * 2006-07-22 2010-12-02 Tien-Fu Chen Pattern matcher and its matching method
US20110044338A1 (en) * 2006-12-20 2011-02-24 Thomas Anthony Stahl Throughput in a lan by managing tcp acks
JP5035068B2 (ja) * 2008-03-28 2012-09-26 富士通株式会社 サービス処理状況分析プログラム、サービス処理状況分析装置、およびサービス処理状況分析方法
CN101335603B (zh) 2008-07-17 2011-03-30 华为技术有限公司 数据传输方法和装置
US8149842B2 (en) * 2008-08-25 2012-04-03 Cisco Technology, Inc. Automated discovery of network devices supporting particular transport layer protocols
WO2011037105A1 (ja) * 2009-09-25 2011-03-31 日本電気株式会社 コンテンツベーススイッチシステム、及びコンテンツベーススイッチ方法
US10721269B1 (en) 2009-11-06 2020-07-21 F5 Networks, Inc. Methods and system for returning requests with javascript for clients before passing a request to a server
CN102656931A (zh) * 2009-12-18 2012-09-05 株式会社Ntt都科摩 无线基站以及中继装置
US9141625B1 (en) 2010-06-22 2015-09-22 F5 Networks, Inc. Methods for preserving flow state during virtual machine migration and devices thereof
US10015286B1 (en) 2010-06-23 2018-07-03 F5 Networks, Inc. System and method for proxying HTTP single sign on across network domains
US8347100B1 (en) 2010-07-14 2013-01-01 F5 Networks, Inc. Methods for DNSSEC proxying and deployment amelioration and systems thereof
US8886981B1 (en) 2010-09-15 2014-11-11 F5 Networks, Inc. Systems and methods for idle driven scheduling
WO2012058643A2 (en) 2010-10-29 2012-05-03 F5 Networks, Inc. System and method for on the fly protocol conversion in obtaining policy enforcement information
US10135831B2 (en) 2011-01-28 2018-11-20 F5 Networks, Inc. System and method for combining an access control system with a traffic management system
US9246819B1 (en) * 2011-06-20 2016-01-26 F5 Networks, Inc. System and method for performing message-based load balancing
US8676993B1 (en) * 2011-06-21 2014-03-18 Google Inc. Bundled transmission control protocol connections
US9270766B2 (en) 2011-12-30 2016-02-23 F5 Networks, Inc. Methods for identifying network traffic characteristics to correlate and manage one or more subsequent flows and devices thereof
US10230566B1 (en) 2012-02-17 2019-03-12 F5 Networks, Inc. Methods for dynamically constructing a service principal name and devices thereof
US9231879B1 (en) 2012-02-20 2016-01-05 F5 Networks, Inc. Methods for policy-based network traffic queue management and devices thereof
US9172753B1 (en) 2012-02-20 2015-10-27 F5 Networks, Inc. Methods for optimizing HTTP header based authentication and devices thereof
US10097616B2 (en) 2012-04-27 2018-10-09 F5 Networks, Inc. Methods for optimizing service of content requests and devices thereof
US10375155B1 (en) 2013-02-19 2019-08-06 F5 Networks, Inc. System and method for achieving hardware acceleration for asymmetric flow connections
US10187317B1 (en) 2013-11-15 2019-01-22 F5 Networks, Inc. Methods for traffic rate control and devices thereof
US10015143B1 (en) 2014-06-05 2018-07-03 F5 Networks, Inc. Methods for securing one or more license entitlement grants and devices thereof
US11838851B1 (en) 2014-07-15 2023-12-05 F5, Inc. Methods for managing L7 traffic classification and devices thereof
US10122630B1 (en) 2014-08-15 2018-11-06 F5 Networks, Inc. Methods for network traffic presteering and devices thereof
US10182013B1 (en) 2014-12-01 2019-01-15 F5 Networks, Inc. Methods for managing progressive image delivery and devices thereof
US11895138B1 (en) 2015-02-02 2024-02-06 F5, Inc. Methods for improving web scanner accuracy and devices thereof
US10834065B1 (en) 2015-03-31 2020-11-10 F5 Networks, Inc. Methods for SSL protected NTLM re-authentication and devices thereof
US11350254B1 (en) 2015-05-05 2022-05-31 F5, Inc. Methods for enforcing compliance policies and devices thereof
US10505818B1 (en) 2015-05-05 2019-12-10 F5 Networks. Inc. Methods for analyzing and load balancing based on server health and devices thereof
US11757946B1 (en) 2015-12-22 2023-09-12 F5, Inc. Methods for analyzing network traffic and enforcing network policies and devices thereof
US10404698B1 (en) 2016-01-15 2019-09-03 F5 Networks, Inc. Methods for adaptive organization of web application access points in webtops and devices thereof
US11178150B1 (en) 2016-01-20 2021-11-16 F5 Networks, Inc. Methods for enforcing access control list based on managed application and devices thereof
US10797888B1 (en) 2016-01-20 2020-10-06 F5 Networks, Inc. Methods for secured SCEP enrollment for client devices and devices thereof
US10791088B1 (en) 2016-06-17 2020-09-29 F5 Networks, Inc. Methods for disaggregating subscribers via DHCP address translation and devices thereof
US11063758B1 (en) 2016-11-01 2021-07-13 F5 Networks, Inc. Methods for facilitating cipher selection and devices thereof
US10505792B1 (en) 2016-11-02 2019-12-10 F5 Networks, Inc. Methods for facilitating network traffic analytics and devices thereof
AU2017383561B2 (en) 2016-12-21 2022-11-10 Dejero Labs Inc. Packet transmission system and method
CN109792325A (zh) * 2017-01-24 2019-05-21 华为技术有限公司 一种数据传输方法、装置及客户终端设备
US10812266B1 (en) 2017-03-17 2020-10-20 F5 Networks, Inc. Methods for managing security tokens based on security violations and devices thereof
US10972453B1 (en) 2017-05-03 2021-04-06 F5 Networks, Inc. Methods for token refreshment based on single sign-on (SSO) for federated identity environments and devices thereof
US11343237B1 (en) 2017-05-12 2022-05-24 F5, Inc. Methods for managing a federated identity environment using security and access control data and devices thereof
US11122042B1 (en) 2017-05-12 2021-09-14 F5 Networks, Inc. Methods for dynamically managing user access control and devices thereof
US11122083B1 (en) 2017-09-08 2021-09-14 F5 Networks, Inc. Methods for managing network connections based on DNS data and network policies and devices thereof
US11736406B2 (en) * 2017-11-30 2023-08-22 Comcast Cable Communications, Llc Assured related packet transmission, delivery and processing
US20220360644A1 (en) * 2019-07-03 2022-11-10 Telefonaktiebolaget Lm Ericsson (Publ) Packet Acknowledgment Techniques for Improved Network Traffic Management

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11112576A (ja) * 1997-10-06 1999-04-23 Hitachi Ltd インターネットワーク装置のコネクション制御方法
JP2002111776A (ja) * 2000-09-28 2002-04-12 Mitsubishi Electric Corp データ配信管理システムおよびデータ配信管理方法
JP2003174487A (ja) * 2001-12-05 2003-06-20 Mitsubishi Electric Corp 再送量削減データ配信管理装置、再送量削減データ配信システム及びデータ配信方法
JP2004312359A (ja) * 2003-04-07 2004-11-04 Nippon Telegr & Teleph Corp <Ntt> Tcp/ip通信方法およびtcp代理サーバ並びに中継代理サーバ

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6701370B1 (en) 1994-06-08 2004-03-02 Hughes Electronics Corporation Network system with TCP/IP protocol spoofing
US6714544B1 (en) * 1999-07-08 2004-03-30 Alcatel Canada Inc. Method and apparatus for proxied signalling of an end to end connection across a connection oriented network
US6987741B2 (en) * 2000-04-14 2006-01-17 Hughes Electronics Corporation System and method for managing bandwidth in a two-way satellite system
US6785751B1 (en) * 2000-09-19 2004-08-31 Intel Corporation Method and apparatus for minimizing bus contention for I/O controller write operations
JP4531302B2 (ja) 2001-07-16 2010-08-25 Kddi株式会社 パケット中継装置、及びその方法
US8090866B1 (en) * 2002-01-18 2012-01-03 Cisco Technology, Inc. TCP proxy connection management in a gigabit environment
US7286476B2 (en) * 2003-08-01 2007-10-23 F5 Networks, Inc. Accelerating network performance by striping and parallelization of TCP connections
US20050060535A1 (en) * 2003-09-17 2005-03-17 Bartas John Alexander Methods and apparatus for monitoring local network traffic on local network segments and resolving detected security and network management problems occurring on those segments

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11112576A (ja) * 1997-10-06 1999-04-23 Hitachi Ltd インターネットワーク装置のコネクション制御方法
JP2002111776A (ja) * 2000-09-28 2002-04-12 Mitsubishi Electric Corp データ配信管理システムおよびデータ配信管理方法
JP2003174487A (ja) * 2001-12-05 2003-06-20 Mitsubishi Electric Corp 再送量削減データ配信管理装置、再送量削減データ配信システム及びデータ配信方法
JP2004312359A (ja) * 2003-04-07 2004-11-04 Nippon Telegr & Teleph Corp <Ntt> Tcp/ip通信方法およびtcp代理サーバ並びに中継代理サーバ

Also Published As

Publication number Publication date
US20060209853A1 (en) 2006-09-21
JP2006261873A (ja) 2006-09-28
US8179904B2 (en) 2012-05-15

Similar Documents

Publication Publication Date Title
JP4627669B2 (ja) パケット転送装置およびその転送制御方式
US7440405B2 (en) Apparatus and method for packet forwarding with quality of service and rate control
US6577596B1 (en) Method and apparatus for packet delay reduction using scheduling and header compression
EP1384356B1 (en) Selective data frame dropping in a network device
EP2400693B1 (en) Routing and service performance management in an application acceleration environment
JP5138847B2 (ja) ネットワークシステム、ネットワーク中継装置、ネットワーク中継監視装置およびネットワーク運用方法
US8982703B2 (en) Routing support for lossless data traffic
EP3593498B1 (en) Router device using flow duplication
US20080159150A1 (en) Method and Apparatus for Preventing IP Datagram Fragmentation and Reassembly
EP3522479B1 (en) Techniques for efficient multipath transmission
WO2007088525A2 (en) Method and system for internal data loop back in a high data rate switch
US9876612B1 (en) Data bandwidth overhead reduction in a protocol based communication over a wide area network (WAN)
WO2014077905A1 (en) Multi-hop error recovery
KR20090083339A (ko) 다중경로 환경에서 전송 프로토콜의 성능을 향상시키기 위한 시스템 및 방법
US20050169305A1 (en) Mobile terminal and radio access point in radio access system
KR20030094851A (ko) 아이피 라우터에서 VoIP 트래픽에 대한 QoS를제공하는 장치 및 포워딩방법
US10009277B2 (en) Backward congestion notification in layer-3 networks
WO2000072532A1 (en) System and method for network packet reduction
JPH09331348A (ja) ネットワーク間接続装置
CN114631297A (zh) 用于多路径通信的方法和网络设备
JPH11331257A (ja) 異ネットワーク間接続方法およびルータ装置
JP2006157760A (ja) パケット転送装置およびパケット転送処理方法
JP2006050433A (ja) トラヒック監視装置、通信ネットワークトラヒック監視システム、および監視方法
JP2008228069A (ja) 中継補助装置
JP4597102B2 (ja) パケット交換装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071026

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071026

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20091218

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100601

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100730

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101102

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101108

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131119

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4627669

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250