JP2003044421A - Virtual storage system and switching node used for the same system - Google Patents

Virtual storage system and switching node used for the same system

Info

Publication number
JP2003044421A
JP2003044421A JP2001225694A JP2001225694A JP2003044421A JP 2003044421 A JP2003044421 A JP 2003044421A JP 2001225694 A JP2001225694 A JP 2001225694A JP 2001225694 A JP2001225694 A JP 2001225694A JP 2003044421 A JP2003044421 A JP 2003044421A
Authority
JP
Japan
Prior art keywords
message
external input
node
output device
disk
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001225694A
Other languages
Japanese (ja)
Inventor
Kazuichi Oe
和一 大江
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2001225694A priority Critical patent/JP2003044421A/en
Publication of JP2003044421A publication Critical patent/JP2003044421A/en
Pending legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To enable a virtual storage system to have the same performance with direct access to an external input/output device such as a disk by a node device. SOLUTION: The system is equipped with a switching node which is interposed between at least one node device 1 and a plurality of external input/ output devices 2 to manage storage areas of the plurality of the external input/ output devices virtually as a common storage 5 of the node device 1 and the switching node 3 has a control part which processes control system messages and a transfer process part 32 or 33 which discriminates the types of messages received from the node device 1 to transfers the control system messages to the control part 31 and data transfer system messages to a specific external input/output device 2.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、仮想ストレージシ
ステム及び同システムに使用されるスイッチングノード
に関し、特に、パーソナルコンピュータ(PC)やワー
クステーション(WS)等のノード装置で複数のストレ
ージ装置等の外部入出力装置を仮想的に共有する場合に
用いて好適な技術に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a virtual storage system and a switching node used in the system, and more particularly to a node device such as a personal computer (PC) or a workstation (WS) which is external to a plurality of storage devices. The present invention relates to a technique suitable for virtually sharing an input / output device.

【0002】[0002]

【従来の技術】従来のストレージアーキテクチャでは、
PCやWS等のノード装置(以下、単に「ノード」とも
いう)に、必要な外部ハードディスク装置等のストレー
ジ装置をSCSI(Small Computer System Interface)やF
C(Fiber Channel)等の所要のインタフェースを用いて
物理的に接続し、それをマウントして使っている。この
ため、ノード側は、マウントしたストレージ装置の容量
や性能などのハード的な制限を意識して運用する必要が
ある。
2. Description of the Related Art In conventional storage architectures,
A storage device such as an external hard disk device required for a node device (hereinafter, simply referred to as “node”) such as a PC or WS is connected to a SCSI (Small Computer System Interface) or F
It is physically connected using a required interface such as C (Fiber Channel), and mounted and used. Therefore, it is necessary for the node side to operate in consideration of hardware restrictions such as the capacity and performance of the mounted storage device.

【0003】そこで、このような制限を意識することな
くストレージ装置の使用を可能にすべく、従来は、複数
のストレージ装置をノード側からは仮想的に単一のスト
レージ装置として扱えるようにするソリューション(仮
想ストレージシステム)が存在する。即ち、例えば図1
2に示すような仮想ストレージシステムが提案されてい
る。
Therefore, in order to enable the use of the storage device without being aware of such restrictions, conventionally, a solution that allows a plurality of storage devices to be virtually handled as a single storage device from the node side. (Virtual storage system) exists. That is, for example, in FIG.
A virtual storage system as shown in 2 has been proposed.

【0004】この図12に示す仮想ストレージシステム
(以下、単に「システム」ともいう)は、PCやWS等
の複数のノード装置(以下、単に「ノード」という)1
00(Node#0-#n;nは1以上の整数)と、これらのノ
ード100を収容するFC(Fiber Channel)スイッチ
300と、複数のストレージ(ディスク)装置(以下、
単に「ディスク」という)200(Disk#0-#m;mは1
以上の整数)と、これらのディスク200を収容するF
Cスイッチ400と、上記の各FCスイッチ300,4
00間に介装された制御ノード500とをそなえて構成
されている。
The virtual storage system (hereinafter, also simply referred to as "system") shown in FIG. 12 includes a plurality of node devices (hereinafter simply referred to as "nodes") 1 such as PCs and WSs.
00 (Node # 0- # n; n is an integer of 1 or more), an FC (Fiber Channel) switch 300 that accommodates these nodes 100, and a plurality of storage (disk) devices (hereinafter,
200 (Disk # 0- # m; m is 1)
The above integer) and F that accommodates these discs 200
C switch 400 and each of the above FC switches 300, 4
00 and a control node 500 interposed therebetween.

【0005】そして、この図12に示すシステムでは、
制御ノード500において各ディスク200の記憶領域
(アドレス情報)を仮想ディスク(Virtual Disk)20
1として一括管理しておき、或るノード100から送信
されたメッセージに応じた処理(特定のディスク200
に対するデータ書き込み/読み出し等)を制御ノード5
00が統括して行なうようになっている。これにより、
ノード100側は、マウントされているディスク200
の数や個々のディスク200の容量等を意識することな
く、データの書き込み/読み出しを実施することが可能
になる。
In the system shown in FIG. 12,
In the control node 500, the storage area (address information) of each disk 200 is set as a virtual disk (Virtual Disk) 20.
It is collectively managed as 1, and processing according to a message transmitted from a certain node 100 (specific disk 200
Data writing / reading to / from the control node 5
00 is in charge of overall control. This allows
Mounted disk 200 on the node 100 side
It is possible to write / read data without being aware of the number of disks, the capacity of each disk 200, and the like.

【0006】[0006]

【発明が解決しようとする課題】しかしながら、上述し
たシステムでは、ノード100側からの制御系メッセー
ジだけでなく、データ書き込み/読み出し時のデータ自
体(データ転送系メッセージ)の転送までをも制御ノー
ド500が統括して処理するため、スループットが悪く
性能面で課題がある。
However, in the system described above, not only the control system message from the node 100 side but also the transfer of the data itself (data transfer system message) at the time of data writing / reading is controlled. Since the processing is performed collectively by, the throughput is poor and there is a problem in terms of performance.

【0007】本発明は、このような課題に鑑み創案され
たもので、ノードが直接ディスク等の外部入出力装置に
アクセスする場合と同等の性能を引き出すことのでき
る、仮想ストレージシステム及び同システムに使用され
るスイッチングノードを提供することを目的とする。
The present invention was devised in view of such problems, and provides a virtual storage system and the same system which can bring out the same performance as when a node directly accesses an external input / output device such as a disk. The purpose is to provide a switching node to be used.

【0008】[0008]

【課題を解決するための手段】上記の目的を達成するた
めに、本発明の仮想ストレージシステムは、複数の外部
入出力装置と、特定の外部入出力装置へのアクセスに伴
って必要なメッセージを発行しうる少なくとも1台のノ
ード装置と、前記のノード装置と複数の外部入出力装置
との間に介装されて、複数の外部入出力装置の記憶領域
を仮想的に上記ノード装置の共有ストレージとして管理
するスイッチングノードとをそなえるとともに、このス
イッチングノードが、制御系メッセージを処理する制御
部と、上記ノード装置から受信されるメッセージの種別
(以下、メッセージ種別という)を識別して、制御系メ
ッセージは上記制御部へ転送する一方、データ転送系メ
ッセージは上記特定の外部入出力装置へ転送する転送処
理部とをそなえて構成されていることを特徴としている
(請求項1,7)。
In order to achieve the above object, the virtual storage system of the present invention provides a plurality of external input / output devices and a message necessary for accessing a specific external input / output device. At least one node device that can be issued, and the storage device of the plurality of external input / output devices virtually interposed between the node device and the plurality of external input / output devices, and shared storage of the node device. And a switching node that manages the control system message, and this switching node identifies the control unit that processes the control system message and the type of message received from the node device (hereinafter referred to as the message type) Is transferred to the control unit, while the data transfer system message is transferred to the specific external input / output device. It is characterized by being made (claims 1,7).

【0009】ここで、上記のノード装置には、上記スイ
ッチングノードへ送信するメッセージのプロトコルをそ
のスイッチングノード側で解釈できるプロトコルに変換
するノード装置側プロトコル変換部と、このノード側プ
ロトコル変換部によるプロトコル変換の際に、上記メッ
セージ種別の識別のための情報(以下、メッセージ識別
情報という)を上記メッセージに付加するメッセージ識
別情報付加部とをそなえてもよい(請求項2)。
Here, in the above node device, a node device side protocol conversion unit for converting a protocol of a message transmitted to the switching node into a protocol that can be interpreted by the switching node side, and a protocol by this node side protocol conversion unit. A message identification information addition unit may be provided for adding information for identifying the message type (hereinafter referred to as message identification information) to the message at the time of conversion (claim 2).

【0010】一方、上記の外部入出力装置には、上記の
スイッチングノードから受信されるメッセージのプロト
コルを自装置側で解釈できるプロトコルに変換する外部
入出力装置側プロトコル変換部をそなえてもよい(請求
項3)。また、上記の制御部には、運用中に上記スイッ
チングノードに対して新たな外部入出力装置が追加接続
されたことを認識すると、その外部入出力装置(以下、
追加入出力装置という)と通信を行なってその追加入出
力装置の資源に関する情報を収集して、既存の外部入出
力装置の資源に関する情報とともに管理する資源情報管
理部をさらにそなえてもよい(請求項4,8)。
On the other hand, the external input / output device may be provided with an external input / output device side protocol conversion unit for converting the protocol of the message received from the switching node into a protocol that can be interpreted by the device itself ( Claim 3). When the controller recognizes that a new external input / output device is additionally connected to the switching node during operation, the external input / output device (hereinafter,
It may further include a resource information management unit that communicates with the additional input / output device) to collect information about the resource of the additional input / output device and manage the information together with the information about the resource of the existing external input / output device. Items 4, 8).

【0011】さらに、上記の制御部には、上記の共有ス
トレージの一部として運用中の外部入出力装置の記憶領
域を書き込み禁止状態に設定して、その記憶領域に保持
されているデータを他の外部入出力装置の記憶領域に移
動させうる運用中データ移動処理部をさらにそなえても
よい(請求項5,9)。また、上記の制御部には、上記
の外部入出力装置の記憶領域に保持されているデータを
キャッシュするためのキャッシュメモリと、上記ノード
装置からのメッセージ内容に基づいてこのキャッシュメ
モリを検索するキャッシュ検索部と、このキャッシュ検
索部の検索により得られたデータをノード装置へ応答メ
ッセージとして送信するキャッシュデータ応答部とをそ
なえてもよい(請求項6,10)。
Further, the control unit sets the storage area of the external input / output device operating as a part of the shared storage to a write-protected state and saves the data held in the storage area to other areas. It may further include an in-operation data movement processing unit that can be moved to the storage area of the external input / output device (claims 5 and 9). Also, the control unit includes a cache memory for caching data held in the storage area of the external input / output device, and a cache memory for searching the cache memory based on message contents from the node device. A search unit and a cache data response unit for transmitting the data obtained by the search by the cache search unit to the node device as a response message may be provided (claims 6 and 10).

【0012】[0012]

【発明の実施の形態】以下、図面を参照して本発明の実
施の形態を説明する。 (A)一実施形態の説明 図1は本発明の一実施形態としての仮想ストレージシス
テムの構成を示すブロック図で、この図1に示す仮想ス
トレージシステム(以下、単に「システム」ともいう)
は、複数のノード装置(以下、単に「ノード」という)
1と、複数のストレージ(ディスク)装置(以下、単に
「ディスク」という)2と、ノード1とディスク2との
間に介装されたネットワークスイッチ(Network Switc
h;スイッチングノード)3と、各ディスク2とネット
ワークスイッチ3とのインタフェース機能を装備する複
数のターゲットチャンネルアダプタ(Target Channel A
dapter:TCA)4とをそなえて構成されている。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings. (A) Description of One Embodiment FIG. 1 is a block diagram showing a configuration of a virtual storage system as one embodiment of the present invention. The virtual storage system shown in FIG. 1 (hereinafter, also simply referred to as “system”)
Is a plurality of node devices (hereinafter simply referred to as “node”)
1, a plurality of storage (disk) devices (hereinafter simply referred to as "disks") 2, and a network switch (Network Switc) interposed between the node 1 and the disk 2.
h; switching node) 3 and multiple target channel adapters (Target Channel A) equipped with the interface function between each disk 2 and network switch 3
dapter: TCA) 4 and is configured.

【0013】なお、各ディスク2とTCA4とは、例え
ばSCSIやFCにより接続される。これらのディスク2とT
CA4との組はノード1に対する外部入出力装置として
位置付けられ、ディスク2はその外部入出力装置の記憶
領域として位置付けられる。また、ノード1,ディスク
2及びTCA4の台数は、勿論、この図1に示す台数に
限られない。さらに、この図1において、「#0」,
「#1」等は、ノード1やTCA4,ディスク2に付与
されているアドレス(識別情報;ID)を表す。
The disks 2 and the TCA 4 are connected by, for example, SCSI or FC. These discs 2 and T
The pair with CA4 is positioned as an external input / output device for node 1, and disk 2 is positioned as a storage area of the external input / output device. The numbers of the nodes 1, disks 2 and TCA 4 are not limited to the numbers shown in FIG. Further, in FIG. 1, “# 0”,
“# 1” and the like represent addresses (identification information; ID) given to the node 1, the TCA 4, and the disk 2.

【0014】ここで、上記のノード1は、PCやWS等
に相当するもので、その要部に着目すると、ディスク2
に対する所望のデータの保存(書き込み)/読み出しの
際に必要なメッセージ(SCSI又はFCコマンド)を生成す
る機能をもつディスクドライバ(Disk Driver)11や
このディスクドライバ11で生成されたコマンドをネッ
トワークスイッチ3側(後述するインターコネクトスイ
ッチ32)で解釈できるプロトコルに変換する(具体的
には、コマンドをカプセル化する)機能をもつカプセル
ドライバ(Capsule Driver)12などをそなえている。
Here, the node 1 corresponds to a PC, WS or the like.
A disk driver (Disk Driver) 11 having a function of generating a message (SCSI or FC command) required when storing (writing) / reading desired data to or from the network switch 3 A capsule driver 12 having a function of converting into a protocol that can be interpreted by the side (interconnect switch 32 described later) (specifically, encapsulating a command) is provided.

【0015】このカプセルドライバ12では、例えば図
2に模式的に示すように、ディスクドライバ11で生成
されたコマンド(SCSI又はFCコマンド)を、ヘッダ部6
とデータ部7とから成るネットワークスイッチ3側に適
したメッセージフォーマットのデータ部7に格納すると
ともに、そのコマンドの内容(制御系かデータ転送系
か)を解釈して、それに応じた情報を、インターコネク
トスイッチ32が受信メッセージの種別を識別できるよ
うに上記ヘッダ部6(以下、メッセージヘッダ6と表記
することがある)に格納することが行なわれるようにな
っている。
In the capsule driver 12, a command (SCSI or FC command) generated by the disk driver 11 is transferred to the header section 6 as schematically shown in FIG.
And a data unit 7 are stored in the data unit 7 having a message format suitable for the network switch 3 side, the contents of the command (control system or data transfer system) are interpreted, and the corresponding information is interconnected. The switch 32 is configured to store the received message in the header section 6 (hereinafter sometimes referred to as the message header 6) so that the type of the received message can be identified.

【0016】つまり、本カプセルドライバ12は、ネッ
トワークスイッチ3へ送信するメッセージ(SCSI又はFC
コマンド)のプロトコルをネットワークスイッチ3側で
解釈できるプロトコルに変換するノード側プロトコル変
換部121としての機能と、このノード側プロトコル変
換部121によるプロトコル変換の際に、そのコマンド
に応じたメッセージ種別の識別のための情報(メッセー
ジ識別情報)を当該メッセージに付加するメッセージ識
別情報付加部122としての機能を兼ね備えていること
になる。
That is, the capsule driver 12 sends a message (SCSI or FC) to the network switch 3.
Function as the node side protocol conversion unit 121 for converting the command) protocol into a protocol that can be interpreted by the network switch 3 side, and identification of the message type according to the command at the time of the protocol conversion by this node side protocol conversion unit 121 It also has a function as a message identification information addition unit 122 that adds information for (message identification information) to the message.

【0017】これにより、ネットワークスイッチ3側で
は、上記メッセージヘッダ6を参照するだけで、受信メ
ッセージの種別(「制御系」か「データ転送系」か)を
識別することができるので、ネットワークスイッチ3側
の処理負荷を抑制しながら、確実に、後述するネットワ
ークスイッチ3での受信メッセージの転送先切り替え
(ネットワークプロセッサ31又はディスク2側への転
送)が実現される。なお、ネットワークスイッチ3の性
能によっては、上記のコマンドの解釈やメッセージ識別
情報の付加をネットワークスイッチ3側で行なうように
してもよい。
As a result, the type of the received message (whether it is the "control system" or the "data transfer system") can be identified on the network switch 3 side only by referring to the message header 6, so that the network switch 3 can be identified. While suppressing the processing load on the side, the transfer destination switching (transfer to the network processor 31 or the disk 2 side) of the received message in the network switch 3 described later is realized with certainty. Depending on the performance of the network switch 3, the above-mentioned command interpretation and message identification information addition may be performed on the network switch 3 side.

【0018】次に、ネットワークスイッチ3は、各ディ
スク2のアドレス情報を一括管理して各ディスク2の記
憶領域を仮想的にノード1の共有ディスク5(以下、仮
想共有ディスク5ともいう)として構築・管理するため
の機能を装備するもので、このために、本実施形態で
は、ネットワークプロセッサ(Network Processor)3
1とインターコネクトスイッチ(SW)32とが設けら
れている。
Next, the network switch 3 collectively manages the address information of each disk 2 and virtually constructs the storage area of each disk 2 as a shared disk 5 of the node 1 (hereinafter also referred to as virtual shared disk 5). It is equipped with a function for management. For this reason, in this embodiment, the network processor 3 is used.
1 and an interconnect switch (SW) 32.

【0019】なお、33はそれぞれ各ノード1あるいは
各TCA4が接続される入出力ポートを示す。これらの
各入出力ポート33には、それぞれ、固有のID〔Port
-ID;#0,#1,#2,…(図7参照)〕が付与されており、こ
れらのPort-IDに基づいてインターコネクトスイッチ3
2(以下、単に「スイッチ32」と表記する)による接
続先の切り替えが行なわれるようになっている。
Reference numeral 33 denotes an input / output port to which each node 1 or each TCA 4 is connected. Each of these input / output ports 33 has a unique ID [Port
-ID; # 0, # 1, # 2, ... (see FIG. 7)] are assigned, and the interconnect switch 3 is based on these Port-IDs.
2 (hereinafter, simply referred to as "switch 32") is used to switch the connection destination.

【0020】さて、ここで、上記のネットワークプロセ
ッサ(制御部)31は、例えば図3に示すような実スト
レージ(ディスク)情報テーブル(記憶領域情報テーブ
ル)311を内部メモリ(図示省略)等に保持すること
により、上述のごとく各ディスク2を仮想共有ディスク
(Virtual Disk)5として管理することができるもので
ある。
Now, the network processor (control unit) 31 holds an actual storage (disk) information table (storage area information table) 311 as shown in FIG. 3 in an internal memory (not shown) or the like. By doing so, each disk 2 can be managed as a virtual shared disk (Virtual Disk) 5 as described above.

【0021】具体的に、上記の実ディスク情報テーブル
311には、図3に示すように、オフセット(offset)
フィールド311a,TCA-IDフィールド311b,SCSI
-ID(又はFC-ID)フィールド311c,開始セクタフィ
ールド311d及び終了セクタフィールド311e等が
用意されており、この図3に示す場合は、TCA-ID=#0
及びS CSI-ID(又はFC-ID)=#0により特定される実
ディスク2のセクタ“0”〜“2999”番地の記憶領
域が仮想共有ディスク5の“0”〜“2999”番地に
マップされ、TCA-ID=#1及びSCSI-ID(又はFC-ID)=
#0により特定される実ディスク2のセクタ“0”〜
“2999”番地の記憶領域が仮想共有ディスク5の以
降の“3000”〜“5999”番地にマップされてい
ることを表している。なお、他のディスク2の記憶領域
をマップする場合も同様である。
More specifically, as shown in FIG. 3, the actual disk information table 311 has an offset (offset).
Field 311a, TCA-ID field 311b, SCSI
-ID (or FC-ID) field 311c, start sector field 311d, end sector field 311e, etc. are prepared. In the case shown in FIG. 3, TCA-ID = # 0.
And the storage area of the sectors “0” to “2999” of the real disk 2 specified by S CSI-ID (or FC-ID) = # 0 is mapped to the addresses “0” to “2999” of the virtual shared disk 5. TCA-ID = # 1 and SCSI-ID (or FC-ID) =
Sector “0” of real disk 2 specified by # 0
This indicates that the storage area of the address “2999” is mapped to the subsequent addresses “3000” to “5999” of the virtual shared disk 5. The same applies to the case of mapping the storage area of another disk 2.

【0022】これにより、ノード1側からは仮想共有デ
ィスク5のみが見え、実際のデータ書き込み/読み出し
(データ転送)時には、上記の実ディスク情報テーブル
311の各情報(以下、実ディスク情報311と表記す
ることがある)を指定してデータ(データ転送系メッセ
ージ)の送受を行なうことになる。なお、上記の実ディ
スク情報311は、ネットワークプロセッサ31から通
知される。
As a result, only the virtual shared disk 5 can be seen from the node 1 side, and at the time of actual data writing / reading (data transfer), each information in the above real disk information table 311 (hereinafter referred to as real disk information 311). Data (data transfer system message) is transmitted and received. The real disk information 311 is notified from the network processor 31.

【0023】このため、本実施形態のネットワークプロ
セッサ31(以下、内部プロセッサ31ということがあ
る)は、上記のような仮想共有ディスク5の構築・管理
機能に加えて、スイッチ32にてスイッチングされて転
送されてくるノード1の発行した制御系メッセージを処
理する機能も装備しており、例えば、次のような機能を
装備している。
Therefore, the network processor 31 of the present embodiment (hereinafter sometimes referred to as the internal processor 31) is switched by the switch 32 in addition to the above-mentioned function of constructing / managing the virtual shared disk 5. It is also equipped with a function of processing a control system message issued by the transferred node 1, for example, the following functions.

【0024】(1)受信した制御系メッセージのデータ部
7に格納されているコマンドの内容を解釈して、或る特
定のディスク2とのコネクション確立のためのコマンド
(以下、コネクションコマンドという)であれば、当該
コネクションコマンドに設定されている「オフセット
値」をキーにして実ディスク情報テーブル311を検索
して該当実ディスク情報311を取得するテーブル検索
部312としての機能。
(1) Interpret the contents of the command stored in the data part 7 of the received control system message, and execute a command for establishing a connection with a specific disk 2 (hereinafter referred to as connection command). If there is, a function as a table search unit 312 that searches the real disk information table 311 using the “offset value” set in the connection command as a key and acquires the corresponding real disk information 311.

【0025】(2)上記テーブル検索部312により得ら
れた実ディスク情報311を含む応答メッセージを生成
してコネクションコマンド発行元のノード1に通知(返
信)する応答メッセージ通知部313としての機能。な
お、上記応答メッセージも、例えば、ヘッダ部6とデー
タ部7とから成るフォーマットを有しており、ヘッダ部
6にコマンド発行元のノード1のIDを設定することに
より、スイッチ32にて当該ノード1が接続されている
該当入出力ポート33への転送が行なわれて当該ノード
1への応答メッセージの返信が正しく行なわれる。
(2) A function as a response message notifying unit 313 that generates a response message including the real disk information 311 obtained by the table searching unit 312 and notifies (replies) to the node 1 which issued the connection command. The response message also has a format including, for example, a header portion 6 and a data portion 7. By setting the ID of the node 1 that issued the command in the header portion 6, the switch 32 causes the node The data is transferred to the corresponding input / output port 33 to which 1 is connected, and the response message is correctly returned to the node 1.

【0026】ノード1側では、上述のごとく応答メッセ
ージ通知部313の発行した応答メッセージによって通
知される実ディスク情報311により、実際のデータ転
送時に、転送先情報としてアクセス対象の実ディスク2
の「ネットアドレス」〔TCA-ID+SCSI-ID(又はFC-I
D)〕を直接指定(転送系メッセージのヘッダ部6に設
定)することが可能となる。この指定(設定)は前述し
たカプセルドライバ12が行なう。
On the node 1 side, the real disk information 311 notified by the response message issued by the response message notification unit 313 as described above allows the real disk 2 to be accessed as transfer destination information at the time of actual data transfer.
"Net address" [TCA-ID + SCSI-ID (or FC-I
D)] can be directly specified (set in the header part 6 of the transfer message). This designation (setting) is performed by the capsule driver 12 described above.

【0027】次に、スイッチ32は、上記の各入出力ポ
ート33間をインターコネクトして任意の入出力ポート
33間のメッセージ送受を可能にするもので、本実施形
態では、制御系メッセージはネットワークプロセッサ3
1へ、転送系メッセージはディスク2側へ転送されるよ
うに構成する。例えば、ノード1が接続されている入出
力ポート33に、受信メッセージのヘッダ部6を参照し
てそのメッセージ種別(制御系メッセージであるか転送
系メッセージであるか)を識別する機能をもたせて、入
出力ポート33において、制御系メッセージには内部プ
ロセッサ31のID(アドレス)を付与することにより
スイッチ32経由でネットワークプロセッサ31へ転送
されるようにする一方、転送系メッセージはそのままス
イッチ32へ送出することによりそのヘッダ部6に設定
されている「ネットアドレス」から特定される入出力ポ
ート(ディスク2)へ転送されるようにしてもよいし、
上記の識別機能をスイッチ32にもたせて、スイッチ3
2が自律的にこのような転送先切り替えを行なうように
してもよい。
Next, the switch 32 interconnects the above-mentioned input / output ports 33 to enable transmission / reception of messages between arbitrary input / output ports 33. In this embodiment, the control system message is a network processor. Three
1 and the transfer system message is transferred to the disk 2 side. For example, the input / output port 33 to which the node 1 is connected has a function of identifying the message type (whether it is a control system message or a transfer system message) by referring to the header part 6 of the received message, In the input / output port 33, the ID (address) of the internal processor 31 is added to the control system message so that the control system message is transferred to the network processor 31 via the switch 32, while the transfer system message is directly sent to the switch 32. By doing so, the “net address” set in the header portion 6 may be transferred to the specified input / output port (disk 2),
If the switch 32 is provided with the above-mentioned identification function, the switch 3
2 may autonomously perform such transfer destination switching.

【0028】つまり、本実施形態では、上記のスイッチ
32又は入出力ポート33が、ノード1から受信される
メッセージの種別を識別して、制御系メッセージはネッ
トワークプロセッサ31へ転送する一方、転送系メッセ
ージは特定のディスク2へ転送する転送処理部として機
能するのである。なお、スイッチ32には、例えば、イ
ンフィニバンド(IB)等の低レイテンシ高スループッ
トのインターコネクトスイッチを用いる。これにより、
ディスク2とノード1との間の物理的な接続は、低レイ
テンシ高スループットの高速内部ネットワークによる接
続となり、転送速度を数GB/s(ギガビット毎秒)程度ま
で引き上げることが可能である。
That is, in this embodiment, the switch 32 or the input / output port 33 identifies the type of the message received from the node 1 and transfers the control system message to the network processor 31, while the transfer system message is transmitted. Functions as a transfer processing unit for transferring to a specific disk 2. As the switch 32, for example, an interconnect switch with low latency and high throughput such as Infiniband (IB) is used. This allows
The physical connection between the disk 2 and the node 1 is a connection with a high-speed internal network with low latency and high throughput, and the transfer speed can be increased to about several GB / s (gigabit per second).

【0029】次に、各TCA4は、それぞれ、ネットワ
ークスイッチ3と配下のディスク2(ターゲットチャン
ネル)との間のインタフェース機能を装備するもので、
本実施形態では、図1中に示すように、上述したネット
ワークスイッチ3から受信される転送系メッセージのプ
ロトコルを自装置側(ディスクドライバ42)で解釈で
きるプロトコル(SCSI又はFCコマンド)に変換(デカプ
セル化)するするためのデカプセルドライバ(外部入出
力装置側プロトコル変換部)41をそなえている。
Next, each TCA 4 is equipped with an interface function between the network switch 3 and the subordinate disk 2 (target channel).
In the present embodiment, as shown in FIG. 1, the protocol of the transfer system message received from the network switch 3 described above is converted into a protocol (SCSI or FC command) that can be interpreted by the device side (disk driver 42) (decapsulation). The decapsulation driver (external input / output device side protocol conversion unit) 41 is provided.

【0030】このような機能を装備することで、TCA
4側の既存のプロトコルとネットワークスイッチ3側の
プロトコルとの整合性を担保でき、正常な通信が担保さ
れる。以下、上述のごとく構成された本実施形態のシス
テムの動作について詳述する。
By equipping such a function, the TCA
Consistency between the existing protocol on the side of 4 and the protocol on the side of network switch 3 can be secured, and normal communication is secured. Hereinafter, the operation of the system of this embodiment configured as described above will be described in detail.

【0031】(A1)コネクション設定時の動作説明 図5に示すように、まず、ノード1において、ファイル
システム等の上位アプリケーションからディスクドライ
バ11に対して、データ転送のためのコネクション確立
要求があると(ステップS1)、ディスクドライバ11
はその要求に応じたコネクションコマンドを生成し(ス
テップS2)、当該コネクションコマンドをカプセルド
ライバ12に渡す(ステップS3)。
(A1) Description of Operation at Connection Setting As shown in FIG. 5, first, in the node 1, when a host application such as a file system requests the disk driver 11 to establish a connection for data transfer. (Step S1), disk driver 11
Generates a connection command in response to the request (step S2), and passes the connection command to the capsule driver 12 (step S3).

【0032】カプセルドライバ12は、ディスクドライ
バ11から受け取ったコネクションコマンドを図2によ
り前述したごとくカプセル化するとともに、メッセージ
ヘッダ6に、自メッセージが「制御系メッセージ」であ
ることを示す情報(メッセージ種別情報)を書き込んで
設定する(ステップS4)。この制御系メッセージは、
ネットワークスイッチ3へ送出され、ネットワークスイ
ッチ3では、入出力ポート33(又はスイッチ32)が
受信メッセージのメッセージヘッダ6を参照して、その
受信メッセージが制御系メッセージであるか転送系メッ
セージであるかを識別する。この場合は受信メッセージ
が制御系メッセージであるので、この制御系メッセージ
は内部プロセッサ31に転送される(ステップS5;例
えば図7の一点鎖線矢印8参照)。
The capsule driver 12 encapsulates the connection command received from the disk driver 11 as described above with reference to FIG. 2 and, in the message header 6, information indicating that its own message is a "control system message" (message type). Information) is written and set (step S4). This control system message is
It is sent to the network switch 3, and in the network switch 3, the input / output port 33 (or the switch 32) refers to the message header 6 of the received message to determine whether the received message is a control system message or a transfer system message. Identify. In this case, since the received message is a control system message, this control system message is transferred to the internal processor 31 (step S5; see, for example, the chain line arrow 8 in FIG. 7).

【0033】内部プロセッサ31は、転送されてきた制
御系メッセージの内容(データ部7)を解釈して、設定
されているオフセット値を検索キーとして実ディスク情
報テーブル311を検索して、対応する実ディスク情報
311を取得する(ステップS6)。そして、内部プロ
セッサ31は、得られた実ディスク情報311を含む応
答メッセージを生成し、その応答メッセージをスイッチ
32経由でコネクションコマンド発行元のノード1へ返
信する(ステップS7)。
The internal processor 31 interprets the contents (data section 7) of the transferred control system message, searches the real disk information table 311 using the set offset value as a search key, and then the corresponding real data. The disk information 311 is acquired (step S6). Then, the internal processor 31 generates a response message including the obtained real disk information 311 and returns the response message to the node 1 which is the connection command issuing source via the switch 32 (step S7).

【0034】ノード1は、このようにして返信されてき
た応答メッセージを受信すると、その応答メッセージに
格納されている実ディスク情報311を内部メモリ(図
示省略)等に保持する(ステップS8)。これにより、
以降、ノード1は、転送系メッセージに、保持した実デ
ィスク情報311の「TCA-ID」及び「SCSI-ID」(又はF
C-ID)をネットアドレス(転送先情報)として設定(付
与)することが可能な状態(コネクション確立状態)と
なる。
Upon receipt of the response message thus returned, the node 1 holds the real disk information 311 stored in the response message in an internal memory (not shown) or the like (step S8). This allows
After that, the node 1 adds the “TCA-ID” and “SCSI-ID” (or F
It becomes a state (connection established state) in which C-ID) can be set (assigned) as a net address (transfer destination information).

【0035】(A2)データ転送時の動作説明 さて、上記のようにコネクション確立状態となった後、
図6に示すように、ノード1において、ファイルシステ
ム等の上位アプリケーションからディスクドライバ11
に対して、実際のデータ転送要求があると(ステップS
11)、ディスクドライバ11は、その要求に応じた転
送コマンド(書き込みの場合は書き込みデータを含む)
を生成して(ステップS12)、カプセルドライバ12
に渡す(ステップS13)。
(A2) Description of Operation During Data Transfer Now, after the connection is established as described above,
As shown in FIG. 6, in the node 1, from the upper application such as the file system to the disk driver 11
However, if there is an actual data transfer request (step S
11), the disk driver 11 transfers a transfer command (including write data in the case of writing) in response to the request.
Is generated (step S12), and the capsule driver 12 is generated.
(Step S13).

【0036】カプセルドライバ12は、受け取った転送
コマンドをカプセル化して転送系メッセージを生成する
とともに、自メッセージが「転送系メッセージ」である
ことを示すメッセージ識別情報と、前述したように保持
した実ディスク情報311のネットアドレス〔TCA-ID+
SCSI-ID(又はFC-ID)〕とをそのメッセージヘッダ6に
書き込む(ステップS14)。本転送系メッセージは、
ネットワークスイッチ3に送出される。
The capsule driver 12 encapsulates the received transfer command to generate a transfer system message, and at the same time, message identification information indicating that the self message is a "transfer system message" and the real disk held as described above. Net address of information 311 [TCA-ID +
SCSI-ID (or FC-ID)] is written in the message header 6 (step S14). This transfer type message is
It is sent to the network switch 3.

【0037】ネットワークスイッチ3では、この場合、
入出力ポート33(又はスイッチ32)が、受信メッセ
ージのメッセージヘッダ6を参照することにより、当該
受信メッセージが転送系メッセージであると識別するの
で、当該転送系メッセージは、内部プロセッサ31には
転送されずに、メッセージヘッダ6に設定されているネ
ットアドレスにより特定されるTCA4(ディスク2)
が接続されている入出力ポート33へ転送される(ステ
ップS15;例えば図7の一点鎖線矢印9参照)。
In the network switch 3, in this case,
Since the input / output port 33 (or the switch 32) refers to the message header 6 of the received message to identify the received message as a transfer type message, the transfer type message is transferred to the internal processor 31. TCA4 (disk 2) specified by the net address set in the message header 6 without
Is transferred to the input / output port 33 to which is connected (step S15; for example, see the alternate long and short dash line arrow 9 in FIG. 7).

【0038】TCA4では、ネットワークスイッチ3か
ら受信した転送系メッセージをデカプセルドライバ41
にてデカプセル化してコマンドを抽出してディスクドラ
イバ42に転送し(ステップS16)、そのコマンドに
応じた処理(データ書き込み/読み出し)をディスクド
ライバ42が配下のディスク2に対して実行する(ステ
ップS17)。
In the TCA 4, the transfer system message received from the network switch 3 is decapsulated by the decapsulation driver 41.
At, the command is extracted by decapsulation and transferred to the disk driver 42 (step S16), and the processing (data writing / reading) according to the command is executed by the disk driver 42 for the subordinate disk 2 (step S17). ).

【0039】以上のように、本実施形態の仮想ストレー
ジシステムによれば、スイッチングノード3において、
コネクションコマンド等の制御系メッセージはネットワ
ークスイッチ3における内部プロセッサ31が獲得・処
理し、転送系メッセージ(実際のデータ)はスイッチ3
2により各ディスク2へ直接転送するので、従来のよう
に制御ノード500(図12参照)が全てのメッセージ
を一律に処理してから転送を実行する場合に比して、そ
の性能(特に、スループット)を大幅に向上することが
できる。
As described above, according to the virtual storage system of this embodiment, in the switching node 3,
Control system messages such as connection commands are acquired and processed by the internal processor 31 in the network switch 3, and transfer system messages (actual data) are received by the switch 3
2 directly transfers each message to each disk 2, so that the performance (especially throughput) is higher than the case where the control node 500 (see FIG. 12) uniformly processes all the messages and then transfers the messages. ) Can be significantly improved.

【0040】なお、上述したネットワークスイッチ3の
内部プロセッサ31は、実ディスク情報テーブル311
に代えて、図4に示すような実ディスク情報テーブル
(記憶領域情報テーブル)311′をそなえることで、
仮想共有ディスク5(つまり、複数のディスク2)をRA
ID(Redundant Arrays of Independent Disks)として
管理するようにしてもよい。
The internal processor 31 of the network switch 3 described above uses the real disk information table 311.
In place of the above, by providing an actual disk information table (storage area information table) 311 'as shown in FIG.
RA the virtual shared disk 5 (that is, multiple disks 2)
It may be managed as an ID (Redundant Arrays of Independent Disks).

【0041】即ち、ストライプサイズ(stripe size)
を仮想共有ディスク5の1セクタ(sector)とする場
合、例えば図4に示すように、1セクタ(フィールド3
11a′)に複数の「TCA-ID」(フィールド311b),
「SCSI-ID」(又はFC-ID)(フィールド311c),「開
始セクタ」(フィールド311d)及び「終了セクタ」
(フィールド311e)の組み合わせ情報を割り当てた
実ディスク情報テーブル311′を、内部プロセッサ3
1で保持・管理しておくことにより、仮想共有ディスク
5の1セクタに対するアクセスで複数ディスク2に対す
るアクセスが発生することになる。つまり、いわゆる
「ストライピング」が実現され、これにより、ディスク
2に対するアクセス速度を大幅に向上することができ
る。
That is, stripe size
When one sector (sector) of the virtual shared disk 5 is used, for example, as shown in FIG.
11a ') has a plurality of "TCA-IDs" (field 311b),
"SCSI-ID" (or FC-ID) (field 311c), "start sector" (field 311d) and "end sector"
The real disk information table 311 ′ to which the combination information of the (field 311e) is assigned is set to the internal processor 3
By holding and managing with 1 in this case, access to one sector of the virtual shared disk 5 will cause access to a plurality of disks 2. That is, so-called "striping" is realized, and thereby the access speed to the disk 2 can be greatly improved.

【0042】なお、上記の実ディスク情報テーブル31
1′の構成を適宜に変更することで、いわゆる「ミラー
リング」(mirroring:同一データを複数のディスク2
に分散して書き込み、単体のディスク2よりも信頼性を
向上させる)や、「パリティチェック」(parity chec
k:データエラーを検出する)、「ECC」(Error Checka
nd Correct:データエラーの検出と訂正を行なう)など
の各種レベルのRAIDを実現することも可能である。
The real disk information table 31 described above is used.
By appropriately changing the configuration of 1 ', so-called "mirroring" (mirroring: the same data is stored in a plurality of disks 2)
Writes to improve the reliability compared to a single disk 2) and "parity check" (parity chec
k: Detects data error), "ECC" (Error Checka
nd Correct: Detects and corrects data errors) and realizes various levels of RAID.

【0043】(A3)運用中にディスク2を追加(増
設)する場合の動作説明 次に、図8に示すように、システム運用中に、新たなデ
ィスク2′(TCA4′)をネットワークスイッチ3に
追加(増設)する場合の動作について説明する。なお、
図8において、既述の符号と同一符号を付したものは既
述のものと同一もしくは同様のものである。
(A3) Description of Operation when Disk 2 is Added (Expanded) During Operation Next, as shown in FIG. 8, a new disk 2 '(TCA4') is set in the network switch 3 during system operation. The operation when adding (adding) will be described. In addition,
In FIG. 8, the elements having the same reference numerals as those described above are the same as or similar to those described above.

【0044】まず、ネットワークスイッチ3の空き入出
力ポート(以下、「空きポート」という)33′に追加
ディスク2′(TCA4′)が接続されると、TCA
4′から割り込み(interruption)メッセージ等が内部
プロセッサ31に送信され、これにより、内部プロセッ
サ31は、空きポート33′にストレージが接続された
ことを認識する(ステップS21)。
First, when an additional disk 2 '(TCA4') is connected to a free input / output port (hereinafter referred to as "free port") 33 'of the network switch 3, the TCA
An interrupt message or the like is transmitted from 4'to the internal processor 31, whereby the internal processor 31 recognizes that the storage is connected to the empty port 33 '(step S21).

【0045】すると、内部プロセッサ31は、処理エン
ジン(Processing Engine)31aにより、新たに接続
された追加ディスク2′に対する問い合わせメッセージ
を作成して、TCA4′宛に送出する(ステップS2
2)。この問い合わせメッセージを受けたTCA4′
は、例えば、自己に接続されているデバイスの数(図
8ではディスク2′が1台),自己に接続されている
デバイス(ディスク2′)の記憶容量,その他必要な
ハード情報(転送速度など)を自己が管理しているデバ
イス情報(資源に関する情報)から取得して、そのデバ
イス情報を上記の問い合わせメッセージの応答として内
部プロセッサ31に返信する(ステップS23)。
Then, the internal processor 31 uses the processing engine 31a to prepare an inquiry message for the newly connected additional disk 2 ', and sends it to the TCA 4' (step S2).
2). TCA4 'receiving this inquiry message
Is, for example, the number of devices connected to itself (one disk 2'in FIG. 8), the storage capacity of the device connected to itself (disk 2 '), other necessary hardware information (transfer speed, etc.). ) Is obtained from the device information (resource-related information) managed by itself, and the device information is returned to the internal processor 31 as a response to the above inquiry message (step S23).

【0046】内部プロセッサ31は、上記の応答メッセ
ージを受けると、その応答メッセージに格納されている
上記〜のデバイス情報を、既存のディスク2のデバ
イス情報とともに制御テーブル31bに登録する。な
お、この制御テーブル31bに保持されるデバイス情報
を基にして、前記の仮想共有ディスク5の構築・管理が
行なわれる。従って、内部プロセッサ31は、後に、追
加ディスク2′の記憶領域をも含めた形で仮想共有ディ
スク5を再構築することが可能である。
Upon receiving the response message, the internal processor 31 registers the device information items 1 to 3 stored in the response message together with the device information of the existing disk 2 in the control table 31b. The virtual shared disk 5 is constructed and managed based on the device information held in the control table 31b. Therefore, the internal processor 31 can later reconstruct the virtual shared disk 5 including the storage area of the additional disk 2 '.

【0047】つまり、上記の処理エンジン31aは、シ
ステム運用中にネットワークスイッチ3に対して新たな
デバイス〔ディスク2′(TCA4′)〕が増設(追加
接続)されたことを認識すると、そのデバイスと通信を
行なってそのデバイスの資源に関する情報を収集して、
既存のデバイス(ディスク2)の資源に関する情報とと
もに制御テーブル31bにて管理する資源情報管理部3
14としての機能を有しているのである。
That is, when the processing engine 31a recognizes that a new device [disk 2 '(TCA4')] has been added (added connection) to the network switch 3 during system operation, the device is treated as the device. To communicate and collect information about the device's resources,
A resource information management unit 3 that manages in the control table 31b together with information on resources of the existing device (disk 2)
It has the function of 14.

【0048】以上により、システムの運用を停止するこ
となく、ディスク2′の増設を簡単に行なうことができ
る。 (A4)システム運用中にディスク2に格納されたデー
タを移動(コピー)する場合の動作説明 次に、システム運用中に、或るディスク2に保存されて
いるデータを他のディスク2に移動する場合の動作につ
いて、図9を用いて説明する。なお、この図9において
も、既述の符号と同一符号を付したものは既述のものと
同一もしくは同様のものである。
As described above, the disk 2'can be easily added without stopping the operation of the system. (A4) Description of Operation When Moving (Copying) Data Stored in Disk 2 During System Operation Next, data stored in a certain disk 2 is moved to another disk 2 during system operation The operation in this case will be described with reference to FIG. Note that, also in FIG. 9, the elements having the same reference numerals as those described above are the same as or similar to those described above.

【0049】まず、保守端末として機能するノード1か
らデータの移動を指示する保守コマンドを内部プロセッ
サ31に投入する。即ち、上記保守コマンドは、例え
ば、ディスクドライバ11にて生成され、カプセルドラ
イバ12にてカプセル化されるとともに、「制御系メッ
セージ」であることを示すメッセージ識別情報が付与さ
れることで、内部プロセッサ31に転送される。
First, a maintenance command for instructing data movement is input to the internal processor 31 from the node 1 functioning as a maintenance terminal. That is, the maintenance command is generated by, for example, the disk driver 11, encapsulated by the capsule driver 12, and added with message identification information indicating that it is a "control system message". 31 is transferred.

【0050】ここで、上記保守コマンドには、少なくと
も、データ移動元のディスク(以下、「移動元ディス
ク」という)2bのネットアドレス〔TCA-ID+SCSI-ID
(又はFC-ID)〕と、データ移動先のディスク(以下、
「移動先ディスク」という)2cのネットアドレスとを
設定しておく。内部プロセッサ31(処理エンジン31
a)は、この保守コマンドを受信すると、移動元ディス
ク2b及び移動先ディスク2c以外の一時的にデータを
蓄えるディスク(以下、「一時ディスク」という)2a
を準備するとともに、移動元ディスク2bを「読み出し
専用」(リードオンリー)(書き込み禁止状態)に設定
する(以上、ステップS31)。
Here, the maintenance command includes at least the net address [TCA-ID + SCSI-ID] of the data migration source disk (hereinafter referred to as "migration source disk") 2b.
(Or FC-ID)] and the data transfer destination disk (hereinafter,
The net address of 2c (referred to as "destination disk") is set in advance. Internal processor 31 (processing engine 31
When the maintenance command is received, a) a disk (hereinafter, referred to as “temporary disk”) 2a other than the migration source disk 2b and the migration destination disk 2c that temporarily stores data.
Is prepared, and the source disk 2b is set to "read only" (read only) (write protected state) (step S31 above).

【0051】なお、上記の設定は、対応するディスク2
を収容するTCA4を介して行なわれる。また、一時デ
ィスク2aは、システム内のディスク2の中で一時ディ
スク2aとして使用するものを予め決めておけばよい
(1台でも2台以上でもよい)。2台以上用意しておく
場合は、上記保守コマンドを受けたときに、その中から
使用するものを選択すればよい。
The above settings are for the corresponding disc 2
Via the TCA4 housing the. As the temporary disk 2a, one of the disks 2 in the system to be used as the temporary disk 2a may be determined in advance (the number of the temporary disks 2a may be one or two or more). When two or more units are prepared, the one to be used may be selected from among them when the maintenance command is received.

【0052】さて、上述のごとく移動先ディスク2c,
移動元ディスク2b,一時ディスク2aの設定を行なっ
た後、内部プロセッサ31(処理エンジン31a)は、
移動元ディスク2aのデータを移動先ディスク2bに順
次コピーしてゆく(ステップS32)。つまり、この場
合の処理エンジン31aは、共有仮想ディスク5(図9
では図示を省略している)の一部として運用中のディス
ク2bを書き込み禁止状態に設定して、そのディスク2
bに保持されているデータを他のディスク2cに移動さ
せうる運用中データ移動処理部315としての機能を有
しているのである。
Now, as described above, the destination disk 2c,
After setting the source disk 2b and the temporary disk 2a, the internal processor 31 (processing engine 31a)
The data of the source disk 2a is sequentially copied to the destination disk 2b (step S32). That is, the processing engine 31a in this case uses the shared virtual disk 5 (see FIG. 9).
The disk 2b in operation is set to the write-protected state as a part of
It has a function as an in-operation data movement processing unit 315 capable of moving the data held in b to another disk 2c.

【0053】なお、このデータコピー途中で移動元ディ
スク2aに対する書き込み要求(制御系メッセージ)が
内部プロセッサ31で受信された場合、ネットワークプ
ロセッサ31は、一時ディスク2aとのコネクションを
設定〔スイッチ32にノード1からの転送系メッセージ
の転送先ポート(Port-ID)を通知〕する。これによ
り、データコピー中のノード1から転送系メッセージに
よりネットワークスイッチ3へ送られる書き込みデータ
は、一時ディスク2aに転送されて蓄積されることにな
る(ステップS33)。
When a write request (control system message) to the migration source disk 2a is received during the data copying, the network processor 31 sets a connection with the temporary disk 2a [node to switch 32 is a node]. Notify the transfer destination port (Port-ID) of the transfer-related message from No. 1]. As a result, the write data sent from the node 1 during the data copy to the network switch 3 by the transfer system message is transferred to the temporary disk 2a and accumulated (step S33).

【0054】さて、移動先ディスク2cへのデータコピ
ーが完了すると、内部プロセッサ31(処理エンジン3
1a)は、データコピー中に一時ディスク2aに蓄積さ
れたデータを読み出し、移動先ディスク2cにコピーし
たデータにその内容を反映させる(ステップS34)。
その後、内部プロセッサ31は、移動元ディスク2bを
アクセス対象から切り離すとともに、一時ディスク2a
を解放する。これにより、移動元ディスク2の交換等を
安全に実施することが可能となる。
When the data copy to the destination disk 2c is completed, the internal processor 31 (processing engine 3
1a) reads the data accumulated in the temporary disk 2a during the data copy, and reflects the content in the data copied to the destination disk 2c (step S34).
After that, the internal processor 31 separates the source disk 2b from the access target, and the temporary disk 2a.
To release. This makes it possible to safely replace the source disk 2 or the like.

【0055】このように、本例では、システム運用中で
あっても、内部プロセッサ31によって、仮想共有ディ
スク5の一部として運用中の或るディスク2(移動元デ
ィスク2b)を「読み出し専用」に設定して、そこに保
持されているデータを他のディスク2(移動先ディスク
2c)に移動させることができるので、一部のディスク
2が使用不能になったり交換が必要になったりした場合
でも、システムの運用を停止することなく、安全にデー
タの退避を行なって対応することができる。
As described above, in this example, even when the system is in operation, the internal processor 31 "reads only" a certain disk 2 (source disk 2b) operating as a part of the virtual shared disk 5. If you set it to, and the data held there can be moved to another disk 2 (destination disk 2c), if some disk 2 becomes unusable or needs to be replaced. However, the data can be safely saved and dealt with without stopping the operation of the system.

【0056】また、上記の例では、移動先ディスク2c
へのデータ移動(コピー)途中の書き込みデータは一時
ディスク2aに蓄積され、データ移動が完了すると、そ
の蓄積データが読み出されて移動先ディスク2cの保持
内容に反映されるので、データコピー中の書き込みデー
タの欠落を確実に防止することができ、移動先ディスク
2cでは常に最新のデータを保持することができる。
Further, in the above example, the destination disk 2c
The write data during the data movement (copying) to the temporary disk 2a is accumulated, and when the data movement is completed, the accumulated data is read out and reflected in the held content of the movement destination disk 2c. It is possible to reliably prevent the loss of write data, and it is possible to always hold the latest data in the destination disk 2c.

【0057】(A5)ネットワークスイッチ3でのキャ
ッシュ動作説明 次に、以下では、ネットワークスイッチ3(内部プロセ
ッサ31)において、任意のディスク2の任意のセクタ
アドレスに保持されているデータをキャッシュしておく
場合について、図10及び図11を用いて説明する。こ
の場合、図10及び図11に示すように、ネットワーク
スイッチ3内部に、「TCA-ID」及びディスク2の「セク
タアドレス」をキーにして検索可能なハッシュ(hash)
テーブル31c(つまり、「TCA-ID」及び「セクタアド
レス」毎にデータを保持するキャッシュメモリ)を準備
しておく。
(A5) Description of Cache Operation in Network Switch 3 Next, in the following, in the network switch 3 (internal processor 31), data held at an arbitrary sector address of an arbitrary disk 2 is cached. The case will be described with reference to FIGS. 10 and 11. In this case, as shown in FIG. 10 and FIG. 11, a hash that can be searched inside the network switch 3 using the “TCA-ID” and the “sector address” of the disk 2 as keys.
A table 31c (that is, a cache memory that holds data for each "TCA-ID" and "sector address") is prepared.

【0058】そして、入出力ポート33(又はスイッチ
32)が「転送系メッセージ」を受信すると、ディスク
2(TCA4)側へ転送する前に、そのメッセージから
「TCA-ID」及び「セクタアドレス」を取り出し内部プロ
セッサ31(処理エンジン31a)に通知する(ステッ
プS41)。内部プロセッサ31の処理エンジン31a
は、通知された「TCA-ID」及び「セクタアドレス」をキ
ーにしてハッシュテーブル31cを検索(これをハッシ
ュ検索という)し、通知された「TCA-ID」及び「セクタ
アドレス」に対応するデータが存在(ハッシュヒット)
すれば、応答メッセージを生成して、ノード1側へリプ
ライする(ステップS42)。
When the input / output port 33 (or switch 32) receives the "transfer system message", the "TCA-ID" and "sector address" are sent from the message before transfer to the disk 2 (TCA4) side. The extraction internal processor 31 (processing engine 31a) is notified (step S41). Processing engine 31a of the internal processor 31
Searches the hash table 31c by using the notified “TCA-ID” and “sector address” as a key (this is called hash search), and the data corresponding to the notified “TCA-ID” and “sector address” Exists (hash hit)
If it does, a response message will be produced | generated and it will reply to the node 1 side (step S42).

【0059】つまり、この場合の上記処理エンジン31
aは、ノード1からのメッセージ内容に基づいてハッシ
ュテーブル31cを検索するハッシュ(キャッシュ)検
索部316としての機能と、このハッシュ検索部の検索
により得られたデータをノードへ応答メッセージとして
送信するキャッシュデータ応答部317としての機能と
を兼ね備えているのである。
That is, the processing engine 31 in this case.
a is a function as a hash (cache) search unit 316 that searches the hash table 31c based on the message content from the node 1, and a cache that transmits the data obtained by the search of this hash search unit to the node as a response message. It also has a function as the data response unit 317.

【0060】一方、上記のハッシュ検索により、ハッシ
ュヒットしなかった場合は、処理エンジン31aからそ
の旨が入出力ポート33(又はスイッチ32)に通知さ
れ、ノード1側からの転送系メッセージは通常通り対象
ディスク2(TCA4)側へ転送される(ステップS4
3)。上記ディスク2(TCA4)側からの応答メッセ
ージはスイッチ32経由でノード1側と内部プロセッサ
31側とにそれぞれ転送され(ステップS44,S4
5)、内部プロセッサ31では、この応答メッセージに
よりハッシュテーブル31cに未キャッシュデータを登
録する。
On the other hand, if no hash hit is found by the above hash search, the processing engine 31a notifies the input / output port 33 (or switch 32) of that fact, and the transfer system message from the node 1 side is as usual. Transferred to the target disk 2 (TCA4) side (step S4)
3). The response message from the disk 2 (TCA4) side is transferred to the node 1 side and the internal processor 31 side via the switch 32 (steps S44, S4).
5) In the internal processor 31, the uncached data is registered in the hash table 31c by this response message.

【0061】このように、本例では、任意のディスク2
に保持されているデータ(アクセスしたデータ)をネッ
トワークスイッチ3側(内部プロセッサ31)でキャッ
シュしておき、ノード1からのメッセージ内容に適合す
るデータが存在すれば、ネットワークスイッチ3側で応
答メッセージを作成して返信するので、ノード1からみ
たアクセス速度を大幅に向上することができる。
Thus, in this example, the disc 2
The data (accessed data) retained in the cache is cached on the network switch 3 side (internal processor 31), and if there is data that matches the message content from the node 1, a response message is sent on the network switch 3 side. Since it is created and sent back, the access speed seen from the node 1 can be greatly improved.

【0062】なお、ネットワークスイッチ3側でキャッ
シュするデータ量については、装備する内部メモリ等の
容量によるが、例えば、アクセス頻度の高いデータのみ
をキャッシュするようにすれば、その容量を削減でき
る。 (B)その他 上述した資源情報管理部314(図8参照),運用中デ
ータ移動処理部315(図9参照),キャッシュ検索部
316及びキャッシュデータ応答部317(図10及び
図11参照)は、内部プロセッサ31の処理エンジン3
1aの機能として、全て装備していてもよいし一部のみ
を装備していてもよい。
The amount of data to be cached on the side of the network switch 3 depends on the capacity of the internal memory or the like equipped, but the capacity can be reduced by caching only the frequently accessed data, for example. (B) Others The resource information management unit 314 (see FIG. 8), the in-operation data migration processing unit 315 (see FIG. 9), the cache search unit 316, and the cache data response unit 317 (see FIGS. 10 and 11) Processing engine 3 of the internal processor 31
As a function of 1a, all may be equipped and only one may be equipped.

【0063】また、上述した実施形態では、ノード1に
対する外部入出力装置として、ディスク装置を適用した
場合について説明したが、例えば、CD−RWやDVD
−RAM等のデータ記録が可能な装置を適用した場合も
上述した実施形態と同様の作用効果が得られる。さら
に、上述した実施形態では、高スループット低レイテン
シの高速内部ネットワークとして、インフィニバンド
(IB)を適用したが、勿論、本発明はこれに限定され
ず、同等の機能を実現できるものであれば同様に適用で
きる。
Further, in the above-described embodiment, the case where the disk device is applied as the external input / output device for the node 1 has been described. For example, a CD-RW or a DVD.
Even when a device capable of recording data, such as a RAM, is applied, the same operational effects as the above-described embodiment can be obtained. Furthermore, in the above-described embodiment, InfiniBand (IB) is applied as a high-speed internal network with high throughput and low latency, but of course the present invention is not limited to this and the same applies as long as equivalent functions can be realized. Applicable to

【0064】そして、本発明は上述した実施形態に限定
されず、本発明の趣旨を逸脱しない範囲で種々変形して
実施することができる。 (C)付記 (付記1) 複数の外部入出力装置と、特定の外部入出
力装置へのアクセスに伴って必要なメッセージを発行し
うる少なくとも1台のノード装置と、該ノード装置と該
複数の外部入出力装置との間に介装されて、該複数の外
部入出力装置の記憶領域を仮想的に該ノード装置の共有
ストレージとして管理するスイッチングノードとをそな
えるとともに、該スイッチングノードが、制御系メッセ
ージを処理する制御部と、該ノード装置から受信される
メッセージの種別(以下、メッセージ種別という)を識
別して、制御系メッセージは該制御部へ転送する一方、
データ転送系メッセージは該特定の外部入出力装置へ転
送する転送処理部とをそなえて構成されていることを特
徴とする、仮想ストレージシステム。
The present invention is not limited to the above-described embodiments, and various modifications can be carried out without departing from the spirit of the present invention. (C) Supplementary note (Supplementary note 1) A plurality of external input / output devices, at least one node device that can issue a message necessary for accessing a specific external input / output device, the node device, and the plurality of node devices. The switching node is interposed between the external input / output device and virtually manages the storage areas of the plurality of external input / output devices as a shared storage of the node device, and the switching node is a control system. The control unit that processes the message and the type of the message received from the node device (hereinafter referred to as the message type) are identified, and the control system message is transferred to the control unit.
A virtual storage system comprising a data transfer system message and a transfer processing unit for transferring the message to the specific external input / output device.

【0065】(付記2) 該ノード装置が、該スイッチ
ングノードへ送信するメッセージのプロトコルを該スイ
ッチングノード側で解釈できるプロトコルに変換するノ
ード装置側プロトコル変換部と、該ノード側プロトコル
変換部によるプロトコル変換の際に、該メッセージ種別
の識別のための情報(以下、メッセージ識別情報とい
う)を該メッセージに付加するメッセージ識別情報付加
部とをそなえていることを特徴とする、付記1記載の仮
想ストレージシステム。
(Supplementary Note 2) A node device side protocol conversion unit for converting the protocol of a message transmitted to the switching node by the node device into a protocol that can be interpreted by the switching node side, and a protocol conversion by the node side protocol conversion unit. The virtual storage system according to Appendix 1, further comprising: a message identification information adding unit that adds information for identifying the message type (hereinafter referred to as message identification information) .

【0066】(付記3) 該外部入出力装置が、該スイ
ッチングノードから受信されるメッセージのプロトコル
を自装置側で解釈できるプロトコルに変換する外部入出
力装置側プロトコル変換部をそなえていることを特徴と
する、付記1又は付記2に記載の仮想ストレージシステ
ム。 (付記4) 該スイッチングノードの該制御部が、運用
中に該スイッチングノードに対して新たな外部入出力装
置が追加接続されたことを認識すると、当該外部入出力
装置(以下、追加入出力装置という)と通信を行なって
当該追加入出力装置の資源に関する情報を収集して、既
存の外部入出力装置の資源に関する情報とともに管理す
る資源情報管理部をさらにそなえていることを特徴とす
る、付記1〜3のいずれか1項に記載の仮想ストレージ
システム。
(Supplementary Note 3) The external input / output device has an external input / output device side protocol conversion unit for converting a protocol of a message received from the switching node into a protocol that can be interpreted by the device itself. The virtual storage system according to supplementary note 1 or supplementary note 2. (Supplementary Note 4) When the control unit of the switching node recognizes that a new external input / output device is additionally connected to the switching node during operation, the external input / output device (hereinafter, additional input / output device) is connected. It is further provided with a resource information management unit that communicates with the existing external input / output device and manages it together with the information about the resource of the existing external input / output device. The virtual storage system according to any one of 1 to 3.

【0067】(付記5) 該スイッチングノードの該制
御部が、該共有ストレージの一部として運用中の外部入
出力装置の記憶領域を書き込み禁止状態に設定して、当
該記憶領域に保持されているデータを他の外部入出力装
置の記憶領域に移動させうる運用中データ移動処理部を
さらにそなえていることを特徴とする、付記1〜4のい
ずれか1項に記載の仮想ストレージシステム。
(Supplementary Note 5) The control unit of the switching node sets the storage area of the external input / output device operating as a part of the shared storage in a write-protected state and is held in the storage area. 5. The virtual storage system according to any one of appendices 1 to 4, further comprising an in-operation data movement processing unit that can move data to a storage area of another external input / output device.

【0068】(付記6) 該スイッチングノードの該制
御部が、該共有ストレージをRAID(Redundant Arrays o
f Independent Disks)として管理するための記憶領域
情報テーブルを有していることを特徴とする、付記1記
載の仮想ストレージシステム。 (付記7) 該スイッチングノードの該制御部が、該外
部入出力装置の該記憶領域に保持されているデータをキ
ャッシュするためのキャッシュメモリと、該ノード装置
からのメッセージ内容に基づいて該キャッシュメモリを
検索するキャッシュ検索部と、該キャッシュ検索部の検
索により得られたデータを該ノード装置へ応答メッセー
ジとして送信するキャッシュデータ応答部とをそなえて
いることを特徴とする、付記1記載の仮想ストレージシ
ステム。
(Supplementary Note 6) The control unit of the switching node uses the shared storage as a RAID (Redundant Arrays).
The virtual storage system according to appendix 1, having a storage area information table for managing as f independent disks). (Supplementary Note 7) A cache memory for the control unit of the switching node to cache data held in the storage area of the external input / output device, and the cache memory based on message contents from the node device. And a cache data response unit for transmitting the data obtained by the search by the cache search unit to the node device as a response message. system.

【0069】(付記8) 複数の外部入出力装置と、特
定の外部入出力装置へのアクセスに伴って必要なメッセ
ージを発行しうる少なくとも1台のノード装置との間に
介装されて、該複数の外部入出力装置の記憶領域を仮想
的に該ノード装置の共有ストレージとして管理するスイ
ッチングノードであって、制御系メッセージを処理する
制御部と、該ノード装置から受信されるメッセージの種
別(以下、メッセージ種別という)を識別して、制御系
メッセージは該制御部へ転送する一方、データ転送系メ
ッセージは該特定の外部入出力装置へ転送する転送処理
部とをそなえたことを特徴とする、仮想ストレージシス
テムに使用されるスイッチングノード。
(Supplementary Note 8) Intervening between a plurality of external input / output devices and at least one node device that can issue a message required for access to a specific external input / output device, A switching node that virtually manages the storage areas of a plurality of external input / output devices as shared storage of the node device, a control unit that processes control-related messages, and a type of message received from the node device (hereinafter , A message type), and the control system message is transferred to the control unit, while the data transfer system message is provided with a transfer processing unit for transferring to the specific external input / output device. Switching node used for virtual storage systems.

【0070】(付記9) 該制御部が、運用中に該スイ
ッチングノードに対して新たな外部入出力装置が追加接
続されたことを認識すると、当該外部入出力装置(以
下、追加入出力装置という)と通信を行なって当該追加
入出力装置の資源に関する情報を収集して、既存の外部
入出力装置の資源に関する情報とともに管理する資源情
報管理部をさらにそなえていることを特徴とする、付記
8記載の仮想ストレージシステムに使用されるスイッチ
ングノード。
(Supplementary Note 9) When the control unit recognizes that a new external input / output device is additionally connected to the switching node during operation, the external input / output device (hereinafter referred to as an additional input / output device). 8) to collect information about resources of the additional input / output device and manage the information together with information about resources of the existing external input / output device. A switching node used in the described virtual storage system.

【0071】(付記10) 該制御部が、該共有ストレ
ージの一部として運用中の外部入出力装置の記憶領域を
書き込み禁止状態に設定して、当該記憶領域に保持され
ているデータを他の外部入出力装置の記憶領域に移動さ
せうる運用中データ移動処理部をさらにそなえているこ
とを特徴とする、付記8又は付記9に記載の仮想ストレ
ージシステムに使用されるスイッチングノード。
(Supplementary Note 10) The control unit sets the storage area of the external input / output device operating as a part of the shared storage to the write-protected state, and the data held in the storage area is changed to another storage area. The switching node used in the virtual storage system according to Supplementary Note 8 or Supplementary Note 9, further comprising an in-operation data movement processing unit that can be moved to the storage area of the external input / output device.

【0072】(付記11) 該制御部が、該共有ストレ
ージをRAID(Redundant Arrays of Independent Disk
s)として管理するための記憶領域情報テーブルを有し
ていることを特徴とする、付記8記載の仮想ストレージ
システムに使用されるスイッチングノード。 (付記12) 該制御部が、該外部入出力装置の該記憶
領域に保持されているデータをキャッシュするためのキ
ャッシュメモリと、該ノード装置からのメッセージ内容
に基づいて該キャッシュメモリを検索するキャッシュ検
索部と、該キャッシュ検索部の検索により得られたデー
タを該ノード装置へ応答メッセージとして送信するキャ
ッシュデータ応答部とをそなえていることを特徴とす
る、付記8記載の仮想ストレージシステムに使用される
スイッチングノード。
(Supplementary Note 11) The control unit uses the shared storage as a RAID (Redundant Arrays of Independent Disk).
A switching node used in the virtual storage system according to appendix 8, characterized by having a storage area information table for management as s). (Supplementary Note 12) A cache memory for the control unit to cache the data held in the storage area of the external input / output device, and a cache for searching the cache memory based on the message content from the node device. The virtual storage system according to appendix 8, comprising a search unit and a cache data response unit that transmits the data obtained by the search by the cache search unit to the node device as a response message. Switching node.

【0073】[0073]

【発明の効果】以上詳述したように、本発明によれば、
次のような利点が得られる。 (1)ノード装置と外部入出力装置との間に介装されたス
イッチングノードにおいて、ノード装置から受信される
メッセージの種別(以下、メッセージ種別という)を識
別して、制御系メッセージは制御部へ転送する一方、デ
ータ転送系メッセージは特定の外部入出力装置へ直接転
送することができるので、従来のように全てのメッセー
ジをノード装置とストレージ装置との間に介装された制
御ノード等で一律に処理する場合に比して、大幅にその
性能(特に、スループット)を向上することができる。
As described in detail above, according to the present invention,
The following advantages are obtained. (1) In the switching node interposed between the node device and the external input / output device, the type of the message received from the node device (hereinafter referred to as the message type) is identified, and the control system message is sent to the control unit. On the other hand, since the data transfer type messages can be directly transferred to a specific external input / output device while being transferred, all the messages are uniformly distributed by a control node or the like interposed between the node device and the storage device as in the past. The performance (especially, throughput) can be significantly improved as compared with the case of performing the processing.

【0074】(2)また、ノード装置は、上記のスイッチ
ングノードへ送信するメッセージのプロトコルをスイッ
チングノード側で解釈できるプロトコルに変換するとと
もに、メッセージ種別の識別のための情報をそのメッセ
ージに付加するので、スイッチングノード側の処理負荷
を抑制しながら、確実に、上記のメッセージの転送先の
切り替えを実現することができる。
(2) Further, the node device converts the protocol of the message to be transmitted to the switching node into a protocol that can be interpreted by the switching node, and adds information for identifying the message type to the message. The switching destination of the above message can be reliably realized while suppressing the processing load on the switching node side.

【0075】(3)さらに、上記の外部入出力装置は、ス
イッチングノードから受信されるメッセージのプロトコ
ルを自装置側で解釈できるプロトコルに変換するプロト
コル変換部を装備することにより、既存のプロトコルと
スイッチングノード側のプロトコルとの整合性を担保で
き、正常な通信を実現することができる。 (4)また、スイッチングノードの制御部は、システム運
用中にスイッチングノードに対して新たな外部入出力装
置が追加接続されと、自動的に、その追加入出力装置と
通信を行なってその追加入出力装置の資源に関する情報
を収集して、既存の外部入出力装置の資源に関する情報
とともに管理することもできるので、システムの運用を
停止することなく、外部入出力装置の増設を簡単に行な
うことができる。
(3) Further, the external input / output device described above is equipped with a protocol conversion unit that converts the protocol of the message received from the switching node into a protocol that can be interpreted by the device itself, thereby switching between the existing protocol and the existing protocol. Consistency with the protocol on the node side can be ensured, and normal communication can be realized. (4) Also, when a new external input / output device is additionally connected to the switching node during system operation, the control unit of the switching node automatically communicates with the additional input / output device to add the additional input / output device. It is also possible to collect information about output device resources and manage them together with information about existing external I / O device resources, so you can easily add external I / O devices without stopping the system operation. it can.

【0076】(5)さらに、スイッチングノードの制御部
は、共有ストレージの一部として運用中の外部入出力装
置の記憶領域を書き込み禁止状態に設定にして、その記
憶領域に保持されているデータを他の外部入出力装置の
記憶領域に移動させることもできるので、一部の外部入
出力装置が使用不能になったり交換が必要になったりし
た場合でも、システムの運用を停止することなく、安全
にデータの退避を行なって対応することができる。
(5) Furthermore, the control unit of the switching node sets the storage area of the external input / output device operating as a part of the shared storage to the write-protected state and sets the data held in the storage area. It can be moved to the storage area of other external I / O devices, so even if some of the external I / O devices become unavailable or need to be replaced, the operation of the system is not stopped and the safety is maintained. Can be dealt with by saving data.

【0077】(6)また、スイッチングノードの制御部
は、共有ストレージをRAID(RedundantArrays of Indep
endent Disks)として管理するための記憶領域情報テー
ブルを有していてもよく、このようにすれば、ノード装
置から外部入出力装置に対するアクセス速度を向上した
り、データ転送の信頼性を向上したりすることが可能に
なる。
(6) Further, the control unit of the switching node uses the shared storage as a RAID (Redundant Arrays of Index).
It may have a storage area information table to be managed as endent Disks), and by doing so, it is possible to improve the access speed from the node device to the external input / output device and to improve the reliability of data transfer. It becomes possible to do.

【0078】(7)さらに、スイッチングノードの制御部
は、外部入出力装置の記憶領域に保持されているデータ
をキャッシュしておき、ノード装置からのメッセージ内
容に適合するキャッシュデータが存在すれば、スイッチ
ングノード側で応答メッセージを作成して返信すること
もできるので、ノード装置側からみたアクセス速度を大
幅に向上することができる。
(7) Furthermore, the control unit of the switching node caches the data held in the storage area of the external input / output device, and if there is cache data that matches the message content from the node device, Since the response message can be created and sent back on the switching node side, the access speed seen from the node device side can be greatly improved.

【図面の簡単な説明】[Brief description of drawings]

【図1】図1は本発明の一実施形態としての仮想ストレ
ージシステムの構成を示すブロック図である。
FIG. 1 is a block diagram showing a configuration of a virtual storage system as an embodiment of the present invention.

【図2】図1に示すノード装置におけるディスクドライ
バ及びカプセルドライバの動作を説明するためのブロッ
ク図である。
FIG. 2 is a block diagram for explaining operations of a disk driver and a capsule driver in the node device shown in FIG.

【図3】図1に示すネットワークプロセッサが管理する
実ストレージ(ディスク)情報テーブルの一例を示す図
である。
3 is a diagram showing an example of a real storage (disk) information table managed by the network processor shown in FIG.

【図4】図3に示す実ストレージ(ディスク)情報テー
ブルの変形例(RAIDの場合)を示す図である。
FIG. 4 is a diagram showing a modified example (in the case of RAID) of the real storage (disk) information table shown in FIG.

【図5】図1に示す仮想ストレージシステムの動作(制
御系メッセージの転送)を説明するためのシーケンス図
である。
5 is a sequence diagram for explaining an operation (transfer of a control system message) of the virtual storage system shown in FIG.

【図6】図1に示す仮想ストレージシステムの動作(転
送系メッセージの転送)を説明するためのシーケンス図
である。
FIG. 6 is a sequence diagram for explaining an operation (transfer of a transfer system message) of the virtual storage system shown in FIG.

【図7】図1に示す仮想ストレージシステムの動作(制
御系及び転送系メッセージの転送経路)の一例を示すブ
ロック図である。
FIG. 7 is a block diagram showing an example of the operation of the virtual storage system shown in FIG. 1 (transfer route of control system and transfer system messages).

【図8】図1に示す仮想ストレージシステムにおいて運
用中にディスク装置を追加する場合の動作を説明するた
めのブロック図である。
8 is a block diagram for explaining an operation when a disk device is added during operation in the virtual storage system shown in FIG.

【図9】図1に示す仮想ストレージシステムにおいて運
用中にデータの移動を行なう場合の動作を説明するため
のブロック図である。
FIG. 9 is a block diagram for explaining an operation when moving data during operation in the virtual storage system shown in FIG. 1.

【図10】図1に示す仮想ストレージシステムにおいて
ネットワークプロセッサでキャッシュヒットした場合の
動作を説明するためのブロック図である。
10 is a block diagram for explaining an operation when a cache hit occurs in a network processor in the virtual storage system shown in FIG.

【図11】図1に示す仮想ストレージシステムにおいて
ネットワークプロセッサでキャッシュヒットしなかった
場合の動作を説明するためのブロック図である。
11 is a block diagram for explaining an operation when a cache hit does not occur in a network processor in the virtual storage system shown in FIG.

【図12】従来の仮想ストレージシステムの一例を示す
ブロック図である。
FIG. 12 is a block diagram showing an example of a conventional virtual storage system.

【符号の説明】[Explanation of symbols]

1 ノード装置 2,2′,2a〜2c ストレージ(ディスク)装置
(外部入出力装置) 3 ネットワークスイッチ(スイッチングノード) 4,4′ ターゲットチャンネルアダプタ(TCA) 5 (仮想)共有ディスク(共有ストレージ;Virtual
Disk) 6 ヘッダ部(メッセージヘッダ) 7 データ部 11,42 ディスクドライバ(Disk Driver) 12 カプセルドライバ(Capsule Driver) 31 ネットワークプロセッサ(Network Processor) 31a 処理エンジン(Processing Engine) 31b 制御テーブル 31c ハッシュテーブル(hash table) 32 インターコネクトスイッチ(SW) 33,33′ 入出力ポート 41 デカプセルドライバ(外部入出力装置側プロトコ
ル変換部) 121 ノード側プロトコル変換部 122 メッセージ識別情報付加部 311,311′ 実ストレージ(ディスク)情報テー
ブル(記憶領域情報テーブル) 311a,311a′ オフセット(offset)フィール
ド 311b TCA-IDフィールド 311c SCSI-ID(又はFC-ID)フィールド 311d 開始セクタフィールド 311e 終了セクタフィールド 312 テーブル検索部 313 応答メッセージ通知部 314 資源情報管理部 315 運用中データ移動処理部 316 ハッシュ(キャッシュ)検索部 317 キャッシュデータ応答部
1 node device 2, 2 ', 2a to 2c storage (disk) device (external input / output device) 3 network switch (switching node) 4, 4'target channel adapter (TCA) 5 (virtual) shared disk (shared storage; Virtual
Disk) 6 Header part (message header) 7 Data part 11,42 Disk driver 12 Disk driver 12 Capsule driver 31 Network Processor 31a Processing Engine 31b Control table 31c Hash table (hash) table) 32 interconnect switch (SW) 33, 33 'input / output port 41 decapsulation driver (external input / output device side protocol conversion unit) 121 node side protocol conversion unit 122 message identification information addition unit 311, 311' real storage (disk) Information table (storage area information table) 311a, 311a 'Offset field 311b TCA-ID field 311c SCSI-ID (or FC-ID) field 311d Start sector field 311e End sector field Rudo 312 table search unit 313 response message notifier 314 resource information managing unit 315 operating data movement processing unit 316 hash (cache) search section 317 cache data response unit

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 複数の外部入出力装置と、 特定の外部入出力装置へのアクセスに伴って必要なメッ
セージを発行しうる少なくとも1台のノード装置と、 該ノード装置と該複数の外部入出力装置との間に介装さ
れて、該複数の外部入出力装置の記憶領域を仮想的に該
ノード装置の共有ストレージとして管理するスイッチン
グノードとをそなえるとともに、 該スイッチングノードが、 制御系メッセージを処理する制御部と、 該ノード装置から受信されるメッセージの種別(以下、
メッセージ種別という)を識別して、制御系メッセージ
は該制御部へ転送する一方、データ転送系メッセージは
該特定の外部入出力装置へ転送する転送処理部とをそな
えて構成されていることを特徴とする、仮想ストレージ
システム。
1. A plurality of external input / output devices, at least one node device capable of issuing a message required for access to a specific external input / output device, the node device and the plurality of external input / output devices. A switching node that is interposed between the device and a storage node that virtually manages the storage areas of the plurality of external input / output devices as shared storage of the node device, and the switching node processes control system messages. Control unit and the type of message received from the node device (hereinafter,
(A message type) is identified and a control system message is transferred to the control unit, while a data transfer system message is configured to include a transfer processing unit that transfers the data to the specific external input / output device. Let's say a virtual storage system.
【請求項2】 該ノード装置が、 該スイッチングノードへ送信するメッセージのプロトコ
ルを該スイッチングノード側で解釈できるプロトコルに
変換するノード装置側プロトコル変換部と、 該ノード側プロトコル変換部によるプロトコル変換の際
に、該メッセージ種別の識別のための情報(以下、メッ
セージ識別情報という)を該メッセージに付加するメッ
セージ識別情報付加部とをそなえていることを特徴とす
る、請求項1記載の仮想ストレージシステム。
2. A node device side protocol conversion unit for converting the protocol of a message transmitted to the switching node into a protocol that can be interpreted by the switching node side, and a protocol conversion process performed by the node side protocol conversion unit. The virtual storage system according to claim 1, further comprising: a message identification information addition unit that adds information for identifying the message type (hereinafter referred to as message identification information) to the message.
【請求項3】 該外部入出力装置が、 該スイッチングノードから受信されるメッセージのプロ
トコルを自装置側で解釈できるプロトコルに変換する外
部入出力装置側プロトコル変換部をそなえていることを
特徴とする、請求項1又は請求項2に記載の仮想ストレ
ージシステム。
3. The external input / output device comprises an external input / output device side protocol conversion unit for converting a protocol of a message received from the switching node into a protocol that can be interpreted by the own device side. The virtual storage system according to claim 1 or 2.
【請求項4】 該スイッチングノードの該制御部が、 運用中に該スイッチングノードに対して新たな外部入出
力装置が追加接続されたことを認識すると、当該外部入
出力装置(以下、追加入出力装置という)と通信を行な
って当該追加入出力装置の資源に関する情報を収集し
て、既存の外部入出力装置の資源に関する情報とともに
管理する資源情報管理部をさらにそなえていることを特
徴とする、請求項1〜3のいずれか1項に記載の仮想ス
トレージシステム。
4. When the control unit of the switching node recognizes that a new external input / output device is additionally connected to the switching node during operation, the external input / output device (hereinafter, additional input / output device) is connected. Device)) to collect information regarding the resources of the additional input / output device, and to manage the information together with information regarding the resources of the existing external input / output device. The virtual storage system according to claim 1.
【請求項5】 該スイッチングノードの該制御部が、 該共有ストレージの一部として運用中の外部入出力装置
の記憶領域を書き込み禁止状態に設定して、当該記憶領
域に保持されているデータを他の外部入出力装置の記憶
領域に移動させうる運用中データ移動処理部をさらにそ
なえていることを特徴とする、請求項1〜4のいずれか
1項に記載の仮想ストレージシステム。
5. The control unit of the switching node sets a storage area of an external input / output device operating as a part of the shared storage to a write-protected state so that data stored in the storage area is protected. The virtual storage system according to any one of claims 1 to 4, further comprising an in-operation data migration processing unit that can be migrated to a storage area of another external input / output device.
【請求項6】 該スイッチングノードの該制御部が、 該外部入出力装置の該記憶領域に保持されているデータ
をキャッシュするためのキャッシュメモリと、 該ノード装置からのメッセージ内容に基づいて該キャッ
シュメモリを検索するキャッシュ検索部と、 該キャッシュ検索部の検索により得られたデータを該ノ
ード装置へ応答メッセージとして送信するキャッシュデ
ータ応答部とをそなえていることを特徴とする、請求項
1記載の仮想ストレージシステム。
6. A cache memory for the control unit of the switching node to cache data held in the storage area of the external input / output device, and the cache based on message contents from the node device. 2. The cache search unit for searching the memory, and the cache data response unit for transmitting the data obtained by the search by the cache search unit to the node device as a response message. Virtual storage system.
【請求項7】 複数の外部入出力装置と、特定の外部入
出力装置へのアクセスに伴って必要なメッセージを発行
しうる少なくとも1台のノード装置との間に介装され
て、該複数の外部入出力装置の記憶領域を仮想的に該ノ
ード装置の共有ストレージとして管理するスイッチング
ノードであって、 制御系メッセージを処理する制御部と、 該ノード装置から受信されるメッセージの種別を識別し
て、制御系メッセージは該制御部へ転送する一方、デー
タ転送系メッセージは該特定の外部入出力装置へ転送す
る転送処理部とをそなえたことを特徴とする、仮想スト
レージシステムに使用されるスイッチングノード。
7. A plurality of external input / output devices and at least one node device capable of issuing a necessary message upon access to a specific external input / output device are interposed between the plurality of external input / output devices. A switching node that virtually manages a storage area of an external input / output device as a shared storage of the node device, and identifies a control unit that processes a control system message and a type of a message received from the node device. , A switching node used in a virtual storage system, characterized in that a control system message is transferred to the control unit, while a data transfer system message is transferred to the specific external input / output device. .
【請求項8】 該制御部が、 運用中に該スイッチングノードに対して新たな外部入出
力装置が追加接続されたことを認識すると、当該外部入
出力装置(以下、追加入出力装置という)と通信を行な
って当該追加入出力装置の資源に関する情報を収集し
て、既存の外部入出力装置の資源に関する情報とともに
管理する資源情報管理部をさらにそなえていることを特
徴とする、請求項7記載の仮想ストレージシステムに使
用されるスイッチングノード。
8. When the control unit recognizes that a new external input / output device is additionally connected to the switching node during operation, the external input / output device (hereinafter referred to as additional input / output device) 8. The resource information management unit further comprising: a resource information management unit that performs communication to collect information about resources of the additional input / output device and manages the information together with information about resources of an existing external input / output device. Switching node used in the virtual storage system.
【請求項9】 該制御部が、 該共有ストレージの一部として運用中の外部入出力装置
の記憶領域を書き込み禁止状態に設定して、当該記憶領
域に保持されているデータを他の外部入出力装置の記憶
領域に移動させうる運用中データ移動処理部をさらにそ
なえていることを特徴とする、請求項7又は請求項8に
記載の仮想ストレージシステムに使用されるスイッチン
グノード。
9. The control unit sets a storage area of an external input / output device that is operating as a part of the shared storage to a write-protected state, and sets the data held in the storage area to another external storage device. The switching node used in the virtual storage system according to claim 7 or 8, further comprising an in-operation data migration processing unit that can be migrated to a storage area of the output device.
【請求項10】 該制御部が、 該外部入出力装置の該記憶領域に保持されているデータ
をキャッシュするためのキャッシュメモリと、 該ノード装置からのメッセージ内容に基づいて該キャッ
シュメモリを検索するキャッシュ検索部と、 該キャッシュ検索部の検索により得られたデータを該ノ
ード装置へ応答メッセージとして送信するキャッシュデ
ータ応答部とをそなえていることを特徴とする、請求項
7記載の仮想ストレージシステムに使用されるスイッチ
ングノード。
10. The control unit retrieves the cache memory based on a message content from the node device and a cache memory for caching data held in the storage area of the external input / output device. 8. The virtual storage system according to claim 7, further comprising a cache search unit and a cache data response unit that transmits the data obtained by the search by the cache search unit to the node device as a response message. Switching node used.
JP2001225694A 2001-07-26 2001-07-26 Virtual storage system and switching node used for the same system Pending JP2003044421A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001225694A JP2003044421A (en) 2001-07-26 2001-07-26 Virtual storage system and switching node used for the same system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001225694A JP2003044421A (en) 2001-07-26 2001-07-26 Virtual storage system and switching node used for the same system

Publications (1)

Publication Number Publication Date
JP2003044421A true JP2003044421A (en) 2003-02-14

Family

ID=19058644

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001225694A Pending JP2003044421A (en) 2001-07-26 2001-07-26 Virtual storage system and switching node used for the same system

Country Status (1)

Country Link
JP (1) JP2003044421A (en)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005011277A (en) * 2003-06-23 2005-01-13 Hitachi Ltd Storage device connected to external storage
JP2006072957A (en) * 2004-08-03 2006-03-16 Hitachi Ltd Storage device for executing data migration with worm function, storage system and data moving method
JP2007501987A (en) * 2003-06-23 2007-02-01 シエラ・ロジック、インコーポレイテッド Storage shelf router interface tunneling system and method
JP2007157089A (en) * 2005-12-09 2007-06-21 Fujitsu Ltd Storage virtualization device and computer system using the same
KR100786895B1 (en) * 2004-11-09 2007-12-17 후지쯔 가부시끼가이샤 Storage virtualization apparatus
JP2008117107A (en) * 2006-11-02 2008-05-22 Hitachi Ltd Storage system
US7441009B2 (en) 2005-12-27 2008-10-21 Fujitsu Limited Computer system and storage virtualizer
JP2009110218A (en) * 2007-10-30 2009-05-21 Fujitsu Ltd Virtualization switch and computer system using the same
US7653792B2 (en) 2003-11-27 2010-01-26 Hitachi, Ltd. Disk array apparatus including controller that executes control to move data between storage areas based on a data protection level
US7889639B2 (en) 2005-12-20 2011-02-15 Fujitsu Limited Fiber channel switch and computer system using the same
JP2011507065A (en) * 2007-12-07 2011-03-03 ヴァーテンシス リミテッド Control path I / O virtualization method
US8732130B2 (en) 2008-02-05 2014-05-20 Fujitsu Limited Virtualization switch, computer system, and data copy method
WO2017134795A1 (en) * 2016-02-04 2017-08-10 株式会社日立製作所 Storage system and cache control method
CN113556298A (en) * 2021-09-18 2021-10-26 云宏信息科技股份有限公司 Storage access method, medium and server based on PowerVC

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7711896B2 (en) 2003-06-23 2010-05-04 Hitachi, Ltd. Storage system that is connected to external storage
JP2007501987A (en) * 2003-06-23 2007-02-01 シエラ・ロジック、インコーポレイテッド Storage shelf router interface tunneling system and method
US8312233B2 (en) 2003-06-23 2012-11-13 Hitachi, Ltd. Storage system that is connected to external storage
JP4686463B2 (en) * 2003-06-23 2011-05-25 エミュレックス デザイン アンド マニュファクチュアリング コーポレーション Storage shelf router interface tunneling system and method
JP2005011277A (en) * 2003-06-23 2005-01-13 Hitachi Ltd Storage device connected to external storage
US7930502B2 (en) 2003-11-27 2011-04-19 Hitachi, Ltd. Disk array apparatus and control method for disk array apparatus
US7653792B2 (en) 2003-11-27 2010-01-26 Hitachi, Ltd. Disk array apparatus including controller that executes control to move data between storage areas based on a data protection level
JP2006072957A (en) * 2004-08-03 2006-03-16 Hitachi Ltd Storage device for executing data migration with worm function, storage system and data moving method
KR100786895B1 (en) * 2004-11-09 2007-12-17 후지쯔 가부시끼가이샤 Storage virtualization apparatus
JP4486921B2 (en) * 2005-12-09 2010-06-23 富士通株式会社 Storage virtualization apparatus and computer system using the same
JP2007157089A (en) * 2005-12-09 2007-06-21 Fujitsu Ltd Storage virtualization device and computer system using the same
US7889639B2 (en) 2005-12-20 2011-02-15 Fujitsu Limited Fiber channel switch and computer system using the same
US7441009B2 (en) 2005-12-27 2008-10-21 Fujitsu Limited Computer system and storage virtualizer
JP2008117107A (en) * 2006-11-02 2008-05-22 Hitachi Ltd Storage system
JP2009110218A (en) * 2007-10-30 2009-05-21 Fujitsu Ltd Virtualization switch and computer system using the same
US7801026B2 (en) 2007-10-30 2010-09-21 Fujitsu Limited Virtualization switch and method for controlling a virtualization switch
JP2011507065A (en) * 2007-12-07 2011-03-03 ヴァーテンシス リミテッド Control path I / O virtualization method
US9021125B2 (en) 2007-12-07 2015-04-28 Micron Technology, Inc. Control path I/O virtualisation
US8732130B2 (en) 2008-02-05 2014-05-20 Fujitsu Limited Virtualization switch, computer system, and data copy method
WO2017134795A1 (en) * 2016-02-04 2017-08-10 株式会社日立製作所 Storage system and cache control method
CN113556298A (en) * 2021-09-18 2021-10-26 云宏信息科技股份有限公司 Storage access method, medium and server based on PowerVC

Similar Documents

Publication Publication Date Title
JP3944449B2 (en) Computer system, magnetic disk device, and disk cache control method
CN100428185C (en) Bottom-up cache structure for storage servers
US7620794B2 (en) Storage system with storage apparatuses including virtual switches
JP6074056B2 (en) Computer system and data control method
US8312233B2 (en) Storage system that is connected to external storage
US9513825B2 (en) Storage system having a channel control function using a plurality of processors
US7124169B2 (en) Network system and its switches
US7433948B2 (en) Methods and apparatus for implementing virtualization of storage within a storage area network
US7269667B2 (en) Disk array system and method for migrating from one storage system to another
JP4297747B2 (en) Storage device
JP4606711B2 (en) Virtualization control device and data migration control method
US20030158999A1 (en) Method and apparatus for maintaining cache coherency in a storage system
US20160085460A1 (en) Optimized read access to shared data via monitoring of mirroring operations
JP2003044421A (en) Virtual storage system and switching node used for the same system
JP2005301802A (en) Storage system
JP2021128802A (en) Information processing system, storage system, and data transfer method
JP2008112399A (en) Storage virtualization switch and computer system
US11327653B2 (en) Drive box, storage system and data transfer method
JP2007048323A (en) Virtualization controller and data migration control method
US20230244417A1 (en) Storage node, storage device, and network chip
US7574529B2 (en) Addressing logical subsystems in a data storage system
TW202230122A (en) Systems and methods for data copy offload for storage devices
US11200172B2 (en) Storage system and method of controlling storage system
JP2004013246A (en) Multiplex write-in type storage device

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040423

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060523

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060606

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060804

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070306

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070507

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080416

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090331