JPWO2017195324A1 - ストレージ装置 - Google Patents
ストレージ装置 Download PDFInfo
- Publication number
- JPWO2017195324A1 JPWO2017195324A1 JP2018516290A JP2018516290A JPWO2017195324A1 JP WO2017195324 A1 JPWO2017195324 A1 JP WO2017195324A1 JP 2018516290 A JP2018516290 A JP 2018516290A JP 2018516290 A JP2018516290 A JP 2018516290A JP WO2017195324 A1 JPWO2017195324 A1 JP WO2017195324A1
- Authority
- JP
- Japan
- Prior art keywords
- request
- data
- area
- drive
- storage
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0683—Plurality of storage devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0604—Improving or facilitating administration, e.g. storage management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0602—Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
- G06F3/0614—Improving the reliability of storage systems
- G06F3/0619—Improving the reliability of storage systems in relation to data integrity, e.g. data losses, bit errors
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0629—Configuration or reconfiguration of storage systems
- G06F3/0637—Permissions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0628—Interfaces specially adapted for storage systems making use of a particular technique
- G06F3/0655—Vertical data movement, i.e. input-output transfer; data movement between one or more hosts and one or more storage devices
- G06F3/0659—Command handling arrangements, e.g. command buffers, queues, command scheduling
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
- G06F3/0601—Interfaces specially adapted for storage systems
- G06F3/0668—Interfaces specially adapted for storage systems adopting a particular infrastructure
- G06F3/0671—In-line storage system
- G06F3/0673—Single storage device
- G06F3/0679—Non-volatile semiconductor memory device, e.g. flash memory, one time programmable memory [OTP]
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computer Security & Cryptography (AREA)
- Memory System Of A Hierarchy Structure (AREA)
Abstract
Description
一方、NVM Express (以下、「NVMe」という)I/Fを2つ持つドライブは、高可用性を実現するために、ストレージクラスタが冗長化されたストレージ装置の両プロセッサとPCIeで接続し、両ストレージクラスタの主記憶に直接アクセスすることができる。
よって、Dual port NVMe SSDで構成したストレージ装置の高信頼化及び高性能化を両立させることが課題である。
201は、ストレージ装置のストレージコントローラを表す。ストレージ装置は、他のコンピュータから転送されるデータを永続的に格納する。ストレージ装置の高可用化を実現するため、ストレージコントローラは、2つまたは2つ以上のストレージクラスタで冗長構成を採用する。実施例1では、ストレージクラスタを2つ設けた例を示す。
323(423)は、IO Memory Mapping Unit(以下、「IOMMU」という)を表し、プロセッサを構成する機能部位の一つである。IOMMUは、IOページテーブルの記載内容に従って、プロセッサに接続するPCIe デバイスによる主記憶のリードライトの可否及びアドレス変換を制御する。例えば、アドレス変換テーブル(IOページテーブル)を保持(キャッシュ)し、アドレス変換の切り替えを制御する。
D111(D211)は、制御データ領域を表し、主記憶331(431)にあるストレージ装置の動作を司る制御データが格納されている領域である。詳細については後述する。
D131(D231)は、キャッシュデータ領域を表し、ホストデータを格納するための主記憶331(431)上の領域である。詳細については後述する。
D001は、物理アドレス空間を表す。物理アドレス空間の大きさは、プロセッサが管理できるアドレス空間の大きさで決まる。
IOページテーブルは、制御対象デバイス情報T101を格納するフィールド、メモリアクセス制御対象領域の開始物理アドレスT102を格納するフィールド、メモリアクセス制御対象領域の大きさを表すページサイズT103を格納するフィールド、制御対象デバイスのメモリアクセス権T104の情報を格納するフィールドを含む。IOページテーブルは、これ以外のフィールドを含んでいてもよい。
ページサイズT103は、典型的には、4kB、2MB、1GBといったサイズが指定できるところ、設計によってこの大きさを変えることもできる。
このIOページテーブルは、典型的には主記憶に格納されているところ、IOページテーブルの複製の一部または全てをドライブ内のバッファに格納してもよい。
メモリアクセス権切替え判定処理は、ストレージ装置がホストからのIO要求を受けてから、このIO要求に対応したストレージ装置が行うべき処理内容に応じて、ストレージ装置がドライブによるメモリライトを許可または禁止するための処理を切り替える判定処理である。この判定処理において、ストレージ装置がホストからのIO要求を受領した以降の処理の主体は、ストレージ装置のプロセッサコアである(以下では、「コア」と略す)。
ステップS005は、コアがホストのWrite要求のIOパターンを分析し、ランダムアクセス処理をすべきかどうかを判定するステップである。ホスト要求のIOパターンは、典型的にはデータ転送長が512B〜数十kBと小さく、Writeデータの格納先となるアクセス範囲が大きくかつ局所性が小さいランダムアクセスと、データ転送長が数十kB〜1MBと大きくかつアクセス先が連続性をもつシーケンシャルアクセス、の2つに大別される。
キャッシュヒットと判定された場合(NO)、コアは、キャッシュ領域上のホストデータを読み出してホストにデータ転送することができる。よって、ドライブリード処理を行う必要が無く、コアはメモリアクセス権切替え判定処理を終了する。
ステップS014に続く、ステップS009、ステップS011及びステップS012については、前述と同様である。
311、411…ホストI/F 321、421…プロセッサ
322、422…プロセッサコア(コア) 323,423…IOMMU
331、431…プロセッサの主記憶(主記憶)
500…ドライブボックス 600…スイッチ 700…ドライブ
D111、D211…制御データ領域
D121、D221…バッファデータ領域
D131、D231…キャッシュデータ領域
Claims (8)
- 2以上のクラスタと、前記クラスタそれぞれに接続される記憶ドライブと、前記クラスタそれぞれに属しIO要求に係るデータを格納する主記憶と、前記クラスタそれぞれに属し前記主記憶に対するアクセスを制御するプロセッサとを備え、
前記主記憶は、前記記憶ドライブからの書き込みを許可する第1の領域と、該書き込みを禁止する第2の領域とを含み、
前記プロセッサは、前記IO要求が第1の要求である場合に、前記IO要求に係るデータの前記記憶ドライブからの転送先として前記第1の領域を選択し、前記IO要求が第2の要求である場合に、前記IO要求に係るデータの前記記憶ドライブからの転送先として前記第2の領域を選択すると共に前記第2の領域に対する書き込みを許可する
ことを特徴とするストレージ装置。 - 請求項1に記載のストレージ装置であって、
前記プロセッサは、書き込みを許可した前記第2の領域への書き込みが終了すると、当該第2の領域に対する前記記憶ドライブからの書き込みを禁止する
ことを特徴とするストレージ装置。 - 請求項1又は2に記載のストレージ装置であって、
前記プロセッサは、前記IO要求が読み出し処理であり、該読み出し処理の対象データが前記主記憶に設けたデータキャッシュ上に存在しない場合、または、前記IO要求がランダムアクセスの書き込み処理であり、該書き込み処理に伴う前記記憶ドライブからのデータ読み出しが必要な場合に、前記第1の要求か前記第2の要求かの選択を行う
ことを特徴とするストレージ装置。 - 請求項1〜3のいずれか1項に記載のストレージ装置であって、
前記プロセッサは、前記第1の要求か前記第2の要求かの選択を、条件判定用ビットマップテーブルに基づいて判断する
ことを特徴とするストレージ装置。 - 記憶ドライブからの書き込みを許可する第1の領域及び該書き込みを禁止する第2の領域を含む主記憶に対し、
IO要求が第1の要求であるか第2の要求であるかを判断する第1のステップと
前記IO要求が第1の要求である場合に、前記IO要求に係るデータの前記記憶ドライブからの転送先として前記第1の領域を選択する第2のステップと、
前記IO要求が第2の要求である場合に、前記IO要求に係るデータの前記記憶ドライブからの転送先として前記第2の領域を選択すると共に前記第2の領域に対する書き込みを許可する第3のステップと
を有するIO要求処理方法。 - 請求項5に記載のIO要求処理方法であって、
前記第3のステップに続いて、書き込みを許可した前記第2の領域への書き込みが終了すると当該第2の領域に対する前記記憶ドライブからの書き込みを禁止する第4のステップ
を有するIO要求処理方法。 - 請求項5又は6に記載のIO要求処理方法であって、
前記第1のステップは、前記IO要求が読み出し処理であり、該読み出し処理の対象データが前記主記憶に設けたデータキャッシュ上に存在しない場合、または、前記IO要求がランダムアクセスの書き込み処理であり、該書き込み処理に伴う前記記憶ドライブからのデータ読み出しが必要な場合に、実行されるステップ
であるIO要求処理方法。 - 請求項5〜7のいずれか1項に記載のIO要求処理方法であって、
前記第1のステップは、当該IO要求処理を実行するプロセッサが条件判定用ビットマップテーブルに基づいて判断するステップ
であるIO要求処理方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2016/064148 WO2017195324A1 (ja) | 2016-05-12 | 2016-05-12 | ストレージ装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2017195324A1 true JPWO2017195324A1 (ja) | 2018-11-08 |
JP6677806B2 JP6677806B2 (ja) | 2020-04-08 |
Family
ID=60266647
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2018516290A Active JP6677806B2 (ja) | 2016-05-12 | 2016-05-12 | ストレージ装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US10782917B2 (ja) |
JP (1) | JP6677806B2 (ja) |
WO (1) | WO2017195324A1 (ja) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11139959B2 (en) * | 2018-02-01 | 2021-10-05 | The University Of Chicago | Stream ciphers for digital storage encryption |
CN109448779B (zh) * | 2018-11-14 | 2020-11-20 | 苏州浪潮智能科技有限公司 | 一种Dual Port SSD的SI测试方法、装置 |
JP2020161029A (ja) * | 2019-03-28 | 2020-10-01 | 株式会社日立製作所 | ストレージシステム及びストレージシステムの制御方法 |
US11256621B2 (en) * | 2019-06-25 | 2022-02-22 | Seagate Technology Llc | Dual controller cache optimization in a deterministic data storage system |
US11977493B2 (en) * | 2019-07-17 | 2024-05-07 | Red Hat, Inc. | Safe virtual machine physical device access for network function virtualization |
JP7315753B2 (ja) * | 2019-08-02 | 2023-07-26 | 株式会社日立製作所 | ストレージ装置 |
JP2021108058A (ja) | 2019-12-27 | 2021-07-29 | 株式会社日立製作所 | ストレージシステム |
JP7242928B2 (ja) * | 2020-02-07 | 2023-03-20 | 株式会社日立製作所 | ストレージシステム及び入出力制御方法 |
JP7028902B2 (ja) | 2020-02-07 | 2022-03-02 | 株式会社日立製作所 | ストレージシステム及び入出力制御方法 |
CN113608784B (zh) * | 2021-08-19 | 2024-05-03 | 湖南国科微电子股份有限公司 | NVMe控制装置和方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005352833A (ja) * | 2004-06-11 | 2005-12-22 | Hitachi Ltd | 共有排他制御方法 |
JP2015026263A (ja) * | 2013-07-26 | 2015-02-05 | 株式会社日立製作所 | 計算機システム、キャッシュ管理方法、及び計算機 |
WO2016038710A1 (ja) * | 2014-09-11 | 2016-03-17 | 株式会社日立製作所 | ストレージシステム |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7761657B2 (en) | 2006-07-10 | 2010-07-20 | Hitachi, Ltd. | Storage control system, control method for storage control system, port selector, and controller |
JP2008027291A (ja) * | 2006-07-24 | 2008-02-07 | Hitachi Ltd | ストレージ装置及びデータ保護方法 |
-
2016
- 2016-05-12 US US16/083,952 patent/US10782917B2/en active Active
- 2016-05-12 WO PCT/JP2016/064148 patent/WO2017195324A1/ja active Application Filing
- 2016-05-12 JP JP2018516290A patent/JP6677806B2/ja active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005352833A (ja) * | 2004-06-11 | 2005-12-22 | Hitachi Ltd | 共有排他制御方法 |
JP2015026263A (ja) * | 2013-07-26 | 2015-02-05 | 株式会社日立製作所 | 計算機システム、キャッシュ管理方法、及び計算機 |
WO2016038710A1 (ja) * | 2014-09-11 | 2016-03-17 | 株式会社日立製作所 | ストレージシステム |
Also Published As
Publication number | Publication date |
---|---|
US20200192601A1 (en) | 2020-06-18 |
US10782917B2 (en) | 2020-09-22 |
WO2017195324A1 (ja) | 2017-11-16 |
JP6677806B2 (ja) | 2020-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6677806B2 (ja) | ストレージ装置 | |
US9836404B2 (en) | Write mirroring to storage class memory devices | |
TWI438628B (zh) | 資料儲存系統及資料儲存媒介 | |
US9262265B2 (en) | Storage system and storage control apparatus | |
US9430386B2 (en) | Multi-leveled cache management in a hybrid storage system | |
US9280478B2 (en) | Cache rebuilds based on tracking data for cache entries | |
US20140189204A1 (en) | Information processing apparatus and cache control method | |
WO2017216887A1 (ja) | 情報処理システム | |
JP6101170B2 (ja) | 計算機システム、キャッシュ管理方法、及び計算機 | |
US7752409B2 (en) | Storage system and computer system and processing method thereof | |
JP2007286946A (ja) | 計算機システム、アクセス制御方法及び管理計算機 | |
JP2014203405A (ja) | 情報処理装置、メモリ制御装置、データ転送制御方法及びデータ転送制御プログラム | |
WO2007146845A2 (en) | Configurable and scalable hybrid multi-tiered caching storage system | |
JP2020021232A (ja) | 情報処理システム | |
JP5977430B2 (ja) | ストレージシステム、ストレージシステムの制御方法及びストレージコントローラ | |
JP2006099802A (ja) | 記憶制御装置およびキャッシュメモリの制御方法 | |
WO2015141219A1 (ja) | ストレージシステム、制御装置、記憶装置、データアクセス方法及びプログラム記録媒体 | |
WO2015173889A1 (ja) | ストレージ装置 | |
WO2017149674A1 (ja) | ストレージシステム、ストレージ装置、およびストレージシステムの制御方法 | |
US10445239B1 (en) | Write buffering | |
KR20200079729A (ko) | 데이터 일관성을 위한 버퍼 캐시 및 방법 | |
JP2017167658A (ja) | 記録装置 | |
JP2021108058A (ja) | ストレージシステム | |
JP2024001761A (ja) | メモリシステムおよび制御方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180720 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190917 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20191016 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20200310 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20200313 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6677806 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |