JP5925280B2 - テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置 - Google Patents

テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置 Download PDF

Info

Publication number
JP5925280B2
JP5925280B2 JP2014223996A JP2014223996A JP5925280B2 JP 5925280 B2 JP5925280 B2 JP 5925280B2 JP 2014223996 A JP2014223996 A JP 2014223996A JP 2014223996 A JP2014223996 A JP 2014223996A JP 5925280 B2 JP5925280 B2 JP 5925280B2
Authority
JP
Japan
Prior art keywords
file
tape
record
data set
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014223996A
Other languages
English (en)
Other versions
JP2016091575A (ja
Inventor
豊 大石
豊 大石
由美子 太田
由美子 太田
真幸 岩永
真幸 岩永
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Priority to JP2014223996A priority Critical patent/JP5925280B2/ja
Priority to US14/922,492 priority patent/US9753930B2/en
Publication of JP2016091575A publication Critical patent/JP2016091575A/ja
Application granted granted Critical
Publication of JP5925280B2 publication Critical patent/JP5925280B2/ja
Priority to US15/681,671 priority patent/US10169344B2/en
Priority to US15/681,652 priority patent/US9984078B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/11File system administration, e.g. details of archiving or snapshots
    • G06F16/116Details of conversion of file system types or formats
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/02Recording, reproducing, or erasing methods; Read, write or erase circuits therefor
    • G11B5/024Erasing
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B5/00Recording by magnetisation or demagnetisation of a record carrier; Reproducing by magnetic means; Record carriers therefor
    • G11B5/008Recording on, or reproducing or erasing from, magnetic tapes, sheets, e.g. cards, or wires
    • G11B5/00813Recording on, or reproducing or erasing from, magnetic tapes, sheets, e.g. cards, or wires magnetic tapes

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

本発明は、テープ装置(テープドライブ)において、テープメデイア(テープ、メディア)に記録されたファイルの内容を物理的に消去することに関する。
テープドライブは、テープに情報を長期間バックアップとして記録するストレージ装置として利用されている。IBMは、LTFS (Linear Tape File System) と呼ばれるテープドライブのためのファイルシステムのフォーマットを公開し、そのコードをオープンソースの形で公開している。LTFSは、テープメディアを Index Partition (IP) と Data Partition (DP) の2つの領域に分割する。前者には主にファイル名を始めとするメタ情報 (index)を、後者には主にファイルの本体を記録する。LTFS を用いてテープメディア上に保存されたファイルを消去する場合、IP上のindex から該当ファイルに関する情報を消去することにより実現する。ファイルを消去しても DP 上に保存されたファイルの本体に該当するデータは残り続ける。これは、ファイルを消去した後であっても消去したファイルの本体に該当するデータを読み出すことが技術的に可能であることを意味している。
LTFSを利用するユーザは、データ・セキュリティの観点から、企業間のデータ交換などの目的でテープメディアを利用しデータの受け渡し後、データ・セキュリティの観点からメディア上のデータを読み出せないようにすることを求める。テープメディアに書き込まれたデータを読み出せないようにする機能として、Long Eraseと呼ばれる SCSI コマンドがある。これは、ユーザが指定した場所からパーティションの末尾まで、高周波のパターンを書き込むことにより、事前に記録されていたデータを読み出すことができないようにする。DPの先頭に記録されたデータをLong Erase を利用して消去すると、テープの全長に渡り消去するという仕組み上、3時間程度の時間が必要になる。テープ全長に渡り記録されたデータを全て消去するためにはこの所要時間を避けることはできない。
図1 は、テープメディア上に書き込まれたファイル、レコード、データセットの関係を示す。
ホストのマイクロソフトのワードなどのアプリケーションが、LTFSを介してファイル単位でテープドライブに書込み要求を発行する。テープドライブは、LTFSから送られてきた可変長のデータ(レコード)をテープに書き込むに当たり、データセットと呼ばれる固定長の塊に再編しそのデータセットの単位でデータを書き込む。レコードの最大長は、環境により異なるが、一般的には1MB程度であり、それより容量が大きなファイルは複数のレコードに分割される。テープメディア上に書き込まれたファイル、レコード、データセットの関係を図示すると図1のようになる。データセットの容量は、テープメディアのフォーマット毎に一意に決まっており、一般的には数MB程度の容量を持つ。テープメディアからデータを読み出す際も同様に、テープドライブはテープメディアからデータセット単位で良み出し、データセットに含まれる該当レコードをLTFSへ送信する。
LTFSを用いてテープメディア上に保存されたファイルを消去する場合がある。
IP上のindexから該当ファイルに関する情報を消去するのみでる。DP 上に保存されたファイルの本体に該当するデータは残り続ける形式に消去されたファイルの本体データを読み出すことが技術的に可能である。
図2は、 テープメディア上に書き込まれたFile Bを高周波のパターンで上書きした場合の模式図を示す。
実際にはインターリーブと呼ばれる機能により、例えばデータセットN+1(Data Set N+1) 内では File AとFile Bの内容が混在した形で記録されておりFile Bの部分だけ上書きするようなことはできない。例えインターリーブ機能を用いずにFileBの部分だけ上書きできると仮定する。図2の斜線部分を、図1のファイルBを高周波のパターンで上書きすると、DataSet N+1 の大半が上書きされてしまう。テープドライブは、訂正符号を用いてもテープ上の Data SetN+1 を読めなくなる。これは、File Aの後半部分が読めなくなることを意味する。つまり、データセット内に消去したいファイルと保持したいファイルが混在している場合、消去したいファイルの内容のみを物理的に上書きすることはできない。
特許文献1は、ダミーのデータセットを介在させてデータセット間間隔を4m制限することにより起因するテープ移動のバックヒッチ動作(減速・停止・加速巻き戻し)を回避することを示す。
特許文献2は、ストレージに記録したデータの消去に関し、既に消去された領域に関する情報を基に、ストレージに記録された全てのデータを消去するために、ストレージ全体を上書きするか、局所的に上書きするか切り替える技術である。
しかし、データ書き込み時にダミーデータを書き込むことにより、特定のデータを消去可能にするものではない。データセキュリィテー観点から、ユーザは企業間のデータ交換などの局面でテープ上のファイルを読み出せないようにとの要求がある。
特開2007−95231号公報 特開2006−344177号公報
ここで、他のファイルを壊すことなくテープ上に保存した任意のファイルを上書きできないと課題を解決したい。そこで、本発明はファイルの完全な消去の前提として、テープに特殊なファイルの書込み方法を提供する。次に、本発明のファイルの物理的な消去を可能にする方法を提供する。
従って、本発明の目的は、テープドライブ用ファイルシステムにより、テープメディアに記録された任意のファイルの内容を物理的に消去する方法、テープドライブ、及びプログラムを提供することである。
かかる目的のもと、本発明は、テープに記録された、特定のファイルのレコードを含むデータセットを物理的に読み出し不可能に消去するために、テープ装置がホストのアプリケーションからのファイルをテープに書込む方法である。この方法は、
(a)前記アプリケーションから順次(シーケンシャル)に前記ファイルを構成するレコードを受け取るステップと、
(b)前記ファイルのレコードと後続のファイルのレコードが同一のデータセットに含まれないように、前記ファイルを構成する複数のレコードに続けて所定の数のダミーのデータ(ダミーレコード)を追加するステップと、
(c)ファイルの最終のレコードと後続(次)のファイルの先頭レコードとの間に前記ダミーレコードを介在させて、1つの前記データセットに隣接するファイルのレコードを含まない少なくとも1つのデータセットを構築するステップと、
(d)先の前記ファイルのレコードを含むデータセット、前記ファイルの最終レコード及びダミーレコードを含むデータセット(ダミーのデータセット)と、前記後続のファイルを含むデータセットを含むデータセットをテープに書込むステップとを含む。
また、この書込み方法において、前記(b)のダミーデータの追加するステップは、前記アプリケーションから所定の数のダミーレコード(固定長)として受け取ることを特徴とする。
また、この書込み方法において、記(b)のダミーデータの追加するステップは、前記ファイルの先頭レコードがデータセットの先頭が一致するように、前記(c)においてデータセットを構築することを特徴とする。
また、この書込み方法において、前記所定のサイズ及び数のダミーレコードは、書込みファイルの先頭のレコードが初めのデータセットの先頭に位置付けられ、最後のデータセットの内の最後のレコード以降は無効データで充填して、ファイルの複数のレコードを含む少なくとも1つのデータセットをテープに書き込むように決定されるータセットの内の最後のレコード以降は無効データで充填して、ファイルの複数のレコードを含む少なくとも1つのデータセットをテープに書き込むように決定されることを特徴とする。
また、この書込み方法において、前記書込むファイルを断片化したエクステントのレコードが含まれるデータセットの構成を特定するステップと、
前記書込むファイルのエクステントの先後に隣接するファイルのレコードが同一のデータセット内に存在しないことを保証するために、前記書き込みエクステントのレコードに後続してダミーレコードを追加して、次のデータセットが後続のファイルを含むように前記ファイル、ダミーレコード、後続のファイルを書込むステップと、を更に含む。
また、この書込み方法において、前記アプリケーションはテープ装置用ファイルシステムであり、前記テープをメタ情報を保管するインデックス・パーティションと、ファイルのレコードを保管するデータ・パーティションとに分割され、前記ファイル及び前記ファイルを構成する複数のエクステントは所定のサイズのレコード単位のレコードで書込むことを特徴とする。
また、この書込み方法において、前記テープの先頭のデータセットの書込み位置から4mの毎に、少なくとも1つのデータセットが書き込まれ、前記ファイルの消去後も残るように、前記ファイルを分割して、ダミーレコードを追加して、前記ファイルのデータセットを含まない前記少なくとも1つのデータセットを、4m手前で書込むステップを、を更に含むことを特徴とする。
更に、かかる目的のもと、本発明は、上記の書込み方法によりファイルが書き込まれたテープから特定の前記ファイルを消去する方法である。この消去する方法は、
(e)アプリケーションから消去するファイルの消去要求を受け取るステップと、
(f)消去するファイルの先頭レコードを含むデータセットの先頭の位置を取得るステップと、
(g)消去するファイルの直後に書き込まれたファイルの先頭レコードを含むデータセットの先頭の位置を取得するステップと、
(h)前記(f)で取得した位置から前記(g)で取得した位置まで高周波パターンを書き込むステップと、を含む。
また、この書込み方法において、インデックス・パーティションに保管されたメタ情報から消去すべき前記ファイルのデータの位置を特定するステップと、
前記ファイルのデータ及びダミーレコードを含むデータセットの番号を特定するステップと、
前記データセットを高周波パターンで物理的に上書きするステップと、を更に含む。
更に、かかる目的のもと、本発明は、上記消去法により前記テープからファイルを消去した後の他のファイルの読み出し方法である。この消去方法は、
前記消去したファイルを読み出要求を受け取るステップと、
前記ファイルを読み出すことが出来ないことを示す読み出しエラー情報で応答を返すステップと、を含む。
更に、かかる目的のもと、本発明は、テープ装置の書込み読み制御が上述の各ステップ
更に、かかる目的のもと、本発明は、上述の各ステップをテープ装置において実行するためのコンピュータ・プログラムである。
上述の本発明を適用する方法により、LTFSを介して記録されたファイルについて、
他のファイルへ影響を与えることなく、任意のファイルのデータ本体を短時間で消去できる。テープドライブは、任意のファイルを高周波のパターンを用い短時間で物理的に上書きすることを可能とする。また、各ファイル間にダミーデータを記録することにより、他のファイルへの影響を与えることなく、特定のファイルの物理的な消去を可能する。
テープメディア上に書き込まれたファイル、レコード、データセットの関係を示す。 テープメディア上に書き込まれたFile Bを高周波のパターンで上書きした場合の模式図を示す。 LTFSの2つのパーティションにより区分けされたテープを示す。 ホストに接続されたテープドライブ(磁気テープ装置)を含むテープストレージシステム(テープ記録装置システム)のハードウェアを示す。 LTFSフォーマットでのメディアのインデックス・パーティションとデータ・パーティションの内容を示す。 1つのファイルを部分的な書き換えの場合のインデックスファイルに含まれる位置メタ情報及びファイル・データの部分(エクステント)の変更内容を示す。 図7は、テープメディア上に書き込まれたファイル間にデータセット1つ分の容量相当のダミーデータを書き込む場合の模式図を示す。 本発明のファイルの消去方法のフローチャートを示す。 テープメディア上に書き込まれたFile Bを含むデータセットを高周波のパターンで上書きした場合の本発明の消去の模式図を示す。
以下において、ホストに接続されたテープドライブを含むストレージシステムにおいてテープに複数のファイルを書込む(記録)する態様、及び、記録された複数のファイルから任意のファイルを消去する場合の実施の形態(実施例)を説明する。
本発明は、ファイルの完全な消去の前提として、テープにファイルを書込む特別な方法を与える。テープに複数のファイルを書込むに当たり、各ファイル間にダミーのデータ(ダミーデータまたはダミーレコード)を介在させて各ファイルをテープに書き込む。記録される際に所定のサイズのダミーレコードを所定の数介在させることにより、他のファイルへの影響を与えることなく、任意のファイルを高周波のパターンを用い短時間で物理的に上書きすることを可能とする方法に関する。
まずファイルの書込みの段階で、テープメディアに複数のファイルを保存するに当たり、各ファイル間にダミーデータを介在させて記録する。次に任意のファイルの消去の段階で、テープに順次(シーケンシャル)に書き込まれた複数のファイルから、任意のファイルを高周波パターンで物理的に上書きすることを可能とする。それにより、他のファイルへ影響を与えることなく、任意のファイルのデータ本体を短時間で消去することを可能とする。
本発明の実施例の基本動作を説明のため、LTFSフォーマット、テープドライブ、LTFSでのファイルのデータの書込みについて説明する。
図3は、LTFSの2つのパーティションにより区分けされたテープを示す。
LTO5テープドライブは、テープの長手方向に沿った書き込み領域のラップ(wrap)を往復しながらデータを書く。LTFSではこのラップ2本分(1往復分)をインデックス・パーティションとして利用している。テープの先端部(BOT:Beginning of Tape)から終端部(EOT:End of tape)に渡ってIPとDPとの2つに区分される。ヘッドが同時に読み書きする単位がトラックであり、トラック16本がラップ1本に相当する。
LTO5のテープカートリッジでは、テープ長手方向は約800m、横手方向はラップ数80本の幅である。IPとDPとは2本のラップの保護領域(guard band)で区分される。テープはラップの長手方向に前後に進行し、BOTおよびEOTにおいて進行する向きを反転することをラップターン(wrap turn)と呼ぶ。テープドライブのヘッドに対してテープの長手方向のBOTからEOTの移動時間は60〜90秒である。長手方向の半分のテープ移動時間は30〜45秒程度である。
テープドライブ用のファイルシステム、例えばLTFSでは、メディア上に書かれたデータをファイルとして見せることができる。ユーザがLTFSを利用してテープメディアに書き込むと、テープメディアではファイル本体の他、インデックスファイル(単にインデックスとも言う)と呼ばれるメタ情報をテープメディアに書き込む。インデックスは、メタ情報としてディレクトリ名及びファイル名やファイル作成日、及び、メディア上の位置、サイズ、ファイル内のオフセットなどを含む位置メタ情報(図6で説明されるエクステント)をXML形式で含む。IPには、主に最新のインデックスが書き込まれる。DPには、ファイルの本体、及び、インデックスの履歴が書き込まれる。
LTFS を用いてテープメディア上のファイルを読み書きする場合、レコードと呼ばれる単位でデータの読み書きを行う。レコードは、LTFSではブロックと呼んでLTFSフォーマットを与える。ブロックは、ファイルのデータが記録されるパーティション毎にパーティションの先頭から何番目のブロックであるという番号で管理される。インデックスファイルには、ファイルのデータに対するブロックの番号で指示される位置情報が含まれる。
図4は、ホストに接続されたテープドライブ(テープ装置)を含むテープストレージシステム(テープ装置システム)のハードウェアを示す。
テープドライブ60は、ホスト300のアプリケーションからファイルシステム(LTFS)を介してファイルの読み書き要求を受け取る。テープドライブは、通信I/F(インターファース)110と、バッファ120と、記録チャネル130と、読書きヘッド140と、制御部150と、位置決め部160と、モータドライバ170と、モータ180とを含む。
インターフェース110は、ネットワークを介してホスト300との通信を行う。例えばインターフェース110は、ホスト300から、テープカートリッジ(メディア、テープ)40へのデータの書込みを指示する書込みコマンドを受信する。またインターフェース110は、ホスト300から、メディア40からのデータ読出しを指示する読出しコマンドを受信する。インターファース110は、書込みデータの圧縮と、読み出しデータの非圧縮とを行う機能を有し、実際のデータに対してメディアへの記憶容量を約2倍近く高めている。
テ−プドライブ60は、ホスト300のアプリケーションから送られた複数のレコードで構築されるデータセット(DataSet:DSと言う)単位でメディア40への読み書きを行う。DSの典型的な大きさは4MBである。ホスト300のアプリケーションは、ファイルシステム(例えばLTFS−API(Application Program Interface))によりファイル名を指定して読み書きアクセスをテープドライブ60に発行する。ファイルシステムは、SCSIコマンドのレベルでレコードをテープドライブに書込み/読み出し要求(Write/Read)を送る。DSは複数のレコードで構成される。
各DSは、データセットに関する管理情報を含む。ユーザデータはレコード単位で管理される。管理情報はデータセット情報テーブル(DSIT:Data Set Information Table)に含まれる。DSITは、そのDSに含まれるレコード又はブロック数およびFM(Filemark)数、更にはメディアの先頭から書かれた累積レコード数および累積FM数、を含む。
バッファ120は、メディア40に書込むべきデータ、また、メディアから読み出したデータを一時的に蓄積するメモリである。例えばバッファ120は、DRAM(Dynamic Random Access Memory)によって構成される。記録チャネル130は、バッファ120に蓄積されたデータをメディア40に書き出すため、またはメディア40から読み出されたデータをバッファ120に一時的に蓄積するために用いられる通信経路である。
読書きヘッド140は、データ読書き素子を有し、メディア40へのデータの書込み及びメディアからのデータの読出しを行う。本実施形態に係る読書きヘッド140はまたサーボ読取り素子を有し、メディア40に設けられたサーボトラックから信号を読み取る。位置決め部160は、カートリッジ40の短手方向(幅方向)に読書きヘッド140の移動を指示する。モータドライバ170は、モータ180を駆動する。
テ−プドライブ60は、ホスト300から受取ったコマンドに従って、データのテ−プへの書込みやテ−プからの読出しをする。テ−プドライブ60は、バッファ、読み書きチャネル、ヘッド、モ−タ、テ−プを巻きつけるリ−ルと、読み書き制御と、ヘッド位置制御システムと、モ−タドライバとを含む。テ−プドライブは、テープカートリッジを着脱可能に搭載する。テ−プは、リ−ルの回転に伴い、長手方向に移動する。ヘッドは、テープの長手方向に移動してデータを書き込んだり、テ−プからデータを読出したりする。また、テープカートリッジ40はカートリッジメモリ(CM:Cartridge Memory)と呼ばれる非接触不揮発性メモリを備える。テープカートリッジ40に搭載されたCMは、テープドライブ60により非接触的に読み書きされる。CMはカートリッジ属性を保管する。テープドライブは、読出し及び書込み時に、CMからカートリッジ属性を取り出して最適な読み書きができるようにする。
制御部150は、テープドライブ60の全体の制御を行う。すなわち、制御部150は、インターフェースで受信したコマンドに従って、データのメディア40への書込み及びメディア40からのデータの読出しを制御する。また、制御部150は、読取られたサーボドラックの信号に従って位置決め部160を制御する。更に制御部150は、位置決め部160及びモータドライバ170を介してモータの動作を制御する。なお、モータドライバ170は制御部150に直接接続されてもよい。
図5は、LTFSフォーマットでのメディアのインデックス・パーティションとデータ・パーティションの内容を示す。
(A)は、LTFSフォーマットで初期化した直後のテープメディアに書き込まれるメタ情報を示す。
テープメディアを LTFS フォーマットで初期化した直後には、テープメディアにはA)に示す情報が書き込まれる。
・FID(Format Identification Data set)は、テープドライブがテープメディアを初期化する際、テープメディアの先頭に書き込まれる特殊なデータであり、テープメディア上のパーティションの数や各パーティションの容量などの情報を持つ。
・VOL1 Labelは、ANSI Label とも呼ばれるもので、文字通りANSIで規定された一般的なフォーマットのラベルである。
・LTFS Labelは、LTFS フォーマットで規定されたラベルで、このテープメディアがLTFSフォーマットのどのバージョンに準拠してフォーマットされたかといった情報を保持するラベルである。ここでメディアに記録されるレコードのサイズを指示する。レコードサイズは例えば1BMであり、ブロック・サイズ(block size)とも言う。
・FM(Filemark)とは、テープメディアで一般的に利用される、いわば本のしおりのようなものであり、データの位置合わせ(seek)を行う際に利用される。アプリケーション(LTFSなど)は、SCSIコマンドとして “WriteFM0”を発行してファイルの区切りの指標をテープメディアに記録する。
・Index#0とは、フォーマット時に書き込まれるインデックスであり、この段階ではファイル自体は一つも存在しないためファイル固有の情報は持たないもののテープメディアのボリューム名などの情報を保持するため書き込まれる。
(B)は、LTFSフォーマットで初期化した後にファイルを書き込んだ場合にテープメディアに書き込まれる情報を示す。
LTFSフォーマットで初期化後、ファイル(File1)を書き込むと、テープメディア上に書き込まれたデータは(B)のようになる。太線で囲まれた部分が追加/更新されたデータである。Index#1はFile1のメタ情報(インデックス)を持つ。IPは最新のインデックスのみ保持する一方、DPはインデックスの履歴を保持する。インデックスを更新するタイミングはファイルシステムの実装にまかされており、例えば一定時間毎に更新したり、テープドライブからテープメディアを取り出す時のみ更新したりしている。更に使い続ける場合も、IPに置かれるインデックスは常に最新のインデックスのみが置かれ、DPは既存のインデックスを上書きすることなく、ファイルおよびインデックスを追記していく。
図5の(C)は、(B)の状態の後、更にファイル(File2)を書き込んだ場合のテープメディアに書き込まれる情報を示す。
最初のファイル(File1)をテープメディア上に書き込んだ後、次のファイル(File2)を追加すると、格納されるFile1にFile2が連続してテープメディアに保管される。Index#2はFile1およびFile2のメタ情報(インデックス)を持つ。
図5の(D)は、(B)の状態の後、File1の末尾に文字情報(File1-2)を追加してFile1を更新した後、メディア上に書き込まれるメタ情報を示す。
文書作成アプリケーション(例、マイクロソフト社のワード)は、メディア上に書き込まれたファイルを更新した後、1つのファイル(File1)がFile1-1及びFile1-2のようにフラグメント化(fragmented)して記録する。
図6は、1つのファイルを部分的な書き換えの場合のインデックスファイルに含まれる位置メタ情報及びファイルのデータの部分(エクステント)の変更内容を示す。
エクステントは、位置メタ情報及びファイル・データの部分(fragment)を意味する。
インデックス(index)はファイルの位置情報(ポインター)をエクステント(extent)と呼ぶ形式で保管する。エクステントの要素(element)は、ファイルの部分(データ部分)の先頭のブロックの番号(StartBlock),その番号のブロック内での開始オフセット(ByteOffset),データのサイズ(ByteCount),データ部分のファイルでの位置(FileOffset)を含む。ユーザデータはブロックサイズで指定されたサイズ(例えば512KB)単位のレコード単位でメディアに記録される。
StartBlockは、テープメディアの先頭から固定サイズのブロックの順番を指す。ByteOffsetは、特定番号のブロック内で書き始めるオフセットを示す。
ByteCountは、エクステントで指示されるデータ部分のデータサイズを指す。
FileOffsetは、エクステントで指示されるデータ部分のファイル位置を指す。
ブロックは、レコードまたはFM(FileMaker:レコードの区切り)を含み、LTFS Labelにおいてサイズが指定される。ユーザデータはブロックサイズで指定されたサイズ(例えば512KB)単位のレコード単位でメディアに記録される。
サイズLのFile1がメディアに記録されている最初の場合(A)、インデックスはエクステント(x)であることを示す。File1は、テープメディアの長手方向にレコード単位で連続して書き込まれている斜線部分である。レコードはエクステントではブロックに相当する。データ部分の書換えの場合(B)は、(A)でFile1を書き込んだ後、そのFile1のMバイトから600KBを250KBのレコードで書換えた場合エクステント(x)(y)(z)の情報を示す。エクステント(y)は、File1のデータ部分600KBバイトを変更して書き込まれる250KBのデータ(レコード)を指示する。データ部分の連続ではなく、後続するBlock番号(StartBlock:N+4)のレコードとして追記書込む。
エクステント(y)は、StartBlock=N+4のオフセットByteOffset=0から250KBを追記(append write)する。
エクステント(x)は、StartBlock=NのByteCount=Mまでのデータ(レコード)を指示す。ブロックNのオフセットMから600KBのデータは変更される。
エクステント(z)は、StartBlock=N+2のByteOffset=(M+600K)modDからByteCount=L-(M+600)のデータ部分を示す。Dはブロックサイズ(例えば512KBまたは1MB)である。ByteOffsetはM+600KBをDで割った余りであり、ブロック番号N+2でのオフセットを与える。
File1のインデックスは、データ部分な書換えにより、複数のエクステント(x)→(y)→(z)にように分散化した配置情報を含む。
本発明の具体的なファイルの書き込み方法を説明する。
図7は、テープメディア上に書き込まれたファイル間にデータセット1つ分の容量相当のダミーデータを書き込む場合の模式図を示す。
各ファイルを書き込んだあと、データセット1つ分の容量相当のダミーデータ(dummydata)を書き込む。ダミーデータは複数のダミーのレコード(ダミーレコード)に構成される。それにより隣接するファイルが同一データセット内に存在しないことを保証する。特に、テープドライブ用のファイルシステム(LTFS)では放送業界などファイルサイズが比較的大きいファイルの保存に利用されることが多いことから、ダミーデータを書き込むことによるテープメディアの容量に与える影響は十分小さいと言える。
図8は、ファイルの消去方法のフローチャートを示す。
上述の書込み方法にファイルが書き込まれた場合、本発明のテープメディア上のファイルの消去方法を説明する。
図9は、 テープメディア上に書き込まれたFile Bを含むデータセットを高周波のパターンで上書きした場合の本発明の消去の模式図を示す。
図8のフローチャートについて図9のファイルBを消去することを例に説明即する。ステップ1(Step1)は、ファイルBの先頭レコードであるレコード#X+5(Record X+5)へ位置合わせ(Locate)する。Read PositionというSCSIコマンドをテープドライブに発行する。このコマンドにより、消去するファイルの先頭レコードを含むデータセットであるデータセット#N+2(Data Set N+2)の先頭位置を取得できる。ステップ2(Step2)についても、Step1と同様の手順でデータセット#N+4(Data Set N+4)の先頭位置を取得できる。データセットは連続して書き込まれており、データセット#N+4の先頭の位置は、ファイルBの末尾を含むデータセットであるデータセット#N+3の末尾の位置と同一視できる。ステップ3(Step3)については、現在特定の領域に高周波パターンを書き込むインターフェースは提供されていないが、ベンダーユニークなSCSIコマンドを新設する等の方法により、実現できる。
ここまで、テープメディア上に保存されたファイルは分散していない、つまり、各ファイルはそれぞれ1つのエクステント(連続したレコード)から構成されていることを前提に解説した。次は、1つのファイルのデータがテープメディア上に断片化(fragmented)して書き込まれる場合を説明する。LTFSは、記録済みのファイルのデータを更新または追記(append)する場合、1つのファイルのデーは、図5(D)に示すように2つのエクステントに断片化して書き込まれている。実際には必ずしも1つのエクステントから構成されるとは限らず、1つのファイルが複数のエクステントから構成されることもある。言い換えると、ファイルが断片化して記録されている。複数のエクステントから構成されるファイルを書き込む/消去する場合には、上述の解説のファイルをエクステントと読みかえ、エクステント間にダミーデータを書き込み、消去するファイルを構成する全エクステントを高周波のパターンで上書きすれば良い。
上述の消去の方法によりテープメディア上から任意のファイル消去した後のそのファイルの読み出そうとするテープドライブの挙動について説明する。消去したファイルを読み出そうとすると、消去したファイルを構成するレコードを含むデータセットが高周波パターンで上書きされている。読み出し指示をしたファイルのレコード位置には高周波パターンであるため、テープドライブは読み出すことが出来ず、読み出しエラーとなる。
他のファイルを読み出す場合、テープドライブの実装によっては、4m以上データセットが書き込まれていない領域が続くと、それ以降に書き込まれたデータセットを探索できないものもある。連続するファイルに対応するデータセットについて上述の消去方法を実行すると、例えば4m以上高周波パターンで上書きされた領域が存在する場合がある。このようなテープドライブに対応するためには、ファイル書き込み時にテープの先頭から4m弱毎に「別のエクステント」に分割し、エクステント間に適量のダミーデータを書き込むことにより、高周波パターンを用いたファイルの消去後も4mごとに1個ないし数個のデータセットが残るようにすることで対応できる。
4m制限の書込み方法について、具体例で説明する。
あるファイルが、従来技術ではレコード#101〜120 までの連続する20レコードからなる1つのエクステントで構成されている場合を想定する。そのレコード数のデータ分のテープメディアの長さが8m弱に相当とすると仮定する。本発明ではそのファイルをレコード#101〜110 とレコード#115〜124 というそれぞれ連続する10個のレコードからなる長さ4m弱の2つのエクステントに分割する。具体的には、データセットの4m以上の空白を避けるためファイルを、2つのエクステント間にレコード#111〜114のダミーデータを書き込むことである。従来 1 ファイルが 1 エクステントで済んでいたところを、本発明により複数のエクステントを用いることになり、その2つ目以降のエクステントを「別のエクステント」と表現している。4m弱で、直前書き込みファイルのエクステントと無関係データ (ダミーデータ) を持つレコードを書き込むことにより、ファイルを構成するレコードの連続性が途切れ、その結果ファイルが複数のエクステントにダミーデータで構成されたデータセットの介在により分断される。
本発明のファイルの消去方法がファイル消去所要時間に与える影響を説明する。
従来は、あるファイルを高周波パターンを用いて上書きしようとすると、最大約3時間かかる。パーティション末尾に存在するファイルを消去する場合は、ファイルの末尾からパーティション末尾まで高周波パターンを書き込む所要時間は無視できる。任意の場所に記録されたファイルの平均消去所要時間は、最大所要時間の半分である 1 時間半程度と言える。本発明を適用することにより、ファイルの消去はファイルの書き込みと同程度の所要時間、つまり、第6世代LTO(Linear Tape Open)テープドライブでは1秒当たり160 MB、第4世代エンタープライズテープドライブ (TS1140) では1秒当たり250MB分のデータを消去することが可能になる。ここでは、ファイルの先頭までの位置合わせ所要時間は考慮していないが、位置合わせ所要時間は、従来技術利用時と変わらない (平均40秒、最大80秒程度)。
金融業界を始め、企業間データ交換にテープディアを用いるに当たり、先頭に高々数GB(全容量の1%弱) のデータしか書き込まないで利用することは珍しくない。そのような状況において本発明のデータセットの消去方法を用いることによりファイル消去所要時間を低減することは非常に効果が大きい。
なお、テープ装置用のファイルシステム(LTFS)の場合の実施例を説明してきた。更に、本発明は、他のアプリケーション、例えばTSM (IBM Tivoli Storage Manager) やTAR(TapeArchive File)のファイルをテープ装置において書込み及び消去する場合にも適用できる。
以上より、本発明の方法を実装したテープドライブは、任意のファイルを高周波のパターンを用い短時間で物理的に上書きすることを可能とする。また、各ファイル間にダミーデータを記録することにより、他のファイルへの影響を与えることなく、特定のファイルの物理的な消去を可能する。なお、本発明を実施の形態(実施例)を用いて説明したが、本発明の範囲は上記実施例には限定されない。本発明の精神及び範囲から逸脱することなく様々に変更したり代替態様を採用したりすることが可能なことは、当業者に明らかである。
40…テープカートリッジ(メディア、テープ)、
60…テープドライブ、
110…通信I/F(インターフェース)、
120…バッファ(ドライブバッファ)、
130…記録チャネル、
140…読み書きヘッド、
150…制御部(コントローラ、読み書き制御を含む)、
160…位置決め部
170…モータドライバ、
180…モータ、
300…ホスト(サーバ)

Claims (12)

  1. テープ装置がホストのアプリケーションからのファイルをテープに書込む方法であって、
    (a)前記アプリケーションから順次に前記ファイルを構成するレコードを受け取るステップと、
    (b)前記ファイルのレコードと後続のファイルのレコードが同一のデータセットに含まれないように、前記ファイルを構成する複数のレコードに続けて所定の数のダミーのデータ(ダミーレコード)を追加するステップと、
    (c)ファイルの最終のレコードと後続のファイルの先頭レコードとの間に前記ダミーレコードを介在させて、1つの前記データセットに隣接するファイルのレコードを含まない少なくとも1つのデータセットを構築するステップと、
    (d)先の前記ファイルのレコードを含むデータセット、前記ファイルの最終レコード及びダミーレコードを含むデータセットと、前記後続のファイルを含むデータセットを含むデータセットをテープに書込むステップと、
    を含むファイルのデータの書込み方法。
  2. 前記(b)のダミーデータの追加するステップは、前記アプリケーションから所定の数のダミーレコードとして受け取ることを特徴とする請求項1に記載の方法。
  3. 前記(b)のダミーデータの追加するステップは、前記ファイルの先頭レコードがデータセットの先頭が一致するように、前記(c)においてデータセットを構築することを特徴とする請求項1に記載の方法。
  4. 前記所定のサイズ及び数のダミーレコードは、書込みファイルの先頭のレコードが初めのデータセットの先頭に位置付けられ、最後のデータセットの内の最後のレコード以降は無効データで充填して、ファイルの複数のレコードを含む少なくとも1つのデータセットをテープに書き込むように決定される、請求項3に記載の書込み方法。
  5. 前記書込むファイルを断片化したエクステントのレコードが含まれるデータセットの構成を特定するステップと、
    前記書き込みエクステントのレコードに後続してダミーレコードを追加して、次のデータセットが後続のファイルを含むように前記ファイル、ダミーレコード、後続のファイルを書込むステップと、
    を更に含む請求項1に記載のファイルのデータの書込み方法。
  6. 前記アプリケーションはテープ装置用ファイルシステムであり、前記テープをメタ情報を保管するインデックス・パーティションと、ファイルのレコードを保管するデータ・パーティションとに分割され、前記ファイル及び前記ファイルを構成する複数のエクステントは所定のサイズのレコード単位のレコードで書込む請求項1の方法。
  7. 前記ファイルを書込み場合に、前記テープの先頭のデータセットの書込み位置から4mの毎に、少なくとも1つのデータセットが書き込まれ、前記ファイルの消去後も残るように、前記ファイルを分割して、ダミーレコードを追加して、前記ファイルのデータセットを含まない前記少なくとも1つのデータセットを、4m手前で書込むステップを、更に含む請求項1に記載のファイルの書込み方法。
  8. 請求項1に記載の方法によりファイルが書き込まれたテープから特定のファイルを消去する方法であって、
    (e)アプリケーションから消去するファイルの消去要求を受け取るステップと、
    (f)消去するファイルの先頭レコードを含むデータセットの先頭の位置を取得るステップと、
    (g)消去するファイルの直後に書き込まれたファイルの先頭レコードを含むデータセットの先頭の位置を取得するステップと、
    (h)前記(f)で取得した位置から前記(g)で取得した位置まで高周波パターンを書き込むステップと、
    を含む特定のファイルをテープから消去する方法。
  9. インデックス・パーティションに保管されたメタ情報から消去すべき前記ファイルのデータの位置を特定するステップと、
    前記ファイルのデータ及びダミーレコードを含むデータセットの番号を特定するステップと、
    前記データセットを高周波パターンで物理的に上書きするステップと、
    を含む請求項8に記載の方法。
  10. 前記請求項8または9に記載の方法により前記テープからファイルを消去した後の他のファイルの読み出し方法であって、
    前記消去したファイルを読み出要求を受け取るステップと、
    前記ファイルを読み出すことが出来ないことを示す読み出しエラー情報で応答を返すステップと、を含むファイルの読み出し方法。
  11. 前記テープ装置の書込み読み制御は、請求項1〜10いずれか1項の各ステップを前記テープ装置において実行する、テープ装置。
  12. 請求項1〜10いずれか1項の各ステップを前記テープ装置において実行するためのコンピュータ・プログラム。
JP2014223996A 2014-11-04 2014-11-04 テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置 Active JP5925280B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2014223996A JP5925280B2 (ja) 2014-11-04 2014-11-04 テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置
US14/922,492 US9753930B2 (en) 2014-11-04 2015-10-26 Deleting files written on tape
US15/681,671 US10169344B2 (en) 2014-11-04 2017-08-21 Deleting files written on tape
US15/681,652 US9984078B2 (en) 2014-11-04 2017-08-21 Deleting files written on tape

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014223996A JP5925280B2 (ja) 2014-11-04 2014-11-04 テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置

Publications (2)

Publication Number Publication Date
JP2016091575A JP2016091575A (ja) 2016-05-23
JP5925280B2 true JP5925280B2 (ja) 2016-05-25

Family

ID=55852868

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014223996A Active JP5925280B2 (ja) 2014-11-04 2014-11-04 テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置

Country Status (2)

Country Link
US (3) US9753930B2 (ja)
JP (1) JP5925280B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5925280B2 (ja) 2014-11-04 2016-05-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置
US10152993B1 (en) * 2017-11-29 2018-12-11 International Business Machines Corporation Save block data to tape in a reverse order
US10909087B2 (en) * 2018-01-23 2021-02-02 International Business Machines Corporation Rollback on a sequential storage medium to a specific point in time
US10734021B1 (en) 2019-08-22 2020-08-04 International Business Machines Corporation High speed file copy from tape using block grouping
JPWO2021177300A1 (ja) * 2020-03-06 2021-09-10
US11335364B1 (en) 2021-05-17 2022-05-17 International Business Machines Corporation Secure data erase for tape storage
CN116263760A (zh) * 2021-12-15 2023-06-16 华为终端有限公司 文件存储方法、文件访问方法、电子设备及存储介质
US11971853B2 (en) 2022-09-30 2024-04-30 International Business Machines Corporation Optimizing removable media library file removal

Family Cites Families (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0738246B2 (ja) * 1988-08-24 1995-04-26 日本電気株式会社 磁気テープ装置
EP0509637A3 (en) * 1991-03-15 1993-06-02 Fujitsu Limited Magnetic tape storage apparatus
US5359468A (en) * 1991-08-06 1994-10-25 R-Byte, Inc. Digital data storage tape formatter
JPH05274841A (ja) 1992-03-26 1993-10-22 Sony Corp 情報記録装置
JP3632213B2 (ja) 1993-06-30 2005-03-23 ソニー株式会社 信号処理装置
JPH09213022A (ja) 1996-02-07 1997-08-15 Sony Corp 音声・映像データ記録・再生装置およびその方法
JPH10108132A (ja) 1996-09-27 1998-04-24 Sony Corp 記録再生装置
JP3813731B2 (ja) 1998-03-31 2006-08-23 富士写真フイルム株式会社 画像記録装置および記録用回転ドラム載置用ダミーシート
US6389222B1 (en) * 1998-07-07 2002-05-14 Kabushiki Kaisha Toshiba Management system for protected and temporarily-erased still picture information
US6857044B2 (en) 2001-10-15 2005-02-15 International Business Machines Corporation Data storage device for fast multiple file write operations
JP3925259B2 (ja) * 2002-03-19 2007-06-06 ソニー株式会社 記録媒体、記録方法、記録装置
JP2004126909A (ja) 2002-10-02 2004-04-22 Panasonic Communications Co Ltd ファイル管理装置及びファイル削除方法、並びに文書処理装置、記録装置
JP4300956B2 (ja) 2003-09-30 2009-07-22 富士ゼロックス株式会社 情報処理装置、情報処理方法、記録媒体、プログラム
TWI343531B (en) 2003-12-19 2011-06-11 Oce Tech Bv Erasing a stored information pattern on a storage medium
JP4537083B2 (ja) * 2004-01-28 2010-09-01 キヤノン株式会社 データ処理装置及びその制御方法
JP4606808B2 (ja) 2004-08-11 2011-01-05 京セラミタ株式会社 データ消去装置、画像形成装置、データ消去方法及びデータ消去プログラム
US20060224846A1 (en) 2004-11-05 2006-10-05 Amarendran Arun P System and method to support single instance storage operations
JP2006344177A (ja) 2005-06-10 2006-12-21 Kyocera Mita Corp データ消去装置及びデータ消去プログラム
JP2007011522A (ja) 2005-06-29 2007-01-18 Hitachi Ltd データの消去方法、ストレージ・デバイス及び計算機システム
JP3870215B1 (ja) * 2005-09-30 2007-01-17 インターナショナル・ビジネス・マシーンズ・コーポレーション テープ記録装置のデータ書込み読取り制御方法
JP4785660B2 (ja) * 2006-07-21 2011-10-05 株式会社リコー 画像処理装置
US7620765B1 (en) 2006-12-15 2009-11-17 Symantec Operating Corporation Method to delete partial virtual tape volumes
JP4939364B2 (ja) 2007-10-17 2012-05-23 インターナショナル・ビジネス・マシーンズ・コーポレーション テープ記録装置のデータ書込みを制御する装置、方法及びプログラム
JP4826610B2 (ja) 2008-09-05 2011-11-30 富士ゼロックス株式会社 画像処理装置および画像消去プログラム
US8767331B2 (en) * 2009-07-31 2014-07-01 Advanced Research Corporation Erase drive system and methods of erasure for tape data cartridge
US8886610B2 (en) 2009-10-01 2014-11-11 Hewlett-Packard Development Company, L. P. Backup simulation for backing up filesystems to a storage device
US8587890B2 (en) * 2011-09-09 2013-11-19 International Business Machines Corporation Tape drive provided write format for overwrite erasure of magnetic tape data recorded in tracks
US9183127B2 (en) * 2012-06-20 2015-11-10 Symantec Corporation Sequential block allocation in a memory
JP2014115807A (ja) 2012-12-10 2014-06-26 International Business Maschines Corporation ファイルを複数のメディアに書込む方法、及びストレージ・システム
US20140181396A1 (en) 2012-12-20 2014-06-26 Amazon Technologies, Inc. Virtual tape using a logical data container
JP6124734B2 (ja) 2013-08-20 2017-05-10 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 高速に読み出し可能なテープメディアにファイルを書込む方法
US9025261B1 (en) 2013-11-18 2015-05-05 International Business Machines Corporation Writing and reading data in tape media
US20150149415A1 (en) * 2013-11-22 2015-05-28 International Business Machines Corporation Rollback Mechanism for Linear Tape File Systems
JP5932877B2 (ja) 2014-04-15 2016-06-08 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テープメディアへファイルを書き込む所要時間の低減
JP6052812B2 (ja) 2014-07-11 2016-12-27 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テープ上のファイルの管理、書き込み、及び読み出し方法
JP6041839B2 (ja) 2014-09-04 2016-12-14 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation メタ情報を保管する方法、プログラム、及びそのテープ記録システム
JP5925280B2 (ja) 2014-11-04 2016-05-25 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置
US9632721B1 (en) 2015-11-09 2017-04-25 International Business Machines Corporation Data writing in a file system
US9536561B1 (en) 2015-12-08 2017-01-03 International Business Machines Corporation Writing dummy indices on a tape medium partition

Also Published As

Publication number Publication date
US20170344562A1 (en) 2017-11-30
JP2016091575A (ja) 2016-05-23
US20160124973A1 (en) 2016-05-05
US10169344B2 (en) 2019-01-01
US9753930B2 (en) 2017-09-05
US9984078B2 (en) 2018-05-29
US20170344561A1 (en) 2017-11-30

Similar Documents

Publication Publication Date Title
US10915244B2 (en) Reading and writing via file system for tape recording system
JP5925280B2 (ja) テープに書き込されたファイルを消去する方法、プログラム、及びテープ装置
JP6041839B2 (ja) メタ情報を保管する方法、プログラム、及びそのテープ記録システム
JP5623239B2 (ja) 書込みレコードの重複を排除する記憶装置、及びその書込み方法
JP6124734B2 (ja) 高速に読み出し可能なテープメディアにファイルを書込む方法
US20150205532A1 (en) Method for Reading File Using Plurality of Tape Media
JP2015069290A (ja) テープドライブ用ファイルシステムよる更新されたファイルの読み出し速度を改善する方法
US20140379980A1 (en) Selective duplication of tape cartridge contents
JP6005122B2 (ja) 複数のテープカートリッジにファイルをスパニングして書込む方法
JP6005010B2 (ja) 複数のテープメディアに1つのファイルをスパニングする方法、ストレージ・システム、およびプログラム
US9236065B2 (en) Reclamation of data on tape cartridge
US9058843B2 (en) Recovery of data written before initialization of format in tape media
US10656853B2 (en) Tape having multiple data areas

Legal Events

Date Code Title Description
A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20160307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20160329

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20160419

R150 Certificate of patent or registration of utility model

Ref document number: 5925280

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150