CZ294346B6 - Způsob přístupu k datům nebo archivování dat a počítačový systém k provádění těchto způsobů - Google Patents

Způsob přístupu k datům nebo archivování dat a počítačový systém k provádění těchto způsobů Download PDF

Info

Publication number
CZ294346B6
CZ294346B6 CZ19971859A CZ185997A CZ294346B6 CZ 294346 B6 CZ294346 B6 CZ 294346B6 CZ 19971859 A CZ19971859 A CZ 19971859A CZ 185997 A CZ185997 A CZ 185997A CZ 294346 B6 CZ294346 B6 CZ 294346B6
Authority
CZ
Czechia
Prior art keywords
file
storage means
access
portions
accessed
Prior art date
Application number
CZ19971859A
Other languages
English (en)
Other versions
CZ9701859A3 (cs
Inventor
Peter Bryan Malcolm
Original Assignee
Cheyenne Advanced Technology Limited
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cheyenne Advanced Technology Limited filed Critical Cheyenne Advanced Technology Limited
Publication of CZ9701859A3 publication Critical patent/CZ9701859A3/cs
Publication of CZ294346B6 publication Critical patent/CZ294346B6/cs

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1448Management of the data involved in backup or backup restore
    • G06F11/1451Management of the data involved in backup or backup restore by selection of backup contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/80Database-specific techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99951File or database maintenance
    • Y10S707/99952Coherency, e.g. same view to multiple users
    • Y10S707/99955Archiving or backup

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Memory System Of A Hierarchy Structure (AREA)
  • Time Recorders, Dirve Recorders, Access Control (AREA)
  • Photoreceptors In Electrophotography (AREA)

Abstract

V systému řízení hierarchického ukládání dat, jsou soubory automaticky archivovány, pokud nebyly po jistou stanovenou dobu zpřístupněny. Je udržována pomocná databáze, která indikuje bloky dat, které byly zpřístupněny a datum, kdy se tak stalo. Nezpřístupněné bloky se potom mohou archivovat a vymazat z diskového souboru, aby se tak snížily požadavky na ukládání.ŕ

Description

Způsob přístupu k datům nebo archivování dat a počítačový systém k provádění těchto způsobů
Oblast techniky
Vynález se týká způsobu přístupu k datům uloženým v počítačovém systému, který zahrnuje paměť s přímým přístupem, základní procesorovou jednotku a prostředek pro hromadné ukládání dat, přičemž tento způsob zahrnuje kroky, že se poskytnutím instrukcí uložených v paměti s přímým přístupem základní procesorové jednotce způsobí, že základní procesorová jednotka hledá přístup k datům uloženým v prostředku pro hromadné ukládání dat, a to generováním alespoň požadavku na čtení, přičemž základní procesorová jednotka řídí následující operace, přičemž způsob zahrnuje identifikaci souboru do kterého se požaduje provést přístup, identifikaci částí souboru v souboru do kterých je přístup nutný a povedení přístupu do identifikovaných částí souboru.
Vynález se rovněž týká způsobu archivování dat uložených v počítačovém systému, který zahrnuje paměť s přímým přístupem, základní procesorovou jednotku, prostředek pro hromadné ukládání dat a záložní prostředek pro ukládání dat, přičemž tento způsob zahrnuje kroky poskytnutí instrukcí uložených v paměti s přímým přístupem základní procesorové jednotce k způsobu toho, že základní procesorová jednotka archivuje vybraná data, uložená v prostředku pro hromadné ukládání dat, na záložní ukládací prostředek k uvolnění prostoru na prostředku pro hromadné ukládání dat.
Vynález se rovněž týká počítačového systému pro způsob přístupu k datům, zahrnujícího paměť s přímým přístupem, základní procesorovou jednotku, prostředek pro hromadné ukládání dat a zařízení k archivování dat uložených v počítačovém systému, přičemž toto zařízení zahrnuje prostředek pro poskytování instrukcí uložených v paměti s přímým vstupem základní procesorové jednotce k způsobení toho, že se základní procesorová jednotka snaží o přístup k datům uloženým v prostředku pro hromadné ukládání dat generováním alespoň požadavku na čtení, prostředku pro identifikaci souboru do kterého se vyžaduje přístup, prostředek pro identifikaci částí souboru v souboru, do kterých je přístup nutný a prostředek pro přístup do částí souboru.
Vynález se rovněž týká počítačového systému pro způsob archivování dat, zahrnujícího paměť s přímým vstupem, základní procesorovou jednotku, prostředek pro hromadné ukládání dat a zařízení k archivování dat, která jsou uložena v počítačovém systému.
Dosavadní stav techniky
V posledním desetiletí rychle rostl objem dat uložených na pevných discích osobních počítačů, které slouží jako zařízení pro hromadné ukládání dat. Zvláště to platí u dat uložených v databázových serverech sítí, kde jsou nyní zcela běžné subsystémy pevných disků o kapacitě 1 GB (gigabajt) a větší, které obsahují mnoho tisíc souborů.
Je typické, že se k mnoha souborům na databázovém serveru sítě nebude po určitou dobu přistupovat. Může se tak dít z různých důvodů; soubor může být starší verze, záložní kopie souboru, nebo se může zachovávat jen proto, že se může časem hodit. Soubor může být rovněž zcela nadbytečným, což může posoudit pouze vlastník souboru, a tudíž se může uchovávat z bezpečnostních důvodů jako záložní kopie. Dobrá počítačová praxe velí, že v případě pochybností je lépe souboru uchovávat po neurčitou dobu. Přirozeným důsledkem je to, že je pevný disk zaplněn starými soubory. Stává se to v podstatě u všech mikroprocesorových počítačových systémů, od těch nejmenších, až po ty největší.
- 1 CZ 294346 B6
Řízení hierarchického ukládání (Hierarchical Storage Management, zkráceně HSM) je známou technikou, která tento problém řeší. Většina operačních systémů si uchovává záznam o posledním datu a času aktualizace souboru (tj. kdy do něj byl proveden poslední zápis). Mnoho operačních systémů si udržuje záznam data a času, kdy byl soubor zpřístupněn (tj. kdy se z něj četlo). HSM systém periodicky snímá záznam souboru na pevném disku a kontroluje u každého datum a čas posledního přístupu. Jestliže souboru nebyl po předem stanovenou dobu využíván (zpravidla po dobu 1 až 6 měsíců), souboru se archivuje, což znamená že se přesune do záložní paměti, například na pásku, a na pevném disku se vymaže.
HSM systém je zpravidla integrován se zálohováním. Porovnejme si systém se zálohováním na pásku se zařízením HSM, u kterého je práh nečinnosti stanoven na tři měsíce. Proces zálohování probíhá periodicky (zpravidla alespoň týdně) a zaznamenává že pro daný soubor byla poslední doba zpřístupnění před více jak třemi měsíci. Proces zálohování se přesvědčí, že má řekněme tři záložní kopie souboru na různých páskách nebo čeká na okamžik, až bude mít tři kopie a potom soboru smaže. Pokus se ukáže, že je souboru potřeba použít, uživatel soubor obnoví z jedné ze tří záložních pásek. Systém zachovávání musí zajistit, aby se pásky obsahující archivní kopie souboru nepřepsaly. Tento způsob poskytuje dlouhodobé řešení problému, jelikož se s páskami dá snadno manipulovat, mohou se snadno nahradit a hlavně jsou levné.
Jakmile byl soubor pomalu HSM systému vymazán, není na původním disku k dispozici. Může to být nevýhodné, pokud se uživatel nebo určitá aplikace vyžádá přístup k souboru, jelikož při prohledávání disku nezůstane po souboru ani stopa.
Uživatel nebo určitá aplikace neví o tom, že se soubor dá obnovit ze záložního souboru, což může u aplikace vést k čemukoliv od klamných závěrů po fatální omyl.
Ideální by bylo, kdyby namísto odstranění souboru bez jakékoliv stopy, zůstal soubor v adresáři disku (nejlépe sjistými identifikačními prostředky, které by upozornily na skutečnost, že byl soubor přesunut do zálohy nebo sekundárního uložení), aniž by soubor zůstal na disku a zabíral tam místo. Ve skutečnosti je toto zařízení k dispozici u mnoha HSM systémů, a způsob realizace je znám jako migrace. Sytém HSM zpravidla zanechává v adresáři odkaz na soubor a buďto nahrazuje data souboru malým „útržkem“, který obsahu určení místa kde lze migrovaný soubor nalézt, nebo zcela data vymaže a ponechá soubor s nulovou délkou.
Další zlepšení systémů HSM, které je známo jako „de-migrace“, způsobuje, že systém HSM automaticky obnovuje migrovaný souboru na původním disku v případě, že se uživatel nebo aplikace pokouší soubor otevřít. Může to však být možné jen tehdy, jestliže záložní paměťové médium, obsahující migrovaný soubor, je trvale připojeno k systému. Tam, kde jsou migrovaná data uložena na takovém „trvale připojeném“ zařízení, například na optickém disku ,jukebox“, může být žádost k otevření (k zpřístupnění) souboru dočasně odročena až do okamžiku kdy je souboru obnoven a ihned potom je dovoleno pokračovat tak, jako by soubor nikdy nemigroval.
Techniky HSM, tak jak byly popsány, jsou efektivní tam, kde se jedná o velký počet elativně malých souborů, které používá v daném čase pouze jeden uživatel. Uvažujme však databázový systém, u kterého více uživatelů používá jeden velký databázový souboru, který zahrnuje jména zákazníků, adresy a podobná historická data. Jelikož se průběžně pořizují data o nových zákaznících a doplňují se záznamy o současných zákaznících, soubor se nikdy nestane kandidátem migrace, jelikož musí být stále k dispozici. Nicméně, takový soubor má mnoho záznamů o starých pasivních zákaznících, které se musí udržovat pro budoucí možnou potřebu, ale jinak mohou být po významnou dobu ponechány bez přístupu. Prostor na disku s takovými pasivními daty často zabírá většinu prostoru vyhrazeného celému souboru.
Jsou již známy soubory s přímým přístupem, u kterých mohou být malá množství dat zapsána, nebo přečtena na různých místech souboru, a to libovolně. Když se vytvoří nový soubor s přímým přístupem, jeho délka se rovná nule až do okamžiku zápisu prvních dat. Jelikož takový
-2CZ 294346 B6 soubor má přímý přístup, nemusí mít první zapsaná data relativní adresu rovnou nule (tj. zapsána na začátek souboru), ale mohou být zapsána na kteroukoliv relativní adrese. Tak například deset bajtů dat může být zapsáno do relativní adresy 1000. Soubor bude potom mít logickou délku 1010 bajtů, jestliže bude skutečně zapsáno pouze 10 bajtů. Některé operační systémy se s touto situací vyrovnávají tím, že automaticky vyplňují chybějících 1000 bytů nulami nebo náhodnými znaky, čímž obsadí všech 1010 bajtů, i když bylo zapsáno pouze deset bajtů dat.
Zdokonalené operační systémy, například takové, jaké se používají u síťových souborových serverů (Network Filé Servers), podporují pojetí rozptýlených souborů, a u kterého je místo na disku přiřazeno jen těm oblastem souboru, do kterých se data skutečně zapsala.
Dosahuje se toho zpravidla rozšířením tabulky přiřazení souboru (mapy toho, jak jsou soubory uloženy na disku) tak, že každý vstup uvádějí následující místo, do kterého se data konkrétního souboru ukládají, je provázán hodnotou uvádějící logickou relativní adresu, na které data začínají. U shora uvedeného příkladu by tudíž první vstup uváděl to, že data začínají na disku v místě x, a n to, že první bajt má logickou relativní adresu 1000 v souboru (v „normálním“ souboru by měla logická relativní adresa hodnotu 0). Oblasti rozptýleného souboru, do kterých nikdy nebyla data zapsána, jsou známá jako prázdná místa.
Podstata vynálezu
Podstatou vynálezu je způsob přístupu k datům uloženým v počítačovém systému, který zahrnuje paměť s přímým přístupem, základní procesorovou jednotku a prostředek pro hromadné ukládání dat, přičemž tento způsob zahrnuje kroky, že se poskytnutím instrukcí uložených v paměti s přímým přístupem základní procesorové jednotce způsobí, že základní procesorová jednotka hledá přístup k datům uloženým v prostředku pro hromadné ukládání dat, a to generováním alespoň požadavku na čtení, přičemž základní procesorová jednotka řídí následující operace, přičemž způsob zahrnuje identifikaci souboru do kterého se požaduje provést přístup, identifikaci částí souboru v souboru, do kterých je přístup nutný a povedení přístupu do identifikovaných částí souboru, přičemž způsob podle vynálezu spočívá v tom, že zahrnuje krok vytváření pomocné databáze, která identifikuje části souboru, do kterých se má realizovat přístup.
Způsob se s výhodou provádí tak, že krok poskytnutí instrukcí uložených v paměti s přímým přístupem základní procesorové jednotce způsobuje, že základní procesorová jednotka hledá přístup k datům uloženým v prostředku pro hromadné ukládání dat vytvořením buďto požadavku na zápis, nebo požadavku na čtení.
Způsob se dále s výhodou provádí tak, že pomocná databáze dále definuje zdali přístupem je přístup pro zápis nebo přístup pro čtení.
Způsob se dále s výhodou provádí tak, že krok vytvoření pomocné databáze zahrnuje vytvoření pomocné databáze, která identifikuje části souboru, do kterých se má provést přístup a datum nebo datum a čas kdy byl přístup proveden.
Způsob se dále s výhodou provádí tak, že počítačový systém zahrnuje tabulku umístění souborů, která definuje místa umístění částí souboru na prostředku pro hromadné ukládání dat, přičemž způsob dále zahrnuje krok kontroly tabulky umístění souborů, při kterém se zjišťuje zdali části souboru jsou na prostředku pro hromadné ukládání dat.
Způsob se dále s výhodou provádí tak, že částmi souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
Způsob se dále s výhodou provádí tak, že počítačový systém zahrnuje záložní ukládání prostředek pro ukládání archivovaných souborů, přičemž způsob dále zahrnuje to, že když kontrolní
-3CZ 294346 B6 krok stanoví, že části souboru nejsou na prostředku pro hromadné ukládání dat, následuje krok vyhledání částí souboru ze záložního ukládacího prostředku.
Vynález se rovněž týká způsobu archivování dat uložených v počítačovém systému, který zahrnuje paměť s přímým přístupem, základní procesorovou jednotku, prostředek pro hromadné ukládání dat a záložní prostředek pro ukládání dat, přičemž tento způsob zahrnuje kroky poskytnutí instrukcí uložených v paměti s přímým přístupem základní procesorové jednotce k způsobení toho, že základní procesorová jednotka archivuje vybraná data, uložená v prostředku pro hromadné ukládání dat, na záložní ukládací prostředek k uvolnění prostoru na prostředku pro hromadné ukládání dat, přičemž vynález spočívá v tom, že základní procesorová jednotka přikazuje následující operace: co se týče souboru určeného k archivaci, poskytnutí pomocné databáze, která identifikuje části souboru v souboru, ke kterým byl proveden přístup, z pomocné databáze identifikaci těch částí souboru, ke kterým byl proveden přístup, archivování alespoň některých částí souboru, ke kterým byl proveden přístup, do záložního ukládacího prostředku a vymazání těch částí souboru, k nimž nebyl proveden přístup, z prostředku pro hromadné ukládání dat, ale ponechání těch částí souborů, ke kterým nebyl proveden přístup, na prostředku pro hromadné ukládání dat.
Tento způsob se s výhodou provádí tak, že krok poskytování pomocné databáze zahrnuje poskytování pomocné databáze, která identifikuje části souboru v souboru, k nimž byl proveden přístup a datum nebo datum a čas kdy byl tento přístup proveden, přičemž krok identifikace zahrnuje identifikování z pomocné databáze těch částí souboru, ke kterým byl proveden přístup od specifikovaného data a těch částí souboru ke kterým nebyl proveden přístup od specifikovaného data, přičemž krok archivování zahrnuje archivování alespoň některých částí souboru, ke kterým nebyl proveden přístup od specifikovaného data, do záložního ukládání prostředku a krok vymazání zahrnuje vymazání těch částí souboru, ke kterým nebyl proveden přístup od specifikovaného data z prostředku pro hromadné ukládání dat, ale ponechání na tom prostředku pro hromadné ukládání dat těch dat, ke kterým byl proveden přístup od specifikovaného data.
Tento způsob se dále s výhodou provádí tak, že kroky archivace a vymazání zahrnují archivování a vymazání těch částí souboru, ke kterým nebyl proveden přístup od specifikovaného data a byly již v předem stanoveném počtu zálohování zálohovány.
Tento způsob se dále s výhodou provádí tak, že počítačový systém zahrnuje tabulku umístění souborů, která definuje umístění částí souboru na prostředku pro hromadné ukládání dat, a že krok vymazání zahrnuje úpravu tabulky umístění souborů.
Tento způsob se dále s výhodou provádí tak, že části souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
Vynález se dále týká počítačového systému k provádění výše uvedeného způsobu přístupu k datům, zahrnujícího paměť s přímým přístupem, základní procesorovou jednotku, prostředek pro hromadné ukládání dat a zařízení k archivování dat uložených v počítačovém systému, přičemž toto zařízení zahrnuje prostředek pro poskytování instrukcí uložených v paměti s přímým vstupem základní procesorové jednotce k způsobení toho, že se základní procesorová jednotka snaží o přístup k datům uloženým v prostředku pro hromadné ukládání dat generováním alespoň požadavku na čtení, prostředek pro identifikaci souboru do kterého se vyžaduje přístup, prostředek pro identifikaci částí souboru v souboru, do kterých je přístup nutný a prostředek pro přístup do částí souboru, přičemž podle vynálezu obsahuje prostředek pro vytvoření pomocné databáze, která identifikuje části souboru, do kterých je třeba provést přístup.
Počítačový systém je dále s výhodou uzpůsoben tak, že prostředek pro poskytování instrukcí uložených v paměti s přímým vstupem do základní procesorové jednotky způsobuje, že se základní procesorová jednotka snaží o přístup k datům uloženým v prostředku pro hromadné uložení dat generováním buďto požadavku na zápis, nebo požadavku na čtení.
-4CZ 294346 B6
Počítačový systém je dále s výhodou uzpůsoben tak že pomocné databáze dále definuje, zda přístupem je přístup pro zápis nebo přístup pro čtení.
Počítačový systém je dále s výhodou uzpůsoben tak, že prostředek pro vytvoření pomocné databáze identifikuje části souboru, do kterých se má provést přístup a datum nebo datum a čas kdy se má přístup provést.
Počítačový systém je dále s výhodou uzpůsoben tak, že zahrnuje tabulku umístění souborů, která definuje umístění částí souboru na prostředek pro hromadné ukládání dat, přičemž zařízení dále zahrnuje prostředek pro kontrolu tabulky umístění souborů, a to pro stanovení, zda jsou části souboru přítomné na prostředku pro hromadné ukládání dat.
Počítačový systém je dále s výhodou uzpůsoben tak, že částmi souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
Počítačový systém je dále s výhodou uzpůsoben tak, že zahrnuje záložní ukládání prostředek pro ukládání archivovaných souborů a prostředek pro vyhledání částí souborů ze záložního ukládacího prostředku, jestliže kontrolní krok určí, že části souboru nejsou na prostředku pro hromadné ukládání dat.
Vynález se dále týká počítačového systému k provádění způsobu archivování dat, zahrnujícího paměť s přímým vstupem, základní procesorovou jednotku, prostředek pro hromadné ukládání dat a zařízení k archivování dat, která jsou uložena v počítačovém systému, který podle vynálezu zahrnuje prostředek pro poskytování instrukcí uložených v paměti s přímým vstupem do základní procesorové jednotky k způsobení toho, že základní procesorová jednotka archivuje vybraná data, uložená v prostředku pro hromadné ukládání dat, do záložního ukládacího prostředku k uvolnění prostoru na prostředku pro hromadné ukládání dat, prostředek pro poskytnutí, pokud jde o soubor, který se má archivovat, pomocné databáze, která identifikuje ty části souboru v souboru, ke kterým byl proveden přístup, prostředek pro identifikování z pomocné databáze těch částí souboru, ke kterým byl proveden přístup, prostředek pro archivaci do záložního ukládacího prostředku, alespoň některých částí souboru, ke kterým byl proveden přístup a prostředek pro vymazání částí souboru, ke kterým nebyl proveden přístup, z prostředku pro hromadné ukládání dat, ale pro ponechání těch částí souborů, ke kterým byl proveden přístup na prostředku pro hromadné ukládání dat.
Počítačový systém k provádění způsobu archivování dat je s výhodou proveden tak, že prostředek pro poskytnutí pomocné databáze zahrnuje prostředek pro poskytnutí pomocné databáze, která identifikuje ty části souboru v souboru, ke kterým byl proveden přístup a datum nebo datum a čas kdy byl proveden přístup, identifikační prostředek zahrnuje prostředek, který v pomocné databázi identifikuje ty části souboru, ke kterým byl proveden přístup od stanoveného data a ty části souboru, ke kterým od stanoveného data nebyl proveden přístup, prostředek pro archivování zahrnuje prostředek pro archivování do záložního ukládacího prostředku, alespoň některých částí souboru, ke kterým od stanoveného data nebyl proveden přístup, prostředek pro archivování zahrnuje prostředek pro archivování do záložního ukládacího prostředku, alespoň některých částí souboru, ke kterým nebyl proveden přistup od stanoveného data a prostředek pro vymazání zahrnuje prostředek pro vymazání z prostředku pro hromadné ukládání dat, těch částí souboru, ke kterým nebyl proveden přístup od stanoveného data, ale ponechání na prostředku pro hromadné ukládání dat, těch částí souboru, ke kterým byl proveden přístup od stanoveného data.
Počítačový systém k provádění způsobu archivování dat je s výhodou proveden tak, že prostředek pro archivování a prostředek pro vymazání zahrnují prostředky pro archivování a vymazání těch částí souboru, ke kterým nebyl proveden přístup od stanoveného data a byly již v předem stanoveném počtu zálohování zálohovány.
- 5 CZ 294346 B6
Počítačový systém k provádění způsobu archivování dat je s výhodou proveden tak, že zahrnuje tabulku umístění souborů, která definuje umístění částí souboru na prostředku pro hromadné ukládání dat, a že prostředek pro vymazání zahrnuje prostředek pro úpravu tabulky umístění souborů.
Počítačový systém k provádění způsobu archivování dat je s výhodou proveden tak, že částmi souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
U provedení vynálezu, kterému se dává přednost a které je popsáno níže ve spojení s přiloženými výkresy, se udržuje pomocná databáze, která uvádí, ke kterým blokům dat byl zjednán přístup, a datum zpřístupnění. Nezpřístupněné bloky se potom mohou archivovat a vymazat z diskového souboru, čímž se snižují požadavky na ukládání. Vymazání se dosáhne použitím FAT (filé alloocatiion table, tj. tabulka přiřazení souboru), čímž se se souborem pracuje jako s rozptýleným souborem.
Je-li vznesen požadavek na čtení části souboru, který byl archivován nebo migrován, potom systém požadovaný soubor před uspokojením požadavku na čtení demigruje.
Záznamy, ke kterým se nedávno přistupovalo, jsou již přítomné na pevném disku a mohou být následně ihned zpřístupněny. Často vyžadované záznamy jsou tudíž snadno k dispozici, aniž by se musel na disku ponechávat celý soubor.
Způsob se může rozšířit zvýšením prahu pasivity na dobu životnosti pomocné databáze. Pokud se přistupuje pouze k malému počtu záznamů z velkého databázového souboru, potom se mohou ponechávat všechny zpřístupněné záznamy na pevném disku, bez ohledu na datum posledního přístupu. Nezpřístupněné záznamy se mohou, z důvodu uvolnění místa na disku, vymazat. V tomto případě pomocná databáze nepotřebuje obsahovat datum nebo datum/čas o posledním přístupu. Během dalšího intervalu, například každý měsíc, mohou všechny zpřístupněné oblasti migrovat a pomocná databáze se může vyčistit.
Tento způsob se dá použít ve spojení se způsobem částečného ukládání souboru již zmíněné aplikace. Po pomocné databázi se potom požaduje dodatečně zaznamenat, zda přístupy do souboru byly zápisy do souboru, při kterých se data mohla modifikovat nebo pouze čteními souboru. Způsob částečného zálohování souboru již zmíněné aplikace nedělí nic s volnými místy na pevné disku a přitom ponechává k dispozici ty záznamy, ke kterým se bude pravděpodobně znovu přistupovat.
Přehled obrázků na výkresech
Vynález bude dále popsán podrobněji s odkazem na přiložené výkresy, na kterých:
obr. 1 znázorňuje blokové schéma systému osobního počítače s páskovou mechanikou, obr. 2 znázorňuje schéma přístupu do souboru, obr. 3 znázorňuje vývojové schéma operace přístupu do souboru podle tohoto vynálezu, obr. 4 znázorňuje schéma podobné schématu na obr. 2, zobrazující části souboru, které se mají na pevném disku uchovat, obr. 5 znázorňuje vývojové schéma operací zálohování, podle tohoto vynálezu tak, jak se provádí systémem řízení hierarchického ukládání,
-6CZ 294346 B6 obr. 6 znázorňuje vývojové schéma operaci čtení souboru, který byl částečně archivován, obr. 7 znázorňuje schéma části mapy paměti na úrovni operačního systému obvyklého osobního počítače, obr. 8 znázorňuje schéma odpovídající části mapy paměti u způsobu podle tohoto vynálezu.
Příklady provedení vynálezu
Na obr. 1 je znázorněn osobní počítač (PC) 10 zahrnující základní procesorovou jednotku (CPU) 12, paměťovou jednotku s přímým přístupem (RAM) a paměťové zařízení ve formě pevného disku 16. Počítač je rovněž vybaven páskovou jednotkou 18 pro zálohování a archivaci dat.
Paměť RAM 14 shromažďuje během provozu počítače instrukce pro základní procesorovou jednotku 12, která řídí požadované operace. Některé instrukce přichází z operačního systému přímo, některé jsou inicializovány aplikačním programem, který se na počítači provozuje.
Operační systém obecně udržuje tabulku FAT, která zaznamenává fyzické umístění každého 20 bloku dat na pevném disku. Kromě toho, operační systém zaznamenává, že vztah ke každému souboru, archivační příznak, který se nastaví po modifikaci souboru, a který se může vymazat, jestliže je souboru zálohován. Existující systémy zálohování používají archivační příznaky k určení, zda byl souboru modifikován a potřebuje tudíž být zálohován.
Systém řízení hierarchického ukládání se může použít pro automatické zálohování kteréhokoliv souboru na pásku pokud nebyl po jistou dobu zpřístupněn.
U výhodného provedení podle tohoto vynálezu se udržuje pomocná databáze, která u každého souboru indikuje, které datové bloky byly kdy zpřístupněny, takže systém řízení hierarchického 30 ukládání může periodicky archivovat nebo migrovat ty bloky, které nebyly zpřístupněny. Tyto bloky se potom mohou vymazat, a tím se mohou snížit požadavky na ukládání.
Uvažujme souboru s počáteční délkou 125 bajtů a s pěti záznamy o 25 bajtech z 1. ledna 1995, kdy byla otevřena pomocná databáze k zachycení požadavků na přístupů k jakémukoliv záznamu 35 nebo k zápisu nového záznamu do souboru. Požadavky během období, například mezi 1. lednem a 10. dubnem 1995 by mohly být následující:
21. ledna 1995 přidán nový záznam, umístěný na relativní adrese 125, dlouhý 25 bajtů.
40 3. února 1995 přečten starý záznam umístěný na relativní adrese 75, dlouhý 25 bajtů.
15. února 1995 přečten starý záznam umístěný na relativní adrese 75, dlouhý 25 bajtů.
3. dubna 1995 přidán nový záznam na relativní adresu 150, dlouhý 25 bajtů.
Po zachycení požadavků se do pomocné databáze zaznamená datum, poloha záznamu v souboru, délka záznamu, a to následujícím způsobem:
Tabulka 1
Číslo dne Relativní adresa Délka
34720 125 25
34733 25 25
34745 75 25
34792 150 25
Samozřejmě musí existovat možnost identifikovat konkrétně požadovaný soubor. Předpokládá se, že se pro každý soubor udržuje samostatná pomocná databáze. V praxi se může dávat přednost udržování samostatné pomocné databáze pro každý podadresář. V tomto případě bude souboru vyžadovat identifikaci v rámci databáze. Tím se ale snižuje počet pomocných databází a tím i počet vytvářených dodatečných souborů. Principiálně se může vytvořit jedna pomocná databáze pro celý disk.
Kterákoliv oblast souboru, která není zahrnuta v tabulce 1, nebyla vůbec zpřístupněna. Číslo dne je pouze číslo udávající počet dnů, které uplynuly od libovolného počátečního data, v tomto případě 1. ledna 1995. U lépe propracovaného systému se může zařadit jak datum, tak i čas (datum/čas). Na obr. 2 je znázorněn souboru ve formě schématu, kde šrafované plochy představují data souboru, která byla čtena nebo zapsána, a kde bílé plochy představují dat, která nebyla zpřístupněna.
Kroky vedoucí k zpřístupnění jsou zobrazeny na obr. 3. Krok 20 indikuje vyžádání přístupu. Může to být požadavek na čtení nebo na zápis. Soubor je nejprve indikován v kroku 22 a v kroku 24 stanovena počáteční relativní adrese a zpřístupněná délka dat. V kroku 26, jsou tato data uložena do pomocné databáze společně s daty, jak je to vidět na obr. 1. Přednost se dává tomu, aby krok zahrnoval operaci konsolidace, která zajistí, že pomocná databáze neobsahuje nadbytečné informace. Například následující přístup mohou zdvojovat nebo překrývat předchozí přístupy. Po dokončení těchto kroků se v kroku 28 realizuje původně zamýšlený přístup do souboru, a v kroku 30 se celá rutina dokončí. Tyto kroky probíhají u každého přístupu, a proto dne 10. dubna má souboru délku 175 bajtů a obsahuje 7 záznamů, přičemž pomocná databáze vypadá jako tabulka 1 uvedená výše. V průběhu monitorování (79 dnů)m se záznamy, které nebyly zpřístupněny, stávají kandidáty archivace. Předpokládejme ale, že dojde k rozhodnutí, že všechny záznamy, které nebyly zpřístupněny v průběhu posledních šedesáti dnů, budou archivovány. Záznamy se nejprve setřídí protože se nejprve předpokládá, že celý souboru má migrovat do záložní paměti a dále se prohledá pomocní databáze pro zjištění všech záznamů s číslem dne 34739 a větším (34739 je šestnáctým dnem před 10. dubnem, který má číslo 34799). Všechny záznamy s číslem dne, které vyhovuje tomuto kritériu, se identifikují, a ty části souboru, které je obsahují, jsou podle toho označeny tak, aby se nestaly předmětem migrace. Ty části souboru, které zůstaly neoznačeny, jsou uvolněny pro migraci.
Ze čtyřech záznamů, ke kterým se přistupovalo mezi 1. lednem a 10. dubnem 1995, pouze poslední dva, zpřístupněné 15. dubna a 3. dubna 1995, mají číslo dne přinejmenším 34739. Proto jenom ty dva nejposledněji zpřístupněné záznamy zůstanou a zbytek souboru, to znamená ty části definované jako bajty 0 až 74 a bajty 100 až 149, budou migrovat. Je to schematicky znázorněno na obr. 4, na kterém jsou záznamy určené k zachování zobrazeny šrafovaně a záznamy které migrují jsou zobrazeny bíle. Oblasti dat souboru,které jsou označen pro migraci, se nyní dále kopírují do záložní paměti pomocí běžné procedury HSM. Podrobnosti o umístění a délce
-8CZ 294346 B6 každého záznamu jsou udržovány systémem HSM, aby se usnadnilo následné vyhledání. Kromě toho může být pomocná databáze upravována tak, že se odstraní jakákoliv stopa po záznamech, které mají číslo dne menší než 34739, čímž se zabrání nekontrolovatelné expanzi velikosti pomocné databáze.
Pro získání výhody z migrace nepoužitých záznamů do záložní paměti, je nutné uvolnit prostor zobrazený stejnými záznamy na disku. Dosáhne se toho přeměnou souboru na rozptýlený soubor. Jinými slovy, záznamy, které migrovaly, se nahradí prázdnými místy. Prostor na disku původně obsazený nadbytečnými záznamy se tím obnoví, jelikož prázdná místa nezabírají prostor na disku. Za předpokladu, že záznam s nejvyšší hodnotou relativní adresy není archivován, zůstane logická délka souboru touto operací nezměněná, ale počet bajtů skutečných dat se sníží, čímž se vytvoří prostor pro nová data souboru.
Rozptýlený soubor je možné vytvořit následujícím způsobem. Předpokládejme, že systém má tabulku FAT, ve které je prostor na disku rozčleněn na bloky o 25 bajtech. Sedm bloků bud zabírat 175 bitů souboru tak, jako 10. dubna 1995. Soubor může být alokován následujícím způsobem:
Tabulka 2
Vstup Příští blokový spoj Logická relativní adresa
Adresář 1 0
1 2 25
2 3 50
3 4 75
4 5 100
5 6 125
6 7 150
7 -1 -1
Je vhodné si povšimnout, že první vstup je uložen ve struktuře adresáře. Každý blok na disku má vstup v tabulce, který uvádí blok, ve kterém lze nalézt příští část souboru. Tak například druhý blok má vstup, který ho spojuje s blokem 3, ve kterém je možné najít část souboru s relativní adresou 50 bajtů. Sedmý blok má pouze negativní vstup (-1), což ukazuje na to, že je to poslední blok obsahující data souboru. V tomto příkladu je souboru vhodně uložen sekvenčně v blocích 1 až 7, ale v praxi mohou být bloky umístěny náhodně, s mezerami mezi nimi.
Tabulka rozmístění se musí nastavit tak, aby se uvolnil prostor na disku používaný migrovanými záznamy, jinými slovy, bajty 0 až 74 a bajty 100 až 149 daného souboru se musí vymazat. První oblast je pokryta bloky 1, 2, a 3 a druhá je pokryta bloky 5 a 6. Po vymazání dat v těchto blocích, jsou zbývající vstupy souboru nastaveny tak, že je zachován řetěz vstupů. Modifikovaná tabulka FAT bude vypadat následovně:
-9CZ 294346 B6
Tabulka 3
Vstup Příští blokový spoj Logická relativní adresa
Adresář 4 75
1 0 0
2 0 0
3 0 0
4 7 150
5 0 0
6 0 0
7 -1 -1
Bloky 1, 2, 3, 5 a 6 mají nulový vstup (0), což znamená, že neobsahují data. Z modifikované tabulky FAT je zřejmé, že operační systém může snadno určit, že první alokovaným blokem souboru je blok 4, který obsahuje data začínající na logické relativní adrese 75 a příští (a poslední) blok dat souboru je uložen v bloku 7 a obsahuje data začínající na logické relativní adrese 150. Je nutné poznamenat, že některé operační systémy neukládají logickou relativní adresu prvního alokovaného bloku, který tím nemůže být u těchto systémů uvolněn.
Přesný způsob, jakým se vymazání realizuje, není důležitý. Co je důležité je, že prostor obsazený migrovanými bloky je k dispozici na pevném disku, což znamená, že byl uvolněn pro použití.
U výše uvedeného příkladu je z důvodu srozumitelnosti uvažováno s velikostí bloku a požadavku na čtení/zápis 25 bajtů, a kromě toho se předpokládalo i to, že se požadavky objevily přesně na hranicích bloku. V praxi to znamená, že velikost alokovaného bloku je násobkem 512 bajtů a poloha a délka požadavků na čtení/zápis se bude značně měnit. Jelikož se mohou uvolnit pouze celé bloky (vymazat), musí se systém realizovat tak, že migrují a uvolňují se pouze oblasti dat, které reprezentují celé bloky. Jelikož velké soubory zabírají mnoho tisíců bloků, je uvedená redukce efektivnosti málo významná.
Uvedené kroky jsou znázorněny ve vývojovém schématu na obr. 5. Krok 42 indikuje počátek operace zálohování. Nejprve se identifikuje požadovaný soubor (krok 42). Potom se vyžádá a prozkoumá pomocná databáze (krok 44), aby se rozlišily ty bloky, které byly od stanoveného data zpřístupněny, od bloků nezpřístupněných. V kroku 46 se identifikují bloky, které nebyly zpřístupněny od specifikovaného data. Mohlo by se stát, že nezpřístupněné bloky již byly zálohovány v průběhu běžné operace zálohování. Může se stát že budou zálohovány vícekrát. Z tohoto důvodu není potřeba je migrovat, nebo je znovu zálohovat. Je však nutné do záložní paměti migrovat ty bloky, u kterých zálohování neproběhlo v dostatečné míře. Lze to identifikovat pomocí příznaků. Není podstatné zda se jedná o migraci bloků, o bloky s příznakem nebo bez nich, pokud jsou správně rozlišeny. V rozhodovacím kroku 48 se stanoví, zda již existuje dostatečné zálohování (tj. trojí). Jestliže neexistuje, potom jsou v kroku 50 bloky s příznakem zálohovány nebo migrovány. V kroku 52 se prostor obsazený nezpřístupněnými bloky uvolní změnou FAT, aby se soubor přeměnil na rozptýlený soubor. Jestliže se souboru již stal rozptýleným souborem, přidají se mezery (prázdná místa). V kroku 54 se celá rutina dokončí.
Konečné upřesňování znamená pozastavit následujících požadavků na čtení souboru, aby se stanovilo, zda se požadavek týká čtení migrovaných dat. Jestliže se neprovede žádné opatření k pozastavení požadavku na čtení, operační systém může vrátit buďto nulová data, nebo může
- 10CZ 294346 B6 hlásit chybu, jestliže je proveden pokus o čtení mezer rozptýleného souboru. Jestliže se pozastavil požadavek na čtení migrovaných dat, může se generovat příslušný signál, který automaticky demigruje požadovanou informaci. Jestliže jsou jednotlivé požadavky na čtení malé, potom čas na demigraci je krátký v porovnání s demigrací celého souboru, jelikož se obnovují pouze skutečně potřebná data.
Tato operace je znázorněna na obr. 6. Krok 60 indikuje počátek přístupu k čtení souboru. Soubor je identifikován (krok 62). Je zjištěna počáteční relativní adresa a čtená délka (krok 64) tak, jako na obr. 3. Operace nyní přechází k rozhodovacímu kroku 66, kde se kontroluje tabulka FAT, aby se určilo, zda se požadavek na čtení týká čtení dat v jakémkoliv bloku nebo blocích, které migrovaly použitím rutiny z obr. 5. Je-li odpověď na tento požadavek NE, potom operace přechází do kroků 70, 72 a 74, které odpovídají krokům 26, 28 a 30 na obr. 3. Je-li ale odpověď na požadavek v kroku 66 ANO, požadovaná data se nejprve demigrují (krok 68), a to před tím, než operace přejde do kroků 70, 72 a 74 tak, jako předtím. Není nutné demigrovat celý blok, ale obecně bude demigrován jen záznam nebo záznamy, které jsou požadovány. Může se stát v rámci jednoho bloku nebo se to může rozšířit přes dva i více bloků.
Rutiny na obr. 3 a 6 vyžadují, aby se přístupy na disk pozdržely. Jak se toho dosáhne bude popsáno s odkazem na obr. 7 a 8. Kdykoliv si program přeje zpřístupnit soubor, volá standardní rutinu, která zapisuje data na disk. Tato rutina, která se u operačního systému DOS nazývá Interrupt 21 hex function (INT21h) (hexadecimální funkce přerušení 21), je integrální součástí operačního systému. Čtení disku je funkce INT21h funkcion 3Fh, zapisování na disk je funkce INT21h function 40h. Činnost prováděná rutinou závisí na parametrech, které rutina získá po vstupu. Tato rutina je znázorněna na obr. 7 jako INT21h a tvoří část operačního systému v mapě paměti systému, kde je vstupní bod INT21h označen šipkou. K provedení výhodného způsobu podle vynálezu se přidává další programový kód na úrovni rozhraní operačního systému tak, jak je to znázorněno na obr. 8. V praxi se to v prostředí DOS může do počítače vložit jako ovládač zařízení s použitím souboru CONFIG.SYS.
Přidaný software se projevuje jako instrukce pro zápis dat, která byla nahrazena nebo doplněna alternativní sadou instrukcí.
U jiných operačních systém je nutné přerušit podobným způsobem funkci zápisu souboru. Zkušený programátor je schopný připravit potřebné rutiny podle výše uvedeného popisu, který se týká operačního systému DOS.
Všeobecně se tento vynález dá použít s pomocí mnoha modifikovaných způsobů a jiných způsobů a systémů, než těch, které tu byly popsány a zobrazeny.
Způsob a systém se může kombinovat se systémem částečného zálohování, který byl uveden v již zmíněné přihlášce 08/165,382. Pokud se tak stane, může se použít stejná pomocná databáze, aby se zaznamenaly modifikace dat, jak se to používá v souladu s tímto vynálezem pro zaznamenání přístupů k datům. Jediný rozdíl je v tom, že je nutné v pomocné databázi zaznamenat, zda přístupem bylo čtení nebo zápis. Systém částečného zálohování souborů podle výše zmíněné přihlášky pak odpovídá vstupům, které se týkají zápisů do pomocné databáze, zatímco dílčí soubor HSM systému podle tohoto vynálezu bude v úvahu jak přístupy kvůli čtení, tak i kvůli zápisu.
U jiné modifikace je systém rozšířen de facto zvýšením pasivního prahu na úroveň životnosti pomocné databáze. Na obr. 5 je krok 44 modifikován tak, že namísto rozlišování bloků, které byly nebo nebyly od stanoveného data zpřístupněny, se rozlišují bloky, které byly zpřístupněny nebo nebyly vůbec zpřístupněny, tj. od prvního vytvoření nebo naplnění pomocné databáze. V tomto případě již pomocná databáze nemusí zaznamenávat datu nebo datum/čas každého přístupu.
-11 CZ 294346 B6
Mohou nastat okolnosti, kdy nebude žádoucí migrovat jisté části souboru, dokonce ani tehdy když nebyly zpřístupněny. Může to platit například pro první a poslední blok v každém souboru.
Konečně, jestliže bude tento vynález začleněn do zcela nového operačního systému, potom by mohla být pomocná databáze v principu kombinována s tabulkou FAT. Normálně se však dává přednost tomu, aby existovaly odděleně.

Claims (24)

  1. PATENTOVÉ NÁROKY
    1. Způsob přístupu k datům uloženým v počítačovém systému (10), který zahrnuje paměť (14) s přímým přístupem, základní procesorovou jednotku (12) a prostředek (16) pro hromadné ukládání dat, přičemž tento způsob zahrnuje kroky, že se poskytnutím instrukcí uložených v paměti (14) s přímým přístupem základní procesorové jednotce (12) způsobí, že základní procesorová jednotka (12) hledá přístup k datům uloženým v prostředku (16) pro hromadné ukládání dat, a to generováním alespoň požadavku na čtení, přičemž základní procesorová jednotka (12) řídí následující operace, přičemž způsob zahrnuje identifikaci souboru do kterého se požaduje provést přístup, identifikaci částí souboru v souboru, do kterých je přístup nutný a povedení přístupu do identifikovaných částí souboru, vyznačující se tím, že zahrnuje krok vytváření pomocné databáze, která identifikuje části souboru, do kterých se má realizovat přístup.
  2. 2. Způsob podle nároku 1, vyznačující se tím, že krok poskytnutí instrukcí uložených v paměti (14) s přímým přístupem základní procesorové jednotce (12) způsobuje, že základní procesorová jednotka (12) hledá přístup k datům uloženým v prostředku (16) pro hromadné ukládání dat vytvořením buďto požadavku na zápis nebo požadavku na čtení.
  3. 3. Způsob podle nároku 2, vyznačující se tím, že pomocná databáze dále definuje zdali přístupem je přístup pro zápis nebo přístup pro čtení.
  4. 4. Způsob podle nároků 1, 2 nebo 3,vyznačující se tím, že krok vytvoření pomocné databáze zahrnuje vytvoření pomocné databáze, která identifikuje části souboru, do kterých se má provést přístup a datum nebo datum a čas kdy byl přístup proveden.
  5. 5. Způsob podle kteréhokoliv nároku 1 až 4, vyznačující se tím, že počítačový systém (10) zahrnuje tabulku umístění souborů, která definuje místa umístění částí souboru na prostředku (16) pro hromadné ukládání dat, přičemž způsob dále zahrnuje krok kontroly tabulky umístění souborů, při kterém se zjišťuje zdali části souboru jsou na prostředku (16) pro hromadné ukládání dat.
  6. 6. Způsob podle nároku 5, vyznačující se tím, že částmi souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
  7. 7. Způsob podle kteréhokoliv nároku 1 až 6, vyznačující se tím, že počítačový systém (10) zahrnuje záložní ukládací prostředek (18) pro ukládání archivovaných souborů, přičemž způsob dále zahrnuje to, že když kontrolní krok stanoví, že části souboru nejsou na prostředku (16), pro hromadné ukládání dat, následuje krok vyhledání částí souboru ze záložního ukládání prostředku (18).
    - 12CZ 294346 B6
  8. 8. Způsob archivování dat uložených v počítačovém systému (10), který zahrnuje paměť (14) s přímým přístupem, základní procesorovou jednotku (12), prostředek (16) pro hromadné ukládání dat a záložní prostředek (18) pro ukládání dat, přičemž tento způsob zahrnuje kroky:
    poskytnutí instrukcí uložených v paměti (14) s přímým přístupem základní procesorové jednotce (12) k způsobení toho, že základní procesorová jednotka (12) archivuje vybraná data, uložená v prostředku (16) pro hromadné ukládání dat, na záložní ukládací prostředek (18) k uvolnění prostoru na prostředku (16) pro hromadné ukládání dat, vyznačující se tím, že základní procesorová jednotka (12) přikazuje následující operace:
    co se týče souboru určeného k archivaci, poskytnutí pomocné databáze, která identifikuje části souboru v souboru, ke kterým byl proveden přístup, z pomocné databáze identifikaci těch částí souboru, ke kterým byl proveden přístup, archivování alespoň některých částí souboru, ke kterým nebyl proveden přístup, do záložního ukládacího prostředku (18) a vymazání těch částí souboru, knimž nebyl proveden přístup, z prostředku (16) pro hromadné ukládání dat, ale ponechání těch částí souborů, ke kterým nebyl proveden přístup, na prostředku (16) pro hromadné ukládání dat.
  9. 9. Způsob podle nároku 8, vyznačující se tím, že krok poskytování pomocné databáze zahrnuje poskytování pomocné databáze, která identifikuje části souboru v souboru, k nimž byl proveden přístup a datum nebo datum a čas kdy byl tento přístup proveden, přičemž krok identifikace zahrnuje identifikování z pomocné databáze těch částí souboru, ke kterým byl proveden přístup od specifikovaného data, do záložního ukládacího prostředku (18) a krok vymazání zahrnuje vymazání těch částí souboru, ke kterým nebyl proveden přístup od specifikovaného data z prostředku (16) pro hromadné ukládání dat, ale ponechání na tomto prostředku (16) pro hromadné ukládání dat těch dat, ke kterým byl proveden přístup od specifikovaného data.
  10. 10. Způsob podle nároku 9, vyznačující se tím, že kroky archivace a vymazání zahrnují archivování a vymazání těch částí souboru, ke kterým nebyl proveden přístup od specifikovaného data a byly již v předem stanoveném počtu zálohování zálohovány.
  11. 11. Způsob podle nároků 8, 9 nebo 10, vy znač u j í c í se t í m , že počítačový systém (10) zahrnuje tabulku umístění souborů, která definuje umístění částí souboru na prostředku (16) pro hromadné ukládání dat, a že krok vymazání zahrnuje úpravu tabulky umístění souborů.
  12. 12. Způsob podle nároku 11,vyznačující se tím, že části souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
  13. 13. Počítačový systém (10) k provádění způsobu přípravy k datům podle nároku 1 zahrnující paměť (14) s přímým přístupem, základní procesorovou jednotku (12), prostředek (16) pro hromadné ukládání dat a zařízení k archivování dat uložených v počítačovém systému (10), přičemž toto zařízení zahrnuje:
    prostředek pro poskytování instrukcí uložených v paměti (14) s přímým vstupem základní procesorové jednotce (12) k způsobení toho, že se základní procesorová jednotka (12) snaží o přístup k datům uloženým v prostředku (16) pro hromadné ukládání dat generováním alespoň požadavku na čtení, prostředek pro identifikaci souboru do kterého se vyžaduje přístup,
    -13CZ 294346 B6 prostředek pro identifikaci částí souboru v souboru, do kterých je přístup nutný a prostředek pro přístup do částí souboru, vyznačující se tím, že obsahuje prostředek pro vytvoření pomocné databáze, která identifikuje části souboru, do kterých je třeba provést přístup.
  14. 14. Počítačový systém (10) podle nároku 13, vyznačující se tím, že prostředek pro poskytování instrukcí uložených v paměti (14) s přímým vstupem do základní procesorové jednotky (12) způsobuje, že se základní procesorová jednotka (12) snaží o přístup k datům uloženým v prostředku (16) pro hromadné uložení dat generováním buďto požadavku na zápis, nebo požadavku na čtení.
  15. 15. Počítačový systém (10) podle nároku 14, vyznačující se tím, že pomocná databáze dále definuje, zda přístupem je přístup pro zápis nebo přístup pro čtení.
  16. 16. Počítačový systém (10) podle nároků 13, 14 nebo 15, v y z n a č u j í c í se tím, že prostředek pro vytvoření pomocné databáze identifikuje části souboru, do kterých se má provést přístup a datum nebo datum a čas kdy se má přístup provést.
  17. 17. Počítačový systém (10) podle kteréhokoliv z nároků 13 až 16, vyznačující se tím, že zahrnuje tabulku umístění souborů, která definuje umístění částí souboru na prostředku (16) pro hromadné ukládání dat, přičemž zařízení dále zahrnuje prostředek pro kontrolu tabulky umístění souborů, a to pro stanovení, zda jsou části souboru přítomné na prostředku (16) pro hromadné ukládání dat.
  18. 18. Počítačový systém (10) podle nároku 17, vyznačující se tím, že částmi souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
  19. 19. Počítačový systém (10) podle kteréhokoliv z nároků 13 až 18, v y z n a č uj í c í se tím, že zahrnuje záložní ukládací prostředek (18) pro ukládání archivovaných souborů a prostředek pro vyhledání částí souborů ze záložního ukládacího prostředku (18), jestliže kontrolní krok určí, že části souboru nejsou na prostředku (16) pro hromadné ukládání dat.
  20. 20. Počítačový systém (10) k provádění způsobu archivování dat podle nároku 8 zahrnují paměť (14) s přímým vstupem, základní procesorovou jednotku (12), prostředek (16) pro hromadné ukládání dat a zařízení k archivování dat, která jsou uložena v počítačovém systému (10), vyznačující se t í m , že zahrnuje:
    prostředek pro poskytování instrukcí uložených v paměti (14) s přímým vstupem do základní procesorové jednotky (12) k způsobení toho, že základní procesorová jednotka (12) zahrnuje vybraná data, uložená v prostředku (16) pro hromadné ukládání dat, do záložního ukládacího prostředku (18) k uvolnění prostoru na prostředku (16) pro hromadné ukládání dat, prostředek pro poskytnutí, pokud jde o soubor, který se má archivovat, pomocné databáze, která identifikuje ty části souboru v souboru, ke kterým byl proveden přístup, prostředek pro identifikování z pomocné databáze těch částí souboru, ke kterým byl proveden přístup, prostředek pro archivaci do záložního ukládacího prostředku (18), alespoň některých částí souboru, ke kterým nebyl proveden přístup a
    - 14CZ 294346 B6 prostředek pro vymazání částí souboru, ke kterým nebyl proveden přístup, z prostředku (16) pro hromadné ukládání dat, ale pro ponechání těch částí souborů, ke kterým byl proveden přístup na prostředku (16) pro hromadné ukládání dat.
  21. 21. Počítačový systém (10) podle nároku 20, vyznačující se tím, že prostředek pro poskytnutí pomocné databáze zahrnuje prostředek pro poskytnutí pomocné databáze, která identifikuje ty části souboru v souboru, ke kterým byl proveden přístup a datum nebo datum a čas kdy byl proveden přístup, identifikační prostředek zahrnuje prostředek, který v pomocné databázi identifikuje ty části souboru, ke kterým byl proveden přístup od stanoveného data a ty části souboru, ke kterým od stanoveného data nebyl proveden přístup, prostředek pro archivování zahrnuje prostředek pro archivování do záložního ukládacího prostředku (18), alespoň některých částí souboru, ke kterým nebyl proveden přístup od stanoveného data, a prostředek pro vymazání zahrnuje prostředek pro mazání z prostředku (16) pro hromadné ukládání dat, těch částí souboru, ke kterým nebyl proveden přístup od stanoveného data, ale ponechání na prostředku (16) pro hromadné ukládání dat, těch částí souboru, ke kterým byl proveden přístup od stanoveného data.
  22. 22. Počítačový systém (10) podle nároku 21, v y z n a č uj í c í se tím, že prostředek pro archivování a prostředek pro vymazání zahrnují prostředky pro archivování a vymazání těch částí souboru, ke kterým nebyl proveden přístup od stanoveného data a byly již v předem stanoveném počtu zálohování zálohovány.
  23. 23. Počítačový systém (10) podle nároků 20, 21 a 22,vyznačující se tím, že zahrnuje tabulku umístění souborů, která definuje umístění částí souboru na prostředku (16) pro hromadné ukládání dat, a že prostředek pro vymazání zahrnuje prostředek pro úpravu tabulky umístění souborů.
  24. 24. Počítačový systém (10) podle nároku 23, vy z n a č u j í c í se tím, že částmi souboru jsou bloky, které odpovídají elementárním blokům identifikovaným v tabulce umístění souborů.
CZ19971859A 1994-12-15 1995-12-01 Způsob přístupu k datům nebo archivování dat a počítačový systém k provádění těchto způsobů CZ294346B6 (cs)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US08/356,478 US5617566A (en) 1993-12-10 1994-12-15 File portion logging and arching by means of an auxilary database

Publications (2)

Publication Number Publication Date
CZ9701859A3 CZ9701859A3 (cs) 2002-06-12
CZ294346B6 true CZ294346B6 (cs) 2004-12-15

Family

ID=23401599

Family Applications (1)

Application Number Title Priority Date Filing Date
CZ19971859A CZ294346B6 (cs) 1994-12-15 1995-12-01 Způsob přístupu k datům nebo archivování dat a počítačový systém k provádění těchto způsobů

Country Status (24)

Country Link
US (1) US5617566A (cs)
EP (1) EP0797805B1 (cs)
JP (1) JPH10510642A (cs)
KR (1) KR100437199B1 (cs)
CN (1) CN1118035C (cs)
AT (1) ATE192249T1 (cs)
AU (1) AU710755B2 (cs)
BG (1) BG63096B1 (cs)
BR (1) BR9510506A (cs)
CA (1) CA2207735C (cs)
CZ (1) CZ294346B6 (cs)
DE (1) DE69516538T2 (cs)
DK (1) DK0797805T3 (cs)
ES (1) ES2145308T3 (cs)
FI (1) FI972544A (cs)
GR (1) GR3033775T3 (cs)
HU (1) HU221081B1 (cs)
IS (1) IS1890B (cs)
MX (1) MX9704419A (cs)
NO (1) NO312529B1 (cs)
NZ (1) NZ296165A (cs)
PL (1) PL182609B1 (cs)
RU (1) RU2182360C2 (cs)
WO (1) WO1996018960A1 (cs)

Families Citing this family (51)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619656A (en) * 1994-05-05 1997-04-08 Openservice, Inc. System for uninterruptively displaying only relevant and non-redundant alert message of the highest severity for specific condition associated with group of computers being managed
US5819298A (en) * 1996-06-24 1998-10-06 Sun Microsystems, Inc. File allocation tables with holes
US5832525A (en) * 1996-06-24 1998-11-03 Sun Microsystems, Inc. Disk fragmentation reduction using file allocation tables
CA2221216A1 (en) * 1996-11-15 1998-05-15 Mark Squibb System and apparatus for merging a write event journal and an original storage to produce an updated storage using an event map
US6366988B1 (en) * 1997-07-18 2002-04-02 Storactive, Inc. Systems and methods for electronic data storage management
US5983368A (en) * 1997-08-26 1999-11-09 International Business Machines Corporation Method and system for facilitating hierarchical storage management (HSM) testing
US6173359B1 (en) 1997-08-27 2001-01-09 International Business Machines Corp. Storage and access to scratch mounts in VTS system
US6067541A (en) * 1997-09-17 2000-05-23 Microsoft Corporation Monitoring document changes in a file system of documents with the document change information stored in a persistent log
US5953729A (en) * 1997-12-23 1999-09-14 Microsoft Corporation Using sparse file technology to stage data that will then be stored in remote storage
US6378128B1 (en) * 1998-10-08 2002-04-23 Microsoft Corporation System and method for dynamically modifying an install-set
US6240427B1 (en) * 1999-01-05 2001-05-29 Advanced Micro Devices, Inc. Method and apparatus for archiving and deleting large data sets
US6415300B1 (en) 1999-07-06 2002-07-02 Syncsort Incorporated Method of performing a high-performance backup which gains efficiency by reading input file blocks sequentially
US6408314B1 (en) 1999-07-06 2002-06-18 Synscort Incorporated Method of performing a high-performance sort which gains efficiency by reading input file blocks sequentially
US6981005B1 (en) * 2000-08-24 2005-12-27 Microsoft Corporation Partial migration of an object to another storage location in a computer system
KR20020031509A (ko) * 2000-10-20 2002-05-02 김영돈, 정춘보 프로그램 제작툴에서 데이터 관리방법
GB2400704A (en) * 2001-10-31 2004-10-20 Gen I Ltd Information archiving software
US20030084071A1 (en) * 2001-11-01 2003-05-01 International Business Machines Corporation Method and system for managing computer performance
KR100468276B1 (ko) * 2001-12-13 2005-01-27 (주)아이디스 멀티미디어 데이터 저장 및 검색 방법
GB0207969D0 (en) * 2002-04-08 2002-05-15 Ibm Data processing arrangement and method
US20040015524A1 (en) * 2002-07-19 2004-01-22 Chalstrom Robert Eugene Method and apparatus for managing digitally-stored media files
US6889302B2 (en) * 2002-08-29 2005-05-03 International Business Machines Corporation Apparatus and method to maintain information in one or more virtual volume aggregates comprising a plurality of virtual volumes
US8375008B1 (en) 2003-01-17 2013-02-12 Robert Gomes Method and system for enterprise-wide retention of digital or electronic data
US20040143609A1 (en) * 2003-01-17 2004-07-22 Gardner Daniel John System and method for data extraction in a non-native environment
US8630984B1 (en) 2003-01-17 2014-01-14 Renew Data Corp. System and method for data extraction from email files
US8943024B1 (en) 2003-01-17 2015-01-27 Daniel John Gardner System and method for data de-duplication
US8065277B1 (en) 2003-01-17 2011-11-22 Daniel John Gardner System and method for a data extraction and backup database
US8856163B2 (en) 2003-07-28 2014-10-07 Google Inc. System and method for providing a user interface with search query broadening
US7107416B2 (en) * 2003-09-08 2006-09-12 International Business Machines Corporation Method, system, and program for implementing retention policies to archive records
JP4189595B2 (ja) * 2004-08-25 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 ファイル管理装置
US8069151B1 (en) 2004-12-08 2011-11-29 Chris Crafford System and method for detecting incongruous or incorrect media in a data recovery process
US20060136525A1 (en) * 2004-12-21 2006-06-22 Jens-Peter Akelbein Method, computer program product and mass storage device for dynamically managing a mass storage device
US7831639B1 (en) * 2004-12-22 2010-11-09 Symantec Operating Corporation System and method for providing data protection by using sparse files to represent images of data stored in block devices
US8527468B1 (en) 2005-02-08 2013-09-03 Renew Data Corp. System and method for management of retention periods for content in a computing system
US8108579B2 (en) * 2005-03-31 2012-01-31 Qualcomm Incorporated Mechanism and method for managing data storage
JP2006338461A (ja) * 2005-06-03 2006-12-14 Hitachi Ltd 電子的なファイルの記憶を制御するシステム及び方法
US7853667B1 (en) * 2005-08-05 2010-12-14 Network Appliance, Inc. Emulation of transparent recall in a hierarchical storage management system
JP4563314B2 (ja) * 2005-12-14 2010-10-13 富士通株式会社 ストレージシステム制御装置、ストレージシステム制御プログラム、ストレージシステム制御方法
US8150827B2 (en) * 2006-06-07 2012-04-03 Renew Data Corp. Methods for enhancing efficiency and cost effectiveness of first pass review of documents
RU2457622C2 (ru) * 2007-11-29 2012-07-27 Эйрбас Оперейшнс Гмбх Система и способ архивирования данных
US8429312B2 (en) 2007-11-29 2013-04-23 Airbus Operations Gmbh System and method for archiving of data
US8117234B2 (en) * 2008-01-24 2012-02-14 International Business Machines Corporation Method and apparatus for reducing storage requirements of electronic records
US8615490B1 (en) 2008-01-31 2013-12-24 Renew Data Corp. Method and system for restoring information from backup storage media
JP5248912B2 (ja) 2008-05-12 2013-07-31 株式会社日立製作所 サーバ計算機、計算機システムおよびファイル管理方法
WO2011072172A1 (en) * 2009-12-09 2011-06-16 Renew Data Corp. System and method for quickly determining a subset of irrelevant data from large data content
US8738668B2 (en) 2009-12-16 2014-05-27 Renew Data Corp. System and method for creating a de-duplicated data set
US8423727B2 (en) * 2010-03-16 2013-04-16 Hitachi, Ltd. I/O conversion method and apparatus for storage system
US8386421B2 (en) 2010-06-28 2013-02-26 Microsoft Corporation Concurrency control for confluent trees
US8412689B2 (en) 2010-07-07 2013-04-02 Microsoft Corporation Shared log-structured multi-version transactional datastore with metadata to enable melding trees
US9848106B2 (en) 2010-12-21 2017-12-19 Microsoft Technology Licensing, Llc Intelligent gameplay photo capture
US10114844B2 (en) * 2015-11-30 2018-10-30 International Business Machines Corporation Readiness checker for content object movement
CN106227795A (zh) * 2016-07-20 2016-12-14 曙光信息产业(北京)有限公司 分级存储的检测方法和***

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4507751A (en) * 1982-06-21 1985-03-26 International Business Machines Corporation Method and apparatus for logging journal data using a log write ahead data set
US4588991A (en) * 1983-03-07 1986-05-13 Atalla Corporation File access security method and means
US4686620A (en) * 1984-07-26 1987-08-11 American Telephone And Telegraph Company, At&T Bell Laboratories Database backup method
US5043871A (en) * 1986-03-26 1991-08-27 Hitachi, Ltd. Method and apparatus for database update/recovery
EP0483174B1 (en) * 1989-07-11 1995-11-22 Cheyenne Advanced Technology Limited A method of operating a data processing system
GB8915875D0 (en) * 1989-07-11 1989-08-31 Intelligence Quotient United K A method of operating a data processing system
US5454099A (en) * 1989-07-25 1995-09-26 International Business Machines Corporation CPU implemented method for backing up modified data sets in non-volatile store for recovery in the event of CPU failure
US5163148A (en) * 1989-08-11 1992-11-10 Digital Equipment Corporation File backup system for producing a backup copy of a file which may be updated during backup
US5214768A (en) * 1989-11-01 1993-05-25 E-Systems, Inc. Mass data storage library
US5276860A (en) * 1989-12-19 1994-01-04 Epoch Systems, Inc. Digital data processor with improved backup storage
US5363473A (en) * 1991-05-28 1994-11-08 The Trustees Of Columbia University In The City Of New York Incremental update process and apparatus for an inference system
JPH05250244A (ja) * 1992-03-04 1993-09-28 Nec Corp データベースシステム
US5263154A (en) * 1992-04-20 1993-11-16 International Business Machines Corporation Method and system for incremental time zero backup copying of data
US5455946A (en) * 1993-05-21 1995-10-03 International Business Machines Corporation Method and means for archiving modifiable pages in a log based transaction management system

Also Published As

Publication number Publication date
JPH10510642A (ja) 1998-10-13
ES2145308T3 (es) 2000-07-01
DE69516538D1 (de) 2000-05-31
FI972544A (fi) 1997-08-14
HU221081B1 (hu) 2002-07-29
KR980700613A (ko) 1998-03-30
IS1890B (is) 2003-09-19
US5617566A (en) 1997-04-01
BG101622A (en) 1998-02-27
NO972784D0 (no) 1997-06-16
GR3033775T3 (en) 2000-10-31
CN1173231A (zh) 1998-02-11
CN1118035C (zh) 2003-08-13
KR100437199B1 (ko) 2004-11-03
EP0797805B1 (en) 2000-04-26
NO312529B1 (no) 2002-05-21
ATE192249T1 (de) 2000-05-15
DK0797805T3 (da) 2000-09-25
RU2182360C2 (ru) 2002-05-10
NO972784L (no) 1997-08-15
EP0797805A1 (en) 1997-10-01
MX9704419A (es) 1998-07-31
HUT77154A (hu) 1998-03-02
IS4507A (is) 1997-06-13
WO1996018960A1 (en) 1996-06-20
BG63096B1 (bg) 2001-03-30
NZ296165A (en) 1997-11-24
AU3988995A (en) 1996-07-03
AU710755B2 (en) 1999-09-30
FI972544A0 (fi) 1997-06-16
CZ9701859A3 (cs) 2002-06-12
DE69516538T2 (de) 2000-11-23
CA2207735C (en) 2004-08-31
PL321160A1 (en) 1997-11-24
BR9510506A (pt) 1999-06-01
CA2207735A1 (en) 1996-06-20
PL182609B1 (pl) 2002-02-28

Similar Documents

Publication Publication Date Title
CZ294346B6 (cs) Způsob přístupu k datům nebo archivování dat a počítačový systém k provádění těchto způsobů
KR100962055B1 (ko) 컴퓨터 시스템들간의 객체 공유
US5276867A (en) Digital data storage system with improved data migration
US6732293B1 (en) Method, software and apparatus for recovering and recycling data in conjunction with an operating system
JP3878412B2 (ja) データを保存し使用し及び回復する方法
US5475834A (en) Integration of migration level two and backup tape processing using multiple inventory entries
US7246211B1 (en) System and method for using file system snapshots for online data backup
KR100317691B1 (ko) 로그 구조화 목표 저장장치를 사전에 구성하여 볼륨을 효율적으로 복사하는 방법 및 장치
US8640136B2 (en) Sharing objects between computer systems
KR20080053878A (ko) 데이터 기억 장치, 그 데이터 재배치 방법, 프로그램을기록한 기록 매체
JP3797864B2 (ja) オペレーティングシステムとの関連でデータを回復および再生する方法、ソフトウェア、および装置
JP4079244B2 (ja) 追記型記憶媒体ボリュームの再編成処理方法
JP3725375B2 (ja) 記憶媒体ライブラリにおけるデータ再編成方法
AU2002330129A1 (en) Sharing objects between computer systems
AU2002360252A1 (en) Efficient search for migration and purge candidates

Legal Events

Date Code Title Description
MM4A Patent lapsed due to non-payment of fee

Effective date: 20061201