RU2014125081A - Согласованные с приложениями снимки общего тома - Google Patents

Согласованные с приложениями снимки общего тома Download PDF

Info

Publication number
RU2014125081A
RU2014125081A RU2014125081/08A RU2014125081A RU2014125081A RU 2014125081 A RU2014125081 A RU 2014125081A RU 2014125081/08 A RU2014125081/08 A RU 2014125081/08A RU 2014125081 A RU2014125081 A RU 2014125081A RU 2014125081 A RU2014125081 A RU 2014125081A
Authority
RU
Russia
Prior art keywords
node
cluster
recording module
command
notification
Prior art date
Application number
RU2014125081/08A
Other languages
English (en)
Other versions
RU2606052C2 (ru
Inventor
Джойдип БУРАГОХАИН
Винод Р. ШАНКАР
Андреа Д'АМАТО
Original Assignee
МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи filed Critical МАЙКРОСОФТ ТЕКНОЛОДЖИ ЛАЙСЕНСИНГ, ЭлЭлСи
Publication of RU2014125081A publication Critical patent/RU2014125081A/ru
Application granted granted Critical
Publication of RU2606052C2 publication Critical patent/RU2606052C2/ru

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F12/00Accessing, addressing or allocating within memory systems or architectures
    • G06F12/16Protection against loss of memory contents
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1402Saving, restoring, recovering or retrying
    • G06F11/1446Point-in-time backing up or restoration of persistent data
    • G06F11/1456Hardware arrangements for backup
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/14Error detection or correction of the data by redundancy in operation
    • G06F11/1479Generic software techniques for error detection or fault masking
    • G06F11/1482Generic software techniques for error detection or fault masking by means of middleware or OS functionality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/82Solving problems relating to consistency
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2201/00Indexing scheme relating to error detection, to error correction, and to monitoring
    • G06F2201/84Using snapshots, i.e. a logical point-in-time copy of the data

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)

Abstract

1. Способ, выполняемый на первом узле кластера, включающем в себя приложение резервного копирования, координатора резервного копирования, по меньшей мере одно приложение, поставщика хранилища, службу кластеров и кластерный модуль записи, и предназначенный для создания снимка общего тома, который обладает согласованностью по приложениям с приложениями на более чем одном узле кластера, которые используют общий том, при этом способ содержит этапы, на которых:принимают запрос от приложения резервного копирования в координаторе резервного копирования на первом узле, причем запрос запрашивает создание снимка общего тома, используемого по меньшей мере одним приложением на первом узле и по меньшей мере одним приложением на по меньшей мере одном другом узле в кластере, причем каждое из по меньшей мере одного приложения на первом узле и на упомянутом по меньшей мере одном другом узле включает в себя модуль записи, и каждый из первого узла и упомянутого по меньшей мере одного другого узла также включает в себя кластерный модуль записи и службу кластеров;отправляют с помощью координатора резервного копирования команду замораживания в кластерный модуль записи и каждый модуль записи на первом узле, причем команда замораживания предписывает кластерному модулю записи и каждому модулю записи на первом узле сохранить данные приложения в общем томе;отправляют с помощью кластерного модуля записи на первом узле уведомление о команде замораживания в службу кластеров на первом узле;отправляют с помощью службы кластеров на первом узле уведомление о команде замораживания в службу кластеров на каждом из упомянутого по мень

Claims (15)

1. Способ, выполняемый на первом узле кластера, включающем в себя приложение резервного копирования, координатора резервного копирования, по меньшей мере одно приложение, поставщика хранилища, службу кластеров и кластерный модуль записи, и предназначенный для создания снимка общего тома, который обладает согласованностью по приложениям с приложениями на более чем одном узле кластера, которые используют общий том, при этом способ содержит этапы, на которых:
принимают запрос от приложения резервного копирования в координаторе резервного копирования на первом узле, причем запрос запрашивает создание снимка общего тома, используемого по меньшей мере одним приложением на первом узле и по меньшей мере одним приложением на по меньшей мере одном другом узле в кластере, причем каждое из по меньшей мере одного приложения на первом узле и на упомянутом по меньшей мере одном другом узле включает в себя модуль записи, и каждый из первого узла и упомянутого по меньшей мере одного другого узла также включает в себя кластерный модуль записи и службу кластеров;
отправляют с помощью координатора резервного копирования команду замораживания в кластерный модуль записи и каждый модуль записи на первом узле, причем команда замораживания предписывает кластерному модулю записи и каждому модулю записи на первом узле сохранить данные приложения в общем томе;
отправляют с помощью кластерного модуля записи на первом узле уведомление о команде замораживания в службу кластеров на первом узле;
отправляют с помощью службы кластеров на первом узле уведомление о команде замораживания в службу кластеров на каждом из упомянутого по меньшей мере одного другого узла, причем данное уведомление предписывает службе кластеров на каждом из этого по меньшей мере одного другого узла инициировать процесс резервного копирования общего тома на каждом из данного по меньшей мере одного другого узла;
ожидают с помощью кластерного модуля записи на первом узле уведомление от службы кластеров на каждом из упомянутого по меньшей мере одного другого узла перед возвратом из команды замораживания, причем уведомление указывает, что каждый модуль записи на соответствующем узле сохранил соответствующие данные приложения в общем томе;
по приему уведомления от службы кластеров на каждом из упомянутого по меньшей мере одного другого узла возвращаются из команды замораживания с помощью кластерного модуля записи на первом узле; и
после возврата кластерного модуля записи на первом узле из команды замораживания отправляют запрос поставщику хранилища с помощью координатора резервного копирования, причем запрос предписывает поставщику хранилища создать снимок общего тома, причем данный снимок обладает согласованностью по приложениям с каждым приложением на первом узле и упомянутому по меньшей мере одном другом узле, которое использует общий том.
2. Способ по п. 1, дополнительно содержащий этап, на котором:
перед отправкой поставщику хранилища запроса, предписывающего поставщику хранилища создать снимок общего тома,
отправляют с помощью координатора резервного копирования команду сброса и приостановки в общий том, тем самым обеспечивая сохранение в общем томе метаданных файловой системы.
3. Способ по п. 1, дополнительно содержащий этапы, на которых:
после того, как создан снимок, отправляют с помощью координатора резервного копирования команду постобработки снимка в кластерный модуль записи и по меньшей мере один из модулей записи на первом узле; и
отправляют с помощью кластерного модуля записи на первом узле уведомление о команде постобработки снимка в службу кластеров на первом узле; и
отправляют с помощью службы кластеров на первом узле уведомление о команде постобработки снимка в службу кластеров на каждом из упомянутого по меньшей мере одного другого узла.
4. Способ по п. 3, в котором упомянутый по меньшей мере один из модулей записи на первом узле, которому отправляется команда постобработки снимка, содержит модуль записи приложения-гипервизора.
5. Способ по п. 3, дополнительно содержащий этапы, на которых:
ожидают с помощью кластерного модуля записи на первом узле уведомление от службы кластеров на каждом из упомянутого по меньшей мере одного другого узла, причем данное уведомление указывает, что процесс резервного копирования завершен на каждом из упомянутого по меньшей мере одного другого узла; и
принимают с помощью кластерного модуля записи на первом узле
уведомление, что процесс резервного копирования завершен, от службы кластеров на каждом из упомянутого по меньшей мере одного другого узла.
6. Способ по п. 5, дополнительно содержащий этап, на котором:
после приема от службы кластеров на каждом из упомянутого по меньшей мере одного другого узла уведомления, что процесс резервного копирования завершен, возвращаются из команды постобработки снимка с помощью кластерного модуля записи на первом узле.
7. Способ по п. 6, дополнительно содержащий этап, на котором:
после возврата кластерного модуля записи и упомянутого по меньшей мере одного модуля записи на первом узле из команды постобработки снимка уведомляют приложение резервного копирования с помощью координатора резервного копирования, что снимок успешно завершен.
8. Способ, выполняемый на узле кластера, включающем в себя координатора резервного копирования, по меньшей мере одно приложение, поставщика-помощника, службу кластеров и кластерный модуль записи, и предназначенный для ответа на уведомление, что процесс резервного копирования общего тома инициирован на другом узле кластера, при этом способ содержит этапы, на которых:
принимают уведомление в службе кластеров на первом узле, что процесс резервного копирования общего тома инициирован на втором узле в кластере, причем общий том используется по меньшей мере одним приложением на каждом из первого и второго узлов, при этом уведомление принимается от службы кластеров на втором узле и указывает, что команда замораживания была принята кластерным
модулем записи на втором узле;
отправляют запрос с помощью службы кластеров на первом узле координатору резервного копирования на первом узле, причем запрос запрашивает создание снимка общего тома;
отправляют с помощью координатора резервного копирования команду замораживания кластерному модулю записи и модулю записи упомянутого по меньшей мере одного приложения на первом узле, причем команда замораживания предписывает кластерному модулю записи и по меньшей мере одному модулю записи сохранить данные приложения в общем томе;
после того, как кластерный модуль записи и упомянутый по меньшей мере один модуль записи возвращаются из команды замораживания, отправляют с помощью координатора резервного копирования команду фиксации поставщику-помощнику на первом узле;
отправляют с помощью поставщика-помощника на первом узле уведомление о команде фиксации в службу кластеров на первом узле, при этом поставщик-помощник блокируется по команде фиксации; и
отправляют с помощью службы кластеров на первом узле кластерному модулю записи на втором узле уведомление, что команда фиксации принята, тем самым указывая, что каждый модуль записи на первом узле сохранил данные соответствующего приложения в общем томе.
9. Способ по п. 8, в котором запрос, отправленный службой кластеров на первом узле для создания снимка общего тома, задает, что для создания этого снимка нужно использовать модуль
записи помощника.
10. Способ по п. 8, дополнительно содержащий этап, на котором:
принимают с помощью службы кластеров на первом узле уведомление от службы кластеров на втором узле, что команда постобработки снимка принята кластерным модулем записи на втором узле.
11. Способ по п. 10, дополнительно содержащий этап, на котором:
отправляют поставщику-помощнику с помощью службы кластеров на первом узле уведомление, что команда постобработки снимка была принята кластерным модулем записи на втором узле.
12. Способ по п. 11, дополнительно содержащий этап, на котором:
возвращаются из команды фиксации с помощью поставщика-помощника.
13. Способ по п. 12, дополнительно содержащий этапы, на которых:
принимают команду постобработки снимка с помощью кластерного модуля записи и упомянутого по меньшей мере одного модуля записи на первом узле; и
выполняют с помощью упомянутого по меньшей мере одного модуля записи постобработку над виртуальным снимком.
14. Способ по п. 13, дополнительно содержащий этапы, на которых:
после возврата кластерного модуля записи и упомянутого по меньшей мере одного модуля записи на первом узле из команды
постобработки снимка уведомляют службу кластеров на первом узле с помощью координатора резервного копирования, что снимок успешно создан на первом узле; и
в ответ на данное уведомление уведомляют с помощью службы кластеров на первом узле кластерный модуль записи на втором узле, что снимок был успешно завершен на первом узле, тем самым указывая кластерному модулю записи на втором узле, что каждый из упомянутого по меньшей мере одного модуля записи обработал команду постобработки снимка на первом узле.
15. Способ по п. 14, дополнительно содержащий этап, на котором:
удаляют с помощью кластерного модуля записи на первом узле виртуальный снимок на первом узле.
RU2014125081A 2011-12-21 2012-12-12 Согласованные с приложениями снимки общего тома RU2606052C2 (ru)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US13/333,722 2011-12-21
US13/333,722 US8516210B2 (en) 2011-12-21 2011-12-21 Application consistent snapshots of a shared volume
PCT/US2012/069029 WO2013096022A1 (en) 2011-12-21 2012-12-12 Application consistent snapshots of a shared volume

Publications (2)

Publication Number Publication Date
RU2014125081A true RU2014125081A (ru) 2015-12-27
RU2606052C2 RU2606052C2 (ru) 2017-01-10

Family

ID=48495925

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2014125081A RU2606052C2 (ru) 2011-12-21 2012-12-12 Согласованные с приложениями снимки общего тома

Country Status (13)

Country Link
US (1) US8516210B2 (ru)
EP (1) EP2795476B1 (ru)
JP (1) JP6238309B2 (ru)
KR (1) KR102006513B1 (ru)
CN (1) CN103136073B (ru)
AU (1) AU2012355673B2 (ru)
BR (1) BR112014014791B1 (ru)
CA (1) CA2858981A1 (ru)
ES (1) ES2602143T3 (ru)
IN (1) IN2014CN04219A (ru)
MX (1) MX343276B (ru)
RU (1) RU2606052C2 (ru)
WO (1) WO2013096022A1 (ru)

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9201887B1 (en) * 2012-03-30 2015-12-01 Emc Corporation Cluster file server proxy server for backup and recovery
US20140075170A1 (en) * 2012-09-12 2014-03-13 International Business Machines Corporation Automated firmware voting to enable multi-enclosure federated systems
US9740563B2 (en) * 2013-05-24 2017-08-22 International Business Machines Corporation Controlling software processes that are subject to communications restrictions by freezing and thawing a computational process in a virtual machine from writing data
US9430649B2 (en) * 2013-12-17 2016-08-30 Microsoft Technology Licensing, Llc Automatic strong identity generation for cluster nodes
US10936545B1 (en) * 2013-12-20 2021-03-02 EMC IP Holding Company LLC Automatic detection and backup of primary database instance in database cluster
US9411811B2 (en) 2014-01-06 2016-08-09 International Business Machines Corporation Coordinated point-in-time snapshots of multiple computing platforms
US9639428B1 (en) * 2014-03-28 2017-05-02 EMC IP Holding Company LLC Optimized backup of clusters with multiple proxy servers
US9411628B2 (en) 2014-11-13 2016-08-09 Microsoft Technology Licensing, Llc Virtual machine cluster backup in a multi-node environment
US9778994B1 (en) 2015-06-26 2017-10-03 EMC IP Holding Company LLC Parallel node backup for CSV
US10133617B2 (en) 2016-07-01 2018-11-20 Hewlett Packard Enterprise Development Lp Failure notifications in multi-node clusters
US10664357B1 (en) * 2016-12-20 2020-05-26 EMC IP Holding Company LLC Single agent backup for cloud networks
US10860427B1 (en) * 2016-12-23 2020-12-08 EMC IP Holding Company LLC Data protection in a large-scale cluster environment
CN106681866B (zh) * 2016-12-30 2019-10-18 成都华为技术有限公司 一种保证应用一致性的方法、装置及***
CN110058962B (zh) * 2018-01-18 2023-05-23 伊姆西Ip控股有限责任公司 确定虚拟机快照的一致性级别的方法、设备和计算机程序产品
US10705927B2 (en) * 2018-07-19 2020-07-07 Hewlett Packard Enterprise Development Lp Freeze a volume of a replication set and unfreeze the volume based on at least one of a snapshot permit message, a snapshot abort message, and expiration of a timeout
US11442893B2 (en) 2018-08-29 2022-09-13 Red Hat, Inc. Database-aware snapshotting
US11461121B2 (en) 2019-07-26 2022-10-04 Red Hat, Inc. Guest-driven virtual machine snapshots
CN111209343B (zh) * 2020-01-22 2022-02-22 腾讯科技(深圳)有限公司 节点数据同步方法、装置、设备以及存储介质
US20220057947A1 (en) * 2020-08-20 2022-02-24 Portworx, Inc. Application aware provisioning for distributed systems
KR20230034005A (ko) 2021-09-02 2023-03-09 주식회사 나눔기술 엣지 클라우드 컴퓨팅 환경에서 멀티 클러스터 스냅샷 생성 및 복구 장치
US20230273742A1 (en) * 2022-02-28 2023-08-31 Nebulon, Inc. Recovery of clustered storage systems

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5857208A (en) 1996-05-31 1999-01-05 Emc Corporation Method and apparatus for performing point in time backup operation in a computer system
US6014669A (en) 1997-10-01 2000-01-11 Sun Microsystems, Inc. Highly-available distributed cluster configuration database
US6154852A (en) 1998-06-10 2000-11-28 International Business Machines Corporation Method and apparatus for data backup and recovery
US6952741B1 (en) 1999-06-30 2005-10-04 Computer Sciences Corporation System and method for synchronizing copies of data in a computer system
US6708227B1 (en) 2000-04-24 2004-03-16 Microsoft Corporation Method and system for providing common coordination and administration of multiple snapshot providers
US7231461B2 (en) 2001-09-14 2007-06-12 International Business Machines Corporation Synchronization of group state data when rejoining a member to a primary-backup group in a clustered computer system
US7117324B2 (en) 2002-10-18 2006-10-03 International Business Machines Corporation Simultaneous data backup in a computer system
US6993603B2 (en) * 2002-12-09 2006-01-31 Microsoft Corporation Managed file system filter model and architecture
US20060206677A1 (en) 2003-07-03 2006-09-14 Electronics And Telecommunications Research Institute System and method of an efficient snapshot for shared large storage
US20050097179A1 (en) * 2003-09-16 2005-05-05 Orme Gregory M. Spam prevention
GB0410540D0 (en) * 2004-05-12 2004-06-16 Ibm Write set boundary management for heterogeneous storage controllers in support of asynchronous update of secondary storage
US7660879B2 (en) * 2004-05-20 2010-02-09 Ananthan Bala Srinivasan System and method for application deployment service
US7475296B2 (en) * 2004-05-20 2009-01-06 International Business Machines Corporation Serviceability and test infrastructure for distributed systems
JP4325524B2 (ja) * 2004-09-29 2009-09-02 日本電気株式会社 スイッチ装置とシステム並びにバックアップ及びリストア方法とプログラム
US7779295B1 (en) * 2005-06-28 2010-08-17 Symantec Operating Corporation Method and apparatus for creating and using persistent images of distributed shared memory segments and in-memory checkpoints
US7685459B1 (en) 2006-04-13 2010-03-23 Symantec Operating Corporation Parallel backup
US7441092B2 (en) 2006-04-20 2008-10-21 Microsoft Corporation Multi-client cluster-based backup and restore
JP4902289B2 (ja) * 2006-07-31 2012-03-21 株式会社日立製作所 バックアップシステム及びバックアップ方法
US7587565B1 (en) * 2006-09-28 2009-09-08 Emc Corporation Generating automated and scheduled SAN copy sessions for ISB protocol systems
US7992036B2 (en) * 2007-01-22 2011-08-02 International Business Machines Corporation Apparatus, system, and method for volume-level restoration of cluster server data
US8307154B2 (en) * 2009-03-03 2012-11-06 Kove Corporation System and method for performing rapid data snapshots
US20110082832A1 (en) 2009-10-05 2011-04-07 Ramkumar Vadali Parallelized backup and restore process and system
US20110252208A1 (en) 2010-04-12 2011-10-13 Microsoft Corporation Express-full backup of a cluster shared virtual machine
JP5541149B2 (ja) * 2010-12-27 2014-07-09 富士通株式会社 スナップショット採取プログラム、サーバおよびスナップショット採取方法

Also Published As

Publication number Publication date
IN2014CN04219A (ru) 2015-07-17
BR112014014791A2 (pt) 2017-06-13
US20130166863A1 (en) 2013-06-27
CA2858981A1 (en) 2013-06-27
BR112014014791B1 (pt) 2022-02-15
CN103136073B (zh) 2015-11-25
EP2795476A4 (en) 2015-06-24
US8516210B2 (en) 2013-08-20
KR102006513B1 (ko) 2019-08-01
MX2014007678A (es) 2014-07-30
ES2602143T3 (es) 2017-02-17
MX343276B (es) 2016-10-31
RU2606052C2 (ru) 2017-01-10
EP2795476A1 (en) 2014-10-29
JP2015506507A (ja) 2015-03-02
JP6238309B2 (ja) 2017-11-29
AU2012355673B2 (en) 2017-09-07
KR20140106588A (ko) 2014-09-03
AU2012355673A1 (en) 2014-07-10
WO2013096022A1 (en) 2013-06-27
EP2795476B1 (en) 2016-08-10
CN103136073A (zh) 2013-06-05

Similar Documents

Publication Publication Date Title
RU2014125081A (ru) Согласованные с приложениями снимки общего тома
US10949245B2 (en) Maintaining high availability during network partitions for virtual machines stored on distributed object-based storage
US9823877B2 (en) Virtual machine backup from storage snapshot
CA2896809C (en) Data processing device and data processing method
US9495259B2 (en) Orchestrating high availability failover for virtual machines stored on distributed object-based storage
US10379964B2 (en) Integrating resources at a backup site
US8583773B2 (en) Autonomous primary node election within a virtual input/output server cluster
WO2016078529A1 (zh) 业务处理方法、装置及***
US20150186044A1 (en) Systems and methods for improving snapshot performance
JP2013539134A5 (ru)
WO2019020081A1 (zh) 分布式***及其故障恢复方法、装置、产品和存储介质
CN103279386A (zh) 一种计算机作业调度***高可用的方法
US20150213051A1 (en) System and method for high availability data replication
WO2015184925A1 (zh) 分布式文件***的数据处理方法及分布式文件***
RU2653254C1 (ru) Способ, узел и система управления данными для кластера базы данных
WO2020258780A1 (en) Dual-controller storage systems
JP2010282468A (ja) 計算機システム及び障害復旧方法
CN103823708A (zh) 虚拟机读写请求处理的方法和装置
WO2017096942A1 (zh) 一种文件存储***、数据调度方法及数据节点
CN105306581A (zh) 一种基于路由器和云盘数据同步的方法
WO2012024937A1 (zh) 一种实现并行计算的方法及***
US11157511B2 (en) Physical replication of database
WO2018157605A1 (zh) 一种集群文件***中消息传输的方法及装置
CN102385624B (zh) 一种面向分布式文件***的日志数据组织的方法
WO2017113861A1 (zh) 一种数据访问方法和装置