CN110532123A

CN110532123A - HBase***的故障转移方法及装置

Info

Publication number: CN110532123A
Application number: CN201910817715.9A
Authority: CN
Inventors: 张洸豪; 张铎
Original assignee: Beijing Xiaomi Mobile Software Co Ltd
Current assignee: Beijing Xiaomi Mobile Software Co Ltd
Priority date: 2019-08-30
Filing date: 2019-08-30
Publication date: 2019-12-03
Anticipated expiration: 2039-08-30
Also published as: EP3786802A1; EP3786802B1; CN110532123B; US20210064473A1; US11249854B2

Abstract

本公开提供一种HBase***的故障转移方法及装置。所述方法应用于HBase***中第一工作节点，所述方法包括：获取HBase***中管理节点发送的预写日志***WAL文件，WAL文件包括：HBase***中第二工作节点发生故障时内部多个表分片的WAL文件，在自身节点内存中拆分WAL文件，得到各表分片的WAL文件，根据自身节点内存中各表分片的WAL文件，确定在故障发生时第二工作节点内存中各表分片的更新数据，将各表分片的更新数据写入自身节点硬盘中，实现了第二工作节点内存中表分片的更新数据的转移和持久化存储，避免了第二工作节点发生故障时内存中数据的丢失。

Description

HBase***的故障转移方法及装置

技术领域

本公开涉及计算机通信技术领域，尤其涉及一种HBase***的故障转移方法及装置。

背景技术

HBase是开源的分布式数据库，提供的服务部署在多个节点上，多个节点组成分布式集群，该分布式集群又称为HBase***。基于提供的服务类型不同，HBase***包括：管理节点和工作节点，其中，管理节点用于对工作节点的表分片信息进行管理，工作节点用于接收请求端发送的读写请求，并根据读写请求对表分片的表数据进行修改。

工作节点在接收到请求端发送的读写请求后，在内存中根据读写请求对表分片的表数据进行修改，得到更新数据，当内存中的数据量达到预设值时，将内存中的更新数据写入自身硬盘中。

当工作节点发生故障时，在该工作节点内存中的数据量未达到预设值的情形下，内存中的更新数据未写入硬盘中，出现内存中更新数据丢失。

发明内容

有鉴于此，本公开提供一种HBase***的故障转移方法，通过在第一工作节点内存中拆分第二工作节点的WAL文件、直接根据经拆分得到的各表分片的WAL文件，确定在故障发生时第二工作节点内存中各表分片的更新数据，将各表分片的更新数据写入第一工作节点的硬盘中，实现了第二工作节点内存中表分片的更新数据的转移和持久化存储，避免了第二工作节点发生故障时内存中数据的丢失。

根据本公开实施例的第一方面，提供了一种HBase***的故障转移方法，应用于所述HBase***中第一工作节点，所述方法包括：

获取所述HBase***中管理节点发送的预写日志***WAL文件，所述WAL文件包括：所述HBase***中第二工作节点发生故障时内部多个表分片的WAL文件；

在自身节点内存中拆分所述WAL文件，得到各所述表分片的WAL文件；

根据所述自身节点内存中各所述表分片的WAL文件，确定在所述故障发生时所述第二工作节点内存中各所述表分片的更新数据；

将各所述表分片的更新数据写入所述自身节点硬盘中。

可选地，所述将各所述表分片的更新数据写入所述自身节点硬盘中，包括：

针对每个所述表分片的更新数据，对所述表分片的更新数据进行格式转换，得到HFile存储格式的数据；

将所述HFile存储格式的数据写入所述自身节点的硬盘中所述表分片的HFile文件中。

可选地，所述方法还包括：

将各所述表分片的更新数据发送给所述HBase***中其他工作节点进行备份。

可选地，所述方法还包括：

在各所述表分片的更新数据写入所述自身节点的硬盘中且备份至所述其他工作节点后，向外提供所述表分片的读写服务。

可选地，所述方法还包括：

在各所述表分片的更新数据写入所述自身节点的硬盘中且备份至所述其他工作节点后，向所述管理节点发送所述表分片的数据转移结束的通知。

根据本公开实施例的第二方面，提供了一种HBase***的故障转移装置，、应用于所述HBase***中第一工作节点，所述装置包括：

获取模块，被配置为获取所述HBase***中管理节点发送的预写日志***WAL文件，所述WAL文件包括：所述HBase***中第二工作节点发生故障时内部多个表分片的WAL文件；

拆分模块，被配置为在自身节点内存中拆分所述WAL文件，得到各所述表分片的WAL文件；

确定模块，被配置为根据所述自身节点内存中各所述表分片的WAL文件，确定在所述故障发生时所述第二工作节点内存中各所述表分片的更新数据；

写入模块，被配置为将各所述表分片的更新数据写入所述自身节点硬盘中。

可选地，所述写入模块，包括：

格式转换子模块，被配置为针对每个所述表分片的更新数据，对所述表分片的更新数据进行格式转换，得到HFile存储格式的数据；

写入子模块，被配置为将所述HFile存储格式的数据写入所述自身节点的硬盘中所述表分片的HFile文件中。

可选地，所述装置还包括：

发送模块，被配置为将各所述表分片的更新数据发送给所述HBase***中其他工作节点进行备份。

可选地，所述装置还包括：

服务模块，被配置为在各所述表分片的更新数据写入所述自身节点的硬盘中且备份至所述其他工作节点后，向外提供所述表分片的读写服务。

可选地，所述装置还包括：

通知模块，被配置为在各所述表分片的更新数据写入所述自身节点的硬盘中且备份至所述其他工作节点后，向所述管理节点发送所述表分片的数据转移结束的通知。

根据本公开实施例的第三方面，提供了一种非临时性计算机可读存储介质，其上存储有计算机程序，该程序被处理器执行时实现上述第一方面中任一项所述方法的步骤。

根据本公开实施例的第四方面，提供了一种HBase***的故障转移装置，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

将各所述表分片的更新数据写入所述自身节点硬盘中。

本公开实施例提供的技术方案可以包括以下有益效果：

本公开中，通过获取HBase***中管理节点发送的WAL文件，在自身节点内存中拆分WAL文件，得到各表分片的WAL文件，并根据自身节点内存中各表分片的WAL文件，确定在故障发生时第二工作节点内存中各表分片的更新数据，之后将各表分片的更新数据写入自身节点硬盘中，实现了第二工作节点内存中表分片的更新数据的转移和持久化存储，避免了第二工作节点发生故障时内存中数据的丢失。

本方案仅包括将各表分片的更新数据写入自身节点硬盘中一次写盘操作，读写盘操作的总次数少，读写盘操作的总耗时短，使得本方案具有故障转移速度快、故障恢复时间短、服务可用性高等优点。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本公开。

附图说明

图1是根据一示例性实施例示出的一种HBase***的故障转移方法流程图；

图2是根据一示例性实施例示出的另一种HBase***的故障转移方法流程图；

图3是根据一示例性实施例示出的另一种HBase***的故障转移方法流程图；

图4是根据一示例性实施例示出的另一种HBase***的故障转移方法流程图；

图5是根据一示例性实施例示出的一种HBase***的故障转移装置框图；

图6是根据一示例性实施例示出的另一种HBase***的故障转移装置框图；

图7是根据一示例性实施例示出的另一种HBase***的故障转移装置框图；

图8是根据一示例性实施例示出的另一种HBase***的故障转移装置框图；

图9是根据一示例性实施例示出的另一种用于HBase***的故障转移装置的一结构示意图。

具体实施方式

这里将详细地对示例性实施例进行说明，其示例表示在附图中。下面的描述涉及附图时，除非另有表示，不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反，它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

在本公开使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本公开。在本公开和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本公开可能采用术语第一、第二、第三等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本公开范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。取决于语境，如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。

本公开提供了一种发送消息的方法，可应用于终端中，该终端具有发送信息的功能，终端可以是手机、平板电脑、个人数字助理等。

图1根据一示例性实施例示出的一种HBase***的故障转移方法流程图，图1所示的方法应用于HBase***中第一工作节点，图1所示的HBase***的故障转移方法包括以下步骤：

在步骤101中，获取HBase***中管理节点发送的WAL(Write-Ahead Logging，预写日志***)文件，WAL文件包括：HBase***中第二工作节点发生故障时内部多个表分片的WAL文件。

HBase***包括管理节点(又称Master)和工作节点(又称Region Server)，管理节点的数量为一个或多个，通常情况下，一个管理节点管理多个工作节点的表分片信息。

表分片是通过划分表得到的，一个表可以划分为多个表分片，在分布式HBase***中，一个表的多个表分片存储在不同工作节点上，一个工作节点可以存有源自多个表的多个表分片。表分片信息有多种，例如表分片的存储地址、表分片的名称、表分片所属的表名称等。

一个工作节点设有一个WAL文件，该WAL文件用于记录工作节点内各表分片内数据的修改日志。工作节点在接收到请求端发送的读写请求后，根据该读写请求在自身节点的WAL文件中生成修改日志，并在内存中基于读写请求对表分片的表数据进行修改，得到表分片的更新数据，将更新数据写入自身硬盘中。工作节点的WAL文件会整体备份到其他设备上，其他设备可以包括HBase***中的其他工作节点。

本申请实施例中，工作节点至少包括第一工作节点和第二工作节点，管理节点对第一工作节点和第二工作节点进行表分片信息管理，其中，第二工作节点为发生故障的工作节点，第一工作节点为用于转移并持久化第二工作节点内表数据的节点。管理节点在确定第二工作节点发生故障后，可以从其他设备中获取该第二工作节点的WAL文件备份，将WAL文件备份发送给第一工作节点。

第一工作节点可以是第二工作节点发生故障时管理服务器临时分配的节点，或者，可以预先建立第一工作节点和第二工作节点的配合关系，当第二工作节点发生故障时，通过查找配合关系，确定与第二工作节点对应的第一工作节点。

在步骤102中，在自身节点内存中拆分WAL文件，得到各表分片的WAL文件。

通常情况下，第二工作节点存有多个表分片，第二工作节点的WAL文件包括多个表分片的WAL文件，第一工作节点在获取第二工作节点的WAL文件后，会对第二工作节点的WAL文件进行拆分，得到多个表分片的WAL文件。

拆分WAL文件的方式有多种，例如，不同表分片的WAL文件配置的标识不同，可以通过识别WAL文件配置的标识，从第二工作节点的WAL文件中，拆分出不同表分片的WAL文件。使用的标识有多种，例如，WAL文件名称、WAL文件编号、表分片属于的表名称等。

在步骤103中，根据自身节点内存中各表分片的WAL文件，确定在故障发生时第二工作节点内存中各表分片的更新数据。

第一工作节点在内存中完成WAL文件拆分，得到各表分片的WAL文件后，根据自身节点内存中各表分片的WAL文件，确定在故障发生时第二工作节点内存中各表分片的更新数据。在第一工作节点内存中得到的多个表分片的WAL文件不被写入第一工作节点硬盘中，而是直接在第一工作节点内存中被读取使用。

实现中，针对每个表分片，可以根据表分片的WAL文件中的修改日志，在内存中重新执行一遍该表分片的修改过程，执行结束后，得到在故障发生时第二工作节点内存中该表分片的更新数据。

在步骤104中，将各表分片的更新数据写入自身节点硬盘中。

第一工作节点确定在故障发生时第二工作节点内存中各表分片的更新数据之后，将各表分片的更新数据写入自身节点硬盘中，从而实现了第二工作节点内存中表分片的更新数据的转移和持久化存储，避免了第二工作节点发生故障时内存中数据的丢失。

本实施例提供的方案仅包括将各表分片的更新数据写入自身节点硬盘中一次写盘操作，读写盘操作的总次数少，读写盘操作的总耗时短，使得本方案具有故障转移速度快、故障恢复时间短、服务可用性高等优点。

在一个可选的实施例中，参照图2是根据一示例性实施例示出的另一种HBase***的故障转移方法流程图，将本步骤可以通过以下方式实现：在步骤1041中，针对每个表分片的更新数据，对表分片的更新数据进行格式转换，得到HFile存储格式的数据；在步骤1042中，将HFile存储格式的数据写入自身节点的硬盘中表分片的HFile文件中。

针对步骤1041，硬盘中数据存储在HFile文件中，HFile文件的数据格式为HFile存储格式。在数据写入硬盘之前，需要将数据进行格式转换，得到HFile存储格式的数据。

针对步骤1042，HFile为HBase中的数据文件，拥有自己的数据存储格式。

硬盘中表分片的HFile文件的来源多种，例如，硬盘中原有的文件，或者，根据HFile存储格式的数据新生成的文件。

当HFile文件是硬盘中原有的文件时，步骤1042的实现方式有多种，例如，第一种方式：基于表分片的更新数据得到的HFile格式的数据可以携带该表分片的标识，硬盘中该表分片的HFile文件可以携带该表分片的标识，可以通过匹配HFile格式的数据携带的标识和硬盘中HFile文件携带的标识，查找携带相同标识的HFile文件，将该HFile格式的数据写入携带相同标识的HFile文件中。

又如，第二种方式：第一工作节点通过管理节点获取第二工作节点中该表分片的HFile文件的存储地址，之后根据该存储地址，将该表分片的HFile格式的数据存储至硬盘中该表分片的HFile文件中。

基于步骤1041和步骤1042的设置，使得工作节点具有对表分片的更新数据进行格式转换，得到HFile存储格式的数据，将HFile存储格式的数据写入自身节点的硬盘中该表分片的HFile文件中的功能，工作节点性能得到提高。

在一个可选的实施例中，第一工作节点可以将步骤103中确定的各表分片的更新数据发送给HBase***中其他工作节点进行备份。

实现中，参照图3是根据一示例性实施例示出的另一种HBase***的故障转移方法流程图，第一工作节点可以在步骤104执行结束后，执行步骤105：将各表分片的更新数据发送给HBase***中其他工作节点进行备份，或者，参照图4是根据一示例性实施例示出的另一种HBase***的故障转移方法流程图，第一工作节点可以在步骤103执行结束后，执行步骤105：将各表分片的更新数据发送给HBase***中其他工作节点进行备份。

基于步骤105的设置，使得第一工作节点具有备份HFile存储格式的数据至其他工作节点的功能，使得在第一工作节点出现故障时，可以从其他工作节点获取第一工作节点内的数据，保证了HBase***的服务可用性。

在使用分布式文件***进行数据管理的情况下，分布式文件***设有多个文件***节点，第一工作节点可以通过配合使用的文件***节点，向其他工作节点发送HFile存储格式的数据。

在一个可选的实施例中，在图3或图4的基础上，所述方法还可以包括：在各表分片的更新数据写入自身节点的硬盘中且备份至其他工作节点后，向外提供表分片的读写服务。

第一工作节点在将HFile存储格式的数据写入自身硬盘中且确定其他工作节点完成备份后，向外提供该表分片的读写服务，从而完成表分片的故障转移，使该表分片处于可用状态。

在使用分布式文件***进行数据管理的情况下，第一工作节点可以接收其他工作节点通过配合使用的文件***节点发送的通知，根据该通知确定其他工作节点完成备份。

在一个可选的实施例中，在图3或图4的基础上，所述方法还包括：在在各表分片的更新数据写入自身节点的硬盘中且备份至其他工作节点后，向管理节点发送表分片的数据转移结束的通知。

管理节点用于对表分片的存储位置等表分片信息进行管理，第一工作节点在将HFile存储格式的数据写入自身硬盘中且确定其他工作节点完成备份后，第一工作节点向管理节点发送表分片的数据转移结束的通知，使得管理节点根据该通知，更改管理节点中该表分片的存储位置等表分片信息。

对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。

其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本公开所必须的。

与前述应用功能实现方法实施例相对应，本公开还提供了应用功能实现装置及相应的终端的实施例。

图5是根据一示例性实施例示出的一种HBase***的故障转移装置框图，应用于HBase***中第一工作节点，所述装置包括：获取模块21、拆分模块22、确定模块23和写入模块24；其中，

所述获取模块21，被配置为获取HBase***中管理节点发送的预写日志***WAL文件，WAL文件包括：HBase***中第二工作节点发生故障时内部多个表分片的WAL文件；

所述拆分模块22，被配置为在自身节点内存中拆分WAL文件，得到各表分片的WAL文件；

所述确定模块23，被配置为根据自身节点内存中各表分片的WAL文件，确定在所述故障发生时所述第二工作节点内存中各所述表分片的更新数据；

所述写入模块24，被配置为将各表分片的更新数据写入自身节点硬盘中。

在一个可选的实施例中，在图5所示的HBase***的故障转移装置的基础上，参照图6，所述写入模块24，可以包括：格式转换子模块241和写入子模块242；其中，

所述格式转换子模块241，被配置为针对每个表分片的更新数据，对表分片的更新数据进行格式转换，得到HFile存储格式的数据；

所述写入子模块242，被配置为将HFile存储格式的数据写入自身节点的硬盘中表分片的HFile文件中。

在一个可选的实施例中，在图5所示的HBase***的故障转移装置的基础上，所述装置还可以包括：发送模块，所述发送模块，被配置为将各表分片的更新数据发送给HBase***中其他工作节点进行备份。

参照图7，发送模块25，可以被配置为在写入模块24将各表分片的更新数据写入自身节点硬盘中后，将各表分片的更新数据发送给HBase***中其他工作节点进行备份。或者，参照图8，发送模块25，可以被配置为在确定模块23确定在故障发生时第二工作节点内存中各表分片的更新数据后，将各表分片的更新数据发送给HBase***中其他工作节点进行备份。

在图5所示的HBase***的故障转移装置的基础上，所述装置还可以包括：发送模块；

所述发送模块，被配置为将各表分片的更新数据发送给HBase***中其他工作节点进行备份。

在一个可选的实施例中，所述装置还可以包括：服务模块；

所述服务模块，被配置为在各表分片的更新数据写入自身节点的硬盘中且备份至其他工作节点后，向外提供表分片的读写服务。

在一个可选的实施例中，所述装置还可以包括：通知模块；

所述通知模块，被配置为在各表分片的更新数据写入自身节点的硬盘中且备份至其他工作节点后，向管理节点发送表分片的数据转移结束的通知。

对于装置实施例而言，由于其基本对应于方法实施例，所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的，其中上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本公开方案的目的。本领域普通技术人员在不付出创造性劳动的情况下，即可以理解并实施。

如图9所示，图9是根据一示例性实施例示出的另一种用于HBase***的故障转移的装置1700的一结构示意图。例如，装置1700可以被提供为一应用服务器。参照图9，装置1700包括处理组件1722，其进一步包括一个或多个处理器，以及由存储器1716所代表的存储器资源，用于存储可由处理部件1722的执行的指令，例如应用程序。存储器1716中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外，处理组件1722被配置为执行指令，以执行上述HBase***的故障转移方法。

装置1700还可以包括一个电源组件1726被配置为执行装置1700的电源管理，一个有线或无线网络接口1750被配置为将装置1700连接到网络，和一个输入输出(I/O)接口1758。装置1700可以操作基于存储在存储器1716的操作***，例如Android、iOS、WindowsServer^TM，Mac OS X^TM，Unix^TM，Linux^TM，FreeBSD^TM或类似。

在示例性实施例中，还提供了一种包括指令的非临时性计算机可读存储介质，例如包括指令的存储器1716，上述指令可由装置1700的处理组件1722执行以完成上述方法。例如，所述非临时性计算机可读存储介质可以是ROM、随机存取存储器(RAM)、CD-ROM、磁带、软盘和光数据存储设备等。

其中，当所述存储器1716中的指令由所述处理组件1722执行时，使得装置1700能够执行一种HBase***的故障转移方法，包括：

将各所述表分片的更新数据写入所述自身节点硬盘中。

本领域技术人员在考虑说明书及实践这里公开的发明后，将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化，这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的，本公开的真正范围和精神由下面的权利要求指出。

应当理解的是，本公开并不局限于上面已经描述并在附图中示出的精确结构，并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。

Claims

1.一种HBase***的故障转移方法，其特征在于，应用于所述HBase***中第一工作节点，所述方法包括：

将各所述表分片的更新数据写入所述自身节点硬盘中。

2.根据权利要求1所述的方法，其特征在于，所述将各所述表分片的更新数据写入所述自身节点硬盘中，包括：

3.根据权利要求1所述的方法，其特征在于，所述方法还包括：

4.根据权利要求3所述的方法，其特征在于，所述方法还包括：

5.根据权利要求3所述的方法，其特征在于，所述方法还包括：

6.一种HBase***的故障转移装置，其特征在于，应用于所述HBase***中第一工作节点，所述装置包括：

7.根据权利要求6所述的装置，其特征在于，所述写入模块，包括：

8.根据权利要求6所述的装置，其特征在于，所述装置还包括：

9.根据权利要求8所述的装置，其特征在于，所述装置还包括：

10.根据权利要求8所述的装置，其特征在于，所述装置还包括：

11.一种非临时性计算机可读存储介质，其上存储有计算机程序，其特征在于，该程序被处理器执行时实现权利要求1～5中任一项所述方法的步骤。

12.一种HBase***的故障转移装置，其特征在于，包括：

处理器；

用于存储处理器可执行指令的存储器；

其中，所述处理器被配置为：

将各所述表分片的更新数据写入所述自身节点硬盘中。