CN113127438B - 用于存储数据的方法、装置、服务器和介质 - Google Patents

用于存储数据的方法、装置、服务器和介质 Download PDF

Info

Publication number
CN113127438B
CN113127438B CN201911395206.8A CN201911395206A CN113127438B CN 113127438 B CN113127438 B CN 113127438B CN 201911395206 A CN201911395206 A CN 201911395206A CN 113127438 B CN113127438 B CN 113127438B
Authority
CN
China
Prior art keywords
data
migration
metadata
stored
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911395206.8A
Other languages
English (en)
Other versions
CN113127438A (zh
Inventor
施黄骏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN201911395206.8A priority Critical patent/CN113127438B/zh
Publication of CN113127438A publication Critical patent/CN113127438A/zh
Application granted granted Critical
Publication of CN113127438B publication Critical patent/CN113127438B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/214Database migration support
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Retry When Errors Occur (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本公开的实施例公开了用于存储数据的方法、装置、服务器和介质,涉及云计算领域。本公开的一具体实施例包括:响应于扩容策略被触发,确定扩容后用户数据的迁移位置,其中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据;启动将新增数据向原始位置的存入以及迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据;响应于迁移源端数据的存入进度和新增数据的存入进度相同,将未存入的新增数据的存储位置更新为迁移位置。通过同时启动新增数据向原始位置的存入和迁移源端数据向迁移位置的写入,在存入数据的过程中,用户可以正常操作原始位置中的数据,从而在不影响用户操作的前提下,实现了动态扩容。

Description

用于存储数据的方法、装置、服务器和介质
技术领域
本公开的实施例涉及云计算技术领域,具体涉及用于存储数据的方法、装置、服务器和介质。
背景技术
在云数据存储领域,为了应对海量数据的存储和处理,一般采用分库分表或是联邦的方案。但由于这两种方案都没有考虑到数据的变化过程,当用户数据增长规模与预期不符的时候,就会导致相关技术中存在如下缺陷:一方面在无法预知用户数据大小的情况下,使用固定的Hash、分表或分库方案,会导致数据倾斜、部分表过大的情况,从而影响服务器的性能。另一方面,当某个用户体量较大,成为热点的时候,无法实现无损地扩容,且期间内的停写时间与用户体量直接相关,越大用户的停写时间将会越长,造成资源浪费。
发明内容
本公开的实施例提出了用于存储数据的方法和装置。
第一方面,本公开的实施例提供了一种用于存储数据的方法,该方法包括:响应于扩容策略被触发,确定扩容后用户数据的分布位置为迁移位置,其中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据;启动新增数据向原始位置的存入以及迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据;响应于迁移源端数据的存入进度和新增数据的存入进度相同,将未存入的新增数据的存储位置更新为迁移位置。
在一些实施例中,该方法还包括:响应于扩容策略被触发,确定与扩容后的用户数据对应的元数据为动态迁移元数据,动态迁移元数据包括previous信息元数据,previous信息元数据用于表征原始位置;并在确定扩容后用户数据的分布位置为迁移位置之后,对动态迁移元数据执行如下操作:将type元数据的类型设置为迁移中,用于表征用户数据处于迁移状态;增加extend信息元数据,用于表征迁移位置。
在一些实施例中,在将原始位置中的数据确定为迁移源端数据之前,方法还包括:基于extend信息元数据,更新历史数据,使得历史数据中包括迁移位置。
在一些实施例中,该方法还包括:响应于新增数据全部存入迁移位置,执行如下操作:将type元数据类型更新为正常,以表征用户数据处于正常状态;将previous元数据中的内容替换为extend信息元数据中的内容;删除extend信息元数据。
在一些实施例中,该方法还包括:响应于缩容策略被触发,确定缩容后的多个用户数据的分布位置为迁移位置,缩容后的多个用户的数据包括已存入原始位置的多个用户的数据;启动迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据。
第二方面,本公开的实施例提供一种用于存储数据的装置,该装置包括:触发单元,被配置成响应于扩容策略被触发,确定扩容后用户数据的分布位置为迁移位置,其中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据;存储单元,被配置成启动新增数据向原始位置的存入以及迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据;位置更新单元,被配置成响应于迁移源端数据的存入进度和新增数据的存入进度相同,将未存入的新增数据的存储位置更新为迁移位置。
在一些实施例中,该装置还包括元数据处理单元,被配置成:响应于扩容策略被触发,确定与扩容后的用户数据对应的元数据为动态迁移元数据,动态迁移元数据包括previous信息元数据,previous信息元数据用于表征原始位置;并在确定扩容后用户数据的分布位置为迁移位置之后,对动态迁移元数据执行如下操作:将type元数据的类型设置为迁移中,用于表征用户数据处于迁移状态;增加extend信息元数据,用于表征迁移位置。
在一些实施例中,在将原始位置中的数据确定为迁移源端数据之前,存储单元还被配置成:基于extend信息元数据,更新历史数据,使得历史数据中包括迁移位置。
在一些实施例中,元数据处理单元还被配置成:响应于新增数据全部存入迁移位置,执行如下操作:将type元数据类型更新为正常,以表征用户数据处于正常状态;将previous元数据中的内容替换为extend信息元数据中的内容;删除extend信息元数据。
在一些实施例中,触发单元还被配置成:响应于缩容策略被触发,确定缩容后的多个用户数据的分布位置为迁移位置,缩容后的多个用户的数据包括已存入原始位置的多个用户的数据;存储单元还被配置成:启动迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据。
本公开的实施例提供的用于存储数据的方法和装置,通过同时启动新增数据向原始位置的存入和迁移源端数据向迁移位置的存入,在存入数据的过程中,用户可以正常操作原始位置中的数据,从而在不影响用户操作的前提下,实现了动态扩容。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本公开的其它特征、目的和优点将会变得更明显:
图1是本公开的一些实施例可以应用于其中的示例性***架构图;
图2是根据本公开的用于存储数据的方法的一个实施例的流程图;
图3是根据本公开的实施例的用于存储数据的方法的一个应用场景的示意图;
图4是根据本公开的用于存储数据的方法的又一个实施例的流程图;
图5是根据本公开的用于存储数据的装置的一个实施例的结构示意图;
图6是适于用来实现本公开的实施例的电子设备的结构示意图。
具体实施方式
下面结合附图和实施例对本公开作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
图1示出了可以应用本公开的实施例的用于存储数据的方法或用于存储数据的装置的示例性***架构100。
如图1所示,***架构100可以包括终端设备101、102、103,网络104和服务器105。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105通信,以接收或发送数据等。终端设备101、102、103上可以安装有各种云存储数据库的客户端应用。
终端设备101、102、103可以是硬件,也可以是软件。当终端设备101、102、103为硬件时,可以是具有与服务器进行数据交互功能的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、膝上型便携计算机和台式计算机等等。当终端设备101、102、103为软件时,可以安装在上述所列举的电子设备中。其可以实现成例如用来提供分布式服务的多个软件或软件模块,也可以实现成单个软件或软件模块。在此不做具体限定。
服务器105可以是提供数据存储服务的服务器,例如对终端设备101、102、103上传的数据进行存储的数据服务器。数据服务器可以对接收到的用户数据进行存储,并根据接收到的指令对用户的数据进行修改、增删等操作。
需要说明的是,本公开的实施例所提供的用于存储数据的方法可以由服务器105执行。相应地,用于存储数据的装置可以设置于服务器105中。服务器可以是硬件,可以实现成多个服务器组成的分布式服务器集群,也可以实现成单个服务器,其上可以运行有多种数据库软件,如Mysql、Nosql和Newsql。
继续参考图2,示出了根据本公开的用于存储数据的方法的一个实施例的流程200。该用于存储数据的方法,包括以下步骤:
步骤201,响应于扩容策略被触发,确定扩容后用户数据的分布位置为迁移位置。在本实施例中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据。
在本实施例中,用于存储数据的方法的执行主体(例如图1所示的服务器)可以通过有线连接方式或者无线连接方式从用户利用其通信的终端进行数据交互。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
通常,用户通过终端将数据上传到服务器,由服务器上运行的数据库软件按照特定的运算规则为用户的数据分配一定的存储空间,比如一定数目的库或表,用于存储用户的数据。由于每个库或表的容量是有限的,当用户的存储数据量增长到一定程度之后,会影响到数据库的性能。为了避免这种情况,本实施例中可以将扩容策略设置为单表的剩余存储空间小于阈值。
作为示例,假设服务器分配给某一用户数据4个表,每个表的存储空间为1G(Gigabyte,千兆),若单表的剩余存储空间小于0.1G时,会出现性能拐点,此时服务器的读写数据的性能就会下降,因此可以将阈值设定为0.1G,即扩容策略为单表的剩余存储空间小于0.1G。当用户数据的存储量增大到某个表的剩余存储空间小于0.1G时,扩容策略被触发,本实施例的执行主体(如图1所示的服务器105)就会执行扩容操作,从而确定一个存储空间更大的存储位置(例如,可以为扩容后的用户数据分配6个表),即迁移位置,用于存储扩容后的用户数据。相应的,扩容后的用户数据包括已经存入原始位置(例如示例中的4个表)的历史数据和待存入的新增数据。
步骤202,启动新增数据向原始位置的存入以及迁移源端数据向迁移位置的存入。
本实施例中,迁移源端数据为原始位置中的数据,即包括扩容策略触发前已存入的历史数据和扩容策略触发后存入的新增数据,由于迁移源端数据是随着新增数据的存入而实时更新的,因而在此过程中用户对原始位置中的数据的操作都会同步到迁移位置中的数据,保证了原始位置与迁移位置中数据的一致性,从而确保了扩容过程中用户数据处于迁移阶段时,不影响用户对数据的正常操作,例如数据的修改、增添、删除以及范围数据的查询等等。
作为示例,可以通过CDC(change data capture,变化数据捕获)异步模块实现迁移源端数据向迁移地址的存入。由于向迁移位置存入迁移源端数据的同时,又有新增数据存入原始位置,因而迁移源端数据是实时更新的,借助CDC异步模块可以实现对新增数据的捕获,并按照数据的存入时序,将迁移源端数据存入迁移位置,即将历史数据存入迁移位置之后再将新增数据存入迁移位置,可以避免数据迁移造成数据紊乱。
步骤203,响应于迁移源端数据的存入进度和新增数据的存入进度相同,将未存入的新增数据的存储位置更新为迁移位置。
在本实施例中,由于迁移位置的存储空间大于原始位置的存储空间,而数据的读写速度是与存储空间的大小正相关的,因而迁移源端数据的存入速度大于新增数据的存入速度,并且迁移源端数据的存入顺序是与数据的存入时序相关的,存入时间越晚的数据,存入迁移位置的顺序就越靠后。作为示例,执行主体向迁移位置存入迁移源端数据时,会首先存入历史数据,当历史数据全部存入迁移位置后,再将原始位置中的新增数据存入迁移位置。当存入原始位置中的新增数据全部存入迁移位置中时,表示迁移源端数据的存入进度与新增数据的存入进度相同。此时新增数据可以直接存入迁移位置,从而完成了动态扩容的过程。
在本实施例的一些可选的实现方式中,为了进一步确保扩容后的数据与扩容前的数据是一致的,检测到迁移源端数据的存入进度和新增数据的存入进度相同时,对迁移位置和原始位置中的数据进行双向验证,例如可以将两个位置中的数据列表进行对比,得到验证结果为一致后,再将新增数据的存入位置更新为迁移位置。
继续参见图3,图3是根据本实施例的用于存储数据的方法的应用场景的一个示意图。在图3的应用场景中,用户通过终端301将数据上传至服务器302中,由服务器302实现对数据的存储。当用户数据增大至一定程度后,用户再存入新增数据时触发扩容策略,然后服务器302就执行本实施例中的用于存储数据的方法,针对用户数据的预期存储量,确定一个比原始位置的存储空间更大的迁移位置。在继续写入新增数据的同时,对原始位置中的数据进行迁移。当迁移源端数据的存入进度追上新增数据的存入进度时,修改未存入的新增数据的存入位置,使得新增数据直接存入迁移位置,从而实现了动态扩容。
本公开的实施例提供的用于存储数据的方法和装置,通过同时启动新增数据向原始位置的存入和迁移源端数据向迁移位置的写入,在写入新增数据的同时,将已存入的数据迁移至扩容后的存储位置,可以根据用户数据的大小进行动态扩容,且在扩容过程中用户仍然可以正常操作数据,从而实现了自动无感扩容。
进一步参考图4,其示出了用于存储数据的方法的又一个实施例的流程400。该用于存储数据的方法的流程400,包括以下步骤:
步骤401,响应于扩容策略被触发,确定扩容后用户数据的分布位置为迁移位置。本实施例中扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据。
该步骤与前述步骤201相近,此处不再赘述。
步骤402,确定动态迁移元数据。元数据为数据的数据,用于表征数据的各种信息,例如数据的存储位置信息、数据的大小、数据的修改记录等等,每一个数据的信息都对一个元数据。再例如,本实施例中的previous信息元数据表征的就是用户数据的原始位置,包括了扩容策略触发前存储用户数据的库或表的分布信息,执行主体可以根据previous信息元数据定位到原始位置中的用户数据以及将新增的用户数据存入原始位置。
在本实施例中,为了确保扩容过程中用户对数据的正常操作以及数据在存入和迁移过程中的一致性和准确性,需要对相关的元数据进行操作。例如本实施例中的动态迁移元数据可以包括previous信息元数据、type元数据和extend信息元数据,其中type元数据用于表征用户数据正处于迁移中或正常状态,extend信息元数据用于表征用户数据的迁移位置信息,具体的在本实施例中,extend信息元数据中包括了用于存储扩容后用户数据的库或表的分布信息,当用户数据处于正常状态时,不存在迁移位置,因而与用户数据对应的一系列元数据中就不包括extend信息元数据。
步骤403,将type元数据的类型设置为迁移中,用于表征用户数据此时处于迁移状态。
步骤404,增加extend信息元数据,用户数据处于迁移状态时,是将数据从原始位置迁移至迁移位置,因此需要增加表征迁移位置的元数据。在本实施例中,extend信息元数据用于表征用户数据的迁移位置,包括了扩容后存储用户数据的库或表的分布信息。
步骤405,基于extend信息元数据,更新历史数据。由于历史数据在扩容前就已经存入数据库,因此需要在历史数据中写入迁移位置信息。作为示例,可以通过CAS异步模块(compare and swap,比较并替换)从extend元数据中获取迁移位置信息并写入到历史数据中。另外,在本实施例一些可选的实现方式中,借助CAS异步模块,还可以将历史数据与多个元数据进行对比,确保用户数据的一致性和准确性,以避免因用户修改数据,导致数据迁移过程中出现不一致的问题。
步骤406,启动将新增数据向原始位置的存入以及迁移源端数据向迁移位置的存入。此步骤与前述步骤202相近,此处不再赘述。需要说明的是,由于前述步骤404在元数据中增加了表征迁移位置信息的extend信息元数据,因此扩容后的新增数据存入时已经包含有迁移位置信息,如此一来,新增数据与步骤405中更新后的历史数据中迁移位置信息是一致的。
步骤407,响应于迁移源端数据的存入进度和新增数据的存入进度相同,将未存入的新增数据的存储位置更新为迁移位置。此步骤与前述步骤203相近,此处不再赘述。
步骤408,响应于新增数据全部存入迁移位置,将type元数据的类型设置为正常,在本实施例中,通过type元数据表征用户数据的状态,新增数据全部存入迁移位置,表示扩容操作中针对用户数据的处理已经完成,因此,可以将type元数据的类型修改为正常。
步骤409,将previous信息元数据中的内容替换为extend信息元数据中的内容。针对用户数据的操作完成之后,用户数据的存储位置已经变更为迁移位置,因此需要更新previous信息元数据中的内容。
步骤410,删除extend信息元数据,处于正常状态下的用户数据只需要用于表征存储位置的previous信息元数据,因此将extend信息元数据删除。
从图4中可以看出,与图2对应的实施例相比,本实施例中的用于存储数据的方法的流程400体现了扩容过程中对动态元数据的处理。借助元数据,本实施例描述的方案可以实现对扩容过程的监控和对数据的更新,从而提高扩容的可靠性。
在上述实施例的一些可选的实现方式中,还可以进一步包括以下步骤:响应于缩容策略被触发,确定缩容后的多个用户数据的分布位置为迁移位置,缩容后的多个用户的数据包括已存入原始位置的多个用户的数据;启动迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据。上述步骤可以实现数据库的无感缩容,即为存储量较小、占用存储位置较多的多个用户的数据,更合理地分配存储位置,以避免资源浪费。下面结合应用实例进行说明,在无法获知用户数据大小的情况下,服务器会为每个用户分配一定数量的库或表,因此就会出现某些存储量较小的用户占据了较大的存储空间,造成了资源浪费。例如,4个用户的数据占用了6个表,而该4个用户实际的存储量只需要2个表,这就造成了存储空间的浪费。相应地,可以将缩容策略设置为用户个数大于一定数量且用户数据存储量之和小于一定阈值,当服务器定期扫描数据时,触发缩容策略,从而执行上述步骤,将4个用户的数据重新分配至迁移位置,迁移位置包括了2个表的分布信息,在没有改变用户的数量和数据的前提下,避免了资源浪费。
进一步参考图5,作为对上述各图所示方法的实现,本公开提供了一种用于存储数据的装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。
如图5所示,本实施例的用于存储数据的装置500包括:触发单元501,被配置成响应于扩容策略被触发,确定扩容后用户数据的分布位置为迁移位置,其中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据;存储单元502,被配置成启动新增数据向原始位置的存入以及迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据;位置更新单元503,被配置成响应于迁移源端数据的存入进度和新增数据的存入进度相同,将未存入的新增数据的存储位置更新为迁移位置。
在本实施例中,该装置还包括元数据处理单元,被配置成:响应于扩容策略被触发,确定与扩容后的用户数据对应的元数据为动态迁移元数据,动态迁移元数据包括previous信息元数据,previous信息元数据用于表征原始位置;并在确定扩容后用户数据的分布位置为迁移位置之后,对动态迁移元数据执行如下操作:将type元数据的类型设置为迁移中,用于表征用户数据处于迁移状态;增加extend信息元数据,用于表征迁移位置。
在本实施例中,在将原始位置中的数据确定为迁移源端数据之前,存储单元502还被配置成:基于extend信息元数据,更新历史数据,使得历史数据中包括迁移位置。
在本实施例中,元数据处理单元还被配置成:响应于新增数据全部存入迁移位置,执行如下操作:将type元数据类型更新为正常,以表征用户数据处于正常状态;将previous元数据中的内容替换为extend信息元数据中的内容;删除extend信息元数据。
在本实施例中,触发单元501还被配置成:响应于缩容策略被触发,确定缩容后的多个用户数据的分布位置为迁移位置,缩容后的多个用户的数据包括已存入原始位置的多个用户的数据;存储单元502还被配置成:启动迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据。
下面参考图6,其示出了适于用来实现本公开的实施例的电子设备(例如图1中的服务器)600的结构示意图。图6示出的服务器仅仅是一个示例,不应对本公开的实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600可以包括处理装置(例如中央处理器、图形处理器等)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储装置608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有电子设备600操作所需的各种程序和数据。处理装置601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
通常,以下装置可以连接至I/O接口605:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置606;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置607;包括例如磁带、硬盘等的存储装置608;以及通信装置609。通信装置609可以允许电子设备600与其他设备进行无线或有线通信以交换数据。虽然图6示出了具有各种装置的电子设备600,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。图6中示出的每个方框可以代表一个装置,也可以根据需要代表多个装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置609从网络上被下载和安装,或者从存储装置608被安装,或者从ROM 602被安装。在该计算机程序被处理装置601执行时,执行本公开的实施例的方法中限定的上述功能。需要说明的是,本公开的实施例所述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。而在本公开的实施例中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述服务器中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:响应于扩容策略被触发,确定扩容后用户数据的迁移位置,其中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据;启动新增数据向原始位置的存入以及迁移源端数据向迁移位置的存入,其中,迁移源端数据为存储于原始位置中的数据。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的实施例的操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(LAN)或广域网(WAN)——连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开的实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括触发单元、存储单元和位置更新单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,触发单元还可以被描述为“响应于扩容策略被触发,确定扩容后用户数据的迁移位置的单元”。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开的实施例中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开的实施例中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (12)

1.一种用于存储数据的方法,包括:
响应于扩容策略被触发,确定扩容后用户数据的分布位置为迁移位置,其中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据;
启动所述新增数据向所述原始位置的存入以及迁移源端数据向所述迁移位置的存入包括:借助变化数据捕获异步模块实现对新增数据的捕获,并按照数据的存入时序,将迁移源端数据存入迁移位置,即将历史数据存入迁移位置之后再将新增数据存入迁移位置;其中,所述迁移源端数据为存储于所述原始位置中的数据;
响应于所述迁移源端数据的存入进度和所述新增数据的存入进度相同,将未存入的所述新增数据的存储位置更新为所述迁移位置包括:当存入原始位置中的新增数据全部存入迁移位置中时,表示迁移源端数据的存入进度与新增数据的存入进度相同,此时新增数据可以直接存入迁移位置。
2.根据权利要求1所述的方法,其中,还包括:
响应于扩容策略被触发,确定与所述扩容后的用户数据对应的元数据为动态迁移元数据,所述动态迁移元数据包括previous信息元数据,所述previous信息元数据用于表征所述原始位置;
并在确定扩容后用户数据的分布位置为迁移位置之后,对所述动态迁移元数据执行如下操作:
将type元数据的类型设置为迁移中,用于表征所述用户数据处于迁移状态;
增加extend信息元数据,用于表征所述迁移位置。
3.根据权利要求2所述的方法,其中,在将所述原始位置中的数据确定为迁移源端数据之前,所述方法还包括:
基于所述extend信息元数据,更新所述历史数据,使得所述历史数据中包括所述迁移位置。
4.根据权利要求3所述的方法,其中,还包括:
响应于所述新增数据全部存入所述迁移位置,执行如下操作:
将所述type元数据类型更新为正常,以表征所述用户数据处于正常状态;
将所述previous信息元数据中的内容替换为所述extend信息元数据中的内容;
删除所述extend信息元数据。
5.根据权利要求1至4之一所述的方法,还包括:
响应于缩容策略被触发,确定缩容后的多个用户数据的分布位置为迁移位置,缩容后的多个用户的数据包括已存入原始位置的多个用户的数据;
启动迁移源端数据向所述迁移位置的存入,其中,所述迁移源端数据为存储于所述原始位置中的数据。
6.一种用于存储数据的装置,包括:
触发单元,被配置成响应于扩容策略被触发,确定扩容后用户数据的分布位置为迁移位置,其中,扩容后的用户数据包括已存入原始位置的历史数据和待存入的新增数据;
存储单元,被配置成启动所述新增数据向所述原始位置的存入以及迁移源端数据向所述迁移位置的存入,其中,所述迁移源端数据为存储于所述原始位置中的数据;所述存储单元进一步被配置成:借助变化数据捕获异步模块实现对新增数据的捕获,并按照数据的存入时序,将迁移源端数据存入迁移位置,即将历史数据存入迁移位置之后再将新增数据存入迁移位置;
位置更新单元,被配置成响应于所述迁移源端数据的存入进度和所述新增数据的存入进度相同,将未存入的所述新增数据的存储位置更新为所述迁移位置,所述位置更新单元进一步被配置成:当存入原始位置中的新增数据全部存入迁移位置中时,表示迁移源端数据的存入进度与新增数据的存入进度相同,此时新增数据可以直接存入迁移位置。
7.根据权利要求6所述的装置,还包括元数据处理单元,被配置成:
响应于扩容策略被触发,确定与所述扩容后的用户数据对应的元数据为动态迁移元数据,所述动态迁移元数据包括previous信息元数据,所述previous信息元数据用于表征所述原始位置;
并在确定扩容后用户数据的分布位置为迁移位置之后,对所述动态迁移元数据执行如下操作:
将type元数据的类型设置为迁移中,用于表征所述用户数据处于迁移状态;
增加extend信息元数据,用于表征所述迁移位置。
8.根据权利要求7所述的装置,在将所述原始位置中的数据确定为迁移源端数据之前,所述存储单元还被配置成:
基于所述extend信息元数据,更新所述历史数据,使得所述历史数据中包括所述迁移位置。
9.根据权利要求8所述的装置,其中,所述元数据处理单元还被配置成:
响应于所述新增数据全部存入所述迁移位置,执行如下操作:
将所述type元数据类型更新为正常,以表征所述用户数据处于正常状态;
将所述previous信息元数据中的内容替换为所述extend信息元数据中的内容;
删除所述extend信息元数据。
10.根据权利要求6至9之一所述的装置,其中,
所述触发单元还被配置成:响应于缩容策略被触发,确定缩容后的多个用户数据的分布位置为迁移位置,缩容后的多个用户的数据包括已存入原始位置的多个用户的数据;
所述存储单元还被配置成:启动迁移源端数据向所述迁移位置的存入,其中,所述迁移源端数据为存储于所述原始位置中的数据。
11.一种服务器,包括:
一个或多个处理器;
存储装置,其上存储有一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。
12.一种计算机可读介质,其上存储有计算机程序,其中,所述程序被处理器执行时实现如权利要求1-5中任一所述的方法。
CN201911395206.8A 2019-12-30 2019-12-30 用于存储数据的方法、装置、服务器和介质 Active CN113127438B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911395206.8A CN113127438B (zh) 2019-12-30 2019-12-30 用于存储数据的方法、装置、服务器和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911395206.8A CN113127438B (zh) 2019-12-30 2019-12-30 用于存储数据的方法、装置、服务器和介质

Publications (2)

Publication Number Publication Date
CN113127438A CN113127438A (zh) 2021-07-16
CN113127438B true CN113127438B (zh) 2023-07-28

Family

ID=76767684

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911395206.8A Active CN113127438B (zh) 2019-12-30 2019-12-30 用于存储数据的方法、装置、服务器和介质

Country Status (1)

Country Link
CN (1) CN113127438B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113867643A (zh) * 2021-09-29 2021-12-31 北京金山云网络技术有限公司 数据存储方法、装置、设备及存储介质
CN116627349A (zh) * 2023-06-14 2023-08-22 富士胶片(中国)投资有限公司 医疗影像数据的处理方法、装置、设备、介质和计算机程序产品

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200892A (zh) * 2011-04-29 2011-09-28 华中科技大学 一种基于动态raid***的扩容方法
CN106843755A (zh) * 2017-01-04 2017-06-13 北京百度网讯科技有限公司 用于服务器集群的数据均衡方法与装置
CN109857723A (zh) * 2019-01-31 2019-06-07 深圳市迷你玩科技有限公司 基于可扩容数据库集群的动态数据迁移方法及相关设备
WO2019134649A1 (zh) * 2018-01-03 2019-07-11 中兴通讯股份有限公司 一种控制面资源迁移的实现方法、装置及网络功能实体

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7613889B2 (en) * 2004-06-10 2009-11-03 International Business Machines Corporation System, method, and program for determining if write data overlaps source data within a data migration scheme
US9344525B2 (en) * 2013-11-25 2016-05-17 Violin Memory Inc. Method and apparatus for data migration

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102200892A (zh) * 2011-04-29 2011-09-28 华中科技大学 一种基于动态raid***的扩容方法
CN106843755A (zh) * 2017-01-04 2017-06-13 北京百度网讯科技有限公司 用于服务器集群的数据均衡方法与装置
WO2019134649A1 (zh) * 2018-01-03 2019-07-11 中兴通讯股份有限公司 一种控制面资源迁移的实现方法、装置及网络功能实体
CN109857723A (zh) * 2019-01-31 2019-06-07 深圳市迷你玩科技有限公司 基于可扩容数据库集群的动态数据迁移方法及相关设备

Also Published As

Publication number Publication date
CN113127438A (zh) 2021-07-16

Similar Documents

Publication Publication Date Title
US10951702B2 (en) Synchronized content library
CN111309732B (zh) 数据处理方法、装置、介质和计算设备
US9892000B2 (en) Undo changes on a client device
CN106708443B (zh) 数据读写方法及装置
US20140281227A1 (en) Provisioning in heterogenic volume of multiple tiers
US11057465B2 (en) Time-based data placement in a distributed storage system
CN110046175B (zh) 一种缓存更新、数据返回方法及装置
CN106357703B (zh) 集群切换方法与设备
CN113127438B (zh) 用于存储数据的方法、装置、服务器和介质
CN112965945A (zh) 数据存储方法、装置、电子设备及计算机可读介质
KR20220125198A (ko) 데이터의 추가 기록 방법, 장치, 전자 기기, 저장 매체 및 컴퓨터 프로그램매체
CN110990356B (zh) 一种用于逻辑镜像的实时自动扩容方法和***
CN109918381B (zh) 用于存储数据的方法和装置
US20150193311A1 (en) Managing production data
US9588884B2 (en) Systems and methods for in-place reorganization of device storage
CN106156038B (zh) 数据存储方法和装置
CN105808451B (zh) 一种数据缓存方法以及相关装置
CN108205559B (zh) 一种数据管理方法及其设备
JP2016515258A (ja) 最適化ファイル動作のためのファイル集合化
CN113032349A (zh) 数据存储方法、装置、电子设备及计算机可读介质
CN115878042A (zh) 一种数据存储***、数据处理方法及存储介质
US11366613B2 (en) Method and apparatus for writing data
CN111625500B (zh) 文件快照方法及装置、电子设备和存储介质
US8977814B1 (en) Information lifecycle management for binding content
US9880904B2 (en) Supporting multiple backup applications using a single change tracker

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant