CN107807793B - 分布式计算机存储***中数据副本异构存储与访问方法 - Google Patents

分布式计算机存储***中数据副本异构存储与访问方法 Download PDF

Info

Publication number
CN107807793B
CN107807793B CN201711024532.9A CN201711024532A CN107807793B CN 107807793 B CN107807793 B CN 107807793B CN 201711024532 A CN201711024532 A CN 201711024532A CN 107807793 B CN107807793 B CN 107807793B
Authority
CN
China
Prior art keywords
data
access
node
attribute
data copy
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711024532.9A
Other languages
English (en)
Other versions
CN107807793A (zh
Inventor
***
黄向东
乔嘉林
龙明盛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201711024532.9A priority Critical patent/CN107807793B/zh
Publication of CN107807793A publication Critical patent/CN107807793A/zh
Application granted granted Critical
Publication of CN107807793B publication Critical patent/CN107807793B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0611Improving I/O performance in relation to response time
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/061Improving I/O performance
    • G06F3/0613Improving I/O performance in relation to throughput
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0638Organizing or formatting or addressing of data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/067Distributed or networked storage systems, e.g. storage area networks [SAN], network attached storage [NAS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明涉及一种分布式计算机存储***中数据副本异构存储与访问方法,属于计算机数据管理技术领域。首先根据用户指定的属性优先级和数据副本数n进行属性分配,每个数据副本对应一个存储特征,并根据存储特征创建各个数据副本的存储模型,随后将数据写入到n个数据副本中;在访问请求到来时,解析访问条件,生成访问属性集,计算各个数据副本的访问优先级,找出最佳访问数据副本进行访问。本发明将不同数据副本按照用户访问特点按不同属性排序存储,从而使分布式计算机存储***中数据的多个数据副本能够快速响应用户在数据不同属性上的访问请求,使得多副本技术在提高***可用性的基础上,还提升了***的访问性能。

Description

分布式计算机存储***中数据副本异构存储与访问方法
技术领域
本发明涉及一种分布式计算机存储***中数据副本异构存储与访问方法,属于计算机数据管理技术领域。
背景技术
工业领域需要处理的数据通常具有多个属性,如工业领域风机传感器观测到的数据,每一条数据包含采样时间、设备编号、风速等属性;可移动设备中GPS传感器产生的每一条数据包含采样时间、设备编号、经纬度、高度等属性。用户会对这些数据进行访问,如:访问某个时间段的数据、访问某些设备的数据等。分布式计算机存储***需根据用户的访问请求快速找到所需数据。
在分布式计算机存储***中,为了提高***的性能以及可用性,将数据以多副本的形式进行存储已成为一种共识。多副本技术是指将一份数据复制多份,并将各数据副本分别存放在分布式计算机存储***的不同节点上。当某个(或某些)节点宕机时,会导致相应数据副本无法访问。在此情况下,只要有一份数据副本可以正常访问,分布式计算机存储***就可以正常使用,以此提高***的可用性。现在流行的分布式计算机存储***大多采用了多副本技术,如HDFS,Cassandra,MongoDB,Hbase,Dynamo等。分布式计算机存储***通常有两种架构,P2P对等架构和中心架构,对于这两种架构,在访问请求来临时,处理请求并协调工作的节点称为协调者节点,接收协调者节点请求的为非协调者节点。
在分布式计算机存储***中,数据可以按照表结构进行管理,一个表结构是由若干列组成的。在一个节点内,表中的多行数据会以某列或者某几列的列值进行排序存储,这些列被称为排序列。用户在建表的时候通过指定排序列,就可以间接地控制数据在磁盘上的存储方式(该存储方式也被理解为数据的存储模型),从而得到不同的***读写性能。
目前,计算机的磁盘结构可以被理解为是一维的:即一个数据集在持久化到磁盘上时,会将数据按照某种方式排序,逐一地存储在磁盘上。例如对于时间序列数据,用户可以指定按照时间顺序将数据存储在磁盘上。当处理针对时间的访问时,可以快速找到对应的数据段,避免扫描全部数据。而当处理针对其他属性的访问时,需要对全部数据进行遍历。传统的解决方法是在其他属性上建立索引,以加速在其他属性的访问,但这种方法会增加额外的空间开销。
对于上述问题,传统的多副本技术并没有带来访问能力的提升:多个数据副本在不同节点存储时,各数据副本均按照同一个属性进行排序存储,即具有相同的存储模型。因此,所有数据副本的访问响应能力相同。可见,多副本技术仅仅提升了***可用性,并没有提升分布式计算机存储***在不同属性上的访问速度。
发明内容
本发明的目的是针对现有的分布式计算机存储***只针对单个属性访问较快的问题,提出一种分布式计算机存储***中数据副本异构存储与访问方法,本方法将不同数据副本按照用户访问特点按不同属性排序存储,从而使分布式计算机存储***中数据的多个数据副本能够快速响应用户在数据不同属性上的访问请求,使得多副本技术在提高***可用性的基础上,还提升了***的访问性能。本发明中,由于各个数据副本在相应节点(磁盘)上的存储模型不同,故称作数据副本异构存储。
本发明提出的分布式计算机存储***中数据副本异构存储与访问方法,采用如下技术方案:
记分布式计算机存储***的节点集合为S,其中A是协调者节点,其他n个节点为非协调者节点;***中的数据由k个属性组成,记***中各数据的数据副本数均为n,以上属性均由用户设置;该方法包括以下步骤:
(1)协调者节点A接收客户端请求,判断接收的客户端请求是否为建立数据副本结构请求,若是,则执行步骤(2),否则判断接收的客户端请求是否为数据导入请求,若是,则执行步骤(3),否则执行步骤(4);
(2)建立数据副本结构
(2-1)协调者节点A接收用户指定的各属性的访问优先级,访问优先级范围为从1到n的正整数;访问优先级数值越高,表明对应的属性越被频繁用于做访问条件;对于用户不指定的属性,则默认访问优先级为1;
(2-2)协调者节点A将k个属性按照访问优先级从高到底排序,相同优先级的属性随机排序,排好序的属性列表记为P,P=(p_1,p_2,…,p_i,…,p_k),其中p_i表示按照访问优先级从高到底排序后的第i个属性,1≤i≤k;将属性p_i分配给第(i-1)%n+1个数据副本,其中%为取模符号;将数据副本r分配到的m_r个属性按优先级从高到底排序,r=1,2,…,n,排序后的m_r个属性称为该数据副本r的存储特征,记做Y_r=(y_1,y_2,…,y_m_r);协调者节点A将各个数据副本的存储特征发送给对应的非协调者节点;
(2-3)所有非协调者节点接收存储特征后,根据各自的存储特征分别建立数据副本结构,并保存各自的存储特征;
(2-4)返回步骤(1);
(3)数据导入
(3-1)判断对应的数据副本结构是否建立,若是,则继续执行,否则返回步骤(1);
(3-2)协调者节点A接收到一份数据集后,将接收的数据集按照各非协调者节点的存储模型发送给n个非协调者节点;
(3-3)各非协调者节点对接收的数据集均分别做如下数据副本异构存储处理:首先将接收的数据集中的数据按照y_1属性的值进行排序,若y_1属性的值相等,则按照y_2属性排序,以此类推,直至检索到某一属性值不相等时,则按照该属性值的顺序对接收的数据集中的数据进行排序;该非协调者节点将排序后的数据集进行存储;
(3-4)返回步骤(1);
(4)数据访问
(4-1)判断对应的数据副本结构是否建立,若是,则继续执行,否则返回步骤(1);
(4-2)协调者节点A接收客户端的数据访问请求为同时对数据的多个属性进行过滤,将被同时访问的多个属性构成的集合记做集合Q;
(4-3)最佳访问数据副本选择:协调者节点A计算各个数据副本的访问优先级,对于每个数据副本,协调者节点A首先将数据副本r的访问优先级W_r初始化为0;然后将该数据副本的存储特征内的每个属性y_j依次与集合Q进行判断,如果y_j∈Q,则将该数据副本的属性优先级W_r加2k-j,j=1,2,…,m_r;将访问优先级最大的数据副本作为最佳访问数据副本,如果多个数据副本访问优先级并列第一,则随机选择一个作为最佳数据副本;协调者节点A将数据访问请求发送给最佳访问数据副本所在的非协调者节点R;
(4-4)非协调者节点R接收协调者节点A发送的数据访问请求后,访问自身存储数据副本内的数据并返回访问结果给协调者节点A;
(4-5)协调者节点A返回访问结果给客户端;
(4-6)返回步骤(1)。
本发明提出的分布式计算机存储***中数据副本异构存储与访问方法,其特点是:
本发明首先根据用户指定的属性优先级和数据副本数n进行属性分配,每个数据副本对应一个存储特征,并根据存储特征创建各个数据副本的存储模型,随后将数据写入到n个数据副本中;在对数据的访问请求到来时,解析访问条件,生成访问属性集,计算各个数据副本的访问优先级,找出最佳访问数据副本进行访问后向用户返回结果。
本发明的优点是:
1、本发明将多副本技术的应用价值从提高***可用性扩展到了加速***多样化访问。与传统多副本方法相比,在不引入额外磁盘空间占用的情况下,本发明提供了加速***在数据不同属性的访问性能。如在对风机传感器数据或时空数据进行访问时,可以支持时间、设备号等多个属性的快速访问,如访问某段时间的数据或者访问某些设备的数据。
2、本发明方法在用户导入数据时,允许用户设置常用的访问属性,如时间和设备号是最常用的访问条件。***会自动设计各个数据副本的存储模型,实现对不同数据副本按照不同属性进行排序存储。加速针对数据的不同属性访问。
3、本发明方法在用户执行访问时,快速定位对访问响应最快的数据副本所在节点。
4、本发明方法具有很强的适用性,既可用在P2P对等架构的分布式存储***上,又可以用在中心架构的分布式存储***上。
附图说明
图1是本发明方法的流程框图。
具体实施方式
本发明提出的一种分布式计算机存储***中数据副本异构存储与访问方法,下面结合附图和具体实施例进一步详细说明如下。
记分布式计算机存储***的节点集合为S,其中A是协调者节点,其他节点为非协调者节点;***中的数据由k个属性组成,记***中各数据的数据副本数均为n,以上属性均由用户设置;本实施例中,数据有设备号、时间、经度、纬度、高度共计k=5个属性,共5条数据,如表1所示,各数据均以n=3个数据副本存储;
表1:具有5个属性的GPS数据表
本发明方法的流程框图如图1所示,具体包括以下步骤:
(1)协调者节点A接收客户端请求,判断接收的客户端请求是否为建立数据副本结构请求,若是,则执行步骤(2),否则判断接收的客户端请求是否为数据导入请求,若是,则执行步骤(3),否则执行步骤(4);
本实施例的流程为先建立数据副本结构,再进行数据导入,最后进行数据访问;
(2)建立数据副本结构
(2-1)协调者节点A接收用户指定的各属性的访问优先级,访问优先级范围为从1到n的正整数;其中,n等于数据副本个数;访问优先级数值越高,表明对应的属性越被频繁用于做访问条件;对于用户不指定的属性,则默认访问优先级为1;
本实施例中,用户指定时间、经度、高度属性的访问优先级均为3,设备号、纬度属性的访问优先级均为默认值1;
(2-2)协调者节点A将k个属性按照访问优先级从高到底排序,相同优先级的属性随机排序,排好序的属性列表记为P,P=(p_1,p_2,…,p_i,…,p_k),其中p_i表示按照访问优先级从高到底排序后的第i个属性,1≤i≤k;将属性p_i分配给第(i-1)%n+1个数据副本,其中%为取模符号;将数据副本r分配到的m_r个属性按优先级从高到底排序,r=1,2,…,n,排序后的m_r个属性称为该数据副本r的存储特征,记做Y_r=(y_1,y_2,…,y_m_r);协调者节点A将各个数据副本的存储特征发送给对应的非协调者节点,非协调者节点个数为n;
本实施例中,协调者节点A根据用户指定的属性访问优先级对各属性从高到低排序,得到的属性列表为P=(时间=3,经度=3,高度=3,设备号=1,纬度=1);分配各个属性给对应数据副本,其中,数据副本1分到2个属性(时间=3,设备号=1),数据副本2分到2个属性(经度=3,纬度=1),数据副本3分到1个属性(高度=3),各个数据副本存储特征为Y_1=(时间,设备号),Y_2=(经度,纬度),Y_3=(高度);协调者节点A将三个存储特征发给相应数据副本所在的非协调者节点;
(2-3)所有非协调者节点接收存储特征后,根据各自的存储特征分别建立数据副本结构(如***以表结构组织数据,则创建包含k个属性的表结构,并将(y_1,y_2…,y_m_r)作为排序列),并保存各自的存储特征;
本实施例中,以表结构管理数据,三个数据副本的表结构相同,均包含五个属性(设备号,时间,经度,纬度,高度);存储特征可直接作为排序列,数据副本1的排序列为(时间,设备号),数据副本2的排序列为(经度,纬度),数据副本3的排序列为(高度);
(2-4)返回步骤(1);
(3)数据导入
(3-1)判断对应的数据副本结构是否建立,若是,则继续执行,否则返回步骤(1);
(3-2)协调者节点A接收到一份数据集后,将接收的数据集按照各非协调者节点的存储模型发送给n个非协调者节点;
(3-3)各非协调者节点对接收的数据集均分别做如下数据副本异构存储处理:首先将接收的数据集中的数据按照y_1属性的值进行排序(可选择从低到高或者从高到低排序,下同),若y_1属性的值相等,则按照y_2属性排序,以此类推,直至检索到某一属性值不相等时,则按照该属性值的顺序对接收的数据集中的数据进行排序;该非协调者节点将排序后的数据集进行存储;
本实施例中,协调者节点A将数据按照各非协调者节点的存储模型写入相应数据副本后,各数据副本按照自己的存储特征对数据进行排序;其中,数据副本1的数据存储如表2所示,首先按时间排序,再按设备号排序;数据副本2的数据存储如表3所示,先按经度排序,再按纬度排序;数据副本3的数据存储如表4所示,按高度排序;
表2数据副本1的数据存储表
表3数据副本2的数据存储表
表4数据副本3的数据存储表
(3-4)返回步骤(1);
(4)数据访问
(4-1)判断对应的数据副本结构是否建立,若是,则继续执行,否则返回步骤(1);
(4-2)协调者节点A接收客户端的数据访问请求为同时对数据的多个属性进行过滤,将被同时访问的多个属性构成的集合记做集合Q;
本实施例中,以“访问时间为10且纬度为80的数据的设备号”为例,数据访问请求对两个属性进行过滤,Q={时间,纬度};
(4-3)最佳访问数据副本选择:协调者节点A计算各个数据副本的访问优先级,对于每个数据副本,协调者节点A首先将数据副本r的访问优先级W_r初始化为0;然后将该数据副本的存储特征内的每个属性y_j依次与集合Q进行判断,如果y_j∈Q,则将该数据副本的属性优先级W_r加2k-j,j=1,2,…,m_r;将访问优先级最大的数据副本作为最佳访问数据副本,如果多个数据副本访问优先级并列第一,则随机选择一个作为最佳数据副本;协调者节点A将数据访问请求发送给最佳访问数据副本所在的非协调者节点R;
本实施例中,数据副本1的访问优先级W_1=16,数据副本2的访问优先级W_2=8,数据副本3的访问优先级W_3=0,数据副本1的访问优先级W_1最大,协调者节点A将数据访问请求发送给数据副本1所在的非协调者节点R;
(4-4)非协调者节点R接收协调者节点A发送的数据访问请求后,访问自身存储数据副本内的数据并返回访问结果(可能为空,表示未访问到相应数据)给协调者节点A;
本实施例中,数据副本1所在的非协调者节点R接收协调者节点A发来的数据访问请求,访问出结果,返回设备号1给协调者节点A;
(4-5)协调者节点A返回访问结果给客户端;
(4-6)返回步骤(1)。

Claims (1)

1.一种分布式计算机存储***中数据副本异构存储与访问方法,其特征在于,记分布式计算机存储***的节点集合为S,其中A是协调者节点,其他n个节点为非协调者节点;***中的数据由k个属性组成,记***中各数据的数据副本数均为n,以上属性均由用户设置;该方法包括以下步骤:
(1)协调者节点A接收客户端请求,判断接收的客户端请求是否为建立数据副本结构请求,若是,则执行步骤(2),否则判断接收的客户端请求是否为数据导入请求,若是,则执行步骤(3),否则执行步骤(4);
(2)建立数据副本结构
(2-1)协调者节点A接收用户指定的各属性的访问优先级,访问优先级范围为从1到n的正整数;访问优先级数值越高,表明对应的属性越被频繁用于做访问条件;对于用户不指定的属性,则默认访问优先级为1;
(2-2)协调者节点A将k个属性按照访问优先级从高到底排序,相同优先级的属性随机排序,排好序的属性列表记为P,P=(p_1,p_2,…,p_i,…,p_k),其中p_i表示按照访问优先级从高到底排序后的第i个属性,1≤i≤k;将属性p_i分配给第(i-1)%n+1个数据副本,其中%为取模符号;将数据副本r分配到的m_r个属性按优先级从高到底排序,r=1,2,…,n,排序后的m_r个属性称为该数据副本r的存储特征,记做Y_r=(y_1,y_2,…,y_j,…,y_m_r);协调者节点A将各个数据副本的存储特征发送给对应的非协调者节点;
(2-3)所有非协调者节点接收存储特征后,根据各自的存储特征分别建立数据副本结构,并保存各自的存储特征;
(2-4)返回步骤(1);
(3)数据导入
(3-1)判断对应的数据副本结构是否建立,若是,则继续执行,否则返回步骤(1);
(3-2)协调者节点A接收到一份数据集后,将接收的数据集按照各非协调者节点的存储模型发送给n个非协调者节点;
(3-3)各非协调者节点对接收的数据集均分别做如下数据副本异构存储处理:首先将接收的数据集中的数据按照y_1属性的值进行排序,若y_1属性的值相等,则按照y_2属性排序,以此类推,直至检索到某一属性值不相等时,则按照该属性值的顺序对接收的数据集中的数据进行排序;该非协调者节点将排序后的数据集进行存储;
(3-4)返回步骤(1);
(4)数据访问
(4-1)判断对应的数据副本结构是否建立,若是,则继续执行,否则返回步骤(1);
(4-2)协调者节点A接收客户端的数据访问请求为同时对数据的多个属性进行过滤,将被同时访问的多个属性构成的集合记做集合Q;
(4-3)最佳访问数据副本选择:协调者节点A计算各个数据副本的访问优先级,对于每个数据副本,协调者节点A首先将数据副本r的访问优先级W_r初始化为0;然后将该数据副本的存储特征内的每个属性y_j依次与集合Q进行判断,如果y_j∈Q,则将该数据副本的属性优先级W_r加2k-j,j=1,2,…,m_r;将访问优先级最大的数据副本作为最佳访问数据副本,如果多个数据副本访问优先级并列第一,则随机选择一个作为最佳数据副本;协调者节点A将数据访问请求发送给最佳访问数据副本所在的非协调者节点R;
(4-4)非协调者节点R接收协调者节点A发送的数据访问请求后,访问自身存储数据副本内的数据并返回访问结果给协调者节点A;
(4-5)协调者节点A返回访问结果给客户端;
(4-6)返回步骤(1)。
CN201711024532.9A 2017-10-27 2017-10-27 分布式计算机存储***中数据副本异构存储与访问方法 Active CN107807793B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711024532.9A CN107807793B (zh) 2017-10-27 2017-10-27 分布式计算机存储***中数据副本异构存储与访问方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711024532.9A CN107807793B (zh) 2017-10-27 2017-10-27 分布式计算机存储***中数据副本异构存储与访问方法

Publications (2)

Publication Number Publication Date
CN107807793A CN107807793A (zh) 2018-03-16
CN107807793B true CN107807793B (zh) 2019-11-08

Family

ID=61582890

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711024532.9A Active CN107807793B (zh) 2017-10-27 2017-10-27 分布式计算机存储***中数据副本异构存储与访问方法

Country Status (1)

Country Link
CN (1) CN107807793B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110362426B (zh) * 2019-06-21 2021-07-27 华中科技大学 一种面向突发性负载的选择性副本实现方法及***
CN111290710B (zh) * 2020-01-20 2024-04-05 北京信息科技大学 一种基于动态调整复制因子的云副本存储方法及***
CN117149097B (zh) * 2023-10-31 2024-02-06 苏州元脑智能科技有限公司 一种分布式存储***数据访问控制方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222090A (zh) * 2011-06-02 2011-10-19 清华大学 一种云环境下海量数据资源管理框架
CN103530362A (zh) * 2013-10-12 2014-01-22 清华大学 一种用于多副本分布式***的计算机数据读写方法
CN103986694A (zh) * 2014-04-23 2014-08-13 清华大学 分布式计算机数据存储***中多副本一致性的控制方法
WO2015172478A1 (zh) * 2014-05-15 2015-11-19 中兴通讯股份有限公司 一种分布式存储***中管理异构副本的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102222090A (zh) * 2011-06-02 2011-10-19 清华大学 一种云环境下海量数据资源管理框架
CN103530362A (zh) * 2013-10-12 2014-01-22 清华大学 一种用于多副本分布式***的计算机数据读写方法
CN103986694A (zh) * 2014-04-23 2014-08-13 清华大学 分布式计算机数据存储***中多副本一致性的控制方法
WO2015172478A1 (zh) * 2014-05-15 2015-11-19 中兴通讯股份有限公司 一种分布式存储***中管理异构副本的方法及装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
分布式存储***中用户数据一致性分析及研究;张倩;《中国优秀硕士学位论文全文数据库 信息科技辑》;20160215(第2期);第2-5章 *
大数据应用在云计算平台的优化部署与调度策略研究;徐聪;《中国博士学位论文全文数据库 信息科技辑》;20160715(第7期);第2-5章 *

Also Published As

Publication number Publication date
CN107807793A (zh) 2018-03-16

Similar Documents

Publication Publication Date Title
CN107807793B (zh) 分布式计算机存储***中数据副本异构存储与访问方法
CN109376156B (zh) 读取具有存储感知的混合索引的方法
CN104408163B (zh) 一种数据分级存储方法和装置
CN106155522B (zh) 会话数据处理、知识库建立、优化、交互方法及装置
CN104281701B (zh) 分布式多尺度空间数据查询方法及***
JP2010503117A (ja) 動的フラグメントマッピング
CN105657064B (zh) 基于虚拟节点存储优化的Swift负载均衡方法
CN106599091B (zh) 基于键值存储的rdf图结构存储和索引方法
CN105975587A (zh) 一种高性能的内存数据库索引组织与访问方法
CN104090962A (zh) 面向海量分布式数据库的嵌套查询方法
CN104021223B (zh) 一种集群数据库测点的访问方法及装置
CN109656798A (zh) 基于顶点重排序的超级计算机大数据处理能力测试方法
CN107239680B (zh) 一种对用户登录进行风险评估的方法及装置
Cao et al. A new method to construct the KD tree based on presorted results
CN103324762A (zh) 基于Hadoop的索引创建方法及其索引方法
CN104794237B (zh) 网页信息处理方法及装置
CN108228606A (zh) 数据的写入方法及装置
CN103761298B (zh) 一种基于分布式架构的实体匹配方法
Tanin et al. An efficient nearest neighbor algorithm for P2P settings
CN107730271B (zh) 基于虚拟交互对象的相似用户确定方法、装置及电子设备
CN106126681A (zh) 一种增量式流式数据聚类方法及***
CN109254962A (zh) 一种基于t-树的索引优化方法及装置
CN108932258A (zh) 数据索引处理方法及装置
CN107609089B (zh) 一种数据处理方法、装置及***
Vokorokos et al. Performance optimization of applications based on non-relational databases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant