CN103646051A - 一种基于列存储的大数据并行处理***及方法 - Google Patents

一种基于列存储的大数据并行处理***及方法 Download PDF

Info

Publication number
CN103646051A
CN103646051A CN201310616040.4A CN201310616040A CN103646051A CN 103646051 A CN103646051 A CN 103646051A CN 201310616040 A CN201310616040 A CN 201310616040A CN 103646051 A CN103646051 A CN 103646051A
Authority
CN
China
Prior art keywords
sql
data
hbase
subregion
statement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201310616040.4A
Other languages
English (en)
Other versions
CN103646051B (zh
Inventor
郝俊瑞
向智宇
高汉松
唐业祎
郭嘉
许德玮
王静
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wuhan Research Institute of Posts and Telecommunications Co Ltd
Original Assignee
Wuhan Research Institute of Posts and Telecommunications Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Research Institute of Posts and Telecommunications Co Ltd filed Critical Wuhan Research Institute of Posts and Telecommunications Co Ltd
Priority to CN201310616040.4A priority Critical patent/CN103646051B/zh
Publication of CN103646051A publication Critical patent/CN103646051A/zh
Application granted granted Critical
Publication of CN103646051B publication Critical patent/CN103646051B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/221Column-oriented storage; Management thereof

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种基于列存储的大数据并行处理***及方法,涉及大数据处理领域,包括客户端、主控节点和多个数据节点,所述主控节点包括HBase主控制器和SQL主引擎,HBase主控制器负责管理和维护所述数据节点,SQL主引擎负责SQL语句的解析并将SQL语句继续向数据节点进行分发;每个所述数据节点包括HBase分区节点和SQL从引擎,HBase分区节点负责每个数据节点上数据的存储和管理,SQL从引擎负责SQL在该数据节点的解析和执行,主控节点和数据节点均包括HBase表,还分别包括SQL表。本发明适合大规模数据量的环境,提供更完善的结构化关系数据模型的SQL接口。

Description

一种基于列存储的大数据并行处理***及方法
技术领域
本发明涉及大数据处理领域,具体来讲是一种基于列存储的大数据并行处理***及方法。
背景技术
随着移动互联网、智能终端、物联网、云计算以及智慧城市的普及,人们逐渐的进入了“大数据”时代。大数据是规模非常巨大和复杂的数据集,数据量达到PB、EB或ZB的级别后,传统数据库管理工具处理起来面临很多问题,比如说获取、存储、检索和分析等。大数据引发了一些问题,如对数据库高并发读写要求、对海量数据的高效率存储和访问需求、对数据库高可扩展性和高可用性的需求,传统数据库以及数据仓库技术显得力不从心。
Hadoop是一个能够对大量数据进行分布式处理的开源软件框架,Hadoop带来了廉价的处理大数据的能力。Hadoop是一个庞大的生态***,为处理大数据提供了各种工具和平台。在Hadoop生态***中Hive扮演数据仓库的角色,Hive的核心是将结构化查询语言接口转化为MapReduce任务,直接对Hadoop分布式文件***上的保存的文件进行分析,由于文件没有进行结构化的组织,而MapReduce本身非常耗时,因此Hive在性能上通常无法满足用户需求。
HBase是一个高可靠性、高性能、可伸缩的、面向列存储的分布式数据库***,具有非常好的查询性能和扩展性。HBase以表的形式存储数据,表由行和列族组成,每个列族(column family)又有若干列组成;HBase中可以有任意多个表,这由用户决定,如表1所示,为一个HBase表,包括行主键(row key)和列族1,列族1中具有列1和列2。
表1
Figure BDA0000423964980000021
在HBase表中,用行主键(row key)来检索表中的记录。访问HBase表中的行,可以通过三种方式:通过单个主键访问、通过主键的范围访问或者全表扫描;存储时,数据按照行主键的字典序排序存储。HBase的目标就是快速在主机内数十亿行数据中定位所需的数据并访问它。但是HBase的缺点是不能提供结构化语言查询接口。
发明内容
针对现有技术中存在的缺陷,本发明的目的在于提供一种基于列存储的大数据并行处理***及方法,适合大规模数据量的环境,提供更完善的结构化关系数据模型的SQL接口。
为达到以上目的,本发明提供一种基于列存储的大数据并行处理***,包括客户端、主控节点和多个数据节点,所述主控节点包括HBase主控制器和SQL主引擎,HBase主控制器负责管理和维护所述数据节点,SQL主引擎负责SQL语句的解析并将SQL语句继续向数据节点进行分发;每个所述数据节点包括HBase分区节点和SQL从引擎,HBase分区节点负责每个数据节点上数据的存储和管理,SQL从引擎负责SQL在该数据节点的解析和执行,主控节点和数据节点均包括HBase表,还分别包括SQL表。
在上述技术方案的基础上,所述SQL主引擎和SQL从引擎组成并行SQL查询引擎,SQL主引擎和SQL从引擎之间的通信由其内部会话完成。
在上述技术方案的基础上,所述客户端通过主控节点通信来访问***数据。
在上述技术方案的基础上,所述HBase表中的元素是SQL表中元素的映射,其中SQL表的名称不做任何变换映射为HBase表的名称,SQL表中非主键的列映射为HBase中列族中的列,SQL表中的主键列映射为HBase中的行主键。
本发明还提供一种基于列存储的大数据并行处理方法,包括如下步骤:S1.客户端发送一个SQL语句给主控节点;S2.主控节点解析所述SQL语句,判断所述SQL语句是数据定义类型的语句还是数据操作类型的语句,若是数据定义类型的语句,进入S3,若是数据操作类型的语句,进入S4;S3.主控节点对SQL语句解析后,修改元数据信息并存放在列存储的元数据表内;并将SQL语句映射到HBase表,并完成与SQL语句相应的操作;最后,主控节点通知各数据节点重新获取元数据信息;S4.主控节点根据SQL语句的解析结果判断涉及的范围,若涉及索引的查找,则确定索引表的范围;若涉及主表的查找,确定主表的范围;根据所涉及表的确定的范围,得出该SQL语句所涉及分区名字列表以及这些分区对应的分区节点的名字列表,将该SQL语句及分区名字列表逐个发送到对应的分区节点,进入S5;S5.每个数据节点收到该SQL语句及分区名字列表,为SQL语句所涉及的每个分区启动一个线程,每个线程进行SQL语句解析以及对应的查询和计算,执行完成后汇总结果,将结果返回至主控节点;S6.所述主控节点对所有数据节点的结果进行合并操作,合并的结果返回给客户端。
在上述技术方案的基础上,所述数据定义类型语句涉及创建表、创建索引、删除表、删除索引或修改表的处理;所述数据操作类型语句涉及数据***、数据删除、数据查询的处理。
在上述技术方案的基础上,所述S3中,将SQL语句映射到HBase表,映射规则为:所述HBase表中的元素是SQL表中元素的映射,其中SQL表的名称不做任何变换映射为HBase表的名称,SQL表中非主键的列映射为HBase中列族中的列,SQL表中的主键列映射为HBase中的行主键。
在上述技术方案的基础上,所述确定索引表的范围在HBase里表现为主表的主键的一个范围,或者是索引表的主键的范围:<开始值,结束值>;根据这个范围计算出该SQL语句的操作是在哪个分区节点的分区上,计算结果是一系列分区节点的名字列表,以及该分区节点上涉及该SQL语句操作的分区。
在上述技术方案的基础上,所述数据节点将接收到的分区信息记录下来。
本发明的有益效果在于:在低成本的分布式集群上实现列存储的并行查询和分析的数据仓库***,该***通过在HBase这种列存储数据库上提供并行的SQL查询机制,并结构化关系数据模型,不仅可以满足超大规模的的数据处理性能,实现了一种可水平扩展的、完全并行的数据仓库***,还提供了标准的SQL接口,简单易用。
附图说明
图1为本发明基于列存储的大数据并行处理***的分布式架构;
图2为本发明基于列存储的大数据并行处理的方法流程图。
具体实施方式
以下结合附图及实施例对本发明作进一步详细说明。
如图1所示,本发明基于列存储的大数据并行处理***,采用分布式体系架构,包括客户端、主控节点和多个数据节点,每个节点都可用普通的X86体系架构的服务器进行构建,数据节点的数量根据业务需求可以线性扩展。所述主控节点包括HBase主控制器和SQL主引擎,HBase主控制器负责管理和维护所述数据节点,SQL主引擎负责SQL语句的解析,并将SQL语句继续向数据节点进行分发。HBase分区节点负责每个数据节点上数据的存储和管理,SQL从引擎负责SQL在该数据节点的解析和执行,主控节点和数据节点均包括HBase表,还分别包括SQL表。所述客户端通过主控节点通信来访问***数据,或者通过和数据节点通信来访问***数据。所述SQL主引擎和SQL从引擎一起组成了***的并行SQL查询引擎,在本***中,SQL主引擎和SQL从引擎之间的通信由其内部会话完成,不经过HBase的远程调用机制,因此避免了由HBase远程调用机制引起的***超时问题。
本发明SQL主引擎和SQL从引擎负责SQL的解析和计算,SQL的解析和计算采用与底层存储无关的技术,可支持多种存储方式,能够支持完整的SQL语法。SQL引擎采用面向对象的方法来实现各种SQL操作,在各种SQL操作中针对的是抽象表;我们将HBase表继承自抽象表,HBase的表需实现抽象表中定义的各种方法;采用这种设计方法的SQL引擎可以支持各种SQL操作。
为了使HBase存储格式支持关系数据库模型的各种SQL操作,需要将SQL表的元素和HBase表的元素互为映射,本***对于所支持的关系数据库的表结构有约定:所支持的表必须是带有主键的。本发明的***利用下述方法将SQL表中元素的映射为HBase表中的元素:
(1)表名的映射:SQL表的名称不做任何变换映射为HBase表的名称,即映射为HBase的同名字的表。
(2)列名映射:对于SQL表中非主键的列,映射为HBase中列族中的列。
(3)主键列映射:SQL表中的主键列映射为HBase中的行主键(row key)。
如图2所示,为本发明基于列存储的大数据并行处理的方法,包括如下步骤:
S1.客户端发送一个SQL语句给主控节点。
S2.主控节点解析所述SQL语句,判断所述SQL语句是数据定义类型的语句还是数据操作类型的语句,若是数据定义类型的语句,进入S3;若是数据操作类型的语句,进入S4。
S3.如果该SQL语句属于数据定义类型的语句,涉及创建表、创建索引、删除表、删除索引或修改表的处理。首先,主控节点对该SQL语句进行解析,并修改元数据信息,将修改的元数据信息存放在列存储的元数据表表内。然后根据该SQL语句,对HBase表进行相应的操作,利用上述“将SQL表中元素的映射为HBase表中的元素”的规则,将该SQL语句映射到HBase表,并完成与SQL语句相应的操作。最后,主控节点通知各数据节点,各数据节点需要重新获取元数据信息。
S4.如果该SQL语句属于数据操作类型的语句,涉及数据***、数据删除、数据查询等。首先,主控节点根据SQL语句的解析结果判断操作涉及的范围,若涉及索引的查找,则确定索引表的范围;若涉及主表的查找,确定主表的范围。确定的范围在在索引表的主键的范围:<开始值,结束值>;在HBase里表现为主表的主键的一个范围。再根据确定的范围计算出该SQL语句的操作是在哪些分区节点的分区上,得到的结果是一系列分区名字列表,以及该分区对应的分区节点的名字列表。在得到该SQL语句所涉及的分区名字列表后,将该SQL语句及分区名字列表逐个发送到对应的分区节点上。
S5.每个数据节点收到该SQL语句及分区名字列表,首先将发送来的分区信息记录下来,根据该SQL语句所涉及的分区,为每个分区启动一个线程每个线程进行SQL语句解析以及对应的查询和计算操作。执行完成后,该分区节点先将结果汇总,并将结果返回到主控节点。
S6.所述主控节点对所有数据节点的结果进行合并操作,合并的结果返回给客户端。
本发明不局限于上述实施方式,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为本发明的保护范围之内。本说明书中未作详细描述的内容属于本领域专业技术人员公知的现有技术。

Claims (9)

1.一种基于列存储的大数据并行处理***,包括客户端、主控节点和多个数据节点,其特征在于:所述主控节点包括HBase主控制器和SQL主引擎,HBase主控制器负责管理和维护所述数据节点,SQL主引擎负责SQL语句的解析并将SQL语句继续向数据节点进行分发;每个所述数据节点包括HBase分区节点和SQL从引擎,HBase分区节点负责每个数据节点上数据的存储和管理,SQL从引擎负责SQL在该数据节点的解析和执行,主控节点和数据节点均包括HBase表,还分别包括SQL表。
2.如权利要求1所述的基于列存储的大数据并行处理***,其特征在于:所述SQL主引擎和SQL从引擎组成并行SQL查询引擎,SQL主引擎和SQL从引擎之间的通信由其内部会话完成。
3.如权利要求1所述的基于列存储的大数据并行处理***,其特征在于:所述客户端通过主控节点通信来访问***数据。
4.如权利要求1所述的基于列存储的大数据并行处理***,其特征在于:所述HBase表中的元素是SQL表中元素的映射,其中SQL表的名称不做任何变换映射为HBase表的名称,SQL表中非主键的列映射为HBase中列族中的列,SQL表中的主键列映射为HBase中的行主键。
5.一种基于权利要求1所述***的基于列存储的大数据并行处理方法,其特征在于,包括如下步骤:
S1.客户端发送一个SQL语句给主控节点;
S2.主控节点解析所述SQL语句,判断所述SQL语句是数据定义类型的语句还是数据操作类型的语句,若是数据定义类型的语句,进入S3,若是数据操作类型的语句,进入S4;
S3.主控节点对SQL语句解析后,修改元数据信息并存放在列存储的元数据表内;并将SQL语句映射到HBase表,并完成与SQL语句相应的操作;最后,主控节点通知各数据节点重新获取元数据信息;
S4.主控节点根据SQL语句的解析结果判断涉及的范围,若涉及索引的查找,则确定索引表的范围;若涉及主表的查找,确定主表的范围;根据所涉及表的确定的范围,得出该SQL语句所涉及分区名字列表以及这些分区对应的分区节点的名字列表,将该SQL语句及分区名字列表逐个发送到对应的分区节点,进入S5;
S5.每个数据节点收到该SQL语句及分区名字列表,为SQL语句所涉及的每个分区启动一个线程,每个线程进行SQL语句解析以及对应的查询和计算,执行完成后汇总结果,将结果返回至主控节点;
S6.所述主控节点对所有数据节点的结果进行合并操作,合并的结果返回给客户端。
6.如权利要求5所述的基于列存储的大数据并行处理方法,其特征在于:所述数据定义类型语句涉及创建表、创建索引、删除表、删除索引或修改表的处理;所述数据操作类型语句涉及数据***、数据删除、数据查询的处理。
7.如权利要求5所述的基于列存储的大数据并行处理方法,其特征在于:所述S3中,将SQL语句映射到HBase表,映射规则为:所述HBase表中的元素是SQL表中元素的映射,其中SQL表的名称不做任何变换映射为HBase表的名称,SQL表中非主键的列映射为HBase中列族中的列,SQL表中的主键列映射为HBase中的行主键。
8.如权利要求5所述的基于列存储的大数据并行处理方法,其特征在于:所述确定索引表的范围在HBase里表现为主表的主键的一个范围,或者是索引表的主键的范围:<开始值,结束值>;根据这个范围计算出该SQL语句的操作是在哪个分区节点的分区上,计算结果是一系列分区节点的名字列表,以及该分区节点上涉及该SQL语句操作的分区。
9.如权利要求8所述的基于列存储的大数据并行处理方法,其特征在于:所述数据节点将接收到的分区信息记录下来。
CN201310616040.4A 2013-11-27 2013-11-27 一种基于列存储的大数据并行处理***及方法 Active CN103646051B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310616040.4A CN103646051B (zh) 2013-11-27 2013-11-27 一种基于列存储的大数据并行处理***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310616040.4A CN103646051B (zh) 2013-11-27 2013-11-27 一种基于列存储的大数据并行处理***及方法

Publications (2)

Publication Number Publication Date
CN103646051A true CN103646051A (zh) 2014-03-19
CN103646051B CN103646051B (zh) 2017-02-08

Family

ID=50251265

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310616040.4A Active CN103646051B (zh) 2013-11-27 2013-11-27 一种基于列存储的大数据并行处理***及方法

Country Status (1)

Country Link
CN (1) CN103646051B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104462351A (zh) * 2014-12-05 2015-03-25 河海大学 一种面向MapReduce范型的数据查询模型与方法
CN104699839A (zh) * 2015-03-31 2015-06-10 北京奇艺世纪科技有限公司 一种文件查找方法及装置
CN105069149A (zh) * 2015-08-24 2015-11-18 电子科技大学 一种面向结构化列式数据的分布式并行数据导入方法
CN104133858B (zh) * 2014-07-15 2017-08-01 武汉邮电科学研究院 基于列存储的智能双引擎分析***及方法
WO2017161989A1 (zh) * 2016-03-23 2017-09-28 中兴通讯股份有限公司 分布式数据库预处理的方法及装置、计算机存储介质
CN107368477A (zh) * 2016-05-11 2017-11-21 北京京东尚科信息技术有限公司 基于HBase协处理器的类SQL查询的方法和***
CN108319604A (zh) * 2017-01-16 2018-07-24 南京烽火软件科技有限公司 一种hive中大小表关联的优化方法
CN110990430A (zh) * 2019-11-29 2020-04-10 广西电网有限责任公司 一种大规模数据并行处理***
CN112163048A (zh) * 2020-09-23 2021-01-01 常州微亿智造科技有限公司 基于ClickHouse实现OLAP分析的方法、装置
WO2023284473A1 (zh) * 2021-07-14 2023-01-19 腾讯科技(深圳)有限公司 数据管理方法、装置、计算机设备及存储介质
CN116644086A (zh) * 2023-05-24 2023-08-25 上海沄熹科技有限公司 一种基于SST的Insert SQL语句实现方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167254A1 (en) * 2002-03-04 2003-09-04 Hong Su Method and system of valuing transformation between extensible markup language (XML) documents
CN102693310A (zh) * 2012-05-28 2012-09-26 无锡成电科大科技发展有限公司 一种基于关系数据库的资源描述框架查询方法和***
CN103116625A (zh) * 2013-01-31 2013-05-22 重庆大学 一种基于Hadoop的海量RDF数据分布式查询处理方法
CN103246749A (zh) * 2013-05-24 2013-08-14 北京立新盈企信息技术有限公司 面向分布式计算的矩阵数据库***及其查询方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030167254A1 (en) * 2002-03-04 2003-09-04 Hong Su Method and system of valuing transformation between extensible markup language (XML) documents
CN102693310A (zh) * 2012-05-28 2012-09-26 无锡成电科大科技发展有限公司 一种基于关系数据库的资源描述框架查询方法和***
CN103116625A (zh) * 2013-01-31 2013-05-22 重庆大学 一种基于Hadoop的海量RDF数据分布式查询处理方法
CN103246749A (zh) * 2013-05-24 2013-08-14 北京立新盈企信息技术有限公司 面向分布式计算的矩阵数据库***及其查询方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
范建永等: "基于HBase的矢量空间数据分布式存储研究", 《地理与地理信息科学》 *
高汉松等: "基于云计算平台的医疗大数据挖掘平台", 《医学信息学杂志》 *

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104133858B (zh) * 2014-07-15 2017-08-01 武汉邮电科学研究院 基于列存储的智能双引擎分析***及方法
CN104462351B (zh) * 2014-12-05 2018-07-24 河海大学 一种面向MapReduce范型的数据查询模型与方法
CN104462351A (zh) * 2014-12-05 2015-03-25 河海大学 一种面向MapReduce范型的数据查询模型与方法
CN104699839A (zh) * 2015-03-31 2015-06-10 北京奇艺世纪科技有限公司 一种文件查找方法及装置
CN105069149A (zh) * 2015-08-24 2015-11-18 电子科技大学 一种面向结构化列式数据的分布式并行数据导入方法
CN105069149B (zh) * 2015-08-24 2019-03-12 电子科技大学 一种面向结构化列式数据的分布式并行数据导入方法
CN107229628B (zh) * 2016-03-23 2022-02-01 金篆信科有限责任公司 分布式数据库预处理的方法及装置
WO2017161989A1 (zh) * 2016-03-23 2017-09-28 中兴通讯股份有限公司 分布式数据库预处理的方法及装置、计算机存储介质
CN107229628A (zh) * 2016-03-23 2017-10-03 中兴通讯股份有限公司 分布式数据库预处理的方法及装置
CN107368477A (zh) * 2016-05-11 2017-11-21 北京京东尚科信息技术有限公司 基于HBase协处理器的类SQL查询的方法和***
CN108319604A (zh) * 2017-01-16 2018-07-24 南京烽火软件科技有限公司 一种hive中大小表关联的优化方法
CN108319604B (zh) * 2017-01-16 2021-10-19 南京烽火天地通信科技有限公司 一种hive中大小表关联的优化方法
CN110990430A (zh) * 2019-11-29 2020-04-10 广西电网有限责任公司 一种大规模数据并行处理***
CN112163048A (zh) * 2020-09-23 2021-01-01 常州微亿智造科技有限公司 基于ClickHouse实现OLAP分析的方法、装置
WO2023284473A1 (zh) * 2021-07-14 2023-01-19 腾讯科技(深圳)有限公司 数据管理方法、装置、计算机设备及存储介质
CN116644086A (zh) * 2023-05-24 2023-08-25 上海沄熹科技有限公司 一种基于SST的Insert SQL语句实现方法
CN116644086B (zh) * 2023-05-24 2024-02-20 上海沄熹科技有限公司 一种基于SST的Insert SQL语句实现方法

Also Published As

Publication number Publication date
CN103646051B (zh) 2017-02-08

Similar Documents

Publication Publication Date Title
CN103646051A (zh) 一种基于列存储的大数据并行处理***及方法
US10983967B2 (en) Creation of a cumulative schema based on an inferred schema and statistics
Schram et al. MySQL to NoSQL: data modeling challenges in supporting scalability
Moniruzzaman et al. Nosql database: New era of databases for big data analytics-classification, characteristics and comparison
CN110032604B (zh) 数据存储装置、转译装置及数据库访问方法
EP2580691B1 (en) Scalable rendering of large spatial databases
US8732213B2 (en) Scalable analysis platform for semi-structured data
CN105989150B (zh) 一种基于大数据环境的数据查询方法及装置
JP2019194882A (ja) ファーストクラスデータベース要素としての半構造データの実装
CN103246749B (zh) 面向分布式计算的矩阵数据库***及其查询方法
Binani et al. SQL vs. NoSQL vs. NewSQL-a comparative study
CN103440288A (zh) 一种大数据存储方法及装置
CN111221791A (zh) 一种多源异构数据导入数据湖的方法
CN107506464A (zh) 一种基于ES实现HBase二级索引的方法
Bansel et al. Cloud-based NoSQL data migration
US11507555B2 (en) Multi-layered key-value storage
Samwel et al. F1 query: Declarative querying at scale
CN108268614A (zh) 一种森林资源空间数据的分布式管理方法
Pothuganti Big data analytics: Hadoop-Map reduce & NoSQL databases
Ptiček et al. Big data and new data warehousing approaches
CN110019549A (zh) 针对物联网平台的大数据存储***
CN105243063B (zh) 信息推荐的方法和装置
US11030204B2 (en) Scale out data storage and query filtering using data pools
Gašpar et al. Integrating Two Worlds: Relational and NoSQL
Gupta et al. Correlation and comparison of nosql specimen with relational data store

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: 430074, No. 88, postal academy road, Hongshan District, Hubei, Wuhan

Patentee after: Wuhan post and Telecommunications Science Research Institute Co., Ltd.

Address before: 430074, No. 88, postal academy road, Hongshan District, Hubei, Wuhan

Patentee before: Wuhan Inst. of Post & Telecom Science

CP01 Change in the name or title of a patent holder