WO2020228801A1

WO2020228801A1 - 一种多语言融合查询方法及多模数据库***

Info

Publication number: WO2020228801A1
Application number: PCT/CN2020/090393
Authority: WO
Inventors: 周敏奇
Original assignee: 华为技术有限公司
Priority date: 2019-05-15
Filing date: 2020-05-15
Publication date: 2020-11-19
Also published as: CA3137857A1; CN111949650A; US11907216B2; US20220075780A1

Abstract

一种融合查询方法及多模数据库(Multi-Model Database，MMDB)框架，在关系数据库引擎中增加外部引擎的可扩展能力，通过用户表来进行外部扩展引擎的元数据管理，以最大限度的降低对关系数据库引擎的侵入，并实现外部引擎运行时的动态加载和卸载。为用户提供关系数据库、图数据库、时序数据库等多模数据库统一数据访问和维护接口，简化运维和应用开发人员的学习和使用成本，提升数据使用安全性。

Description

一种多语言融合查询方法及多模数据库***

技术领域

本申请涉及数据库领域，更为具体地，涉及一种融合查询方法及多模数据库***。

背景技术

数据库***是许多应用***的核心。传统的数据库***是基于关系模型构建的关系型数据库***，专门用于处理结构化的数据。简单来说，关系模型就是二维表格模型，而一个关系型数据库就是由二维表及其之间的联系所组成的一个数据组织。随着互联网和人工智能化的发展，在结构化数据的基础上，逐步衍生出了半结构化数据，如JSON，XML格式，以及非结构化数据，如文本数据，音视频数据等。结构化数据的典型应用包括银行交易等；而半结构化数据则在用户画像、物联网设备日志采集、应用点击流分析等场景中得到大规模使用；非结构化数据则对应着海量的图片、视频、和文档处理等业务。为了适应各种类型数据的管理需求，很多非关系型的专用数据库***被开发出来，包括XML数据库，图数据库，时序数据库，文档数据库，key-value(KV)数据库等。

当前应用***变的越来越复杂，在很多场景下应用需要同时使用多种类型的数据，比如关系型数据、图、时序数据等，数据库也需要提供相应的计算能力，比如图遍历、图分析、时序计算等。以“平安城市”场景为例，当犯罪案件发生时，警方既需要通过关系型数据库查询犯罪嫌疑人的基本信息，行为记录等，也需要通过图计算引擎和图数据库来分析和查询嫌疑人的同行、同住、通话、社交等关系，进而搜索出和嫌疑人有直接或间接联系的人员。而不同类型数据的存储和管理服务通常分别由不同类型的数据库提供，因此用户需要分别使用多个数据库***，使用过程繁琐，多套独立的数据库***导致***的管理和维护复杂，且需要在数据库之间导入导出数据，增加了数据暴露的风险，数据的一致性也难以保证。

为解决上述问题，现有技术在关系型数据库的基础上，以UDT(user-defined type)的方式加入特定的数据类型，比如JSON类型，Spatial类型等，并通过user-defined function(UDF)的方式增加对类型数据的计算能力。相比于构建一个新的数据库***而言，虽然现有技术方案能够相对快速的扩展新数据类型的处理能力，但受限于原有关系型数据库的表结构，只能扩展一些数据长度较小的数据类型，而对于数据较大的数据类型，比如图数据，很难实现扩展，如果要支持图数据的处理，则要对原有的关系型数据库内核做较大的改造，开发周期长，且无法运行时扩展和卸载新的扩展计算引擎。

发明内容

本申请提供一种融合查询的方法和多模数据库管理***，为用户提供关系数据库、图数据库、时序数据库等多模数据库统一数据访问和维护接口，简化运维和应用开发人员的学习和使用成本，提升数据使用安全性。

第一方面，本申请实施例提供一种数据库***，包括：主计算引擎、一个或多个扩展计算引擎，以及适配器；所述主计算引擎用于，接收来自客户端的融合查询，所述融合查询包括第一类型的查询和第二类型的查询；对所述第一类型的查询进行处理，以得到第一处理结果，并通过第一接口将所述第二类型的查询传递给所述适配器；所述适配器用于，基于所述一个或多个扩展计算引擎的元数据，确定用于处理所述第二类型的查询的第一扩展计算引擎，以及所述第一扩展计算引擎对应的第二接口；通过所述第二接口将所述第二类型的查询传递给所述第一扩展计算引擎；所述第一扩展计算引擎用于，处理所述第二类型的查询以得到第二处理结果，并将所述第二处理结果通过所述适配器返回给所述主计算引擎；所述主计算引擎还用于，根据所述第一处理结果和所述第二处理结果，生成查询结果，并将所述查询结果返回给所述客户端。

在一种可能的实现方式中，所述第一扩展计算引擎将所述第二类型的查询转化为第一类型的查询，并将转化后的查询发送给所述主计算引擎；所述主计算引擎处理所述转化后的查询，以得到查询结果。

在一种可能的实现方式中，所述第一类型的查询为SQL查询，所述第二类型的查询为图查询、时序查询或近似查询。

在一种可能的实现方式中，所述第二类型的查询通过用户定义函数UDF定义。

在一种可能的实现方式中，所述第一接口包括至少一个钩子函数；所述至少一个钩子函数与所述UDF关联。

在一种可能的实现方式中，所述元数据包括：所述多模数据库管理***支持的扩展计算引擎的信息。

在一种可能的实现方式中，所述扩展计算引擎的信息包括：所述扩展计算引擎的类型、所述扩展计算引擎的一个或多个实例所在的服务器的地址，以及所述扩展计算引擎所对应的接口信息；所述适配器具体用于，查询所述元数据以确定所述第一扩展计算引擎的第一引擎实例，以及所述第一引擎实例所对应的接口，通过所述第一引擎实例所对应的所述接口将所述第二类型的查询传递给所述第一引擎实例以进行处理。

在一种可能的实现方式中，所述元数据存储在所述多模数据库管理***的用户表中。

在一种可能的实现方式中，所述主计算引擎为结构化查询语言SQL引擎，所述一个或多个扩展计算引擎包括图计算引擎、时序引擎或近似查询引擎中的至少一个。

在一种可能的实现方式中，所述第一类型的查询为结构化查询语句，所述第二类型的查询为图查询语句，所述第一扩展计算引擎为图计算引擎。

第二方面，本申请实施例提供一种融合查询方法，可应用于多模数据库管理***中，该方法包括：数据库管理器***接收客户端提交的融合查询，所述融合查询包括第一类型的查询和第二类型的查询；通过主计算引擎对所述第一类型的查询进行处理，以得到第一处理结果；基于元数据，确定用于处理所述第二类型的查询的第一扩展计算引擎，以及所述第一扩展计算引擎对应的接口；通过所述接口将所述第二类型的查询传递给所述第一扩展计算引擎；所述第一扩展计算引擎对所述第二类型的查询进行处理以得到第二处理结果，所述主计算引擎通过所述接口接收所述第二处理结果，根据所述第一处理结果和所述第二处理结果，生成查询结果，并将所述查询结果返回给所述客户端。

第三方面，本申请实施例提供一种数据库服务器，包括用于执行上述第一方面或第一方面的任一实现方式所描述的多模数据库管理***的一个或多个功能单元，这些功能单元可以由软件模块实现，或者由硬件，比如处理器实现，或者由软件结合必要的硬件实现。

第四方面，本申请实施例提供一种数据库服务器，包括存储器、处理器以及存储在所述存储器上的计算机程序，当所述处理器执行所述计算机程序时实现上述第一方面或第一方面的任一实现方式所描述的多模数据库管理***的功能。

第五方面，本申请实施例提供一种计算机可读存储介质，其上存储有计算机程序(指令)，该程序(指令)被处理器执行时实现上述第一方面或第一方面的任一实现方式所描述的多模数据库管理***的功能。

附图说明

为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍。

图1是本申请实施例提供的一种数据库***的架构图。

图2是本申请实施例的数据库管理***的结构示意图。

图3是本申请实施例的计算引擎的示意图。

图4是本申请实施例的数据库管理***的工作流程示意图。

图5是本申请实施例的数据库管理***的工作流程示意图。

图6是本申请实施例的数据库管理***的结构示意图。

图7是本申请实施例的数据库管理***的工作流程示意图。

图8是本申请实施例的数据库***的架构图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行详细描述，显然，所描述的实施例是本申请的一部分实施例，而不是全部实施例。

本申请实施例中所涉及的多个，是指两个或两个以上。另外，需要理解的是，在本申请的描述中，“第一”、“第二”等词汇，仅用于区分描述的目的，而不能理解为指示或暗示相对重要性，也不能理解为指示或暗示顺序。

本申请实施例提供的方法可应用于数据库***(Database System)中。图1示出了数据库***的一种典型的逻辑架构，根据图1，数据库***100包括数据库110和数据库管理***(Database Management System，DBMS)130。

其中，数据库110是存储在数据存储器(Data Storage)120中的有组织的数据集合，即按照特定的数据模型组织、存储和使用的相关联的数据集合。根据组织数据所使用的数据模型的不同，数据可分为多种类型，比如关系型数据(relational data)、图(graph)数据、时序(time series)数据等。关系型数据是使用关系模型建模的数据，通常表示为表，表中的行表示一个对象或实体的相关值的集合。图数据，简称为“图”，用于表示对象或实体之间的关系，比如社交关系。时间序列数据，简称时序数据，是按时间顺序记录和索引的数据列，用于描述一个对象在时间维度上的状态变化信息。

数据库管理***130是数据库***的核心，是用于组织、存储以及维护数据的***软件。客户端200可以通过数据库管理***130访问数据库110，数据库管理员也通过数据库管理***进行数据库的维护工作。数据库管理***130提供多种功能，供客户端200建立，修改和查询数据库，其中，客户端200可以为应用程序，或者用户设备。数据库管理***130所提供的功能可以包括但不限于以下几项：(1)数据定义功能，数据库管理***130提供数据定义语言(Data Definition Language，DDL)来定义数据库110的结构，DDL用于刻画数据库框架，并可以被保存在数据字典中；(2)数据存取功能，数据库管理***130提供数据操纵语言(Data Manipulation Language，DML)，实现对数据库110的基本存取操作，比如检索、***、修改和删除；(3)数据库运行管理功能，数据库管理***130提供数据控制功能对数据库110运行进行有效地控制和管理，以确保数据正确有效；(4)数据库的建立和维护功能，包括数据库初始数据的载入，数据库的转储、恢复、重组织，***性能监视、分析等功能；(5)数据库的传输，数据库管理***提供处理数据的传输，以实现客户端与数据库管理***之间的通信，通常与操作***协调完成。

数据存储器120包括但不限于固态硬盘(SSD)、磁盘阵列、云存储或其他类型的非瞬态计算机可读存储介质。所属领域的技术人员可以理解一个数据库***可能包括比图1中所示的部件更少或更多的组件，或者包括与图1所示组件不同的组件，图1仅仅示出了与本发明实施例所公开的实现方式更加相关的组件。

本申请实施例提供一种能同时支持多种数据模型(比如关系型、图、键-值、时序等)的多模数据库(multi-model database，MMDB)管理***,以及基于该多模数据库管理***的多语言融合查询方法。其中，方法和装置是基于同一发明构思的，由于方法及装置解决问题的原理相似，因此装置与方法的实施可以相互参见，重复之处不再赘述。

图2示出了本申请实施例的一个多模数据库管理***的示例。根据图2，数据库管理***130包括：存储引擎170、适配器135以及若干个计算引擎(如图2所示的主计算引擎132，以及扩展计算引擎140和150)。计算引擎132、140和150分别为不同类型的计算引擎，每一种类型的计算引擎支持一种类型的查询语言，比如关系型数据库引擎(简称“关系引擎”)支持关系数据模型，用于处理处理关系型查询，比如结构化查询语言(Structured Query Language，SQL)查询；图计算引擎用于处理图查询，比如Gremlin查询；时序引擎用于处于时序查询。计算引擎的主要功能是根据客户端200提交的查询(Query)，生成对应的执行计划，并依照执行计划进行数据操作，以产生查询结果。对于关系型数据库管理***来说，计算引擎主要包括SQL引擎和执行引擎。其中，SQL引擎主要完成SQL查询的解析，查询的重写以及执行计划的生成；执行引擎由操作算子及其相关的执行环境组成。常用的操作算子包括scan,hash join,aggregate等，执行环境主要由执行框架和资源管理器组成。

存储引擎170负责在文件***之上，向计算引擎提供访问数据的接口，同时提供索引管理，运行时的缓存、事务、日志等数据的管理。例如存储引擎170可以将主计算引擎132的执行结果通过物理I/O写入数据存储器120。

在一个实施例中，如图3所示，一个计算引擎包括解析器210，重写器230、优化器 250和执行器270。解析器210用于对输入的查询语句进行词法分析、语法分析、语义分析，输出查询解析树。重写器230用于将查询变换为易于优化的格式，比如通过操作合并、谓词转换等方式来重写查询语句。优化器250用于基于查询代价预估、基于规则或者基于机器学习等方法选择最优执行路径，进而生成执行计划。执行器270用于通过存储引擎读取数据，根据执行计划将数据处理后得到处理结果，并将处理结果返回给客户端。

本申请实施例的数据库管理***130，在主计算引擎132的基础上，还扩展了其它的计算引擎，如计算引擎140和150，原始数据始终以关系型存储，且仅存储一份，在执行查询的过程中主计算引擎132可以动态调用扩展的计算引擎以进行特定处理，以支持多种查询语言的融合查询，且避免了在不同的数据库***之间导入和导出数据，提高了***的安全性。可以理解的是，扩展计算引擎140和150是与主计算引擎132不同类型的计算引擎。比如，主计算引擎132可以为关系型计算引擎，扩展计算引擎140为图引擎，扩展计算引擎150为时序引擎。

参照图2，数据库管理***130接收来自客户端200的查询，将查询传递给主计算引擎132进行处理，并将处理结果返回给客户端200。在一个实施例中，客户端200发起的查询为融合查询，即包含多种查询语言的扩展查询语句。下面给出融合查询的一个示例：

with suspects(cid)as Gremlin(‘

(g.v().has(‘cid1’,‘1111111111’).

outE(‘flight’,‘CA1315’).has(‘time1’,‘2016/7/1’).

outV().

inE(‘call’).has(‘time1’,gt(‘2016/6/24’)).count().gt(3)’)

select photo,phone#,wechatid

from suspects s,citizen c

where c.id＝s.id

以上查询语句是同时包含SQL和图查询的融合查询语句，其中，加粗以及斜体字部分为图查询语句，“select”开头的部分为SQL查询语句。

融合查询的另一个示例如下：

with crossing_traffic_flow(cno int,direction char,agg_traffic int)as

Timeseries(‘

select cno,direction,sum(laneout)-sum(lanein)

from traffic_flow

groupby laneid,timestamp,direction,cno’)

select crossing.add,traffic.cno,sum(laneout)-sum(lanein)

from crossing,ccrossing_traffic_flow traffic

where crossing.cno＝traffic.cno

这是包含时序和SQL的融合查询，其中，加粗以及斜体字部分为图查询语句，“select”开头的部分为SQL查询语句。

传统的数据库管理***只能支持单一类型的查询，无法支持融合查询。本申请实施例的数据库管理***130可以在运行时动态扩展外部计算引擎，以支持由多种类型查询语言构成的融合查询。具体地，数据库管理***130接收到融合查询后，识别出该融合查询包含的第一类型的查询(比如SQL查询)和第二类型的查询(比如图查询)，将第一类型的查询交由主计算引擎132以进行处理，并通过预先配置的一个或多个接口，比如集成在主计算引擎132中的接口142，将第二类型的查询传递给适配器135。适配器135是主计算引擎132和扩展计算引擎140和150之间的桥梁。

元数据(Pseudo Catalog)122用于存储扩展计算引擎的信息，元数据122包括但不限于如下信息中的一项或多项：***当前可用的扩展计算引擎的类型、扩展计算引擎的ID、扩展计算引擎实例所在的服务器的地址、扩展计算引擎的接口信息等。例如，Pseudo Catalog可以包括扩展计算引擎的类型与外部扩展引擎所在服务器的地址之间的映射，以及扩展计算引擎的类型与扩展计算引擎的接口之间的映射。在扩展计算引擎多实例部署的情况下，即同一扩展计算引擎的多个实例分布在多个计算节点上时，Pseudo Catalog还包括外部扩展引擎类型与外部扩展引擎实例的之间的映射。在一个实施例中，数据库管理***可以通过一张或多张用户表的形式来存储上述映射，这样对主计算引擎132的内核修改较小。

在一个实施例中，适配器135基于Pseudo Catalog 122记录的信息，确定出用于处理第二类型的查询的扩展计算引擎140，以及扩展计算引擎140对应的接口，并将第二类型的查询，或者第二类型的查询的参数通过该接口传递给扩展计算引擎140进行处理。扩展计算引擎140处理第二类型的查询后得到处理结果，并通过适配器将该处理结果反馈给主计算引擎132。可以理解的是，扩展计算引擎140也可以在处理第二类型的查询的过程中，通过适配器135返回中间结果给主计算引擎132，主计算引擎132可以基于扩展计算引擎140返回的中间进行查询处理。也就是说，主计算引擎132在处理第一类型的查询时可以参考扩展计算引擎140对第二类型的查询处理的中间结果。

在一个实施例中，适配器135包括公共模块封装器(Common Envelope Wrapper)和外部引擎封装器(Foreign Engine Wrapper)。Common Envelope Wrapper用于实现扩展计算引擎的初始化、启动、终止，实现扩展计算引擎与主计算引擎之间的心跳，握手，异常处理等。Foreign Engine Wrapper为函数的执行过程提供了一些钩子函数，用来向扩展计算引擎传递查询参数等信息，并且在扩展计算引擎的解析器(parser)、重写器(rewriter)、优化器(optimizer)、执行器(executor)等各个组件的处理阶段返回结果给主计算引擎进行相应地处理。

具体地，在一个实施例中，如图4所示，在主计算引擎132的线程启动阶段(InitPostgres)，调用Common Envelope Wrapper，对***表中的Pseudo Catalog进行初始化等操作。在主计算引擎132处理查询的各个阶段，例如parser、rewriter、optimizer和executor等，都加入了钩子函数，实现与扩展计算引擎的交互。例如，主计算引擎132、扩展计算引擎140和150均可以注册钩子函数，每个钩子函数会在特定的条件或事件下被调用，进而实现相应功能，比如传递消息。例如，主计算引擎132可以注册一个或多个钩子函数，在主计算引擎132在处理查询的过程中，会调用注册的钩子函数，该钩子函数触发适配器335确定出一个特定的扩展计算引擎或者扩展计算引擎实例，并确定相关的接口，然后通过对应的接口将信息传递给扩展计算引擎，比如将第二类型的查询相关的信息传递给扩展计算引擎。扩展计算引擎也可以注册一些列钩子函数，在扩展计算引擎处理第二类型的查询的过程中，比如通过图查询解析、重写和优化，进图查询转化为SQL查询后，调用钩子函数，钩子函数进而通过适配器135以及主计算引擎132对应的接口将转化为SQL查询的图查询返回给主计算引擎132，主计算引擎132继续处理该转化为SQL查询的图查询，得到查询结果。在线程结束阶段，再次调用Common Envelope Wrapper，释放资源，清理缓存。

图5示出了数据库管理***130处理包含SQL和图查询的融合查询语句的过程。根据图5，数据库管理***130可以定义一个用户定义函数(user defined function，UDF)，该UDF的入参为图计算引擎支持的图查询语句，返回类型是多条记录的表结果集。融合查询中的图查询可以视为该UDF。该UDF通过调用接口142将图查询语句传递给适配器135，适配器135基于Pseudo Catalog 122记录的扩展计算引擎的元数据，确定图计算引擎340对应的接口152，进而通过调用接口152将图查询语句传递给图计算引擎340以进行处理。

在一个实施例中，图计算引擎340依次对图查询语句进行解析、重写、优化、执行等操作，以得到查询结果。进一步地，图计算引擎340可以通过适配器135将查询结果返回给主计算引擎132。

在另一个实施例中，图计算引擎340在对图查询处理的各个阶段，也可以通过适配器135将中间结果返回给主计算引擎132。例如，图计算引擎340可以通过解析、重写等操作，将图查询转化为SQL查询，然后通过适配器135将转化后的SQL查询传递给主计算引擎(关系型计算引擎)，关系型计算引擎进而对该转化后的SQL查询进行进一步处理，以得到处理结果。

所属领域的技术人员可以理解数据库管理***130可能包括比图2中所示的部件更少或更多的组件，或者包括与图2中所示组件不同的组件，图2仅仅示出了与本发明实施例所公开的实现方式更加相关的组件。例如数据库管理***130包含的扩展计算引擎包括但不限于图2所示的2个，可以为1个，或者多于2个。

图6示出了本申请实施例的另一个数据库管理***的示例。根据图6，数据库管理***230包括SQL引擎330，图计算引擎340、时序引擎350、近似查询引擎360、适配器335和存储引擎370。数据库管理***230支持多种类型的融合查询，比如包含关系查询和图查询的融合查询、包含关系查询和时序查询的融合查询等等。

SQL引擎330接收到融合查询后，识别出融合查询中包含的特定类型的查询，比如图查询、时序查询等。其中，本申请实施例可以通过用户定义函数(UDF)来在SQL查询中扩展其它类型的查询，如图查询、时序查询等。以图5右上角方框中的查询为例，以“Gremlin”开头的斜体部分的语句可以视为一个UDF。UDF通常与特定的接口关联。

在一个实施例中，如图6所示，SQL引擎330包括解析器332、优化器334、执行器336，以及跳转模块338。解析器332用于把SQL查询语句通过词法和语法解析成特定的结构体，比如查询树。优化器334基于规则或基于代价模型生成查询语句对应的最优执行计划。执行器336执行优化器334生成的执行计划，以得到查询结果。

在一个实施例中，跳转模块338包括一系列钩子函数(Hook)，每一个UDF都关联了一个或多个钩子函数。UDF调用其关联的钩子函数，钩子函数进而通过适配器335将信息传递给扩展计算引擎，比如图计算引擎340、时序引擎350和近似查询引擎360中的某一个。同时，扩展计算引擎的处理结果也可以通过适配器335返回给UDF。

在一个实施例中，如图7所示，假设客户端200发起的查询为包含关系查询和图查询的融合查询，图查询对应的UDF会调用其关联的钩子函数，进而通过钩子函数将图查询传递至适配器335。适配器335基于Pseudo Catalog 122记录的扩展计算引擎的元数据，确定用于处理该图查询的扩展计算引擎类型、该类型的扩展计算引擎实例所在的服务器ID，以及该扩展计算引擎实例对应的接口，进而通过该接口将图查询发送给该扩展计算引擎实例进行处理。这里的服务器ID，包括但不限于服务器器IP地址和/或端口号。

在一个实施例中，Pseudo Catalog 122记录的元数据如表1所示：

表1

如图7所示，适配器335接收到图查询后，基于该元数据，确定数据库管理***当前支持的外部引擎包含图计算引擎，然后根据元数据中的foreign_engine_mapping确定可用于处理该图查询的图计算引擎实例，如图计算引擎实例所在服务器的IP地址。进一步地，适配器335根据元数据中的foreign_engine_wrapper信息确定该图计算引擎实例所对应的foreign_engine_wrapper，即接口和相关的钩子函数。最后，适配器335通过确定的接口将图查询发送至图计算引擎实例进行处理，并将处理的中间结果和/或最终结构通过钩子函数返回给SQL引擎330。

图8示出了本申请实施例提供的一种集成了以上实施例描述的多模数据库管理***的数据库***，包括：数据存储器203、数据库管理***200，以及存储在数据存储器203中的数据库201。数据库201包含按照关系型模型组织的数据表。

客户端10通过网络30与数据库管理***200建立通信连接，并向数据库管理***200发送请求或查询(query)，以访问和/或修改数据存储器203中的数据库201，或者导入新的数据至数据库201。数据库管理***200根据接收到的查询，执行相应的操作以生成查询所对应的查询结果，并将查询结果返回给客户端10。

客户端10包括被配置成与数据库管理***200交互的任何类型的设备或应用程序。在一些示例中，客户端10包括一个或多个应用服务器。客户端10发起的查询是使用特定数据库语言描述的，数据库语言包括但不限于：适用于关系型数据库的结构化查询语言(Structured Query Language，SQL)，适用于图数据库的图查询语言(比如Gremlin)，适用于时序数据库(time series database)的时序语言等等。在一个实施例中，客户端10提交的查询是由多种类型查询语言构成的融合查询，比如包含的第一类型的查询(比如SQL查询)和第二类型的查询(比如图查询)的融合查询。

数据库管理***200可以为前述实施例所描述的多模数据库管理***，具体工作过程可以参见前述各个实施例。

数据库管理***200的运行依赖于必要的软硬件环境，包括但不限于硬件层251和操作***255。其中，硬件层251包含操作***255和数据库管理***200运行所需的基本硬件单元，例如，处理器，内存(Memory)、输入/输出(I/O)设备、网络接口控制器(network interface controller，NIC)等。操作***255是管理硬件单元的***软件，可以提供内存管理、线程调度等功能。

数据存储器203可以是硬盘、磁盘、存储阵列、存储服务器、云存储、存储区网络(Storage Area Network，SAN)等非瞬态计算机可读存储介质，与硬件层251所在的计算节点通信连接。或者，数据存储器203也可以集成在硬件层251所在的计算节点，与处理器和I/O设备通过总线或其它内部通信方式交互数据。需要说明的是，本申请实施例中的“计算节点”，是指具备执行数据计算和/或存储所需的硬件资源的实体，比如物理机或数据库服务器等，或者能够调用硬件资源进行计算和/或存储的实体，比如物理机中部署的虚拟机(virtual machine，VM)或容器等。

在一个实施例中，数据库管理***200的功能可以由处理器执行内存中存储的可执行程序来实现。应理解，在本发明的各种实施例中，“可执行程序”应被广泛地解释为包括但不限于：指令，指令集，代码，代码段，子程序，软件模块，应用，软件包，线程，进程，函数，固件，中间件等。

所属领域的技术人员可以理解一个数据库***可能包括比图8中所示的部件更少或更多的组件，或者包括与图8中所示组件不同的组件，图8仅仅示出了与本发明实施例所公开的实现方式更加相关的组件。应理解，在本发明的各种实施例中，“可执行程序”应被广泛地解释为包括但不限于：指令，指令集，代码，代码段，子程序，软件模块，应用，软件包，线程，进程，函数，固件，中间件等。上述实施例描述的方法步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本发明实施例的实上施过程构成任何限定。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以硬件、或者计算机软件和硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能。

Claims

一种多模数据库管理***，其特征在于，包括：主计算引擎、一个或多个扩展计算引擎，以及适配器；

所述主计算引擎用于，接收来自客户端的融合查询，所述融合查询包括第一类型的查询和第二类型的查询；对所述第一类型的查询进行处理，以得到第一处理结果，并通过第一接口将所述第二类型的查询传递给所述适配器；

所述适配器用于，基于所述一个或多个扩展计算引擎的元数据，确定用于处理所述第二类型的查询的第一扩展计算引擎，以及所述第一扩展计算引擎对应的第二接口；通过所述第二接口将所述第二类型的查询传递给所述第一扩展计算引擎；

所述第一扩展计算引擎用于，处理所述第二类型的查询以得到第二处理结果，并将所述第二处理结果通过所述适配器返回给所述主计算引擎；

所述主计算引擎还用于，根据所述第一处理结果和所述第二处理结果，生成查询结果，并将所述查询结果返回给所述客户端。
根据权利要求1所述的多模数据库管理***，其特征在于，所述第二类型的查询通过用户定义函数UDF定义。
根据权利要求2所述的多模数据库管理***，其特征在于，所述第一接口包括至少一个钩子函数；所述至少一个钩子函数与所述UDF关联。
根据权利要求1至3任一项所述的多模数据库管理***，其特征在于，所述元数据包括：所述多模数据库管理***支持的扩展计算引擎的信息。
根据权利要求4所述的多模数据库管理***，其特征在于，所述扩展计算引擎的信息包括：所述扩展计算引擎的类型、所述扩展计算引擎的一个或多个实例所在的服务器的地址，以及所述扩展计算引擎所对应的接口信息。
根据权利要求1至5任一项所述的多模数据库管理***，其特征在于，所述元数据存储在所述多模数据库管理***的用户表中。
根据权利要求1至6任一项所述的多模数据库管理***，其特征在于，所述主计算引擎为结构化查询语言SQL引擎，所述一个或多个扩展计算引擎包括图计算引擎、时序引擎或近似查询引擎中的至少一个。
根据权利要求7所述的多模数据库管理***，其特征在于，所述第一类型的查询为结构化查询语句，所述第二类型的查询为图查询语句，所述第一扩展计算引擎为图计算引擎。
一种数据库服务器，包括处理器、存储器及存储在所述存储器上并可被所述处理器执行的计算机程序，其特征在于，所述处理器执行所述程序时实现权利要求1至8中任一项所述的多模数据库管理***的功能。
一种融合查询方法，其特征在于，包括：

接收客户端提交的融合查询，所述融合查询包括第一类型的查询和第二类型的查询；

通过主计算引擎对所述第一类型的查询进行处理，以得到第一处理结果；

基于元数据，确定用于处理所述第二类型的查询的第一扩展计算引擎，以及所述第一扩展计算引擎对应的接口；

通过所述接口将所述第二类型的查询传递给所述第一扩展计算引擎；

通过所述第一扩展计算引擎对所述第二类型的查询进行处理以得到第二处理结果；

根据所述第一处理结果和所述第二处理结果，生成查询结果，并将所述查询结果返回给所述客户端。
根据权利要求10所述的方法，其特征在于，所述第二类型的查询通过用户定义函数UDF定义。
根据权利要求10或11所述的方法，其特征在于，所述元数据包括：所述多模数据库管理***支持的扩展计算引擎的信息。
根据权利要求10至12任一项所述的方法，其特征在于，所述扩展计算引擎的信息包括：所述扩展计算引擎的类型、所述扩展计算引擎的一个或多个实例所在的服务器的地址，以及所述扩展计算引擎所对应的接口信息；所述适配器具体用于，查询所述元数据以确定所述第一扩展计算引擎的第一引擎实例，以及所述第一引擎实例所对应的接口，通过所述第一引擎实例所对应的所述接口将所述第二类型的查询传递给所述第一引擎实例以进行处理。
根据权利要求10至13任一项所述的方法，其特征在于，所述第一类型的查询为结构化查询语句，所述第二类型的查询为图查询语句，所述第一扩展计算引擎为图计算引擎。