CN113127509A - PaaS平台中SQL执行引擎的适配方法及装置 - Google Patents

PaaS平台中SQL执行引擎的适配方法及装置 Download PDF

Info

Publication number
CN113127509A
CN113127509A CN201911413753.4A CN201911413753A CN113127509A CN 113127509 A CN113127509 A CN 113127509A CN 201911413753 A CN201911413753 A CN 201911413753A CN 113127509 A CN113127509 A CN 113127509A
Authority
CN
China
Prior art keywords
sql
execution engine
metadata
information
decision
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911413753.4A
Other languages
English (en)
Other versions
CN113127509B (zh
Inventor
颜涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Chongqing Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Chongqing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Chongqing Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201911413753.4A priority Critical patent/CN113127509B/zh
Publication of CN113127509A publication Critical patent/CN113127509A/zh
Application granted granted Critical
Publication of CN113127509B publication Critical patent/CN113127509B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • G06F16/2433Query languages
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种PaaS平台中SQL执行引擎的适配方法及装置,该方法包括:接收用户输入的SQL语句;对SQL语句进行解析,得到SQL元数据信息;将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;将SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果;将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。通过上述方式,本发明实现了SQL执行引擎的自动适配,用户使用SQL访问PaaS平台数据时,根据用户提交的SQL自动识别并适配最优的SQL引擎,避免人为经验的不确定性,能够保证在PaaS平台中使用最合适的SQL执行引擎执行相应的SQL语句。

Description

PaaS平台中SQL执行引擎的适配方法及装置
技术领域
本发明涉及计算机技术领域,具体涉及一种PaaS平台中SQL执行引擎的适配方法及装置。
背景技术
PaaS(Platform as a Service,平台即服务)平台开放的数据服务底层多是基于hadoop的,其一般的执行流程是用户通过PaaS平台数据服务来访问hadoop的数据,执行计算和存储数据都是在Hadoop上完成。Hadoop上SQL处理引擎较多,主流的有hive、sparkSQL、flink、impala等等。其中,每种SQL处理引擎都有适用于的不同的场景,在擅长的场景下才能发挥最优的效果,在不适合的场景下运行效率和稳定性会大幅下降甚至运行失败。Hadoop平台上使用不合适的SQL引擎运行程序,容易出现运行效率不稳定或者失败的现象,增加业务运维难度。并且,Hadoop平台一般每天都有非常多的程序在运行,大量运行效率不高的程序会造成整个平台计算资源的明显浪费。
现有技术中,技术人员在开发和提交SQL作业的时候,多是依靠技术人员的经验或者根据反复运行测试的结果确定SQL执行引擎。
但是,一方面,通过人工经验判断选择执行引擎,严重依赖技术人员的个人能力,无法保证选择的SQL引擎是最适合业务场景的。另一方面,通过选择不同的SQL引擎进行效率测试后再选择哪个最优的引擎的效率较低,并且在各个SQL引擎上重复运行相同程序测试运行效率会造成平台计算资源的浪费。因此,亟需一种高效的SQL执行引擎的适配方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的PaaS平台中SQL执行引擎的适配方法及装置。
根据本发明的一个方面,提供了一种PaaS平台中SQL执行引擎的适配方法,包括:
接收用户输入的SQL语句;
对SQL语句进行解析,得到SQL元数据信息;
将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;
将SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果;
将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。
可选地,方法进一步包括:
对SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标;
将运行性能指标、SQL元数据信息、表元数据存入历史指标库中。
可选地,SQL选择器包含至少一个具有预测模型的决策单元;
则将SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果具体包括:
将SQL元数据信息和表元数据整合为决策请求,将决策请求提供给至少一个决策单元,以供至少一个决策单元进行决策并输出SQL执行引擎决策结果;
按照投票的方式,从至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
可选地,采用自学习的方式,根据历史指标库中的数据对SQL选择器的预测模型进行训练,或者根据历史指标库中的数据对SQL选择器所包含的决策单元的预测模型进行训练。
可选地,SQL元数据信息包括以下信息中的至少一项:表、字段类型、字段长度、结果字段、排序信息、关联信息、算子类型、***临时表次数;
SQL元数据信息中的关键信息包括以下信息中的至少一项:SQL元数据信息中的表信息、SQL元数据信息中的字段信息、SQL元数据信息中的存储信息。。
根据本发明的另一方面,提供了一种PaaS平台中SQL执行引擎的适配装置,包括:
SQL接收器,用于接收用户输入的SQL语句;
SQL解析器,用于对SQL语句进行解析,得到SQL元数据信息;
表元数据获取器,用于将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;
SQL选择器,接收SQL元数据信息和表元数据并进行处理,输出SQL执行引擎选择结果;
SQL执行器,将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。
可选地,装置进一步包括:
检测模块,用于对SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标;
存储模块,用于将运行性能指标、SQL元数据信息、表元数据存入历史指标库中。
可选地,SQL选择器包含至少一个具有预测模型的决策单元、数据接收单元、决策输出器;
数据接收单元,用于接收SQL元数据和表元数据,将SQL元数据信息和表元数据整合为决策请求,将决策请求提供给至少一个决策单元,以供至少一个决策单元进行决策并输出SQL执行引擎决策结果;
决策输出器,用于按照投票的方式,从至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
可选地,装置进一步包括:
自学习模块,用于采用自学习的方式,根据历史指标库中的数据对SQL选择器的预测模型进行训练,或者根据历史指标库中的数据对SQL选择器所包含的决策单元的预测模型进行训练。
可选地,SQL元数据信息包括以下信息中的至少一项:表、字段类型、字段长度、结果字段、排序信息、关联信息、算子类型、***临时表次数;
SQL元数据信息中的关键信息包括以下信息中的至少一项:SQL元数据信息中的表信息、SQL元数据信息中的字段信息、SQL元数据信息中的存储信息。。
根据本发明的又一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行上述PaaS平台中SQL执行引擎的适配方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如上述PaaS平台中SQL执行引擎的适配方法对应的操作。
根据本发明的PaaS平台中SQL执行引擎的适配方法及装置,该方法包括:接收用户输入的SQL语句;对SQL语句进行解析,得到SQL元数据信息;将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;将SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果;将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。通过上述方式,本发明实现了SQL执行引擎的自动适配,用户使用SQL访问PaaS平台数据时,根据用户提交的SQL自动识别并适配最优的SQL引擎,避免人为经验的不确定性,能够保证在PaaS平台中使用最合适的SQL执行引擎执行相应的SQL语句。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例提供的PaaS平台中SQL执行引擎的适配方法的流程图;
图2示出了本发明另一实施例提供的PaaS平台中SQL执行引擎的适配方法的流程图;
图3示出了本发明实施例提供的PaaS平台中SQL执行引擎的适配装置的结构示意图;
图4示出了本发明实施例中SQL选择器中的流程示意图;
图5示出了本发明实施例中PaaS平台中SQL执行引擎的适配装置的结构示意图;
图6示出了本发明实施例提供的计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本发明的示例性实施例。虽然附图中显示了本发明的示例性实施例,然而应当理解,可以以各种形式实现本发明而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本发明,并且能够将本发明的范围完整的传达给本领域的技术人员。
图1示出了本发明实施例提供的PaaS平台中SQL执行引擎的适配方法的流程图,本实施例中PaaS平台基于Hadoop平台实现,如图1所示,该方法包括以下步骤:
步骤S101,接收用户输入的SQL语句。
平台用户使用SQL访问PaaS平台数据时,需要提交SQL语句。实际应用中,平台用户可以包括程序开发任务、业务分析人员、数据建模人员等等。
步骤S102,对SQL语句进行解析,得到SQL元数据信息。
接收到用户输入的SQL语句之后,对SQL语句进行解析,解析出SQL元数据。
步骤S103,将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据。
然后,将SQL元数据信息匹配Hadoop平台的各个表元数据,提取出SQL元数据信息中的关键信息,构成Hadoop表元数据。
步骤S104,将SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果。
将SQL元数据信息和表元数据输入至SQL选择器中,SQL选择器根据这些数据进行选择判断,选择一个最适合处理SQL语句的SQL执行引擎,得到SQL执行引擎选择结果。
例如,SQL选择器是一个预测模型,通过预测模型对SQL元数据信息和表元数据进行预测判断,输出SQL执行引擎选择结果。
步骤S105,将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。
最终,将SQL语句提供给选择出来的最合适的SQL执行引擎进行执行。
根据本发明实施例所提供的PaaS平台中SQL执行引擎的适配方法,通过对用户输入的SQL语句进行解析,提取出相应的SQL元数据以及Hadoop表元数据,根据这些数据做选择,选择出最适合的SQL执行引擎。该方式提供了一种自动适配SQL执行引擎的方法,在用户使用SQL访问PaaS平台数据时,根据用户提交的SQL自动识别并适配最优的SQL引擎,避免人工经验的不确定性,能够保证在PaaS平台中使用最合适的SQL执行引擎执行相应的SQL语句,进而能够避免运行效率不稳定或者运行失败的问题,降低业务运维难度,也能够避免计算资源的浪费。
图2示出了本发明另一实施例提供的PaaS平台中SQL执行引擎的适配方法的流程图,本实施例中PaaS平台基于Hadoop平台实现,如图2所示,该方法包括以下步骤:
步骤S201,接收用户输入的SQL语句。
平台用户使用SQL访问PaaS平台数据时,需要提交SQL语句。实际应用中,平台用户可以包括程序开发任务、业务分析人员、数据建模人员等等。
步骤S202,对SQL语句进行解析,得到SQL元数据信息。
对SQL语句进行解析,解析出SQL元数据信息,可选地,SQL元数据信息包括以下信息中的至少一项:表、字段类型、字段长度、结果字段、排序信息、关联信息、算子类型、***临时表次数。
SQL语句解析需要获取的详细元数据信息列表举例如下,其中,表一为输入SQL的输入表元数据信息举例。表二为输入SQL的关联元数据信息举例。表三为输入SQL的关键算子元数据信息举例。
表一
Figure BDA0002350648250000071
表二
Figure BDA0002350648250000072
表三
Figure BDA0002350648250000081
步骤S203,将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据。
将SQL元数据信息匹配Hadoop平台的各个表元数据,提取出SQL元数据信息中的关键信息,构成Hadoop表元数据。
可选地,SQL元数据信息中的关键信息包括以下信息中的至少一项:SQL元数据信息中的表信息、SQL元数据信息中的字段信息、SQL元数据信息中的存储信息。构成的表元数据包括以下中的至少一项:表的大小、存储格式、字段类型、长度。
表四为输入SQL的输入表在hadoop平台中的字段元数据信息举例,表五为输入SQL的输入表在hadoop平台中的存储元数据信息举例。
表四
Figure BDA0002350648250000082
表五
Figure BDA0002350648250000091
步骤S204,将SQL元数据信息和表元数据整合为决策请求,将决策请求提供给至少一个决策单元,以供至少一个决策单元进行决策并输出SQL执行引擎决策结果。
本发明实施例中,SQL选择器包含至少一个具有预测模型的决策单元,决策单元的总数量为奇数,并且各个决策单元之间相互独立。将SQL元数据信息和表元数据整合为决策请求,并将决策请求提供给各个决策单元,各个决策单元通过自身的预测模型对接收到的决策请求进行决策判断,各个决策单元都会输出一个SQL执行引擎决策请求。
其中,各个决策单元通过自学习的方式,根据历史指标库中的数据进行预测模型的训练。历史指标库中包括历史运行的SQL元数据信息、历史表元数据、历史SQL运行性能指标。具体地,通过独立的学习模型按照预设周期训练决策单元的预测模型。
步骤S205,按照投票的方式,从至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
然后,再按照投票选举的方式,从各个决策单元输出的SQL执行引擎决策结果中选出最终的结果,也即SQL执行引擎选择结果,该SQL执行引擎选择结果也就是根据SQL元数据和Hadoop表元数据选择出来的最适合运行SQL语句的执行引擎。
步骤S206,将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。
将SQL语句提供给选择出来的最合适的SQL执行进行执行。
步骤S207,对SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标。
对SQL语句在选择出来的最优的SQL执行引擎上运行过程进行监测,得到运行的性能表现指标,运行性能指标具体包括运行时长、消耗CPU、消耗内存等等。
步骤S208,将运行性能指标、SQL元数据信息、表元数据存入历史指标库中。
将运行性能指标、SQL元数据信息以及表元数据,合并一起记录在历史指标库中。根据上述内容,历史指标库中的数据可用于决策单元的预测模型的训练。
表六为SQL执行引擎上运行的性能表现指标举例。
表六
Figure BDA0002350648250000101
根据本发明实施例提供的PaaS平台中SQL执行引擎的适配方法,通过对用户输入的SQL语句进行解析,提取出相应的SQL元数据以及Hadoop表元数据,通过多个决策单元对这些数据做决策,并根据SQL决策结果选择出最适合的SQL执行引擎。该方式提供了一种自动适配SQL执行引擎的方法,在用户使用SQL访问PaaS平台数据时,根据用户提交的SQL自动识别并适配最优的SQL引擎,避免人工经验的不确定性,能够保证在PaaS平台中使用最合适的SQL执行引擎执行相应的SQL语句,进而能够避免运行效率不稳定或者运行失败的问题,降低业务运维难度,也能够避免平台计算资源的浪费。同时,决策单元具有自学习自优化的能力,根据历史指标库中的数据进行自优化,从而能够提升选择的精确性,避免认为模型调优工作量。
图3示出了本发明实施例提供的PaaS平台中SQL执行引擎的适配装置的结构示意图,如图3所示,该装置包括:
SQL接收器31,用于接收用户输入的SQL语句;
SQL解析器32,用于对SQL语句进行解析,得到SQL元数据信息。
该装置首先接收用户提交的SQL语句,提交给SQL解析器解析SQL。解析SQL过程是从用户提交的SQL语句中提取出需要的元数据信息,包含需要查询的表、字段、关联类型、关联字段、排序类型、排序字段、***临时表次数等,作为表元数据获取器和SQL选择器的输入数据。
表元数据获取器33,用于将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据。
表元数据获取器接收SQL将SQL元数据信息中的关键信息从Hadoop平台中提取出来,构成表元数据,作为SQL选择器的输入数据。
SQL选择器34,用于接收SQL元数据信息和表元数据并进行处理,输出SQL执行引擎选择结果。
将SQL解析器解析出的元数据、表元数据获取器获取的表元数据作为输入数据,提交给SQL引擎选择器选出最优SQL引擎。
SQL执行器35,将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。
在一种可选的方式中,SQL选择器34包含决策器、数据接收单元、决策输出器;决策器包含至少一个具有预测模型的决策单元
数据接收单元,用于接收SQL元数据和表元数据,将SQL元数据信息和表元数据整合为决策请求,将决策请求提供给至少一个决策单元,以供至少一个决策单元进行决策并输出SQL执行引擎决策结果。
决策输出器,用于按照投票的方式,从至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
数据接收单元负责接收提交的SQL元数据和hadoop平台的表元数据,并将这两个数据整合为一个完整的决策请求提交给决策器。决策器由一组奇数个独立的决策单元组成,分别对数据接收单元提交的决策请求进行决策判断,并输出最优SQL执行引擎给决策输出器。决策输出器在接收到各个决策单元的输出结果后,按照投票选举的方式,选出最终的结果,即最优SQL执行引擎。
图4示出了本发明实施例中SQL选择器中的流程示意图,如图4所示,先接收SQL元数据和Hadoop表元数据,然后将接收到的SQL元数据和Hadoop表元数据整合为决策请求发送给决策单元1、决策单元2、决策单元3、决策单元4……,各个决策单元的输出结果被提供给决策输出器,决策输出器输出最终选择的最优的SQL执行引擎选择结果。
在一种可选的方式中,上述装置还包括:检测模块,用于对SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标;存储模块,用于将运行性能指标、SQL元数据信息、表元数据存入历史指标库中。
图5示出了本发明实施例中PaaS平台中SQL执行引擎的适配装置的结构示意图,如图5所示,该装置包括:SQL接收器、SQL解析器、Hadoop表元数据获取器、SQL执行引擎选择器、SQL提交执行器、SQL选择自学习器、历史SQL运行指标库。
其中,SQL接收器接收用户提交的SQL语句,提交给SQL解析器解析SQL,提取出SQL元数据信息,作为Hadoop表元数据获取器和SQL执行引擎选择器的输入数据。Hadoop表元数据获取器将SQL元数据信息匹配Hadoop平台中各个表元数据,获得SQL元数据中的关键信息构成Hadoop表元数据,也作为SQL执行引擎选择器的输入数据。
然后,将SQL解析器解析出的元数据、hadoop平台表元数据获取器获取的表元数据作为输入数据,提交给SQL执行引擎选择器选出最优SQL引擎。SQL执行引擎选择器又包括数据接收单元、决策器、决策输出器。具体实现过程如下:
数据接收单元负责接收提交的SQL元数据和hadoop平台的表元数据,并将这两个数据整合为一个完整的决策请求提交给决策器。
决策器由一组奇数个独立的决策单元组成,分别对数据接收单元提交的决策请求进行决策判断,并输出最优SQL执行引擎决策结果给决策输出器。
决策输出器在接收到各个决策单元的输出结果后,按照投票选举的方式,选出最终的结果,即最优SQL执行引擎。
其中,SQL引擎选择自学习器为SQL执行引擎选择器中的各个决策单元提供决策支撑,是决策单元的大脑。每个决策单元独立的一套算法模型,每天进行自动学习,不断积累和提升决策准确度。
决策单元自学习具体指的是从历史SQL运行指标库中获取各个历史运行的SQL元数据、表元数据、历史SQL运行性能指标,通过独立的学习模型每天进行决策计算训练。
最终,SQL提交执行器将SQL语句提交给选择出来的SQL执行引擎,如hive、spark、flink、impala等等。
本发明实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的PaaS平台中SQL执行引擎的适配方法。
可执行指令具体可以用于使得处理器执行以下操作:
接收用户输入的SQL语句;
对SQL语句进行解析,得到SQL元数据信息;
将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;
将SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果;
将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
对SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标;
将运行性能指标、SQL元数据信息、表元数据存入历史指标库中。
在一种可选的方式中,SQL选择器包含至少一个具有预测模型的决策单元,所述可执行指令使所述处理器执行以下操作:
将SQL元数据信息和表元数据整合为决策请求,将决策请求提供给至少一个决策单元,以供至少一个决策单元进行决策并输出SQL执行引擎决策结果;
按照投票的方式,从至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
在一种可选的方式中,所述可执行指令使所述处理器执行以下操作:
采用自学习的方式,根据历史指标库中的数据对SQL选择器的预测模型进行训练,或者根据历史指标数据库中的数据对SQL选择器所包含的决策单元的预测模型进行训练。
在一种可选的方式中,SQL元数据信息包括以下信息中的至少一项:表、字段类型、字段长度、结果字段、排序信息、关联信息、算子类型、***临时表次数;
SQL元数据信息中的关键信息包括以下信息中的至少一项:SQL元数据信息中的表信息、SQL元数据信息中的字段信息、SQL元数据信息中的存储信息。
图6示出了本发明计算设备实施例的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图6所示,该计算设备可以包括:处理器(processor)602、通信接口(Communications Interface)604、存储器(memory)606、以及通信总线608。
其中:处理器602、通信接口604、以及存储器606通过通信总线608完成相互间的通信。通信接口604,用于与其它设备比如客户端或其它服务器等的网元通信。处理器602,用于执行程序610,具体可以执行上述用于计算设备的PaaS平台中SQL执行引擎的适配方法实施例中的相关步骤。
具体地,程序610可以包括程序代码,该程序代码包括计算机操作指令。
处理器602可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器606,用于存放程序610。存储器606可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序610具体可以用于使得处理器602执行以下操作:
接收用户输入的SQL语句;
对SQL语句进行解析,得到SQL元数据信息;
将SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;
将SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果;
将SQL语句提供给SQL执行引擎选择结果对应的SQL执行引擎进行执行。
在一种可选的方式中,所述程序610使所述处理器602执行以下操作:
对SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标;
将运行性能指标、SQL元数据信息、表元数据存入历史指标库中。
在一种可选的方式中,SQL选择器包含至少一个具有预测模型的决策单元;所述程序610使所述处理器602执行以下操作:
将SQL元数据信息和表元数据整合为决策请求,将决策请求提供给至少一个决策单元,以供至少一个决策单元进行决策并输出SQL执行引擎决策结果;
按照投票的方式,从至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
在一种可选的方式中,所述程序610使所述处理器602执行以下操作:采用自学习的方式,根据历史指标库中的数据对SQL选择器的预测模型进行训练,或者根据历史指标数据库中的数据对SQL选择器所包含的决策单元的预测模型进行训练。
在一种可选的方式中,SQL元数据信息包括以下信息中的至少一项:表、字段类型、字段长度、结果字段、排序信息、关联信息、算子类型、***临时表次数;
SQL元数据信息中的关键信息包括以下信息中的至少一项:SQL元数据信息中的表信息、SQL元数据信息中的字段信息、SQL元数据信息中的存储信息。
在此提供的算法或显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明实施例也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本发明并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明实施例的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。上述实施例中的步骤,除有特殊说明外,不应理解为对执行顺序的限定。

Claims (10)

1.一种PaaS平台中SQL执行引擎的适配方法,包括:
接收用户输入的SQL语句;
对所述SQL语句进行解析,得到SQL元数据信息;
将所述SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;
将所述SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果;
将所述SQL语句提供给所述SQL执行引擎选择结果对应的SQL执行引擎进行执行。
2.根据权利要求1所述的方法,其中,所述SQL选择器包含至少一个具有预测模型的决策单元;
则将所述SQL元数据信息和表元数据输入至SQL选择器中进行处理,得到SQL执行引擎选择结果具体包括:
将所述SQL元数据信息和表元数据整合为决策请求,将所述决策请求提供给所述至少一个决策单元,以供所述至少一个决策单元进行决策并输出SQL执行引擎决策结果;
按照投票的方式,从所述至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
3.根据权利要求1所述的方法,其中,所述方法进一步包括:
对所述SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标;
将所述运行性能指标、所述SQL元数据信息、表元数据存入历史指标库中。
4.根据权利要求1-3中任一项所述的方法,其中,所述采用自学习的方式,根据历史指标库中的数据对所述SQL选择器的预测模型进行训练,或者根据历史指标库中的数据对所述SQL选择器所包含的至少一个决策单元的预测模型进行训练。
5.根据权利要求1所述的方法,其中,所述SQL元数据信息包括以下信息中的至少一项:表、字段类型、字段长度、结果字段、排序信息、关联信息、算子类型、***临时表次数;
所述SQL元数据信息中的关键信息包括以下信息中的至少一项:SQL元数据信息中的表信息、SQL元数据信息中的字段信息、SQL元数据信息中的存储信息。
6.一种PaaS平台中SQL执行引擎的适配装置,包括:
SQL接收器,用于接收用户输入的SQL语句;
SQL解析器,用于对所述SQL语句进行解析,得到SQL元数据信息;
表元数据获取器,用于将所述SQL元数据信息中的关键信息从Hadoop平台提取出来,构成表元数据;
SQL选择器,接收所述SQL元数据信息和表元数据并进行处理,输出SQL执行引擎选择结果;
SQL执行器,将所述SQL语句提供给所述SQL执行引擎选择结果对应的SQL执行引擎进行执行。
7.根据权利要求6所述的装置,其中,所述SQL选择器包含至少一个具有预测模型的决策单元、数据接收单元、决策输出器;
所述数据接收单元,用于接收SQL元数据和表元数据,将所述SQL元数据信息和表元数据整合为决策请求,将所述决策请求提供给所述至少一个决策单元,以供所述至少一个决策单元进行决策并输出SQL执行引擎决策结果;
所述决策输出器,用于按照投票的方式,从所述至少一个SQL执行引擎决策结果中选择出SQL执行引擎选择结果。
8.根据权利要求6所述的装置,其中,所述装置进一步包括:
检测模块,用于对所述SQL执行引擎选择结果对应的SQL执行引擎的执行过程进行监测,得到运行性能指标;
存储模块,用于将所述运行性能指标、所述SQL元数据信息、表元数据存入历史指标库中。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如权利要求1-5中任一项所述的PaaS平台中SQL执行引擎的适配方法对应的操作。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行如权利要求1-5中任一项所述的PaaS平台中SQL执行引擎的适配方法对应的操作。
CN201911413753.4A 2019-12-31 2019-12-31 PaaS平台中SQL执行引擎的适配方法及装置 Active CN113127509B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911413753.4A CN113127509B (zh) 2019-12-31 2019-12-31 PaaS平台中SQL执行引擎的适配方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911413753.4A CN113127509B (zh) 2019-12-31 2019-12-31 PaaS平台中SQL执行引擎的适配方法及装置

Publications (2)

Publication Number Publication Date
CN113127509A true CN113127509A (zh) 2021-07-16
CN113127509B CN113127509B (zh) 2023-08-15

Family

ID=76770385

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911413753.4A Active CN113127509B (zh) 2019-12-31 2019-12-31 PaaS平台中SQL执行引擎的适配方法及装置

Country Status (1)

Country Link
CN (1) CN113127509B (zh)

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090240711A1 (en) * 2008-03-20 2009-09-24 Dbsophic Ltd. Method and apparatus for enhancing performance of database and environment thereof
US20170139956A1 (en) * 2015-11-18 2017-05-18 Linkedin Corporation Dynamic data-ingestion pipeline
US20180060341A1 (en) * 2016-09-01 2018-03-01 Paypal, Inc. Querying Data Records Stored On A Distributed File System
CN107818112A (zh) * 2016-09-13 2018-03-20 腾讯科技(深圳)有限公司 一种大数据分析作业***及任务提交方法
CN108549683A (zh) * 2018-04-03 2018-09-18 联想(北京)有限公司 数据查询方法以及***
CN108763573A (zh) * 2018-06-06 2018-11-06 众安信息技术服务有限公司 一种基于机器学习的olap引擎路由方法及***
CN109670653A (zh) * 2018-12-29 2019-04-23 北京航天数据股份有限公司 一种基于工业模型预测引擎进行预测的方法及装置
US20190325292A1 (en) * 2019-06-28 2019-10-24 Intel Corporation Methods, apparatus, systems and articles of manufacture for providing query selection systems
CN110427992A (zh) * 2019-07-23 2019-11-08 杭州城市大数据运营有限公司 数据匹配方法、装置、计算机设备及存储介质

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090240711A1 (en) * 2008-03-20 2009-09-24 Dbsophic Ltd. Method and apparatus for enhancing performance of database and environment thereof
US20170139956A1 (en) * 2015-11-18 2017-05-18 Linkedin Corporation Dynamic data-ingestion pipeline
US20180060341A1 (en) * 2016-09-01 2018-03-01 Paypal, Inc. Querying Data Records Stored On A Distributed File System
CN107818112A (zh) * 2016-09-13 2018-03-20 腾讯科技(深圳)有限公司 一种大数据分析作业***及任务提交方法
CN108549683A (zh) * 2018-04-03 2018-09-18 联想(北京)有限公司 数据查询方法以及***
CN108763573A (zh) * 2018-06-06 2018-11-06 众安信息技术服务有限公司 一种基于机器学习的olap引擎路由方法及***
CN109670653A (zh) * 2018-12-29 2019-04-23 北京航天数据股份有限公司 一种基于工业模型预测引擎进行预测的方法及装置
US20190325292A1 (en) * 2019-06-28 2019-10-24 Intel Corporation Methods, apparatus, systems and articles of manufacture for providing query selection systems
CN110427992A (zh) * 2019-07-23 2019-11-08 杭州城市大数据运营有限公司 数据匹配方法、装置、计算机设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
XINGCHENG HUA等: "Hadoop configuration tuning with ensemble modeling and metaheuristic optimization", 《IEEE ACCESS》, vol. 6, pages 44161 - 44174, XP011689398, DOI: 10.1109/ACCESS.2018.2857852 *
XUANXUFENG: "Hadoop生态***流行数据格式和存储引擎性能测试比较", pages 1, Retrieved from the Internet <URL:《https://www.aboutyun.com/thread-21449-1-1.html》> *
顾荣: "大数据处理技术与***研究", 《中国博士学位论文全文数据库信息科技辑》, no. 3, pages 138 - 17 *

Also Published As

Publication number Publication date
CN113127509B (zh) 2023-08-15

Similar Documents

Publication Publication Date Title
US11379755B2 (en) Feature processing tradeoff management
CN108121795B (zh) 用户行为预测方法及装置
US10878004B2 (en) Keyword extraction method, apparatus and server
US20200050968A1 (en) Interactive interfaces for machine learning model evaluations
US10339465B2 (en) Optimized decision tree based models
US10318882B2 (en) Optimized training of linear machine learning models
US11915104B2 (en) Normalizing text attributes for machine learning models
US20170132314A1 (en) Identifying relevant topics for recommending a resource
CA3109481A1 (en) Identification and application of hyperparameters for machine learning
CN111241389B (zh) 一种基于矩阵的敏感词过滤方法、装置、电子设备、存储介质
CN108647329B (zh) 用户行为数据的处理方法、装置及计算机可读存储介质
CN111680085A (zh) 数据处理任务分析方法、装置、电子设备和可读存储介质
CN112052082B (zh) 任务属性优化方法、装置、服务器及存储介质
CN112860855B (zh) 一种信息抽取方法、装置及电子设备
CN110968664A (zh) 一种文书检索方法、装置、设备及介质
CN116797195A (zh) 工单处理方法、装置、计算机设备和计算机可读存储介质
CN115344805A (zh) 素材审核方法、计算设备及存储介质
CN109471786B (zh) 一种数据采集方法、装置、设备和存储介质
CN116150327A (zh) 文本处理方法和装置
US10559223B2 (en) Food description processing methods and apparatuses
CN111611781B (zh) 数据标注方法、问答方法、装置及电子设备
EP4322066A1 (en) Method and apparatus for generating training data
CN113127509B (zh) PaaS平台中SQL执行引擎的适配方法及装置
KR101870658B1 (ko) 언어지능 모듈 실시간 분산처리 최적화 시스템 및 방법
CN113593546B (zh) 终端设备唤醒方法和装置、存储介质及电子装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant