CN105243068A - 数据库***的查询方法、服务器和能耗测试*** - Google Patents

数据库***的查询方法、服务器和能耗测试*** Download PDF

Info

Publication number
CN105243068A
CN105243068A CN201410326426.6A CN201410326426A CN105243068A CN 105243068 A CN105243068 A CN 105243068A CN 201410326426 A CN201410326426 A CN 201410326426A CN 105243068 A CN105243068 A CN 105243068A
Authority
CN
China
Prior art keywords
power consumption
physical operations
executive plan
cost
time cost
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201410326426.6A
Other languages
English (en)
Inventor
金培权
邢宝平
金勇�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Science and Technology of China USTC
Huawei Technologies Co Ltd
Original Assignee
University of Science and Technology of China USTC
Huawei Technologies Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Science and Technology of China USTC, Huawei Technologies Co Ltd filed Critical University of Science and Technology of China USTC
Priority to CN201410326426.6A priority Critical patent/CN105243068A/zh
Publication of CN105243068A publication Critical patent/CN105243068A/zh
Pending legal-status Critical Current

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种数据库***的查询方法、服务器和能耗测试***,包括:获取所述数据库***在采集时间内的CPU功耗和磁盘功耗,所述数据库***的各物理操作在所述采集时间内的训练参数;根据所述CPU功耗和磁盘功耗计算所述各物理操作的实际功耗,以所述各物理操作的训练参数为自变量,以所述各物理操作的实际功耗为因变量进行回归分析得到所述各物理操作的预测功耗函数;根据所述各物理操作的预测功耗函数计算SQL语句的各执行计划的能耗代价。所述方法通过采用回归分析方法得到各物理操作的预测功耗函数,使得各物理操作的预测功耗函数更准确。另外,通过引入调节因子来调整数据库的能耗代价和时间代价,可以灵活调整数据库***的能耗。

Description

数据库***的查询方法、服务器和能耗测试***
技术领域
本发明实施例涉及数据库技术,尤其涉及一种数据库***的查询方法、服务器和能耗测试***。
背景技术
建设低碳社会已经成为全球共识,在数据库***中如何建设低成本、低能耗的新型数据库***成为至关重要的问题。传统的数据库***仅考虑了数据库***的性能优化,没有估计数据库***的能耗代价。随着以数据为中心的计算模式的兴起以及大数据等概念的发展,如何降低数据库***的能耗已成为学术界和工业界普遍关注的热点问题。
现有技术中,提出了一种数据库***的能耗估计方法,该技术中假设每个元组和每个磁盘块的功耗为常量α和β,并将物理操作的功耗定义为元组数T和磁盘块数N的标量函数。常用的一些物理操作如下:顺序扫描(Seqcan)、索引扫描(IndexScan)、位图扫描(Bitmapscan)、子查询(SubquerySan)、函数扫描(FunctionScan),现有技术中,顺序扫描的代价函数为αT+βN,索引扫描的代价函数为τT+βN+C,位图扫描的代价函数为n(τT+βN)+C,子查询的代价函数为函数扫描的代价函数为数据库***的总代价模型取性能和能耗间的折衷:C=EPn,其中,E是基于T和N计算得到的数据库***的能耗,P代表性能。当执行一条结构化查询(StructuredQueryLanguage,简称SQL)语句时,数据库***的服务器会计算该SQL语句的执行计划,一条SQL语句一般有多个执行计划,服务器会计算得到每个执行计划对应的总代价,然后,选取总代价最小的执行计划作为该SQL语句的最优执行计划。
但是,现有技术的能耗估计方法也存在以下问题:现有技术中,假设每一个元组或者磁盘块的功耗是固定的,但最近的研究发现不同的物理操作有着不同的功耗,即使两个物理操作的CPU使用率相同,其功耗差异最大可达到60%,因此,现有技术的方法并不能够准确得到每个物理操作的功耗,从而使得数据库***的测得的能耗值与实际能耗值存在很大差异。
发明内容
本发明实施例提供一种数据库***的查询方法、服务器和能耗测试***,使得测得的数据库***的查询代价更加准确。
本发明第一方面提供一种数据库***的查询方法,包括:
获取所述数据库***在采集时间内的中央处理器CPU功耗和磁盘功耗,以及所述数据库***的各物理操作在所述采集时间内的训练参数;
根据所述CPU功耗和磁盘功耗计算所述各物理操作的实际功耗,以所述各物理操作的训练参数为自变量,以所述各物理操作的实际功耗为因变量进行回归分析得到所述各物理操作的预测功耗函数;
当执行一条SQL语句时,根据所述各物理操作的预测功耗函数计算所述SQL语句的各执行计划的能耗代价,并根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,选择查询代价最小的执行计划作为所述SQL语句的最优执行计划。
结合本发明第一方面,在本发明第一方面的第一种可能的实现方式中,所述根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,包括:
根据以下公式计算所述执行各计划的查询代价:其中,Cost为执行计划的查询代价,P为所述执行计划的能耗代价,T为所述执行计划的时间代价,为调节因子,
结合本发明第一方面以及本发明第一方面的第一种可能的实现方式,在本发明第一方面的第二种可能的实现方式中,所述根据所述各物理操作的预测功耗函数计算所述各执行计划的能耗代价,包括:
根据所述各物理操作的预测功耗函数计算所述每个执行计划包括的各物理操作的预测功耗;
根据以下公式计算所述各执行计划的预测功耗:其中,P为执行计划的能耗代价,为所述执行计划的第i个物理操作的预测功耗,i=1,2,…,N,为所述执行计划的第i个物理操作的预测时间代价。
结合本发明第一方面以及本发明第一方面的第一种可能的实现方式,在本发明第一方面的第三种可能的实现方式中,所述根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,包括:
确定所述每个执行计划的各物理操作的预测时间代价;
根据以下公式计算所述各执行计划的时间代价:其中,T为执行计划的时间代价,为所述执行计划的第i个物理操作的预测时间代价,i=1,2,…,N。
结合本发明第一方面以及本发明第一方面的第一种至第三种可能的实现方式,在本发明第一方面的第四种可能的实现方式中,所述各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,其中,所述元组数目为所述各物理操作所涉及的元组的数目,所述页面数目为所述各物理操作从磁盘读取的页面的数目。
结合本发明第一方面以及本发明第一方面的第一种至第三种可能的实现方式,在本发明第一方面的第五种可能的实现方式中,所述获取所述数据库***在采集时间内的CPU功耗和磁盘功耗,包括:
接收能耗测试***发送的所述CPU功耗和磁盘功耗,其中,所述CPU功耗是所述能耗测试***根据测试获取的所述数据库***的CPU的电流和电压得到的,所述磁盘功耗是所述能耗测试***根据测试获取的所述数据库***的磁盘的电流和电压得到的。
本发明第二方面提供一种服务器,包括:
获取模块,用于获取所述数据库***的在采集时间内的中央处理器CPU功耗和磁盘功耗,以及获取所述数据库***的各物理操作在所述采集时间内的训练参数;
分析模块,用于根据所述CPU功耗和磁盘功耗计算所述各物理操作的实际功耗,以所述各物理操作的训练参数为自变量,以所述各物理操作的实际功耗为因变量进行回归分析得到所述各物理操作的预测功耗函数;
能耗计算模块,用于当执行一条SQL语句时,根据所述各物理操作的预测功耗函数计算所述SQL语句的各执行计划的能耗代价,并根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,选择查询代价最小的执行计划作为所述SQL语句的最优执行计划。
结合本发明第二方面,在本发明第二方面第一种可能的实现方式中,所述能耗计算模块具体用于:
根据以下公式计算所述执行各计划的查询代价:其中,Cost为执行计划的查询代价,P为所述执行计划的能耗代价,T为所述执行计划的时间代价,为调节因子,
结合本发明第二方面以及本发明第二方面第一种可能的实现方式,在本发明第二方面第二种可能的实现方式中,所述能耗计算模块具体用于:
根据所述各物理操作的预测功耗函数计算所述每个执行计划包括的各物理操作的预测功耗;
根据以下公式计算所述各执行计划的预测功耗:其中,P为执行计划的能耗代价,为所述执行计划的第i个物理操作的预测功耗,i=1,2,…,N,为所述执行计划的第i个物理操作的预测时间代价。
结合本发明第二方面以及本发明第二方面第一种可能的实现方式,在本发明第二方面第三种可能的实现方式中,所述能耗计算模块具体用于:
确定所述每个执行计划的各物理操作的预测时间代价;
根据以下公式计算所述各执行计划的时间代价:其中,T为执行计划的时间代价,为所述执行计划的第i个物理操作的预测时间代价,i=1,2,…,N。
结合本发明第二方面以及本发明第二方面第一种至第三种可能的实现方式,在本发明第二方面第四种可能的实现方式中,所述各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,其中,所述元组数目为所述各物理操作所涉及的元组的数目,所述页面数目为所述各物理操作从磁盘读取的页面的数目。
结合本发明第二方面以及本发明第二方面第一种至第三种可能的实现方式,在本发明第二方面第五种可能的实现方式中,所述获取模块具体用于:
接收能耗测试***发送的所述CPU功耗和磁盘功耗,其中,所述CPU功耗是所述能耗测试***根据测试获取的所述数据库***的CPU的电流和电压得到的,所述磁盘功耗是所述能耗测试***根据测试获取的所述数据库***的磁盘的电流和电压得到的。
本发明第三方面提供一种能耗测试***,包括:数据分析机、模数A/D转换器、能耗测试设备、电源设备;
所述电源设备,用于为所述能耗测试设备提供电源;
所述能耗测试设备包括多个电流传感器以及多个分压器,所述每个电流传感器的一端与所述电源设备连接,所述每个电流传感器的另一端与待测试的数据库***的一个硬件单元连接,所述电流传感器用于测量所连接的硬件单元的电流,所述每个分压器与一个硬件单元并联,所述每个分压器用于测量所连接的硬件单元的电压,所述能耗测试设备将测量到的所述各硬件单元的电压和电流传输给所述A/D转化器;
所述A/D转换器将所述各硬件单元的电压和电流转换为数字信号,并将转换后的数字信号发送给所述数据分析机;
所述数据分析机对所述数字信号进行数据处理,得到所述数据库***的CPU功耗和磁盘功耗。
本发明实施例的数据库***的查询方法、服务器和能耗测试***,通过获取各物理操作的训练参数以及CPU的功耗和磁盘功耗,根据CPU功耗和磁盘功耗计算各物理操作的实际功耗,以各物理操作的训练参数为自变量,以各物理操作的实际功耗为因变量采用回归分析方法得到各物理操作的预测功耗函数,使得各物理操作的预测功耗函数更准确,从而使得执行计划的能耗代价更加接近执行计划的实际能耗代价。另外,通过引入调节因子来调整数据库的能耗代价和时间代价,根据不同用户的需求设置不同的调整因子来灵活调整数据库***的能耗。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种数据库***的查询方法的流程图;
图2为静态环境下TPC-H数据库***的能耗代价的对比示意图;
图3为竞争环境下TPC-H数据库***的能耗代价示意图;
图4为本发明实施例提供的能耗测试***的结构示意图;
图5为本发明实施例提供的一种服务器的结构示意图;
图6为本发明实施例提供的另一种服务器的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1为本发明实施例提供的一种数据库***的查询方法的流程图,本发明实施例的方法可以由服务器执行,如图1所示,本实施例的方法可以包括:
步骤101、获取数据库***在采集时间内的CPU功耗和磁盘功耗,以及数据库***的各物理操作在采集时间内的训练参数。
服务器可以接收能耗测试***发送的CPU功耗和磁盘功耗,能耗测试***用于测试数据库***的CPU与磁盘的电流和电压,然后,根据CPU的电压和电流计算得到CPU的功耗,根据磁盘的电流和电压计算得到磁盘功耗。其中,CPU功耗为采集时间内的平均功耗,磁盘功耗也为采集时间内的平均功耗,能耗测试***可以自定义CPU和磁盘的采集间隔,在每个采集时刻采集CPU和磁盘的瞬时功耗,然后,根据各采集时刻采集到的CPU功耗和磁盘功耗计算CPU和磁盘在采集时间内的平均功耗。
各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,其中,元组数目为各物理操作所涉及的元组的数目,页面数目为各物理操作从磁盘读取的页面的数目。各物理操作的训练参数可以不同,例如,物理操作1的训练参数可以为CPU使用率、所涉及的元组数目、从磁盘读取数据的页面数目。物理操作2的训练参数可以为CPU使用率、内存使用率、涉及的元组数目、从磁盘读取数据的页面数目、选择度。当然,训练参数还可以是其他参数,本发明实施例并不对此进行限制。
一般的操作***都提供了实时获取CPU使用率和内存使用率的接口,因此,服务器能够实时的获取到CPU使用率和内存使用率。例如,在Linux***中,可以通过在一个很短的时间间隔内连续读取文件/proc/stat和/proc/meminfo来确定当前的CPU使用率和内存使用率。/proc/stat文件中包含了CPU的所有活动信息,例如:user(用户态CPU时间)、nice(值为负的进程占用的CPU时间)、system(核心态CPU时间)、idle(除磁盘IO等待时间以外的其它等待时间)、iowait(硬盘I/O等待时间)、irq(硬中断时间)、sofirq(软中断时间)。因此,CPU使用率可以使用下面的公式计算,其中t1和t2是两个连续的读取时间点,total是总的时间:
proc/meminfo文件中还存储了当前内存的使用量(cmem)以及内存总量(amem),因此很容易计算内存使用率:
现有的数据库***在运行时会维护每个表的一些统计量,然后服务器可以根据这些统计量来计算各物理操作的元组数目、页面数目、选择度等参数。
数据库***中常用的物理操作主要有以下几种类型:扫描(Scan)操作、排序(Sort)操作、选择(Select)操作、聚集(Aggregate)操作、乘积(Product)操作和连接操作(Join)。每个物理操作包括多个操作参数,每个操作参数有其对应的特征数据,操作参数被划分为共同操作参数和特定操作参数,共同操作参数为所有物理操作共有的操作参数,特定操作参数为一些特定物理操作所独有的操作参数,表1列举了PostgreSQL数据库***中的物理操作的共同操作参数和该共同操作参数对应的特征数据,表2列举了物理操作的一些特定操作参数以及该特定操作参数对应的特征数据:
表1
操作参数名称 特征数据
COUT 输出元组的数目
SOUTAVG 输出元组的平均长度(Bytes)
CIN 输入元组的数目
SINAVG 输入元组的平均长度(Bytes)
表2
操作参数名称 特征数据 物理操作的类型
TSIZE 输入表的大小(以元组计) Seek/Scan
PAGES 输入表的大小(以页计) Seek/Scan
TCOLUMNS 元组中列数目 Seek/Scan
INDEXDEPTH 访问中索引的层次 Seek
HASHOPAVA 每个元组散列操作的成本 Hash Agg/Join
CHASHCOL 散列涉及到的列数目 Hash Agg
CINNERCOL 连接操作涉及到的列数目(内表) Joins
COUTERCOL 连接操作涉及到的列数目(外表) Joins
SSEEKTABLE 内表的元组数目 Nested loop
CSORTCOL 排序中涉及到的列数目 Sort
SINSUM 多趟归并中总数据大小 Merge join
在根据统计信息获取到各物理操作的操作参数的特征数据后,根据各物理操作的操作参数的特征数据得到各物理操作的元组数目、页面数目、选择度。例如,可以将物理操作的所有操作参数的特征数据中包括的元组数目加起来得到该物理操作的元组数目,物理操作的所有操作参数包括共同操作参数和特定操作参数。同理可以将物理操作的所有操作参数的特征数据中包括的页面数目加起来得到该物理操作的页面数目。选择度也称选择性,是指在一个表上执行一个选择操作时返回的结果集大小。选择度的值直接影响返回结果集的大小,从而会影响整个执行计划的中间结果大小以及最终的时间代价,服务器可以直接读取到选择度。
服务器在获取物理操作的特征数据时可以人工定制一些特定的SQL语句来表示各种物理操作,通过运算各物理操作对应的SQL语句获取各物理操作符的特征数据,如表3所示,表3列举了6中物理操作及其对应的SQL语句:
表3
物理操作 SQL语句
Scan SELECT*FROM R;
Sort SELECT*FROM R ORDER BY R.A;
Select SELECT*FROM R WHERE R.A<a;
Aggregate SELECT COUN T(*)FROM R;
Product SELECT*FROM R,S;
Join SELECT*FROM R,S WHERE R.A=a;
步骤102、根据CPU功耗和磁盘功耗计算各物理操作的实际功耗,以各物理操作的训练参数为自变量,以各物理操作的实际功耗为因变量进行回归分析得到各物理操作的预测功耗函数。
服务器在根据CPU功耗和磁盘功耗计算各物理操作的实际功耗时,可以将物理操作的CPU功耗和磁盘功耗直接相加得到物理操作的实际功耗。
各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,当某一物理操作的训练参数包括以下五个参数时:元组数目、页面数目、选择度、CPU使用率、内存使用率,则服务器以元组数目、页面数目、选择度、CPU使用率、内存使用率为自变量,以物理操作的实际功耗为因变量进行回归分析得到物理操作的预测功耗函数。例如:将单个物理操作的预测功耗P定义为:P=F(T,N,σ,C,M),其中,T为元组数目,N为页面数目,σ为选择度,C为CPU使用率,M为内存使用率,F为预测功耗函数,P为物理操作的实际功耗。对F用获取到的训练参数进行回归分析,可以得到F。举例来说,假设某一物理操作的训练参数包括以下四个参数:CPU使用率、内存使用率、元组数目和页面数目,则可以建立类似下面的回归方程:
P=a+a1·X1+a2·X2+a3·X3+a4·X4
其中,自变量X1代表CPU使用率,X2代表内存使用率,X3代表元组数,X4代表页面数目,将获取到的CPU使用率、内存使用率、元组数目和页面数目以及物理操作的实际功耗的值带入上述回归方程进行线性回归(这一步可以使用开源的统计分析工具),最终得到的函数就类似下面的形式:
P=30.49+0.61·X1+0.22·X2+0.12·X3+0.15·X4
常用回归分析的方法有线性回归和指数回归,当然还有其他回归方法,这里不再一一列举。本实施例中可以采用迭代线性回归的训练方法,在迭代线性回归方法中以总误差率值作为目标函数,总误差率值为物理操作的预测功耗与实际功耗的比值。回归过程如下:
(1)根据初始输入训练参数T、N、σ、C、M和实际功耗P,线性回归得到预测功耗函数F1,将训练参数带入F1得到预测功耗,根据预测功耗和实际功耗计算总误差率值f1。
(2)选取单个训练参数进行简单变换(如:),将变换后的训练参数作为新特征再次进行回归,得到预测功耗函数F2和总误差率值f2。
(3)比较f1、f2,若f2<f1,则将步骤(2)中生成的新特征保留,保存预测功耗函数F2,重复执行步骤(2),直到f2>f1,且之前无新特征,则算法停止。
现有技术中,各物理操作的预测功耗函数是人为定义的,很多情况下人为定义的预测功耗函数并不符合实际情况,导致各物理操作的预测功耗不准确。而本发明实施例,每个物理操作的预测功耗函数,均是根据训练参数采用回归分析得到,使得各物理操作的预测功耗函数更加接近实际情况,各物理操作的预测功耗值更准确。
步骤103、当执行一条SQL语句时,根据各物理操作的预测功耗函数计算SQL语句的各执行计划的能耗代价,并根据各物理操作的预测时间代价计算各执行计划的时间代价,根据各执行计划的能耗代价和时间代价计算各执行计划的查询代价,选择查询代价最小的执行计划作为SQL语句的最优执行计划。
每一条SQL语句对应多个执行计划,执行计划可以看成是多个物理操作的一个执行序列,执行计划的查询代价为执行计划包括的所有物理操作的能耗代价和时间代价有关。
本实施例中,服务器根据各物理操作的预测功耗函数计算各执行计划的能耗代价,具体为:首先,根据各物理操作的预测功耗函数计算每个执行计划包括的各物理操作的预测功耗;然后,根据以下公式计算各执行计划的预测功耗:其中,P为执行计划的能耗代价,为执行计划的第i个物理操作的预测功耗,i=1,2,…,N,为执行计划的第i个物理操作的预测时间代价,N为执行计划包括的物理操作的个数。
服务器根据各物理操作的预测时间代价计算各执行计划的时间代价,具体为:首先,确定每个执行计划的各物理操作的预测时间代价;根据以下公式计算所述各执行计划的时间代价:其中,T为执行计划的时间代价,为执行计划的第i个物理操作的预测时间代价,i=1,2,…,N。
服务器在得到执行计划的能耗代价和时间代价后,可以根据以下公式计算各执行计划的查询代价:其中,Cost为执行计划的查询代价,P为执行计划的能耗代价,T为执行计划的时间代价,为调节因子,
现有技术中,服务器在确定SQL语句的最优执行计划时总是选择时间代价最小的执行计划,而能耗有效的查询方式通常选取能耗代价最低的执行计划。能耗和时间这两个指标存在着一定的矛盾,本实施例的方法在于寻找一种折中的方式,保证执行计划的能耗代价较低,但允许执行计划的时间性能有所退化。本实施例的方法通过引入调节因子来实现,数据库***可以根据应用的要求来选择不同的值,进而实现能耗和时间性能的最佳折衷,若数据库***希望能够尽可能地降低能耗,那么可以设置较小的值,当时,表示时间性能可以无限退化,只关注能耗指标;相应地,当时,不允许时间性能有任何退化。
假设有两个执行计划Plan1和Plan2,Plan1的能耗代价为P,Plan1的时间代价为T*,Plan2的能耗代价小于Plan1,假设为nP(0<n<1),Plan2的时间代价为T。如果Plan1和Plan2的查询代价相等,那么Plan1的时间代价T*大于Plan2的时间代价,在能耗有效的数据库***中服务器选择Plan2,Plan2允许时间性能退化。Plan1的时间代价T*的计算过程如下:
Plan1:P、T*
Plan2:nP、T,令
=> P &PartialD; T 1 - &PartialD; = ( nP ) &PartialD; T 1 - &PartialD;
=> &PartialD; lgP + ( 1 - &PartialD; ) lg T * = &PartialD; ( lgn + lgP ) + ( 1 - &PartialD; ) lgT
=> ( 1 - &PartialD; ) lg T * = ( 1 - &PartialD; ) lgT + &PartialD; lgn
=> lg T * = lgT + &PartialD; 1 - &PartialD; lgn
=> T * = n &PartialD; 1 - &PartialD; T
上述结果表明,Plan2比Plan1节约(1-n)×P的能耗,通过设置不同的值来控制能耗代价和时间代价的折衷度。如表4所示,当n=0.8时,即用户希望执行计划能够节约20%的能耗时,调节因子与时间性能的关系,若也就是说,在时,选择Plan2的时间性能会比Plan1的时间性能低6%。若取更大的值,则在同样的能耗节约情况下,允许的时间性能退化度更大。
表4
本实施例中,由于各物理操作的预测功耗函数采用回归分析方法得到,因此,各物理操作的预测功耗更精确,从而使得SQL语句的执行计划的能耗更准确,请参照图2和图3所示,图2为静态环境下TPC-H数据库***的能耗代价的对比示意图,图3为竞争环境下TPC-H数据库***的能耗代价示意图,其中,静态环境即***上只运行数据库服务,由于测试查询依次单个执行,相当于独占***资源,竞争环境即***中数据库服务不是独占***资源,而是存在其他的应用程序同时运行。图2和图3白色区域表示TPC-H的实际能耗,黑色区域表示本发明实施例的方法所确定的能耗,灰色区域表示现有技术采用标量函数方法所确定的能耗,通过对比,可以看出本发明实施例的方法测得的执行计划的能耗更加准确。
本实施例,通过获取各物理操作的训练参数以及CPU的功耗和磁盘功耗,根据CPU功耗和磁盘功耗计算各物理操作的实际功耗,以各物理操作的训练参数为自变量,以各物理操作的实际功耗为因变量采用回归分析方法得到各物理操作的预测功耗函数,使得各物理操作的预测功耗函数更准确,从而使得执行计划的能耗代价更加接近执行计划的实际能耗代价。另外,通过引入调节因子来调整数据库的能耗代价和时间代价,根据不同用户的需求设置不同的调整因子来灵活调整数据库***的能耗。
本发明实施例还提供了一种能耗测试***,该能耗测试***用于测量数据库***的各物理操作的实际功耗,图4为本发明实施例提供的能耗测试***的结构示意图,如图4所示,本实施例的能耗测试***,包括:数据分析机、模数(Analog/Digital,简称A/D)转换器、能耗测试设备、电源设备。其中,电源设备,用于为所述能耗测试设备提供电源;能耗测试设备包括多个电流传感器以及多个分压器,所述每个电流传感器的一端与所述电源设备连接,所述每个电流传感器的另一端与待测试的数据库***的一个硬件单元连接,所述电流传感器用于测量所连接的硬件单元的电流,所述每个分压器与一个硬件单元并联,所述每个分压器用于测量所连接的硬件单元的电压,所述能耗测试设备将测量到的所述各硬件单元的电压和电流传输给所述A/D转化器;所述A/D转换器将所述各硬件单元的电压和电流转换为数字信号,并将转换后的数字信号发送给所述数据分析机;所述数据分析机对所述数字信号进行数据处理,得到所述数据库***的CPU功耗和磁盘功耗。
本实施例中,能耗测试设备通过电流传感器感测量电流,由于电流传感器采用感应式测量,不会影响电流的流动。分压器在测得电压各硬件单元的电压后,可以将电压转换成0~5v之间的电压然后传输给与A/D转换器。这里,硬件单元具体可以是CPU、磁盘、内存、SSD、主板等,能耗测试设备将测得的数据最终传送给数据分析机进行分析处理。数据分析机将处理后的数据发送给服务器,服务器根据这些数据得到各物理操作的训练参数,训练参数包括物理操作的实际功耗,采用本实施例的能耗测试***得到的各物理操作的实际能耗,比现有技术中采用数字电表、软件模拟等方法获取的物理操作的能耗更准确。
另外,本实施例的能耗测试***不仅可以测试数据库***的整机功耗,还可以连续监控数据库***中各个硬件单元的能耗,因此,可以发现不同算法之间在内部细节上的能耗差异,有利于进一步设计能耗有效的算法。
图5为本发明实施例提供的一种服务器的结构示意图,如图5所示,本实施例的服务器包括:获取模块11、分析模块12和能耗计算模块13。
其中,获取模块11,用于获取所述数据库***的在采集时间内的中央处理器CPU功耗和磁盘功耗,以及获取所述数据库***的各物理操作在所述采集时间内的训练参数;
分析模块12,用于根据所述CPU功耗和磁盘功耗计算所述各物理操作的实际功耗,以所述各物理操作的训练参数为自变量,以所述各物理操作的实际功耗为因变量进行回归分析得到所述各物理操作的预测功耗函数;
能耗计算模块13,用于当执行一条SQL语句时,根据所述各物理操作的预测功耗函数计算所述SQL语句的各执行计划的能耗代价,并根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,选择查询代价最小的执行计划作为所述SQL语句的最优执行计划。
本实施例中,所述各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,其中,所述元组数目为所述各物理操作所涉及的元组的数目,所述页面数目为所述各物理操作从磁盘读取的页面的数目。可选地,所述各物理操作的训练参数不同,当然,各物理操作的训练参数也可以相同。
可选地,能耗计算模块13具体用于:根据以下公式计算所述执行各计划的查询代价:其中,Cost为执行计划的查询代价,P为所述执行计划的能耗代价,T为所述执行计划的时间代价,为调节因子,
可选地,所述能耗计算模块13具体用于:根据所述各物理操作的预测功耗函数计算所述每个执行计划包括的各物理操作的预测功耗;根据以下公式计算所述各执行计划的预测功耗:其中,P为执行计划的能耗代价,为所述执行计划的第i个物理操作的预测功耗,i=1,2,…,N,为所述执行计划的第i个物理操作的预测时间代价。
可选地,能耗计算模块13具体用于:确定所述每个执行计划的各物理操作的预测时间代价;根据以下公式计算所述各执行计划的时间代价:其中,T为执行计划的时间代价,为所述执行计划的第i个物理操作的预测时间代价,i=1,2,…,N。
本实施例中,所述获取模块11具体用于:接收能耗测试***发送的所述CPU功耗和磁盘功耗,其中,所述CPU功耗是所述能耗测试***根据测试获取的所述数据库***的CPU的电流和电压得到的,所述磁盘功耗是所述能耗测试***根据测试获取的所述数据库***的磁盘的电流和电压得到的。
本实施例的服务器,可以用于执行图1所示实施例的方法,其实现原理和技术效果类似,这里不再赘述。
图6为本发明实施例提供的另一种服务器的结构示意图,如图6所示,本实施例的服务器200包括:处理器21、存储器22、通信接口23以及***总线24,存储器22和通信接口23通过***总线24与处理器21连接并通信,通信接口23用于和其他设备进行通信,存储器22中存储有计算机执行指令221;所述处理器21,用于运行所述计算机执行指令221,执行如下所述的方法:
获取所述数据库***在采集时间内的中央处理器CPU功耗和磁盘功耗,以及所述数据库***的各物理操作在所述采集时间内的训练参数;
根据所述CPU功耗和磁盘功耗计算所述各物理操作的实际功耗,以所述各物理操作的训练参数为自变量,以所述各物理操作的实际功耗为因变量进行回归分析得到所述各物理操作的预测功耗函数;
当执行一条SQL语句时,根据所述各物理操作的预测功耗函数计算所述SQL语句的各执行计划的能耗代价,并根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,选择查询代价最小的执行计划作为所述SQL语句的最优执行计划。
其中,当处理器21所述根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价时,具体用于:根据以下公式计算所述执行各计划的查询代价:其中,Cost为执行计划的查询代价,P为所述执行计划的能耗代价,T为所述执行计划的时间代价,为调节因子,
当处理器21根据所述各物理操作的预测功耗函数计算所述各执行计划的能耗代价时,具体用于:根据所述各物理操作的预测功耗函数计算所述每个执行计划包括的各物理操作的预测功耗;然后,根据以下公式计算所述各执行计划的预测功耗:其中,P为执行计划的能耗代价,为所述执行计划的第i个物理操作的预测功耗,i=1,2,…,N,为所述执行计划的第i个物理操作的预测时间代价。
当处理器21根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价时,具体用于:首先,确定所述每个执行计划的各物理操作的预测时间代价;然后,根据以下公式计算所述各执行计划的时间代价:其中,T为执行计划的时间代价,为所述执行计划的第i个物理操作的预测时间代价,i=1,2,…,N。
本实施例中,所述各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,其中,所述元组数目为所述各物理操作所涉及的元组的数目,所述页面数目为所述各物理操作从磁盘读取的页面的数目。
处理器21获取所述数据库***在采集时间内的CPU功耗和磁盘功耗时,具体用于:通过通信接口23接收能耗测试***发送的所述CPU功耗和磁盘功耗,其中,所述CPU功耗是所述能耗测试***根据测试获取的所述数据库***的CPU的电流和电压得到的,所述磁盘功耗是所述能耗测试***根据测试获取的所述数据库***的磁盘的电流和电压得到的。
本实施例的服务器可用于执行图1所示的方法,其具体实现方式和技术效果类似,这里不再赘述。
本领域普通技术人员可以理解:实现上述各方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成。前述的程序可以存储于一计算机可读取存储介质中。该程序在执行时,执行包括上述各方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

Claims (13)

1.一种数据库***的查询方法,其特征在于,包括:
获取所述数据库***在采集时间内的中央处理器CPU功耗和磁盘功耗,以及所述数据库***的各物理操作在所述采集时间内的训练参数;
根据所述CPU功耗和磁盘功耗计算所述各物理操作的实际功耗,以所述各物理操作的训练参数为自变量,以所述各物理操作的实际功耗为因变量进行回归分析得到所述各物理操作的预测功耗函数;
当执行一条结构化查询语言SQL语句时,根据所述各物理操作的预测功耗函数计算所述SQL语句的各执行计划的能耗代价,并根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,选择查询代价最小的执行计划作为所述SQL语句的最优执行计划。
2.根据权利要求1所述的方法,其特征在于,所述根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,包括:
根据以下公式计算所述执行各计划的查询代价:其中,Cost为执行计划的查询代价,P为所述执行计划的能耗代价,T为所述执行计划的时间代价,为调节因子,
3.根据权利要求1或2所述的方法,其特征在于,所述根据所述各物理操作的预测功耗函数计算所述各执行计划的能耗代价,包括:
根据所述各物理操作的预测功耗函数计算所述每个执行计划包括的各物理操作的预测功耗;
根据以下公式计算所述各执行计划的预测功耗:其中,P为执行计划的能耗代价,为所述执行计划的第i个物理操作的预测功耗,i=1,2,…,N,为所述执行计划的第i个物理操作的预测时间代价。
4.根据权利要求1或2所述的方法,其特征在于,所述根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,包括:
确定所述每个执行计划的各物理操作的预测时间代价;
根据以下公式计算所述各执行计划的时间代价:其中,T为执行计划的时间代价,为所述执行计划的第i个物理操作的预测时间代价,i=1,2,…,N。
5.根据权利要求1-4中任一项所述的方法,其特征在于,所述各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,其中,所述元组数目为所述各物理操作所涉及的元组的数目,所述页面数目为所述各物理操作从磁盘读取的页面的数目。
6.根据权利要求1-4中任一项所述的方法,其特征在于,所述获取所述数据库***在采集时间内的CPU功耗和磁盘功耗,包括:
接收能耗测试***发送的所述CPU功耗和磁盘功耗,其中,所述CPU功耗是所述能耗测试***根据测试获取的所述数据库***的CPU的电流和电压得到的,所述磁盘功耗是所述能耗测试***根据测试获取的所述数据库***的磁盘的电流和电压得到的。
7.一种服务器,其特征在于,包括:
获取模块,用于获取所述数据库***的在采集时间内的中央处理器CPU功耗和磁盘功耗,以及获取所述数据库***的各物理操作在所述采集时间内的训练参数;
分析模块,用于根据所述CPU功耗和磁盘功耗计算所述各物理操作的实际功耗,以所述各物理操作的训练参数为自变量,以所述各物理操作的实际功耗为因变量进行回归分析得到所述各物理操作的预测功耗函数;
能耗计算模块,用于当执行一条结构化查询语言SQL语句时,根据所述各物理操作的预测功耗函数计算所述SQL语句的各执行计划的能耗代价,并根据所述各物理操作的预测时间代价计算所述各执行计划的时间代价,根据各执行计划的能耗代价和时间代价计算所述各执行计划的查询代价,选择查询代价最小的执行计划作为所述SQL语句的最优执行计划。
8.根据权利要求7所述的服务器,其特征在于,所述能耗计算模块具体用于:
根据以下公式计算所述执行各计划的查询代价:其中,Cost为执行计划的查询代价,P为所述执行计划的能耗代价,T为所述执行计划的时间代价,为调节因子,
9.根据权利要求7或8所述的服务器,其特征在于,所述能耗计算模块具体用于:
根据所述各物理操作的预测功耗函数计算所述每个执行计划包括的各物理操作的预测功耗;
根据以下公式计算所述各执行计划的预测功耗:其中,P为执行计划的能耗代价,为所述执行计划的第i个物理操作的预测功耗,i=1,2,…,N,为所述执行计划的第i个物理操作的预测时间代价。
10.根据权利要求7或8所述的服务器,其特征在于,所述能耗计算模块具体用于:
确定所述每个执行计划的各物理操作的预测时间代价;
根据以下公式计算所述各执行计划的时间代价:其中,T为执行计划的时间代价,为所述执行计划的第i个物理操作的预测时间代价,i=1,2,…,N。
11.根据权利要求7-10中任一项所述的服务器,其特征在于,所述各物理操作的训练参数包括以下参数中的任意组合:CPU使用率、内存使用率、元组数目、页面数目、选择度,其中,所述元组数目为所述各物理操作所涉及的元组的数目,所述页面数目为所述各物理操作从磁盘读取的页面的数目。
12.根据权利要求7-10中任一项所述的服务器,其特征在于,所述获取模块具体用于:
接收能耗测试***发送的所述CPU功耗和磁盘功耗,其中,所述CPU功耗是所述能耗测试***根据测试获取的所述数据库***的CPU的电流和电压得到的,所述磁盘功耗是所述能耗测试***根据测试获取的所述数据库***的磁盘的电流和电压得到的。
13.一种能耗测试***,其特征在于,包括:数据分析机、模数A/D转换器、能耗测试设备、电源设备;
所述电源设备,用于为所述能耗测试设备提供电源;
所述能耗测试设备包括多个电流传感器以及多个分压器,所述每个电流传感器的一端与所述电源设备连接,所述每个电流传感器的另一端与待测试的数据库***的一个硬件单元连接,所述电流传感器用于测量所连接的硬件单元的电流,所述每个分压器与一个硬件单元并联,所述每个分压器用于测量所连接的硬件单元的电压,所述能耗测试设备将测量到的所述各硬件单元的电压和电流传输给所述A/D转化器;
所述A/D转换器将所述各硬件单元的电压和电流转换为数字信号,并将转换后的数字信号发送给所述数据分析机;
所述数据分析机对所述数字信号进行数据处理,得到所述数据库***的CPU功耗和磁盘功耗。
CN201410326426.6A 2014-07-09 2014-07-09 数据库***的查询方法、服务器和能耗测试*** Pending CN105243068A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410326426.6A CN105243068A (zh) 2014-07-09 2014-07-09 数据库***的查询方法、服务器和能耗测试***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410326426.6A CN105243068A (zh) 2014-07-09 2014-07-09 数据库***的查询方法、服务器和能耗测试***

Publications (1)

Publication Number Publication Date
CN105243068A true CN105243068A (zh) 2016-01-13

Family

ID=55040719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410326426.6A Pending CN105243068A (zh) 2014-07-09 2014-07-09 数据库***的查询方法、服务器和能耗测试***

Country Status (1)

Country Link
CN (1) CN105243068A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107102995A (zh) * 2016-02-19 2017-08-29 华为技术有限公司 一种sql执行计划的确定方法及装置
CN107193813A (zh) * 2016-03-14 2017-09-22 阿里巴巴集团控股有限公司 数据表连接方式处理方法及装置
CN107688589A (zh) * 2017-02-20 2018-02-13 平安科技(深圳)有限公司 数据库***优化的方法及装置
CN108509453A (zh) * 2017-02-27 2018-09-07 华为技术有限公司 一种信息处理方法及装置
WO2018157680A1 (zh) * 2017-03-01 2018-09-07 华为技术有限公司 一种执行计划的生成方法、装置及数据库服务器
CN109241093A (zh) * 2017-06-30 2019-01-18 华为技术有限公司 一种数据查询的方法、相关装置及数据库***
CN110119403A (zh) * 2019-04-03 2019-08-13 北京三快在线科技有限公司 Sql优化方法、装置、电子设备及可读存储介质
CN110308782A (zh) * 2018-03-22 2019-10-08 阿里巴巴集团控股有限公司 功耗预测、控制方法、设备及计算机可读存储介质
CN107239541B (zh) * 2017-06-02 2020-02-14 星环信息科技(上海)有限公司 一种代价估计的方法及设备
WO2020198925A1 (en) * 2019-03-29 2020-10-08 Pivotal Software, Inc. Predicted properties for database query planning
CN112395311A (zh) * 2019-08-13 2021-02-23 阿里巴巴集团控股有限公司 一种请求的处理时长的预测方法及装置
CN113748398A (zh) * 2019-09-06 2021-12-03 阿里巴巴集团控股有限公司 数据处理与任务调度方法、设备、***及存储介质
CN113826078A (zh) * 2019-09-11 2021-12-21 阿里巴巴集团控股有限公司 资源调度与信息预测方法、设备、***及存储介质
CN116541418A (zh) * 2023-06-30 2023-08-04 阿里巴巴(中国)有限公司 数据查询方法、电子设备及计算机可读存储介质

Cited By (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107102995A (zh) * 2016-02-19 2017-08-29 华为技术有限公司 一种sql执行计划的确定方法及装置
CN107102995B (zh) * 2016-02-19 2020-02-21 华为技术有限公司 一种sql执行计划的确定方法及装置
US10901976B2 (en) 2016-02-19 2021-01-26 Huawei Technologies Co., Ltd. Method and apparatus for determining SQL execution plan
CN107193813A (zh) * 2016-03-14 2017-09-22 阿里巴巴集团控股有限公司 数据表连接方式处理方法及装置
CN107193813B (zh) * 2016-03-14 2021-05-14 阿里巴巴集团控股有限公司 数据表连接方式处理方法及装置
WO2018149085A1 (zh) * 2017-02-20 2018-08-23 平安科技(深圳)有限公司 数据库***优化的方法、***、电子装置及存储介质
US11132362B2 (en) 2017-02-20 2021-09-28 Ping An Technology (Shenzhen) Co., Ltd. Method and system of optimizing database system, electronic device and storage medium
CN107688589B (zh) * 2017-02-20 2019-02-26 平安科技(深圳)有限公司 数据库***优化的方法及装置
CN107688589A (zh) * 2017-02-20 2018-02-13 平安科技(深圳)有限公司 数据库***优化的方法及装置
CN108509453A (zh) * 2017-02-27 2018-09-07 华为技术有限公司 一种信息处理方法及装置
CN108509453B (zh) * 2017-02-27 2021-02-09 华为技术有限公司 一种信息处理方法及装置
WO2018157680A1 (zh) * 2017-03-01 2018-09-07 华为技术有限公司 一种执行计划的生成方法、装置及数据库服务器
CN107239541B (zh) * 2017-06-02 2020-02-14 星环信息科技(上海)有限公司 一种代价估计的方法及设备
CN109241093B (zh) * 2017-06-30 2021-06-08 华为技术有限公司 一种数据查询的方法、相关装置及数据库***
CN109241093A (zh) * 2017-06-30 2019-01-18 华为技术有限公司 一种数据查询的方法、相关装置及数据库***
CN110308782A (zh) * 2018-03-22 2019-10-08 阿里巴巴集团控股有限公司 功耗预测、控制方法、设备及计算机可读存储介质
CN110308782B (zh) * 2018-03-22 2023-09-08 阿里巴巴集团控股有限公司 功耗预测、控制方法、设备及计算机可读存储介质
WO2020198925A1 (en) * 2019-03-29 2020-10-08 Pivotal Software, Inc. Predicted properties for database query planning
CN110119403B (zh) * 2019-04-03 2020-08-18 北京三快在线科技有限公司 Sql优化方法、装置、电子设备及可读存储介质
CN110119403A (zh) * 2019-04-03 2019-08-13 北京三快在线科技有限公司 Sql优化方法、装置、电子设备及可读存储介质
CN112395311A (zh) * 2019-08-13 2021-02-23 阿里巴巴集团控股有限公司 一种请求的处理时长的预测方法及装置
CN113748398A (zh) * 2019-09-06 2021-12-03 阿里巴巴集团控股有限公司 数据处理与任务调度方法、设备、***及存储介质
CN113826078A (zh) * 2019-09-11 2021-12-21 阿里巴巴集团控股有限公司 资源调度与信息预测方法、设备、***及存储介质
CN116541418A (zh) * 2023-06-30 2023-08-04 阿里巴巴(中国)有限公司 数据查询方法、电子设备及计算机可读存储介质
CN116541418B (zh) * 2023-06-30 2023-09-15 阿里巴巴(中国)有限公司 数据查询方法、电子设备及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN105243068A (zh) 数据库***的查询方法、服务器和能耗测试***
CN109858740B (zh) 企业风险的评估方法、装置、计算机设备及存储介质
Yang et al. Using the comprehensive patent citation network (CPC) to evaluate patent value
US8566308B2 (en) Intelligent adaptive index density in a database management system
CN108446210A (zh) ***性能的度量方法、存储介质和服务器
Huang et al. A framework for scalable bilevel optimization: Identifying and utilizing the interactions between upper-level and lower-level variables
CN111737078B (zh) 基于负载类型的自适应云服务器能耗测算方法、***及设备
Yao et al. Evaluating and analyzing the energy efficiency of CNN inference on high‐performance GPU
CN103399797A (zh) 服务器资源配置方法及装置
Götz et al. Energy-efficient databases using sweet spot frequencies
US20090182994A1 (en) Two-level representative workload phase detection method, apparatus, and computer usable program code
Roukh et al. Eco-processing of OLAP complex queries
Zhou et al. An adaptive ensemble of surrogate models based on hybrid measure for reliability analysis
Gagolewski et al. Ockham’s index of citation impact
Pang et al. PUMA: Parallel subspace clustering of categorical data using multi-attribute weights
Ma et al. Query independent scholarly article ranking
US7647333B2 (en) Cube-based percentile calculation
JP5584917B2 (ja) データ分析システム及びデータ分析方法
CN116820767A (zh) 一种云资源管理方法、装置、电子设备及存储介质
Bouhatous et al. The impact of multicore cpus on eco-friendly query processors in big data warehouses
Bihari et al. Year based EM-index: a new approach to evaluate the scientific impact of scholars
CN110717244B (zh) 基于平均偏离度算法的数据信任度分析计算机仿真方法
Lu et al. On the auto-tuning of elastic-search based on machine learning
Miao Clustering of different dimensional variables based on distance correlation coefficient
Qi et al. PreKar: A learned performance predictor for knowledge graph stores

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20160113

WD01 Invention patent application deemed withdrawn after publication