WO2024066720A1

WO2024066720A1 - 指标阈值的确定方法、装置、存储介质及电子装置

Info

Publication number: WO2024066720A1
Application number: PCT/CN2023/110331
Authority: WO
Inventors: 杨伟伟; 冯媛; 邵敏峰
Original assignee: 中兴通讯股份有限公司
Priority date: 2022-09-30
Filing date: 2023-07-31
Publication date: 2024-04-04
Also published as: CN117875746A

Abstract

本公开实施例提出了一种指标阈值的确定方法、装置、存储介质及电子装置，该方法包括：获取目标指标对应的聚合指标数据；从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。采用上述技术方案，解决了相关技术中如何确定出指标阈值的问题。

Description

指标阈值的确定方法、装置、存储介质及电子装置

本公开要求于2022年09月30日提交中国专利局、申请号为202211225305.3、发明名称“指标阈值的确定方法、装置、存储介质及电子装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及大数据和人工智能技术领域，具体而言，涉及一种指标阈值的确定方法、装置、存储介质及电子装置。

背景技术

随着万物互联时代的到来，传感器、智能手机、可穿戴设备以及智能家电等设备将成为万物互联的一部分，在设备的运行时期往往会产生海量数据，无线网络运营商在对数据的快速处理过程中，通常会挖掘有效数据价值并应用于运维支撑和运营分析。基于移动互联网的业务丰富多样，不同的业务对网络性能的要求也各异，因此，在采集数据进行运维支撑和运营分析的过程中，往往需要结合业务的特点和指标的实际情况进行阈值设定，从而灵活地构建指标的评价标准。

需要进行阈值设定的运维分析场景非常多，如异常检测、根因分析、数据预测、告警管理、智能恢复和感知评估等。以往无线网络运营商对业务的指标进行阈值设定的时候主要是基于指标的固定经验阈值或者相对复杂的统计学分布得到的动态阈值，即使是采用基于统计学分布等数学方法的动态阈值，也是将阈值求解问题转换为另一个维度的阈值设置问题，难以准确客观地衡量业务指标的优劣情况，进而有效地指导网络运维和分析并达到数据价值最大化的目标。

因此，针对相关技术，如何确定出指标阈值的问题，目前尚未提出有效的解决方案。

因此，有必要对相关技术予以改良以克服相关技术中的所述缺陷。

发明内容

本公开实施例提供了一种指标阈值的确定方法、装置、存储介质及电子装置，以至少解决如何确定出指标阈值的问题。

根据本公开实施例的一方面，提供一种指标阈值的确定方法，包括：获取目标指标对应的聚合指标数据；从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。

根据本公开实施例的又一方面，还提供了一种指标阈值的确定装置，包括：获取模块，设置为获取目标指标对应的聚合指标数据；第一确定模块，设置为从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；第二确定模块，设置为根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。

根据本公开实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述指标阈值的确定方法。

根据本公开实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述指标阈值的确定方法。

通过本公开，通过获取目标指标对应的聚合指标数据；从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值，解决了如何确定指标阈值的技术问题。

附图说明

此处所说明的附图用来提供对本公开的进一步理解，构成本公开的一部分，本公开的示例性实施例及其说明用于解释本公开，并不构成对本公开的不当限定。在附图中：

图1是本公开实施例的指标阈值的确定方法的计算机终端的硬件结构框图；

图2是根据本公开实施例的指标阈值的确定方法的流程图；

图3是根据本公开实施例的二维离散点的示意图；

图4是根据本公开实施例的指标阈值的确定装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本公开方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、***、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

本公开实施例中所提供的方法实施例可以在计算机终端或者类似的运算装置中执行。以运行在计算机终端上为例，图1是本公开实施例的指标阈值的确定方法的计算机终端的硬件结构框图。如图1所示，计算机终端可以包括一个或多个(图1中仅示出一个)处理器202(处理器202可以包括但不限于微处理器(Microprocessor Unit，简称是MPU)或可编程逻辑器件(Programmable logic device，简称是PLD)和设置为存储数据的存储器204，在一个示例性实施例中，上述计算机终端还可以包括设置为通信功能的传输设备206以及输入输出设备208。本领域普通技术人员可以理解，图1所示的结构仅为示意，其并不对上述计算机终端的结构造成限定。例如，计算机终端还可包括比图1中所示更多或者更少的组件，或者具有与图1所示等同功能或比图1所示功能更多的不同的配置。

存储器204可设置为存储计算机程序，例如，应用软件的软件程序以及模块，如本公开实施例中的指标阈值的确定方法对应的计算机程序，处理器202通过运行存储在存储器204内的计算机程序，从而执行各种功能应用以及数据处理，即实现上述的方法。存储器204可包括高速随机存储器，还可包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器204可进一步包括相对于处理器202远程设置的存储器，这些远程存储器可以通过网络连接至计算机终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

传输设备206设置为经由一个网络接收或者发送数据。上述的网络具体实例可包括计算机终端的通信供应商提供的无线网络。在一个实例中，传输设备206包括一个网络适配器(Network Interface Controller，简称为NIC)，其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中，传输设备206可以为射频(Radio Frequency，简称为RF)模块，其设置为通过无线方式与互联网进行通讯。

接下来对本公开中提及的技术术语的含义进行解释：

KQI，Key Quality Indicators，业务质量参数；

KPI，Key Performance Index，关键性能指标；

TCP，Transmission Control Protocol，传输控制协议；

RTT，Round-Trip Time，往返时延；

CPU，Central Processing Unit，中央处理器。

图2是根据本公开实施例的指标阈值的确定方法的流程图，如图2所示，该方法的步骤包括：

步骤S202，获取目标指标对应的聚合指标数据。

步骤S204，从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据。

需要说明的是，上述对第二指标数据进行聚类的聚类算法可以包括Kmeans聚类算法，DBSCAN-基于密度的空间聚类算法，谱聚类算法，GMM-高斯混合模型聚类算法，MeanShift-均值迁移聚类算法，层次聚类等，但不限于此。

步骤S206，根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。

本公开实施例通过获取目标指标对应的聚合指标数据；从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值，解决了如何确定出指标阈值的问题。

在一个示例性实施例中，为了更好的理解上述步骤S202中获取目标指标对应的聚合指标数据的实现过程，提出了以下实现步骤：确定预先设置的监测维度、所述监测维度的监测对象、所述目标指标的指标类别、所述指标类别下的初始指标数据和所述目标指标对应的时间聚合粒度；根据所述预先设置的监测维度、所述监测维度的监测对象、所述目标指标的指标类别、所述指标类别下的初始指标数据确定待聚合指标数据；按照所述目标指标对应的时间聚合粒度对所述待聚合指标数据进行聚合，得到所述目标指标对应的聚合指标数据。

在一个示例性实施例中，提出了一种按照所述目标指标对应的时间聚合粒度对所述待聚合指标数据进行聚合，得到所述目标指标对应的聚合指标数据的技术方案，具体包括：获取所述待聚合指标数据的第一时间粒度；在确定所述第一时间粒度小于所述时间聚合粒度的情况下，获取待聚合指标数据在所述第一时间粒度内的第一指标数据，在将多个第一时间粒度聚合为所述时间聚合粒度；将所述多个第一时间粒度内的多个第一指标数据聚合为所述时间聚合粒度内的第一聚合指标数据，将所述第一聚合指标数据确定为所述目标指标对应的聚合指标数据。

在一个示例性实施例中，还可以在确定所述第一时间粒度等于所述时间聚合粒度的情况下，获取待聚合指标数据在所述第一时间粒度内的第一指标数据，将所述第一指标数据确定为所述目标指标对应的聚合指标数据。

在一个示例性实施例中，在对所述第二指标数据进行聚类之前，进一步的，可以对所述第二指标数据进行标准化处理，得到多个标准化指标数值，其中，每一个标准化指标数值对应有排序序号；对于每一个标准化指标数值，将所述标准化指标数值对应的排序序号确定为横坐标，将所述标准化指标数值确定为纵坐标，得到所述标准化指标数值对应的坐标点；确定出两两相邻的所述坐标点之间的坐标斜率，得到多个坐标斜率，对于所述多个坐标斜率中的每一个坐标斜率，确定所述每一个坐标斜率的平滑值，得到多个平滑值；根据所述多个平滑值确定第三指标数据，并将所述第三指标数据确定为更新后的所述第二指标数据。

需要说明的是，上述标准化处理可以包括归一化处理，例如，采用归一化的处理方式对第二指标数据进行标准化，将范围压缩至[0，1]范围内，可以将数据标准化，从而提高数据的处理效率。

在一个示例性实施例中，在对于所述多个坐标斜率中的每一个坐标斜率，确定所述每一个坐标斜率的平滑值，得到多个平滑值的过程中，提出了如下技术方案：按照预设聚类算法对将所述多个坐标斜率进行聚类，得到多组斜率值；对于每一组斜率值，将每一组斜率值的坐标斜率的均值确定为所述每一组斜率值的坐标斜率的平滑值。

其中，上述预设聚类算法可以包括Kmeans聚类算法，DBSCAN-基于密度的空间聚类算法，谱聚类算法，GMM-高斯混合模型聚类算法，MeanShift-均值迁移聚类算法，层次聚类等，本公开对此不作限制。

在一个示例性实施例中，还提出了一种技术方案，具体步骤包括：在确定所述多组斜率值中存在目标组斜率值的情况下，将与所述目标组斜率值相邻的临近组斜率值的坐标斜率的平滑值确定为所述目标组斜率值内的坐标斜率的平滑值，或者按照预设平滑值确定所述目标组斜率值内的坐标斜率的平滑值，其中，所述目标组斜率值内的坐标斜率的数量与所述每一组斜率值内的坐标斜率的数量不同。

在一个示例性实施例中，在对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数之后，进一步的，可以根据所述每个分组的指标数据的均值得到多组均值，并根据所述多组均值确定均值集合，其中，所述均值集合包括各个分段函数对应的均值；确定所述分段函数的交点坐标集合的交点坐标，确定所述交点坐标对应的左导数和右导数，并确定所述左导数在所述均值集合内对应的第一分段函数的第一均值和所述右导数在所述均值集合内对应的第二分段函数的第二均值；基于所述第一均值和所述第二均值确定是否将所述交点坐标保留在所述指标阈值集合内。

在一个示例性实施例中，针对基于所述第一均值和所述第二均值确定是否将所述交点坐标保留在所述指标阈值集合内的实现过程，提出以下技术方案进行说明：确定所述交点坐标与原点坐标之间的第一绝对距离值；根据所述第一绝对距离值和所述第一均值确定所述第一均值对应的第一坐标信息，其中，所述第一坐标信息表示所述第一分段函数的自变量取值；根据所述第一绝对距离值和所述第二均值确定所述第二均值对应的第二坐标信息，其中，所述第二坐标信息表示所述第二分段函数的自变量取值；在确定所述第一坐标信息与所述第二坐标信息相同的情况下，将所述交点坐标保留在所述指标阈值集合内；在确定所述第一坐标信息与所述第二坐标信息不同的情况下，将所述交点坐标保留在所述指标阈值集合内。

在一个示例性实施例中，提出了一种如何实现上述步骤S206中根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值的技术方案，具体包括：确定出所述分段函数的不可导点集合和二阶导数为目标值的坐标点；基于所述不可导点集合、所述二阶导数为目标值的坐标点和所述分段函数的交点坐标集合确定出所述指标阈值集合；根据所述目标指标的指标偏向性从指标阈值集合内确定出指标阈值。

其中，需要说明的是，上述目标值例如可以取0，但不限于此。

在一个示例性实施例中，可以通过多种方式实现根据所述目标指标的指标偏向性从指标阈值集合内确定出指标阈值的过程，具体包括：方式1、在确定所述目标指标的指标偏向性为负向的情况下，如果确定所述指标阈值的类型为告警阈值，则将所述指标阈值集合内的最大值确定为所述指标阈值；如果确定所述指标阈值的类型为择优阈值，则将所述指标阈值集合内的最小值确定为所述指标阈值。

方式2、在确定所述目标指标的指标偏向性为正向的情况下，如果确定所述指标阈值的类型为告警阈值，则将所述指标阈值集合内的最小值确定为所述指标阈值；如果确定所述指标阈值的类型为择优阈值，则将所述指标阈值集合内的最大值确定为所述指标阈值。

可选的，在上述实施例中，告警阈值可以理解为目标指标的指标数据对应的性能较差时的阈值，例如，设置CPU使用率的告警阈值为80％，此时CPU占用资源较多，性能较差。而择优阈值可以理解为目标指标的指标数据对应的性能较优时的阈值，例如，设置网络时延的择优阈值为10％，此时网络时延较小，性能较优。特别的，对于多个择优阈值，从中选取最小的作为择优时延。

进一步的，通过以下步骤对本公开实施例的指标阈值的确定过程作进一步的详细描述。

(1)模型构建单元：

首先基于运维应用实际业务场景，确定监测维度和指标，构建运维场景关键KPI指标体系{KPI1，KPI2，...，KPIn}；然后根据实际的业务运维实时性要求，确定时间聚合粒度，对每个维度-KPI数据进行时间粒度指标聚合，构建{维度(即监测维度)、对象(即监测对象)、时间粒度(即时间聚合粒度)、指标(即目标指标的指标类别)、数据(即指标类别下的初始指标数据)}五元组数据；其中，业务指标配置信息需要明确指标的偏向性及指标的正常范围区间。

(2)基于离散样本点求解映射函数求解：

步骤a、构建单维度单对象或多对象KPI指标数据集合(对象范围选择取决于实际应用场景)，将时序指标进行数据值排序(从小到大或从大到小均可)，得到ID值和KPI指标值组合的二维序列{i：Valuei}，i∈[1，N]，N为数据集合的样本个数，ID值为排序后KPI指标的对应序号，从1开始以间隔为1的长度递增。

为了更易于形象化地理解，二维序列可以表现为坐标轴分别为样本ID和KPI指标值的二维离散点图像。如图3所示，以ID为横坐标，以KPI指标值为纵坐标的坐标点。

步骤b、考虑到KPI指标值可能波动较大，为了便于后续处理，先对指标进行标准化。采用归一化的处理方式对KPI指标值进行标准化，将范围压缩至[0，1]范围内。

步骤c、分段计算连续两点间斜率k＝(y₂-y₁)/(x₂-x₁)，并对斜率进行三点均值平滑斜率k’，基于平滑斜率k’及ID值进行聚类，得到G个分组，计算各分组的平滑斜率均值，使用集合K进行标记。

其中，采用聚类的算法可以避免在算法模型构建的过程中过多地进行参数设置，并且可以将序列中有差异的数据进行分类，便于后续更加容易完成转折点的获取，本公开对聚类算法的类型不作具体限定。

步骤d、对步骤c的G个聚类分组结果集，分别进行曲线拟合，获得拥有G个拟合函数的分段函数f(x)。曲线拟合的方式可以快速获得近似的分段函数，为后续在阈值自动计算的过程中求解转折点提供了有效的途径。

(3)阈值自动计算：

步骤a、求解各相邻分段拟合函数的交点坐标信息，对交点坐标，再求解x∈[1，N]区间，f(x)不可导点集合C及二阶导数为0的坐标点，组成阈值集合T。对x∈C，分别计算左导数k1’及右导数k2’，针对k1’、k2’分别计算与k∈K的绝对距离，判定归属类别。若左、右导数均归属同一分组，表明该点并非我们想寻找的转折点，则将该点从阈值集合T中剔除。

步骤b、结合步骤1业务指标配置信息中提供的指标偏向性信息，取阈值集合T中最大值或最小值为所求得阈值解。

接下来结合以下实施例对指标阈值的确定方法进行进一步说明，以下实施例采用了不同的运维场景以及其对应的指标数据进行说明。

实施例1

以基于底层监控指标的IT设备运维场景进行举例，在运维过程中，时常需要根据服务器的资源使用情况来进行阈值设置，当达到设定阈值时需要发出告警，并考虑进行服务器扩容。

对于模型构建单元，确定本实施例的监测维度为服务器，对象为服务器A、服务器B、服务器C，指标为CPU使用率(％)、内存使用率(％)、磁盘使用率(％)、网络速率(kbps)，以上指标构建成服务器设备运维场景关键的KPI指标体系；

根据实际的业务运维实时性要求，确定时间聚合粒度为1小时，以服务器的CPU使用率(％)为目标指标为例，对该指标进行时间粒度聚合，构建{维度、对象、时间粒度、指标、数据}五元组数据；业务指标配置信息明确CPU使用率(％)指标的偏向性为负向，指标的正常范围区间为0到100。

获得如表1所示的某天24个小时以1小时为粒度，经过聚合后的CPU使用率指标数据：

表1：指标数据记录表

基于上述模型构建单元的内容，根据离散样本点求解映射函数。

首先，在模型构建单元的结果中，确定服务器A、服务器B为对象，选择其对应的指标数据集合，将集合中的指标数据按照数值进行排序，得到ID值和CPU使用率(％)数值组合的二维序列{i：Valuei}，i∈[1，48]，构建横轴为样本ID、纵轴为CPU使用率(％)的二维离散点图像。

其次，对CPU使用率(％)的指标数值进行归一化处理，可以采用最小值-最大值缩放法，将指标范围压缩至[0，1]范围内，归一化函数如下所示：

其中，上述二维序列内的二维序列离散点可以理解为上述标准化指标数值对应的坐标点。

再次，分段计算连续两点间斜率(相当于上述坐标斜率)，并对斜率进行三点均值平滑斜率k’，最后2个点无法计算三点均值平滑斜率，可以用前面1个点的三点均值平滑斜率代替，得到ID值和三点均值平滑斜率组合的新序列{i：k’i}，i∈[1，48]，对序列中的值进行DBSCAN聚类，得到4个分组，计算各分组的平滑斜率均值(相当于对于每一组斜率值，将每一组斜率值的坐标斜率的均值确定为所述每一组斜率值的坐标斜率的平滑值的过程)，得到集合K＝{0.046，0.012，0.034，0.089}。

最后，对上步每个分组的数据使用线性一次函数进行拟合，得到有4个分段的分段函数f(x)。

基于上述求解的映射函数，进行阈值自动学习。

首先，求解各相邻分段拟合函数的交点坐标集合X＝{(10，0.3)，(30，0.5)，(40，0.8)}，对于交点坐标，再求解x∈[1，48]区间，f(x)不可导点集合C及二阶导数为0的坐标点，组成阈值集合T，此实施例中集合C和T同样为{(10，0.3)，(30，0.5)，(40，0.8)}。对x∈C，分别计算左导数k1’及右导数k2’，针对k1’、k2’分别计算与k∈K的绝对距离，k选择坐标点左、右两侧分段函数所对应分组的平滑斜率均值，根据计算的绝对距离，判定归属类别。对于坐标点(10，0.3)，左导数k1’、右导数k2’分别为0.04和0.01，坐标点(10，0.3)左、右两侧分段函数所对应分组的平滑斜率均值分别为0.046和0.012，根据绝对距离计算，左导数k1’、右导数k2’属于不同分组，则不将该点从阈值集合T中剔除。其他坐标点以此类推，最终得到阈值集合T为{(10，0.3)，(30，0.5)，(40，0.8)}。

其次，结合模型构建单元业务指标配置信息中设置的指标偏向性为负向，且使用场景为寻找需要发出告警的CPU使用率(％)，即较差阈值，故选取阈值集合T中三点均值平滑斜率的最大值0.8为生成阈值的参考值，根据该值反向求得归一化前的CPU使用率(％)指标值90.72，即为所需阈值解。

实施例2

以基于模型构建KPI/KQI指标的业务***运维场景进行举例，在移动运营商的网络运维中，需要关注小区的KQI指标情况，通过小区的KQI来对小区的感知情况进行评价，在评价的过程中通常需要进行KQI指标阈值的设定。

对于模型构建单元，确定本实施例的监测维度为小区，对象为小区622001、小区622002、小区622003、...、小区622099，指标为TCP连接成功率(％)、TCP重传率(％)、TCP乱序率(％)、TCP平均RTT时延(ms)；

根据实际的业务运维实时性要求，确定时间聚合粒度为1小时，以小区的TCP平均RTT时延(ms)为例，对该指标进行时间粒度聚合，构建{维度、对象、时间粒度、指标、数据}五元组数据；业务指标配置信息明确TCP平均RTT时延(ms)指标的偏向性为负向，指标的正常范围为大于等于0。

获得某天24个小时以1小时为粒度，经过聚合后的TCP平均RTT时延(ms)指标数据。

首先，在模型构建单元的结果中，确定小区622001、小区622002、小区622003、...、小区622050共50个小区为对象，选择其对应的指标数据集合，将集合中的指标数据按照数值进行排序，得到ID值和TCP平均RTT时延(ms)数值组合的二维序列{i：Valuei}，i∈[1，1200]。构建横轴为样本ID、纵轴为TCP平均RTT时延(ms)的二维离散点图像。

其次，对TCP平均RTT时延(ms)的指标数值进行归一化处理，可以采用最小值-最大值缩放法，将指标范围压缩至[0，1]范围内。

再次，分段计算连续两点间斜率，并对斜率进行三点均值平滑斜率k’，最后2个点无法计算三点均值平滑斜率，可以用前面1个点的三点均值平滑斜率代替，得到ID值和三点均值平滑斜率组合的新序列{i：k’i}，i∈[1，1200]，对序列中的值进行高斯混合聚类，得到13个分组，计算各分组的平滑斜率均值，得到集合K。

最后，对上步每个分组的数据使用线性一次函数、二次函数等进行拟合，可以选择拟合最好的曲线作为拟合结果，得到有13个分段的分段函数f(x)。

基于上述求解的映射函数，进行阈值自动学习。

首先，求解各相邻分段拟合函数的交点坐标集合X，对于交点坐标，再求解x∈[1，1200]区间，f(x)不可导点集合C及二阶导数为0的坐标点，组成阈值集合T。对x∈C，分别计算左导数k1’及右导数k2’，针对k1’、k2’分别计算与k∈K的绝对距离，k选择坐标点左、右两侧分段函数所对应分组的平滑斜率均值，根据计算的绝对距离，判定归属类别。如果属于相同分组，则将该点从阈值集合T中剔除。

其次，结合模型构建单元业务指标配置信息中设置的指标偏向性为负向，且使用场景为寻找需要理想阈值，故选取阈值集合T中三点均值平滑斜率的最小值0.123为生成阈值的参考值，根据该值反向求得归一化前的TCP平均RTT时延(ms)指标值2.5，即为所需阈值解。

基于上述实施例，根据不同类型指标在现实网络的实际分布特征，比如大部分指标都具备“三段式”特征，即少量“劣化”样本、绝大多数“正常”样本、少量“优质”样本，可以将指标阈值的计算问题转化为图像的求解问题。

在求解的过程中，首先对指标的单边性进行划分，区分正向、负向指标，其次再对指标数据进行预处理并计算曲线的变化率，随后采用机器学习算法对指标数据进行模型训练，最后将阈值的学习转化为基于指标单边性转折点的求解问题，以较低的成本和较高的准确性实现不同类型指标阈值的智能生成。

相较于传统的固定经验阈值或者相对复杂的基于统计学分布的动态阈值，可以较为彻底地解决阈值或转换后的阈值需要人工设置的问题。本公开的技术方案具有更好的适用性和准确性，为移动运营商的运维支撑和运营分析提供了有力的保障，不仅助力移动运营商更加准确地进行运维支撑和运营分析，也大大节省了人力成本。

另外，本公开涉及大数据和人工智能技术领域，尤其涉及互联网、物联网等存在大量指标阈值需要进行针对性设置的通信大数据及其工程运维领域，比如移动运营商的运维支撑和运营分析，如异常检测、根因分析、数据预测、告警管理、智能恢复和感知评估等场景。目前市场上的指标阈值的设定方法应用非常广泛，并且指标阈值主要是基于指标的固定经验阈值或者相对复杂的统计学分布得到的动态阈值进行设定。随着人工智能技术的深度发展，基于人工智能算法构建的模型具有更好的适用性，本公开将指标阈值的计算问题转化为图像的求解问题，并结合人工智能算法进行训练和预测，所采用的人工智能算法在实际应用中也有较多的选择，比如神经网络、聚类、分类等算法，所构建的模型具有较好的准确性和较广阔的应用前景，为移动运营商工程运维的精确化和智能化提供了前提，也为人力成本的降低明确了方向。

本公开针对运维领域，特别是大型复杂架构***。包括基于底层监控指标的IT设备运维及基于模型构建KPI/KQI指标的业务***运维。通过对***关键指标采集、清洗、监测维度模型构建及指标阈值自动学习，从而识别***中可能存在的故障或风险，进而方便网优人员对故障进行提前处置或规避。

在本实施例中还提供了指标阈值的确定装置，该装置用于实现上述实施例及优选实施方式，已经进行过说明的不再赘述。如以下所使用的，术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的设备较佳地以软件来实现，但是硬件，或者软件和硬件的组合的实现也是可能并被构想的。

图4是根据本公开实施例的指标阈值的确定装置的结构框图。如图4所示，指标阈值的确定装置包括：

获取模块42，设置为获取目标指标对应的聚合指标数据；

第一确定模块44，设置为从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；

第二确定模块46，设置为根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。

通过上述装置，通过获取目标指标对应的聚合指标数据；从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值，解决了如何确定出指标阈值的问题。

在一个示例性实施例中，上述获取模块42还设置为：确定预先设置的监测维度、所述监测维度的监测对象、所述目标指标的指标类别、所述指标类别下的初始指标数据和所述目标指标对应的时间聚合粒度；根据所述预先设置的监测维度、所述监测维度的监测对象、所述目标指标的指标类别、所述指标类别下的初始指标数据确定待聚合指标数据；按照所述目标指标对应的时间聚合粒度对所述待聚合指标数据进行聚合，得到所述目标指标对应的聚合指标数据。

在一个示例性实施例中，上述获取模块42还设置为：获取所述待聚合指标数据的第一时间粒度；在确定所述第一时间粒度小于所述时间聚合粒度的情况下，获取待聚合指标数据在所述第一时间粒度内的第一指标数据，在将多个第一时间粒度聚合为所述时间聚合粒度；将所述多个第一时间粒度内的多个第一指标数据聚合为所述时间聚合粒度内的第一聚合指标数据，将所述第一聚合指标数据确定为所述目标指标对应的聚合指标数据。

在一个示例性实施例中，上述获取模块42还设置为：在确定所述第一时间粒度等于所述时间聚合粒度的情况下，获取待聚合指标数据在所述第一时间粒度内的第一指标数据，将所述第一指标数据确定为所述目标指标对应的聚合指标数据。

在一个示例性实施例中，上述获取模块42还设置为：在对所述第二指标数据进行聚类之前，对所述第二指标数据进行标准化处理，得到多个标准化指标数值，其中，每一个标准化指标数值对应有排序序号；对于每一个标准化指标数值，将所述标准化指标数值对应的排序序号确定为横坐标，将所述标准化指标数值确定为纵坐标，得到所述标准化指标数值对应的坐标点；确定出两两相邻的所述坐标点之间的坐标斜率，得到多个坐标斜率，对于所述多个坐标斜率中的每一个坐标斜率，确定所述每一个坐标斜率的平滑值，得到多个平滑值；根据所述多个平滑值确定第三指标数据，并将所述第三指标数据确定为更新后的所述第二指标数据。

在一个示例性实施例中，上述获取模块42还设置为：在对于所述多个坐标斜率中的每一个坐标斜率，确定所述每一个坐标斜率的平滑值，得到多个平滑值的过程中，按照预设聚类算法对将所述多个坐标斜率进行聚类，得到多组斜率值；对于每一组斜率值，将每一组斜率值的坐标斜率的均值确定为所述每一组斜率值的坐标斜率的平滑值。

在一个示例性实施例中，上述获取模块42还设置为：在确定所述多组斜率值中存在目标组斜率值的情况下，将与所述目标组斜率值相邻的临近组斜率值的坐标斜率的平滑值确定为所述目标组斜率值内的坐标斜率的平滑值，或者按照预设平滑值确定所述目标组斜率值内的坐标斜率的平滑值，其中，所述目标组斜率值内的坐标斜率的数量与所述每一组斜率值内的坐标斜率的数量不同。

在一个示例性实施例中，上述第一确定模块44还设置为：根据所述每个分组的指标数据的均值得到多组均值，并根据所述多组均值确定均值集合，其中，所述均值集合包括各个分段函数对应的均值；确定所述分段函数的交点坐标集合的交点坐标，确定所述交点坐标对应的左导数和右导数，并确定所述左导数在所述均值集合内对应的第一分段函数的第一均值和所述右导数在所述均值集合内对应的第二分段函数的第二均值；基于所述第一均值和所述第二均值确定是否将所述交点坐标保留在所述指标阈值集合内。

在一个示例性实施例中，上述第一确定模块44还设置为：确定所述交点坐标与原点坐标之间的第一绝对距离值；根据所述第一绝对距离值和所述第一均值确定所述第一均值对应的第一坐标信息，其中，所述第一坐标信息表示所述第一分段函数的自变量取值；根据所述第一绝对距离值和所述第二均值确定所述第二均值对应的第二坐标信息，其中，所述第二坐标信息表示所述第二分段函数的自变量取值；在确定所述第一坐标信息与所述第二坐标信息相同的情况下，将所述交点坐标保留在所述指标阈值集合内；在确定所述第一坐标信息与所述第二坐标信息不同的情况下，将所述交点坐标保留在所述指标阈值集合内。

在一个示例性实施例中，上述第二确定模块46还设置为：确定出所述分段函数的不可导点集合和二阶导数为目标值的坐标点；基于所述不可导点集合、所述二阶导数为目标值的坐标点和所述分段函数的交点坐标集合确定出所述指标阈值集合；根据所述目标指标的指标偏向性从指标阈值集合内确定出指标阈值。

在一个示例性实施例中，上述第二确定模块46还设置为：在确定所述目标指标的指标偏向性为负向的情况下，如果确定所述指标阈值的类型为告警阈值，则将所述指标阈值集合内的最大值确定为所述指标阈值；如果确定所述指标阈值的类型为择优阈值，则将所述指标阈值集合内的最小值确定为所述指标阈值。

在一个示例性实施例中，上述第二确定模块46还设置为：在确定所述目标指标的指标偏向性为正向的情况下，如果确定所述指标阈值的类型为告警阈值，则将所述指标阈值集合内的最小值确定为所述指标阈值；如果确定所述指标阈值的类型为择优阈值，则将所述指标阈值集合内的最大值确定为所述指标阈值。

进一步的，本公开提出了一种基于曲线图像计算的阈值智能学习运维装置，能够解决业界阈值自学习领域替换的核心问题(即将一个阈值自动学习过程转换为另一个阈值的门限设置)，真正做到无人工干预的阈值自动识别及运维。通过对大数据运维指标的采集、清洗、模型构建，获得基于实际应用场景粒度下监测对象的指标数据；将构建后数据进行序列图形化展示，将分布数据转换为曲线图像，并通过对分布的转折点求解，结合实际的指标业务特征，进一步实现指标阈值自学习功能。

本公开第一方面提供了基于采集指标的模型构建单元，设置为实现数据清洗、聚体模型描述及核心业务指标配置项描述等功能。

本公开第二方面提供了一种基于离散样本点求解映射函数的方法，所述方法包括：基于模型构建后的时序数据转换为本公开求解阈值时所需的图像表现形式，需要说明的是，此处不是要真正将图像进行绘制，而是转后的数据序列能够表达图像的特点；通过聚类、图像拟合算法，得到图像基于样本序列的映射函数。

本公开第三方面提供了一种基于曲线图像计算的阈值自动学习计算方法，所述方法包括：通过对上述步骤所得函数曲线的斜率变化率求解，结合指标的业务特性，获得阈值智能识别结果。

本公开第四方面提供了一种基于曲线图像计算的阈值自动学习装置，所述装置包括：数据实时聚合模块，设置为针对运维***多维度***每个实体节点的关键KPI指标进行实时数据清洗及指标聚合；阈值智能识别模块，设置为执行上述步骤中的方法。

本公开第五方面提供了一种电子设备，所述电子设备包括计算机处理器以及存储器：计算机存储器设置为存储计算机程序；

处理器设置为实现上述第一方面所述的模型构建单元所实现的功能，以及执行上述第二方面所述的一种基于离散样本点求解映射函数的方法和第三方面所述的一种基于曲线图像计算的阈值自动学习计算方法。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个可读存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本公开各个实施例的方法。

在一个示例性实施例中，上述计算机可读存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。

本实施例中的具体示例可以参考上述实施例及示例性实施方式中所描述的示例，本实施例在此不再赘述。

本公开的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取目标指标对应的聚合指标数据；

S2，从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；

S3，根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。

在一个示例性实施例中，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

显然，本领域的技术人员应该明白，上述的本公开的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本公开不限制于任何特定的硬件和软件结合。

以上所述仅为本公开的优选实施例而已，并不用于限制本公开，对于本领域的技术人员来说，本公开可以有各种更改和变化。凡在本公开的原则之内，所作的任何修改、等同替换、改进等，均应包含在本公开的保护范围之内。

Claims

一种指标阈值的确定方法，包括：

获取目标指标对应的聚合指标数据；

从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；

根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。
根据权利要求1所述的指标阈值的确定方法，其中，获取目标指标对应的聚合指标数据，包括：

确定预先设置的监测维度、所述监测维度的监测对象、所述目标指标的指标类别、所述指标类别下的初始指标数据和所述目标指标对应的时间聚合粒度；

根据所述预先设置的监测维度、所述监测维度的监测对象、所述目标指标的指标类别、所述指标类别下的初始指标数据确定待聚合指标数据；

按照所述目标指标对应的时间聚合粒度对所述待聚合指标数据进行聚合，得到所述目标指标对应的聚合指标数据。
根据权利要求2所述的指标阈值的确定方法，其中，按照所述目标指标对应的时间聚合粒度对所述待聚合指标数据进行聚合，得到所述目标指标对应的聚合指标数据，包括：

获取所述待聚合指标数据的第一时间粒度；

在确定所述第一时间粒度小于所述时间聚合粒度的情况下，获取待聚合指标数据在所述第一时间粒度内的第一指标数据，在将多个第一时间粒度聚合为所述时间聚合粒度；

将所述多个第一时间粒度内的多个第一指标数据聚合为所述时间聚合粒度内的第一聚合指标数据，将所述第一聚合指标数据确定为所述目标指标对应的聚合指标数据。
根据权利要求3所述的指标阈值的确定方法，其中，所述方法还包括：

在确定所述第一时间粒度等于所述时间聚合粒度的情况下，获取待聚合指标数据在所述第一时间粒度内的第一指标数据，将所述第一指标数据确定为所述目标指标对应的聚合指标数据。
根据权利要求1所述的指标阈值的确定方法，其中，在对所述第二指标数据进行聚类之前，所述方法还包括：

对所述第二指标数据进行标准化处理，得到多个标准化指标数值，其中，每一个标准化指标数值对应有排序序号；

对于每一个标准化指标数值，将所述标准化指标数值对应的排序序号确定为横坐标，将所述标准化指标数值确定为纵坐标，得到所述标准化指标数值对应的坐标点；

确定出两两相邻的所述坐标点之间的坐标斜率，得到多个坐标斜率，对于所述多个坐标斜率中的每一个坐标斜率，确定所述每一个坐标斜率的平滑值，得到多个平滑值；

根据所述多个平滑值确定第三指标数据，并将所述第三指标数据确定为更新后的所述第二指标数据。
根据权利要求5所述的指标阈值的确定方法，其中，在对于所述多个坐标斜率中的每一个坐标斜率，确定所述每一个坐标斜率的平滑值，得到多个平滑值的过程中，包括：

按照预设聚类算法对将所述多个坐标斜率进行聚类，得到多组斜率值；

对于每一组斜率值，将每一组斜率值的坐标斜率的均值确定为所述每一组斜率值的坐标斜率的平滑值。
根据权利要求6所述的指标阈值的确定方法，其中，所述方法还包括：

在确定所述多组斜率值中存在目标组斜率值的情况下，将与所述目标组斜率值相邻的临近组斜率值的坐标斜率的平滑值确定为所述目标组斜率值内的坐标斜率的平滑值，或者按照预设平滑值确定所述目标组斜率值内的坐标斜率的平滑值，其中，所述目标组斜率值内的坐标斜率的数量与所述每一组斜率值内的坐标斜率的数量不同。
根据权利要求1所述的指标阈值的确定方法，其中，在对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数之后，所述方法还包括：

根据所述每个分组的指标数据的均值得到多组均值，并根据所述多组均值确定均值集合，其中，所述均值集合包括各个分段函数对应的均值；

确定所述分段函数的交点坐标集合的交点坐标，确定所述交点坐标对应的左导数和右导数，并确定所述左导数在所述均值集合内对应的第一分段函数的第一均值和所述右导数在所述均值集合内对应的第二分段函数的第二均值；

基于所述第一均值和所述第二均值确定是否将所述交点坐标保留在所述指标阈值集合内。
根据权利要求8所述的指标阈值的确定方法，其中，基于所述第一均值和所述第二均值确定是否将所述交点坐标保留在所述指标阈值集合内，包括：

确定所述交点坐标与原点坐标之间的第一绝对距离值；

根据所述第一绝对距离值和所述第一均值确定所述第一均值对应的第一坐标信息，其中，所述第一坐标信息表示所述第一分段函数的自变量取值；

根据所述第一绝对距离值和所述第二均值确定所述第二均值对应的第二坐标信息，其中，所述第二坐标信息表示所述第二分段函数的自变量取值；

在确定所述第一坐标信息与所述第二坐标信息相同的情况下，将所述交点坐标保留在所述指标阈值集合内；

在确定所述第一坐标信息与所述第二坐标信息不同的情况下，将所述交点坐标保留在所述指标阈值集合内。
根据权利要求1所述的指标阈值的确定方法，其中，根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值，包括：

确定出所述分段函数的不可导点集合和二阶导数为目标值的坐标点；

基于所述不可导点集合、所述二阶导数为目标值的坐标点和所述分段函数的交点坐标集合确定出所述指标阈值集合；

根据所述目标指标的指标偏向性从指标阈值集合内确定出指标阈值。
根据权利要求1所述的指标阈值的确定方法，其中，根据所述目标指标的指标偏向性从指标阈值集合内确定出指标阈值，包括：

在确定所述目标指标的指标偏向性为负向的情况下，如果确定所述指标阈值的类型为告警阈值，则将所述指标阈值集合内的最大值确定为所述指标阈值；

如果确定所述指标阈值的类型为择优阈值，则将所述指标阈值集合内的最小值确定为所述指标阈值。
根据权利要求1所述的指标阈值的确定方法，其中，根据所述目标指标的指标偏向性从指标阈值集合内确定出指标阈值，包括：

在确定所述目标指标的指标偏向性为正向的情况下，如果确定所述指标阈值的类型为告警阈值，则将所述指标阈值集合内的最小值确定为所述指标阈值；

如果确定所述指标阈值的类型为择优阈值，则将所述指标阈值集合内的最大值确定为所述指标阈值。
一种指标阈值的确定装置，包括：

获取模块，设置为获取目标指标对应的聚合指标数据；

第一确定模块，设置为从所述聚合指标数据中确定出指标数据集合，对所述指标数据集合内的第一指标数据进行排序，得到第二指标数据，对所述第二指标数据进行聚类，得到聚类后的多个分组，并对所述多个分组的每个分组的指标数据进行拟合，得到所述每个分组对应的分段函数，其中，同一指标数据集合表示同一监测对象的指标数据；

第二确定模块，设置为根据所述目标指标的指标偏向性从所述分段函数的交点坐标集合内确定出指标阈值。
一种计算机可读的存储介质，所述存储介质中存储有计算机程序，其中，所述计算机程序被设置为运行时执行所述权利要求1至12任一项中所述的方法。
一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至12任一项中所述的方法。