CN112905423A

CN112905423A - 大数据环境中分布式资源容器监控与自评估方法及***

Info

Publication number: CN112905423A
Application number: CN202110323299.4A
Authority: CN
Inventors: 王军平
Original assignee: Beijing Saibo Yunrui Intelligent Technology Co ltd
Current assignee: Beijing Saibo Yunrui Intelligent Technology Co ltd
Priority date: 2021-03-26
Filing date: 2021-03-26
Publication date: 2021-06-04
Anticipated expiration: 2041-03-26
Also published as: CN112905423B

Abstract

本发明提供一种大数据环境中分布式资源容器监控与自评估方法及***，其中，方法包括：基于预设的第一规则对大数据上各个节点进行分组；在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控；在每隔一预设时间，向所述容器输入预设的测试数据并接收所述容器对于所述测试数据的自评估数据。本发明的大数据环境中分布式资源容器监控与自评估方法，实现对大数据的各个节点上运行的容器的监控，提高大数据运行的稳定性及安全性。

Description

大数据环境中分布式资源容器监控与自评估方法及***

技术领域

本发明涉及监控技术领域，特别涉及一种大数据环境中分布式资源容器监控与自评估方法及***。

背景技术

目前，现在的社会是一个高速发展的社会，科技发达，信息流通，人们之间的交流越来越密切，生活也越来越方便，大数据就是这个高科技时代的产物。大数据必然无法用单台的计算机进行处理，必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

Docker是PaaS提供商dotCloud开源的一个基于LXC的高级容器引擎，源代码托管在Github上,基于go语言并遵从Apache2.0协议开源。简单得来说，Docker是一个由GO语言写的程序运行的“容器”(Linuxcontainers，LXCs)；目前云服务的基石是操作***级别的隔离，在同一台宿主机上虚拟出多个主机。Docker则实现了一种应用程序级别的隔离，它改变我们基本的开发、操作单元，由直接操作虚拟主机(VM)转换到操作程序运行的“容器”上来。

现在，亟需一种对于大数据中各个节点的容器的统一监控方法，来实现对大数据的各个节点上运行的容器的监控，提高大数据运行的稳定性及安全性。

发明内容

本发明目的之一在于提供了一种大数据环境中分布式资源容器监控与自评估方法，以解决上述技术问题。

本发明实施例提供的一种大数据环境中分布式资源容器监控与自评估方法，包括：

基于预设的第一规则对大数据上各个节点进行分组；

在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控；

在每隔一预设时间，向容器输入预设的测试数据并接收容器对于测试数据的自评估数据。

优选的，基于预设的第一规则对大数据上各个节点进行分组，包括：

获取各个节点的位置信息；

构建虚拟地图，将位置信息映射至虚拟地图中，确定各个位置信息对应的虚拟位置；

确定包含所有的虚拟位置的最小的规则区域；

确定规则区域的中点，任选一个虚拟位置作为标准位置，

确定各个虚拟位置相对于标准位置的偏转角度；偏转角度为虚拟位置至中点的连线与标准位置至中点的连线之间所呈角度；

将偏转角度按照从大至小排列，形成第一列表；

将第一列表从上至下分为预设的第一数量的分组；

或，

获取各个节点的重要度；基于重要度从高到低对节点进行排序，获取节点列表；

从节点列表中从上至下提取预设的第一数量的节点作为核心节点，构建核心节点列表；

基于节点列表和核心节点列表，确定非核心节点列表；

依次提取核心节点列表中核心节点，确定核心节点与非核心节点列表中的节点的关联度；

基于关联度，提取预设的第二数量的非核心节点列表中的节点与核心节点组成一个分组；

当核心节点列表中的核心节点都提取完后，获得预设的第一数量的分组。

优选的，在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控，包括：

计算分组内各个节点到该分组内的其他的节点的传输距离和值，以传输距离和值最小的节点作为第一级监控节点；

或，

以核心节点为第一级监控节点。

优选的，在每隔一预设时间，向容器输入预设的测试数据并接收容器对于测试数据的自评估数据，包括：

容器接收到测试数据时，基于测试数据进行运行；

获取运行过程中的各个预设部位的监控数据，以及运行后的输出数据；

基于监控数据与输出数据，构建自评估向量；

获取预设的自评估数据库，自评估数据库中匹配向量与自评估数据一一对应；

计算自评估向量与自评估数据库中每个匹配向量的匹配度，计算公式如下：

其中，PPD_j为自评估向量与自评估数据库中第j个匹配向量的匹配度，n为自评估向量中数据的总数或匹配向量中数据的总数；σ_i为自评估向量的第i个数据的值；μ_i,j为第j个匹配向量的第i个数据的值；

获取自评估数据库中与自评估向量的匹配度最大的匹配向量所对应的自评估数据。

优选的，获取各个节点的重要度，包括：

获取预设时间内节点参与大数据内的任务的参与数据；

解析参与数据，确定第一重要值；第一重要值的计算公式如下：

其中，D₁为第一重要值，M为预设时间内大数据内的任务总数；m为节点参与的任务数；Q_k为节点参与的第k个任务的任务总量；q_k为节点参与的第k个任务时完成的任务量；

分别为预设的第一相关系数和第二相关系数；

获取节点的节点数据；

解析节点数据，获取第二重要值；第二重要值的计算公式如下：

其中，D₂为第二重要值，A_f为节点数据中第f个参数的参数值；δ_f为对应f个参数的预设权重值；P为节点数据中参数的总数；

获取节点的连接情况；

解析连接情况，获取第三重要值；第三重要值的计算公式如下：

其中，D₃为第三重要值；T为节点与大数据的其他节点的数据传输时间总和；

为所有的节点的数据传输时间总和的平均值；ΔT₀预设的标准误差阈值；Q_d为与节点直接连接的第d个其他节点的预设的权限值；ω_d为第d个其他节点与节点的连接系数，连接系数根据其他节点与节点的数据传输参数查询预设的连接系数表获得；F为与节点直接连接的其他节点的总数；

基于第一重要值、第二重要值和第三重要值，确定节点的重要度，计算公式如下：

D＝τ₁Q+τ₂D₁+τ₃D₂+τ₄D₃；

其中，D为重要度，Q为节点的预设的权限值；τ₁为预设的对应权限值的关系系数；τ₂为预设的对应第一重要值的关系系数；τ₃为预设的对应第二重要值的关系系数；τ₄为预设的对应第三重要值的关系系数。

优选的，确定核心节点与非核心节点列表中的节点的关联度，包括：

获取核心节点到非核心节点的所有路径；

确定所有路径中最短路径所经过的节点数；

确定所有路径中经过的节点数小于等于预设节点数的各个路径的路径传输时间及路径传输数据量；

基于节点数、路径传输时间和路径传输数据量，确定关联度，计算公式如下：

其中，G为关联度；N为最短路径所经过的节点数；O为经过的节点数小于等于预设节点数的路径总数；t_l经过的节点数小于等于预设节点数的第l个路径的路径传输时间；q_l经过的节点数小于等于预设节点数的第l个路径的路径传输数据量，β₁、β₂、β₃都为预设权重值。

优选的，大数据环境中分布式资源容器监控与自评估方法，还包括：

设置第二级监控节点，用于采集第一级监控节点的监控数据及第一级监控节点的运行状态数据。

本发明还提供一种大数据环境中分布式资源容器监控与自评估***，包括：

分组模块，用于基于预设的第一规则对大数据上各个节点进行分组；

监控模块，同于在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控；

自评估模块，用于在每隔一预设时间，向容器输入预设的测试数据并接收容器对于测试数据的自评估数据。

获取各个节点的位置信息；

确定包含所有的虚拟位置的最小的规则区域；

确定规则区域的中点，任选一个虚拟位置作为标准位置，

将偏转角度按照从大至小排列，形成第一列表；

将第一列表从上至下分为预设的第一数量的分组；

或，

基于节点列表和核心节点列表，确定非核心节点列表；

或，

以核心节点为第一级监控节点。

本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中：

图1为本发明实施例中一种大数据环境中分布式资源容器监控与自评估方法的示意图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。

本发明实施例提供了一种大数据环境中分布式资源容器监控与自评估方法，如图1所示，包括：

步骤S1：基于预设的第一规则对大数据上各个节点进行分组；

步骤S2：在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控；

步骤S3：在每隔一预设时间，向容器输入预设的测试数据并接收容器对于测试数据的自评估数据。

上述技术方案的工作原理及有益效果为：

对大数据的节点进行分组，分组后在组内指定或建立一个第一级监控节点，用于对组内各个节点上运行的容器的状态进行监控；在原有的节点自我监控基础上，增加组内监控机制，提高了容器运行的安全性；此外，每个一预设时间，向容器输入预设的测试数据，容器运行测试数据；基于测试数据进行自我评估；第一级监控节点接收容器输出的自评估数据进行记录，并对自评估数据进行分析，便于发现容器运行的异常。

本发明的大数据环境中分布式资源容器监控与自评估方法，在原有的节点对容器监控的基础上，设置第一级监控节点，实现了各个节点上运行的容器的统一监控，提高了大数据运行的稳定性及安全性。

在一个实施例中，基于预设的第一规则对大数据上各个节点进行分组，包括：

获取各个节点的位置信息；

确定包含所有的虚拟位置的最小的规则区域；

确定规则区域的中点，任选一个虚拟位置作为标准位置，

将偏转角度按照从大至小排列，形成第一列表；

将第一列表从上至下分为预设的第一数量的分组；

或，

基于节点列表和核心节点列表，确定非核心节点列表；

上述技术方案的工作原理及有益效果为：

分组方法分为两种。第一种，基于节点的实际地理位置，对各个节点进行分组；节点的设置位置相近，其之间的传输数据的速度也快，采用本实施例中的基于位置信息分组法，规则区域的面积不能超过一预设值，例如实际位置不超高一个市的区域；规则区域指代圆形区域、方形区域等区域边界为规则图形的情况；此外除了射线区域划分法，还可采用区块划分，例如将规则区域等分为N*M个区块。第二种，以重要度筛选出核心节点，以核心节点为核心进行分组。实现合理的分组，通过分组进行监控，以降低采用一个监控节点进行统一监控，对监控节点的负荷压力。

在一个实施例中，在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控，包括：

或，

以核心节点为第一级监控节点。

上述技术方案的工作原理及有益效果为：

通过计算传输距离和值，实现第一级监控节点到各个被监控的节点的距离最短，实现反映时间最短化，提高监控的及时性。或，核心节点的分组方案是以核心节点为核心，采用核心节点作为第一级监控节点具有代表意义，并且在分组的时候已经考虑核心节点与组内其他节点的关联度，故采用核心节点作为第一级监控节点较为合理。

在一个实施例中，在每隔一预设时间，向容器输入预设的测试数据并接收容器对于测试数据的自评估数据，包括：

容器接收到测试数据时，基于测试数据进行运行；

基于监控数据与输出数据，构建自评估向量；

上述技术方案的工作原理及有益效果为：

通过自评估方法，实现容器的自我评估，便于当自评估不过关时，对容器进行调整。在自评估时，采用预设的自评估数据库实现自评估数据的生成，其中自评估数据库是事先采用大量的数据构建的。

在一个实施例中，获取各个节点的重要度，包括：

获取预设时间内节点参与大数据内的任务的参与数据；

分别为预设的第一相关系数和第二相关系数；

获取节点的节点数据；

获取节点的连接情况；

D＝τ₁Q+τ₂D₁+τ₃D₂+τ₄D₃；

上述技术方案的工作原理及有益效果为：

参与数据为节点参与大数据平台的任务的数据；节点数据主要包库节点缓存、节点内存、节点的CPU占用率等；节点的连接情况包括：与节点连接的节点的权限值以及传输时间等；基于参与数据、节点数据、节点的连接情况和节点的预设权限值确定节点的重要度，实现节点重要度的准确分析确定。

在一个实施例中，确定核心节点与非核心节点列表中的节点的关联度，包括：

获取核心节点到非核心节点的所有路径；

确定所有路径中最短路径所经过的节点数；

上述技术方案的工作原理及有益效果为：

基于核心节点与非核心节点之间的连接路径分析非核心节点对于核心节点的关联度，实现准确的关联度的确定。

在一个实施例中，大数据环境中分布式资源容器监控与自评估方法，还包括：

上述技术方案的工作原理及有益效果为：

二级监控节点，为总监控，通过第一级监控节点上报的数据对大数据级的节点中的容器的运行情况进行汇总；实现了统筹监控，此外第二级监控节点还在第一级监控节点异常时，替代第一级监控节点的功能。

上述技术方案的工作原理及有益效果为：

获取各个节点的位置信息；

确定包含所有的虚拟位置的最小的规则区域；

确定规则区域的中点，任选一个虚拟位置作为标准位置，

将偏转角度按照从大至小排列，形成第一列表；

将第一列表从上至下分为预设的第一数量的分组；

或，

基于节点列表和核心节点列表，确定非核心节点列表；

上述技术方案的工作原理及有益效果为：

或，

以核心节点为第一级监控节点。

上述技术方案的工作原理及有益效果为：

容器接收到测试数据时，基于测试数据进行运行；

基于监控数据与输出数据，构建自评估向量；

上述技术方案的工作原理及有益效果为：

在一个实施例中，获取各个节点的重要度，包括：

获取预设时间内节点参与大数据内的任务的参与数据；

分别为预设的第一相关系数和第二相关系数；

获取节点的节点数据；

获取节点的连接情况；

D＝τ₁Q+τ₂D₁+τ₃D₂+τ₄D₃；

上述技术方案的工作原理及有益效果为：

获取核心节点到非核心节点的所有路径；

确定所有路径中最短路径所经过的节点数；

上述技术方案的工作原理及有益效果为：

在一个实施例中，大数据环境中分布式资源容器监控与自评估***，还包括：

二级监控模块，用于设置第二级监控节点，用于采集第一级监控节点的监控数据及第一级监控节点的运行状态数据。

上述技术方案的工作原理及有益效果为：

显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。

Claims

1.一种大数据环境中分布式资源容器监控与自评估方法，其特征在于，包括：

基于预设的第一规则对大数据上各个节点进行分组；

在每隔一预设时间，向所述容器输入预设的测试数据并接收所述容器对于所述测试数据的自评估数据。

2.如权利要求1所述的大数据环境中分布式资源容器监控与自评估方法，其特征在于，所述基于预设的第一规则对大数据上各个节点进行分组，包括：

获取各个所述节点的位置信息；

构建虚拟地图，将所述位置信息映射至所述虚拟地图中，确定各个所述位置信息对应的虚拟位置；

确定包含所有的虚拟位置的最小的规则区域；

确定所述规则区域的中点，任选一个所述虚拟位置作为标准位置，

确定各个所述虚拟位置相对于所述标准位置的偏转角度；所述偏转角度为所述虚拟位置至所述中点的连线与所述标准位置至所述中点的连线之间所呈角度；

将所述偏转角度按照从大至小排列，形成第一列表；

将所述第一列表从上至下分为预设的第一数量的分组；

或，

获取所述各个节点的重要度；基于所述重要度从高到低对所述节点进行排序，获取节点列表；

从所述节点列表中从上至下提取预设的第一数量的所述节点作为核心节点，构建核心节点列表；

基于所述节点列表和所述核心节点列表，确定非核心节点列表；

依次提取所述核心节点列表中所述核心节点，确定所述核心节点与所述非核心节点列表中的所述节点的关联度；

基于所述关联度，提取预设的第二数量的所述非核心节点列表中的所述节点与所述核心节点组成一个分组；

当所述核心节点列表中的所述核心节点都提取完后，获得预设的第一数量的分组。

3.如权利要求2所述的大数据环境中分布式资源容器监控与自评估方法，其特征在于，所述在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控，包括：

计算所述分组内各个所述节点到该分组内的其他的所述节点的传输距离和值，以所述传输距离和值最小的所述节点作为所述第一级监控节点；

或，

以所述核心节点为所述第一级监控节点。

4.如权利要求1所述的大数据环境中分布式资源容器监控与自评估方法，其特征在于，所述在每隔一预设时间，向所述容器输入预设的测试数据并接收所述容器对于所述测试数据的自评估数据，包括：

所述容器接收到所述测试数据时，基于所述测试数据进行运行；

基于所述监控数据与所述输出数据，构建自评估向量；

获取预设的自评估数据库，所述自评估数据库中匹配向量与所述自评估数据一一对应；

计算所述自评估向量与所述自评估数据库中每个所述匹配向量的匹配度，计算公式如下：

其中，PPD_j为所述自评估向量与所述自评估数据库中第j个所述匹配向量的匹配度，n为所述自评估向量中数据的总数或所述匹配向量中数据的总数；σ_i为所述自评估向量的第i个数据的值；μ_i,j为第j个所述匹配向量的第i个数据的值；

获取所述自评估数据库中与所述自评估向量的匹配度最大的所述匹配向量所对应的所述自评估数据。

5.如权利要求2所述的大数据环境中分布式资源容器监控与自评估方法，其特征在于，所述获取所述各个节点的重要度，包括：

获取预设时间内所述节点参与大数据内的任务的参与数据；

解析所述参与数据，确定第一重要值；所述第一重要值的计算公式如下：

其中，D₁为所述第一重要值，M为预设时间内所述大数据内的任务总数；m为所述节点参与的任务数；Q_k为所述节点参与的第k个任务的任务总量；q_k为所述节点参与的第k个任务时完成的任务量；

分别为预设的第一相关系数和第二相关系数；

获取所述节点的节点数据；

解析所述节点数据，获取第二重要值；所述第二重要值的计算公式如下：

其中，D₂为所述第二重要值，A_f为所述节点数据中第f个参数的参数值；δ_f为对应所述f个参数的预设权重值；P为所述节点数据中所述参数的总数；

获取所述节点的连接情况；

解析所述连接情况，获取第三重要值；所述第三重要值的计算公式如下：

其中，D₃为所述第三重要值；T为所述节点与大数据的其他节点的数据传输时间总和；

为所有的节点的所述数据传输时间总和的平均值；△T₀预设的标准误差阈值；Q_d为与所述节点直接连接的第d个其他节点的预设的权限值；ω_d为第d个其他节点与所述节点的连接系数，所述连接系数根据所述其他节点与所述节点的数据传输参数查询预设的连接系数表获得；F为与所述节点直接连接的所述其他节点的总数；

基于所述第一重要值、所述第二重要值和所述第三重要值，确定所述节点的重要度，计算公式如下：

D＝τ₁Q+τ₂D₁+τ₃D₂+τ₄D₃；

其中，D为所述重要度，Q为所述节点的预设的权限值；τ₁为预设的对应所述权限值的关系系数；τ₂为预设的对应所述第一重要值的关系系数；τ₃为预设的对应所述第二重要值的关系系数；τ₄为预设的对应所述第三重要值的关系系数。

6.如权利要求2所述的大数据环境中分布式资源容器监控与自评估方法，其特征在于，所述确定所述核心节点与所述非核心节点列表中的所述节点的关联度，包括：

获取所述核心节点到所述非核心节点的所有路径；

确定所有路径中最短路径所经过的节点数；

基于所述节点数、所述路径传输时间和所述路径传输数据量，确定所述关联度，计算公式如下：

其中，G为所述关联度；N为最短路径所经过的节点数；O为经过的节点数小于等于预设节点数的路径总数；t_l经过的节点数小于等于预设节点数的第l个路径的路径传输时间；q_l经过的节点数小于等于预设节点数的第l个路径的路径传输数据量，β₁、β₂、β₃都为预设权重值。

7.如权利要求1所述的大数据环境中分布式资源容器监控与自评估方法，其特征在于，还包括：

设置第二级监控节点，用于采集所述第一级监控节点的监控数据及所述第一级监控节点的运行状态数据。

8.一种大数据环境中分布式资源容器监控与自评估***，其特征在于，包括：

自评估模块，用于在每隔一预设时间，向所述容器输入预设的测试数据并接收所述容器对于所述测试数据的自评估数据。

9.如权利要求8所述的大数据环境中分布式资源容器监控与自评估***，其特征在于，所述基于预设的第一规则对大数据上各个节点进行分组，包括：

获取各个所述节点的位置信息；

确定包含所有的虚拟位置的最小的规则区域；

将所述偏转角度按照从大至小排列，形成第一列表；

将所述第一列表从上至下分为预设的第一数量的分组；

或，

10.如权利要求9所述的大数据环境中分布式资源容器监控与自评估***，其特征在于，所述在每个分组的各个节点中挑选出一个节点作为第一级监控节点；通过第一级监控节点对组内的各个节点内运行的容器进行监控，包括：

或，

以所述核心节点为所述第一级监控节点。