业务管理方法和装置
技术领域
本申请涉及信息化技术领域,特别是涉及一种业务管理方法和装置。
背景技术
在人们的日常工作和生活中,管理***已经广泛地被应用。例如在各政府部门、企事业单位、科教文卫组织等,均已具备信息化水平,尤其是已建成大量业务***的组织中更是离不开网络信息化。
通常,管理***在使用过程中,常常涉及到数据采集,并基于采集的数据进行分析和处理从而实现管理***的运行。传统的数据采集是按照时间顺序对数据进行逐一采集。
然而,传统的数据采集方式在数据量大的时候容易出现采集不及时,导致管理***的工作运转不正常。
发明内容
基于此,有必要针对上述技术问题,提供一种能够采集效率的业务管理方法、装置、计算机设备和存储介质。
一种业务管理方法,所述方法包括:
采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取所述管理设备***的初始运行信息、并对所述初始运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个;
按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种;
将所述分析结果输出至客户端。
在其中一个实施例中,所述按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果,包括:
通过所述预设接口接收所述可用运行信息;
根据所述可用运行信息中的配置信息和性能信息,创建资源统计报表;其中,所述资源统计报表包括硬件资源和硬件资源的相关信息;
按照日期和不同类型的资源属性的匹配条件得到配置项的项目和比例;
按照所述配置项的项目和比例,将所述所述管理设备***中各设备的资源配置信息进行展示。
在其中一个实施例中,所述按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果,还包括:
对所述可用运行信息中的日志和业务信息,按照日期和不同条件得到的各个监控对象的资源利用率,获取所述创立性能巡检报表;
按日期和不同条件得到所述管理设备***中各设备的创立性能巡检报表,获取所述管理设备***中各设备的运行状态;
若所述运行状态为故障状态,基于所述故障状态创建告警统计报表。
在其中一个实施例中,所述方法还包括:
将所述故障状态对应的设备信息发送至所述客户端。
在其中一个实施例中,所述按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果,还包括:
获取所述管理设备***中各设备的关键节点参数和关键节点的连接关系;
根据所述关键节点参数和关键节点的连接关系生成网络拓扑视图;其中,所述网络拓扑视图中的图元包括:服务器、网络设备、安全设备、存储设备、中间件、数据库,业务软件部署于所述网络拓扑视图中的图元对应的设备上。
在其中一个实施例中,所述按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果,包括:
根据所述可用运行信息中的配置信息和性能信息,生成设备性能瓶颈信息;
基于所述设备性能瓶颈信息针对所述管理设备***可能发生的故障,生成风险预警信息。
在其中一个实施例中,所述方法还包括:
根据所述风险预警信息按照预设的风险等级从高到低进行排序,并将排序后的风险预警信息发送至所述客户端。
一种业务管理装置,所述装置包括:
采集层模块,用于采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取管理设备***的初始运行信息、并对所述运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个;
应用层模块,用于按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果,并将所述分析结果输出至客户端;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种。
在其中一个实施例中,所述采集层模块和所述应用层模块的通讯方式为热插拔式;所述采集层模块的脚本采用shell、bat、python、go和powershell中的至少一种形式;所述采集层模块的部署方式为单机部署、集群部署或跨网段部署中的任意一种;所述采集层模块为支持微服务架构的模块。
在其中一个实施例中,所述采集层模块,用于对接http/webservice接口、ftp、ssh、数据库或消息中间件,并采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取管理设备***的初始运行信息、并对所述运行信息进行预处理,得到所述管理设备***的可用运行信息。
一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取所述管理设备***的初始运行信息、并对所述初始运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个;
按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种;
将所述分析结果输出至客户端。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取所述管理设备***的初始运行信息、并对所述初始运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个;
按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种;
将所述分析结果输出至客户端。
上述业务管理方法、装置、计算机设备和存储介质,通过管理设备***采用基于自身的运行状态和数据规模的多线程多并发的方式获取管理设备***的初始运行信息、并对初始运行信息进行预处理,得到管理设备***的可用运行信息,并按照预设的分析策略,对通过预设接口接收到的可用运行信息进行分析,得到管理设备***的多个维度的分析结果,然后将分析结果输出至客户端。该方法由于基于自身的运行状态和数据规模自适应地确定线程数量和并发数量,因此所得到的线程数量和并发数量与管理设备***的运行状态和数据规模能够匹配,因而能够极大地提高数据获取初始运行信息的速度和效率,且进一步平衡了效率和资源利用率。同时对初始运行信息进行预处理,能够避免处理无效数据的存储和分析,节约了空间并减少了分析过程的数据处理量,提高了分析结果的获取效率。另外,将上述分析结果发送至对应的客户端,能够客户端根据分析结果进行相应的处理,从而实现业务处理的闭环,完善了业务流程,提高了业务管理的效率,提高了有效性和完整性。
附图说明
图1为一个实施例提供的业务管理方法的应用环境图;
图2为一个实施例提供的业务管理方法的流程示意图;
图3为一个实施例提供的业务管理方法的流程示意图;
图4为另一个实施例提供的业务管理方法的流程示意图;
图5为另一个实施例提供的业务管理方法的流程示意图;
图6为另一个实施例提供的业务管理方法的流程示意图;
图7为一个实施例提供的业务管理装置的结构框图;
图8为另一个实施例提供的业务管理装置的结构框图;
图9为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请提供的业务管理方法,可以应用于如图1所示的应用环境中。其中,采集层模块所部署的采集服务器102通过网络与应用层模块所在的服务器104进行通信。其中,采集服务器102可以和应用层模块所部署的服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
本领域技术人员可以理解,图1中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
下面以具体的实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
需要说明的是,下述方法实施例的执行主体可以是业务管理装置,该装置可以通过软件、硬件或者软硬件结合的方式实现成为上述计算机设备的部分或者全部。下述方法实施例以执行主体为管理设备***为例进行说明。
图2为一个实施例提供的业务管理方法的流程示意图。本实施例涉及的是管理设备***根据自身的运行状态和数据规模高效采集数据并进行业务管理的具体过程。如图2所示,包括:
S10、采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取所述管理设备***的初始运行信息、并对所述初始运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个。
具体的,管理设备***可以获取自身的运行状态和数据规模,并确定与自身的运行状态和数据规模匹配的线程数量和并发数量,基于这个线程数量和并发数量,采用多线程多并发的方式获取管理设备***的初始运行信息。然后,管理设备***并对采集到的初始运行信息进行预处理,得到所述管理设备***的可用运行信息。其中,上述初始运行信息包括管理设备***中各个设备的配置信息、性能信息、日志和业务信息。其中,配置信息包括上述预处理可以包括对初始运行信息的数据结构标准化处理、归并压制处理和过滤处理中的至少一个。采用数据结构标准化处理能够使得数据结构统一,便于读取、存储、识别和调用;采用归并压制处理能够将上述数据根据类别进行分类并压缩进行存储,以节约存储空间;采用过滤处理能够过滤掉无用的信息,仅保留有用的信息,进一步减少数据量。
需要说明的是,确定与自身的运行状态和数据规模匹配的线程数量和并发数量,可以是利用预先设置的运行状态和数据规模,与线程数量和并发数量之间的对应关系进行确定。通常,运行状态好的情况下,线程数量和并发数量可以较小,运行状态不良的情况下,线程数量和并发数量可以较大;数据规模小的情况下,线程数量和并发数量可以较小,数据规模大的情况下,线程数量和并发数量可以较大。
S20、按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种。
具体的,管理设备***可以根据预先设置的分析策略,对通过预设接口接收上述可用运行信息,并对可用运行信息进行分析,从而得到上述管理设备***的多个维度的分析结果。需要说明的是,上述可用运行信息可以包括配置信息、性能信息、日志和业务信息中的一种或多种,通过对上述可用运行信息基于预设的分析策略进行分析,因此能够得到多个维度的分析结果。其中,这多个维度的分析结果可以包括资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和信息故障中的一种或任意多种。需要说明的是,上述分析策略可以是不同的配置信息、性能信息、日志和业务信息,与不同维度的不同分析结果之间的对应关系。该对应关系可以是根据经验得到的,也可以是学习历史的可用运行信息和相应的处理结果进行学习得到的,对此本实施例不做限定。
S30、将所述分析结果输出至客户端。
具体的,管理设备***得到上述分析结果后,可以将分析结果按照类型或者客户端的权限发送至对应的客户端,以使客户端根据分析结果进行相应的处理,从而实现业务处理的闭环。
本实施例中,管理设备***采用基于自身的运行状态和数据规模的多线程多并发的方式获取管理设备***的初始运行信息、并对初始运行信息进行预处理,得到管理设备***的可用运行信息,并按照预设的分析策略,对通过预设接口接收到的可用运行信息进行分析,得到管理设备***的多个维度的分析结果,然后将分析结果输出至客户端。该方法由于基于自身的运行状态和数据规模自适应地确定线程数量和并发数量,因此所得到的线程数量和并发数量与管理设备***的运行状态和数据规模能够匹配,因而能够极大地提高数据获取初始运行信息的速度和效率,且进一步平衡了效率和资源利用率。同时对初始运行信息进行预处理,能够避免处理无效数据的存储和分析,节约了空间并减少了分析过程的数据处理量,提高了分析结果的获取效率。另外,将上述分析结果发送至对应的客户端,能够客户端根据分析结果进行相应的处理,从而实现业务处理的闭环,完善了业务流程,提高了业务管理的效率,提高了有效性和完整性。
可选地,在上述实施例的基础上,步骤S20的一种可能的实现方式可以如图3所示,包括:
S211、通过所述预设接口接收所述可用运行信息。
S212、根据所述可用运行信息中的配置信息和性能信息,创建资源统计报表;其中,所述资源统计报表包括硬件资源和硬件资源的相关信息。
S213、按照日期和不同类型的资源属性的匹配条件得到配置项的项目和比例。
S214、按照所述配置项的项目和比例,将所述所述管理设备***中各设备的资源配置信息进行展示。
具体的,管理设备***能够通过预设接口接收上述可用运行信息,需要说明的是,该预设接口为预先定义的接口,因此在初始运行信息获取过程中策略的修改不会影响后续处理过程,便于迭代。管理设备***能够根据上述配置信息和性能信息,创建资源统计报表;其中,所述资源统计报表包括硬件资源和硬件资源的相关信息,可选地,资源统计报表,可以按照应用***维度、统计各IP对应的设备的CPU使用率、内存使用率、磁盘空间使用率、网卡带宽使用率等;资源统计报表中的硬件资源的相关统计,可以包括按照设备类型、统计有多少CPU的颗数、内存总量、硬盘个数、主板、插槽、电源等的类型和对应的数量。然后管理设备***按照创建资源统计报表中的不同的日期和不同类型的资源属性的匹配条件,得到上述配置项的项目和比例,例如可以是按照资源录入或者数据自动采集的时间,设备类型(安全设备、网络设备、服务器、配件等),统计相关容量比例,例如统计各设备在统计周期的内存整体使用情况。
在一个实施例的基础上,步骤S20的另一种可能的实现方式可以如图4所示,包括:
S221、对所述可用运行信息中的日志和业务信息,按照日期和不同条件得到的各个设备的资源利用率,获取所述创立性能巡检报表。
S222、按日期和不同条件得到所述管理设备***中各设备的创立性能巡检报表,获取所述管理设备***中各设备的运行状态。
S223、若所述运行状态为故障状态,基于所述故障状态创建告警统计报表。
具体的,管理设备***通过对上述对可用运行信息中的日志和业务信息,按照日期和不同条件得到的各个监控对象的资源利用率,获取创立性能巡检报表。同时还按照日期和不同条件得到管理设备***中各设备的创立性能巡检报表,获取管理设备***中各设备的运行状态。需要说明的是,该运行状态可以是基于时间的一条曲线或者一组数据。可选地,该运行状态可以包括优、良、中、差等;也可以包括繁忙、正常和空闲等;还可以包括故障状态、正常状态或者风和风险状态。然后管理设备***在运行状态为故障状态的时候,基于故障状态创建告警统计报表来对对故障状态进行记录,或者对未来的故障分析提供数据基础。
本实施例中,管理设备***对可用运行信息中的日志和业务信息,按照日期和不同条件得到的各个设备的资源利用率,获取创立性能巡检报表,并按日期和不同条件得到管理设备***中各设备的创立性能巡检报表,获取管理设备***中各设备的运行状态,当运行状态为故障状态,基于故障状态创建告警统计报表从而实现告警信息的统一记录和管理,因此利于对故障处理的结果追踪和故障处理策略的优化,便于提高业务管理的有效性。
可选地,在上述各个实施例的基础上,还可以包括将所述故障状态对应的设备信息发送至所述客户端。管理设备***通过将上述故障状态对应的设备信息发送至所述客户端,便于客户端对故障的设备进行关注、处理和追踪,进一步完善了业务管理流程的闭环,提高了业务管理的有效性。
在一个实施例的基础上,步骤S20的另一种可能的实现方式可以如图5所示,包括:
S231、获取所述管理设备***中各设备的关键节点参数和关键节点的连接关系。
S232、根据所述关键节点参数和关键节点的连接关系生成网络拓扑视图;其中,所述网络拓扑视图中的图元包括:服务器、网络设备、安全设备、存储设备、中间件、数据库,业务软件部署于所述网络拓扑视图中的图元对应的设备上。
具体的,管理设备***能够获取各个设备中的关键节点的和关键节点参数,以及关键节点之间的连接关系。管理设备***能够根据根据所述关键节点参数和关键节点的连接关系生成网络拓扑视图。需要说明的是,上述网络拓扑视图中的图元包括:服务器、网络设备、安全设备、存储设备、中间件、数据库,以及上述图元对应的设备上所部署的业务软件。
本实施例中,管理设备***获取管理设备***中各设备的关键节点参数和关键节点的连接关系,并根据关键节点参数和关键节点的连接关系生成网络拓扑视图,因此能够将上述管理设备***中各个设备进行可视化展示,便于查看,和排查不同图元对应的设备的故障。
在一个实施例的基础上,步骤S20的另一种可能的实现方式可以如图6所示,包括:
S241、根据所述可用运行信息中的配置信息和性能信息,生成设备性能瓶颈信息;
S242、基于所述设备性能瓶颈信息针对所述管理设备***可能发生的故障,生成风险预警信息。
具体的,管理设备***根据可用运行信息中的配置信息和性能信息,生成设备性能瓶颈信息,并基于设备性能瓶颈信息针对管理设备***可能发生的故障,生成风险预警信息。需要说明的是,该设备性能瓶颈信息能够表征管理设备***中各个设备运行的正常与否的临界的信息,因此,管理设备***能够基于设备性能瓶颈信息针对管理设备***可能发生的故障,生成风险预警信息,对还没有发生故障的设备进行风险预警,从而能够预测风险,降低故障率。
可选地,管理设备***根据所述风险预警信息按照预设的风险等级从高到低进行排序,并将排序后的风险预警信息发送至所述客户端,从而使得客户端能够优先处理风险等级高的风险预警信息对应的故障,进一步确保了管理设备***的正常运行。
应该理解的是,虽然图2-6的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图2-6中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在一个实施例中,如图7所示,提供了一种业务管理装置,包括:
采集层模块100,用于采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取管理设备***的初始运行信息、并对所述运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个;
应用层模块200,用于按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果,并将所述分析结果输出至客户端;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种。
在一个实施例中,应用层模块200,具体用于通过所述预设接口接收所述可用运行信息;根据所述可用运行信息中的配置信息和性能信息,创建资源统计报表;其中,所述资源统计报表包括硬件资源和硬件资源的相关信息;按照日期和不同类型的资源属性的匹配条件得到配置项的项目和比例;按照所述配置项的项目和比例,将所述所述管理设备***中各设备的资源配置信息进行展示。
在一个实施例中,应用层模块200,具体用于对所述可用运行信息中的日志和业务信息,按照日期和不同条件得到的各个监控对象的资源利用率,获取所述创立性能巡检报表;按日期和不同条件得到所述管理设备***中各设备的创立性能巡检报表,获取所述管理设备***中各设备的运行状态;若所述运行状态为故障状态,基于所述故障状态创建告警统计报表。
在一个实施例中,应用层模块200,具体用于将所述故障状态对应的设备信息发送至所述客户端。
在一个实施例中,应用层模块200,具体用于获取所述管理设备***中各设备的关键节点参数和关键节点的连接关系;根据所述关键节点参数和关键节点的连接关系生成网络拓扑视图;其中,所述网络拓扑视图中的图元包括:服务器、网络设备、安全设备、存储设备、中间件、数据库,业务软件部署于所述网络拓扑视图中的图元对应的设备上。
在一个实施例中,应用层模块200,具体用于根据所述可用运行信息中的配置信息和性能信息,生成设备性能瓶颈信息;基于所述设备性能瓶颈信息针对所述管理设备***可能发生的故障,生成风险预警信息。
在一个实施例中,应用层模块200,还用于根据所述风险预警信息按照预设的风险等级从高到低进行排序,并将排序后的风险预警信息发送至所述客户端。
在一个实施例中,采集层模块100和应用层模块200的通讯方式为热插拔式,因此能够灵活根据业务实际情况进行修改、迭代更新,即采集层模块的升级,不影响整个管理设备***。
在一个实施例中,采集层模块100的脚本采用shell、bat、python、go和powershell中的至少一种形式实现。
在一个实施例中,采集层模块100的部署方式为单机部署、集群部署或跨网段部署中的任意一种以适配被管理***的具体形式。
在一个实施例中,采集层模块100为支持微服务架构的模块。
在一个实施例中,采集层模块100具体用于对接http/webservice接口、ftp、ssh、数据库或消息中间件,并采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取管理设备***的初始运行信息、并对所述运行信息进行预处理,得到所述管理设备***的可用运行信息。
在一个实施例中,上述业务管理装置还可以如图8所示的结构,包括历史趋势分析模块、资源裕度分析模块、告警关联分析模块、配置变更分析模块、拓扑变更分析模块、实施性能分析模块,数据配置模块、性能数据模块、状态数据模块、日志数据模块和业务数据模块。
在一个实施例中,上述业务管理装置还可以包括配置变更分析模块、实时性能分析模块、历史趋势分析模块、资源裕度分析模块、拓扑变更分析模块、告警关联分析模块和分析总控模块,所述配置变更分析模块、实时性能分析模块、历史趋势分析模块、资源裕度分析模块、拓扑变更分析模块以及告警关联分析模块均基于IT综合监控***的采集功能,并接受所采集的IT基础资源的配置、性能、日志和业务信息;配置变更分析模块接收IT基础资源的配置信息,并将配置信息输入至分析总控模块保存,实现对IT软、硬件设备配置信息的统一管理,并快速将IT基础架构的配置情况反馈至客户端,主要功能包括:资源类型维护、资源维护、资源属性维护、资源运行生命轨迹管理以及资源信息查询及统计;实时性能分析模块实时接收IT基础资源的实时性能,并通过折线图的形式将实时性能的变化表现在图表中并实时上传至分析总控模块,所述实时性能分析模块包括硬件管理模块和性能管理模块,所述硬件管理模块对IT硬件设备信息的统一管理,并将硬件的工作状态反馈给客户端,显示硬件性能瓶颈以及故障分析,主要功能包括:硬件性能查询、服务器启停管理、日志查询分析;所述性能管理模块对IT软、硬件设备性能状态统一管理,并快速将性能瓶颈以及故障分析反馈给客户端,主要功能包括:资源性能查询以及性能topN查询,其中,性能topN查询支持按照设备类型、业务***维度对资源的某一项性能指标进行排名展示。告警关联分析模块为统一触发、通知、展示、处理和查询告警信息的集中平台,为用户提供实时报警,主要功能包括:告警级别维护、告警类型维护、告警行为维护、告警规则维护以及告警信息处理、查询、统计和展示;且告警关联分析模块将警报数据上传至分析总控模块保存;分析总控模块包括文件存储模块、分布式计算框架和搜索引擎,所述文件储存模块储存配置变更分析模块和实时性能分析模块的实时数据并打上时间戳,利用搜索引擎接入文件储存模块提供数据搜索功能,所述分布式计算框架提供Spark/R的高速计算,拥有并行化的高性能统计算法库,支持并行化统计算法和基础算法库,支持的并行化基础算法,支持处理大数据集。
所述历史趋势分析模块、资源裕度分析模块、拓扑变更分析模块均内置于分布式计算框架内,
所述历史趋势分析模块和资源裕度分析模块对文件储存模块内的数据进行分析,创立资源统计报表,按日期和不同资源属性匹配条件得到配置项的数目和比例的汇总,显示IT***中各种硬件、软件、应用的资源配置情况;
创立性能巡检报表,按日期和不同条件得到各个监控对象的资源利用情况,实时巡检IT资源的运行状况;同时创立告警统计报表,对当前告警和历史告警的查询、统计和分析功能,并按照日、周、月不同时间粒度的告警明细和统计报表,
所述拓扑变更分析模块通过图形化方式反映业务***硬件设备、基础软件和业务软件功能模块间的功能和逻辑关联关系信息,图元包括:服务器、网络设备、安全设备、存储设备、中间件、数据库和业务软件,对于非监视区域的网络结构采用网络云表示,利用图元间的连线反映软、硬件功能连接和逻辑关联的关系,观展现设备节点的运行信息和告警信息。
通过配置变更分析模块、实时性能分析模块和告警关联分析模块实现对业务***的设备状态、性能及业务状态的统一监控和管理,通过历史趋势分析模块、资源裕度分析模块、拓扑变更分析模块创立资源统计报表、创立性能巡检报表,并通过图形化方式反映业务***硬件设备、基础软件和业务软件间的功能和逻辑关联关系信息,在此基础上实现运行信息数据挖掘、效能评估、可靠性分析、风险管理和辅助决策等功能,保障业务的安全稳定运行,有效地提高运维组织的运维水平和效率。
上述采集服务器可以部署采集层的模块,负责数据采集工作,并进行配置,如中央处理器的配置信息和存储空间的配置信息等、性能:如中央处理器使用率和磁盘空间利用率等、日志:如业务应用的日志、以及业务信息,如OA***的业务流进行采集和标准化处理,还可以包括归并压制日志类的信息,过滤、预处理等操作。上述采集层可以采用SNMP、TCP、Syslog、SSH、WMI等协议确保***运行及建设过程中数据的安全性。上述应用服务器用于接收采集服务器发送的这些数据,并进行分析,得到分析结果。数据库服务器可以负责统一部署统一信息库和数据服务总线,并负责数据存储以及与中间件的通讯。数据库服务器还可以通过服务总线提高数据传输效率。上述统一信息库负责存储***的监控信息、管理类信息、分析结果信息以及***所需的基本参数,为业务健康监管***提供数据支持,监控信息包括配置信息、性能信息、状态信息、告警信息。例如当磁盘故障的时候,对应的服务器所属于的***的业务线则可能存在大概率故障,则进行告警。管理类信息包括用户信息、设备管理信息,分析结果主要包括定时生成的日、周、月、季、年的分析报告信息;数据服务总线指监控***采用数据服务总线实现各模块间的数据通讯以及向外部***提供数据。且数据服务总线遵循SOA架构体系,支持多种操作***平台和多种技术协议,具备可扩展的特性,提供页面服务WebService和数据库适配器功能,并具有适配器扩展的功能。上述应用服务器部署处理层的模块,负责数据分析处理工作,所述处理层完成数据分析的工作,主要包括:配置变更分析配置变更分析,实时性能分析、历史趋势分析、资源裕度分析、拓扑变更分析以及告警关联分析;前端服务器(Web服务器)负责应用的发布和管理以及与用户之间的人机交互工作,且Web服务器包括展现层,该展现层向用户提供web浏览方式的人机交互界面,用户通过***提供的各式图形化组件直观的查阅并维护相关资产管理信息、性能管理信息、告警管理信息、业务管理信息、网络管理信息以及综合分析类报表,且通过***维护界面实现对设备监控策略以及用户权限方面的设置工作,所述资产管理信息实现对IT软、硬件设备配置信息的统一管理,用于用户了解IT基础架构的配置情况;性能管理信息实现对IT软、硬件设备性能状态的统一管理,用于用户发现性能瓶颈以及故障分析;所述告警管理信息是统一触发、通知、展示、处理和查询告警信息的集中平台,用于用户提发现并处理报警;业务管理信息通过图形化方式反映业务***的IT基础架构与业务之间的逻辑关联关系,以业务的视角显现业务故障所影响的部门;网络管理信息通过图形化方式反映网络节点间的物理及逻辑关联关系,以网络的视角,为用户提供网络故障定位分析环境;所述综合分析类报表支持用户自定义日常运维报表,并且按日、周、月、季、年或自定义时间区间的进行报表统计,自定义报表的生成时间、内容、格式和打印时间,支持图文混排,报表支持曲线、棒图和饼图展现形式,支持报表文件导出:HTML、Excel、PDF和打印功能,所述***维护界面包括:监控策略设置、用户权限设置、操作日志查询以及功能菜单维护。基于上述,能够实现全流程的***监控,确保被管理***的安全运行和故障问题的有效解决。
关于业务管理装置的具体限定可以参见上文中对于业务管理方法的限定,在此不再赘述。上述业务管理装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图9所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储可用运行信息。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种业务管理方法。
本领域技术人员可以理解,图9中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取所述管理设备***的初始运行信息、并对所述初始运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个;
按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种;
将所述分析结果输出至客户端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
通过所述预设接口接收所述可用运行信息;
根据所述可用运行信息中的配置信息和性能信息,创建资源统计报表;其中,所述资源统计报表包括硬件资源和硬件资源的相关信息;
按照日期和不同类型的资源属性的匹配条件得到配置项的项目和比例;
按照所述配置项的项目和比例,将所述所述管理设备***中各设备的资源配置信息进行展示。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
对所述可用运行信息中的日志和业务信息,按照日期和不同条件得到的各个监控对象的资源利用率,获取所述创立性能巡检报表;
按日期和不同条件得到所述管理设备***中各设备的创立性能巡检报表,获取所述管理设备***中各设备的运行状态;
若所述运行状态为故障状态,基于所述故障状态创建告警统计报表。
4在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将所述故障状态对应的设备信息发送至所述客户端。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取所述管理设备***中各设备的关键节点参数和关键节点的连接关系;
根据所述关键节点参数和关键节点的连接关系生成网络拓扑视图;其中,所述网络拓扑视图中的图元包括:服务器、网络设备、安全设备、存储设备、中间件、数据库,业务软件部署于所述网络拓扑视图中的图元对应的设备上。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据所述可用运行信息中的配置信息和性能信息,生成设备性能瓶颈信息;
基于所述设备性能瓶颈信息针对所述管理设备***可能发生的故障,生成风险预警信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
根据所述风险预警信息按照预设的风险等级从高到低进行排序,并将排序后的风险预警信息发送至所述客户端。
应当清楚的是,本申请实施例中处理器执行计算机程序的过程,与上述方法中各个步骤的执行过程一致,具体可参见上文中的描述。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
采用基于管理设备***的运行状态和数据规模的多线程多并发的方式获取所述管理设备***的初始运行信息、并对所述初始运行信息进行预处理,得到所述管理设备***的可用运行信息;其中,所述初始运行信息包括所述管理设备***中各设备的配置信息、性能信息、日志和业务信息,所述预处理包括数据结构标准化处理、归并压制处理和过滤处理中的至少一个;
按照预设的分析策略,对通过预设接口接收到的所述可用运行信息进行分析,得到所述管理设备***的多个维度的分析结果;其中,多个维度的所述分析结果包括:资源统计报表、创立性能巡检报表、告警统计报表、网络拓扑视图、设备性能瓶颈信息和故障信息中的至少一种;
将所述分析结果输出至客户端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
通过所述预设接口接收所述可用运行信息;
根据所述可用运行信息中的配置信息和性能信息,创建资源统计报表;其中,所述资源统计报表包括硬件资源和硬件资源的相关信息;
按照日期和不同类型的资源属性的匹配条件得到配置项的项目和比例;
按照所述配置项的项目和比例,将所述所述管理设备***中各设备的资源配置信息进行展示。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
对所述可用运行信息中的日志和业务信息,按照日期和不同条件得到的各个监控对象的资源利用率,获取所述创立性能巡检报表;
按日期和不同条件得到所述管理设备***中各设备的创立性能巡检报表,获取所述管理设备***中各设备的运行状态;
若所述运行状态为故障状态,基于所述故障状态创建告警统计报表。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将所述故障状态对应的设备信息发送至所述客户端。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取所述管理设备***中各设备的关键节点参数和关键节点的连接关系;
根据所述关键节点参数和关键节点的连接关系生成网络拓扑视图;其中,所述网络拓扑视图中的图元包括:服务器、网络设备、安全设备、存储设备、中间件、数据库,业务软件部署于所述网络拓扑视图中的图元对应的设备上。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据所述可用运行信息中的配置信息和性能信息,生成设备性能瓶颈信息;
基于所述设备性能瓶颈信息针对所述管理设备***可能发生的故障,生成风险预警信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
根据所述风险预警信息按照预设的风险等级从高到低进行排序,并将排序后的风险预警信息发送至所述客户端。
应当清楚的是,本申请实施例中计算机程序被处理器执行的过程,与上述方法中各个步骤的执行过程一致,具体可参见上文中的描述。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。