CN112686644A - 一种项目运行状态监测方法、***、设备及存储介质 - Google Patents

一种项目运行状态监测方法、***、设备及存储介质 Download PDF

Info

Publication number
CN112686644A
CN112686644A CN202110043307.XA CN202110043307A CN112686644A CN 112686644 A CN112686644 A CN 112686644A CN 202110043307 A CN202110043307 A CN 202110043307A CN 112686644 A CN112686644 A CN 112686644A
Authority
CN
China
Prior art keywords
project
current
alarm
item
monitoring
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110043307.XA
Other languages
English (en)
Inventor
陈跃强
汪小涛
许兴
高晶
蔡利伟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yonghui Yunjin Technology Co ltd
Original Assignee
Yonghui Yunjin Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yonghui Yunjin Technology Co ltd filed Critical Yonghui Yunjin Technology Co ltd
Priority to CN202110043307.XA priority Critical patent/CN112686644A/zh
Publication of CN112686644A publication Critical patent/CN112686644A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供一种项目运行状态监测方法、***、设备及存储介质,其中,方法包括:采集当前项目中的依赖信息和配置文件,将所述依赖信息和配置文件存储于数据库中,所述依赖信息包括有当前项目的依赖项目,所述配置文件包括有时间等待步长;根据所述依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监测;在检测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息。本发明由于项目与项目之间具有依赖关系,能够根据依赖关系依次进行运行,且能够实现对每个项目单独的监测和告警,精准确认产生异常的项目,便于管理人员进行精准及时的处理,提高工作效率。

Description

一种项目运行状态监测方法、***、设备及存储介质
技术领域
本发明涉及数据管理技术领域,尤其涉及一种项目运行状态监测方法、***、设备及存储介质。
背景技术
随着社会的发展,信息化的进程越来越快,使得信息数据量越来越大。因此信息行业需要承担数据计算的任务以倍数进行累加,其中,大部分计算任务都是在深夜进行跑批处理。在这个过程中,通常需要把每个计算任务划分为不同种类,封装到每个任务当中,但是任务与任务之间无法关联,例如:A任务是数据采集功能,B任务是数据计算功能,此时A、B任务是封装在一起的,B任务需要在A任务完成之后才能够执行。
由于A、B任务封装在一起,因此,一旦出现异常,产生告警信息,就需要对A、B任务进行分别检测,才能够识别出异常任务。若封装在一起的任务较多时,就需要将所有任务依次进行检测,才能够识别出异常任务,导致工作量较大,工作效率低。
发明内容
基于此,有必要针对上述技术问题,提供一种项目运行状态监测方法、***、设备及存储介质。
一种项目运行状态监测方法,包括以下步骤:采集当前项目中的依赖信息和配置文件,将所述依赖信息和配置文件存储于数据库中,所述依赖信息包括有当前项目的依赖项目,所述配置文件包括有时间等待步长;根据所述依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监测;在检测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息。
在其中一个实施例中,所述配置文件中还包括账号、密码、会话ID、依赖项目名称、时间等待步长、最长等待时长、最大等待轮数、最大重启次数和项目失败容忍等级。
在其中一个实施例中,所述根据所述依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监控,具体包括:根据所述时间等待步长对所述当前项目的运行状态进行查询,并获取当前项目的监控时间;预先设置有监控时长阈值,在所述监控时间超过所述监控时长阈值或当前项目的运行状态为成功时进入状态响应。
在其中一个实施例中,所述状态响应具体包括:若当前项目的运行状态为成功时,通过所述当前项目,执行下一项目;若当前项目的运行状态为失败时,拒绝所述当前项目,并调用告警规则发送告警信息;若当前项目的运行状态为超时,且当前项目为下一项目的必须依赖项目,则认定为超时响应。
在其中一个实施例中,在所述若当前项目的运行状态为超时,且当前项目为下一项目的必须依赖项目,则认定为超时响应之后,还包括:根据配置文件内容,执行继续等待操作或是对当前项目进行重启操作;若对当前项目进行持续等待操作,则等待的轮数不得超过所述最大等待轮数,若超过所述最大等待轮数,则结束当前项目,并根据所述告警规则进行告警;若对当前项目进行重启操作,则重启次数不得超过所述最大重启次数,若超过所述最大重启次数,则结束当前项目,并根据所述告警规则进行告警。
在其中一个实施例中,所述告警规则具体为:在配置文件或网络页面的短信告警界面中预先添加项目失败后收信人和项目超时后收信人的告警号码;在项目运行状态存在异常触发告警时,获取告警信息,将所述告警信息进行封装,并发送至所述告警号码对应的终端。
一种项目运行状态监测***,包括:信息采集模块,用于采集当前项目中的依赖信息和配置文件,将所述依赖信息和配置文件存储于数据库中,所述依赖信息包括有当前项目的依赖项目,所述配置文件包括有时间等待步长;状态监测模块,用于根据所述依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监测;告警模块,用于在监测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息。
一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述各个实施例中所述的一种项目运行状态监测方法的步骤。
一种存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述各个实施例中所述的一种项目运行状态监测方法的步骤。
相比于现有技术,本发明的优点及有益效果在于:项目与项目之间具有依赖关系,能够根据依赖关系依次进行运行,且能够实现对每个项目单独的监测和告警,精准确认产生异常运行状态的项目,便于管理人员进行精准及时的处理,提高工作效率。
附图说明
图1为一个实施例中一种项目运行状态监测方法的流程示意图;
图2为一个实施例中一种项目运行状态监测***的结构示意图;
图3为一个实施例中设备的内部结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,下面通过具体实施方式结合附图对本发明做进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
在一个实施例中,如图1所示,提供了一种项目运行状态监测方法,包括以下步骤:
步骤S101,采集当前项目中的依赖信息和配置文件,将依赖信息和配置文件存储于数据库中,依赖信息包括有当前项目的依赖项目,配置文件包括有时间等待步长。
具体地,项目在调度***中进行,在启动当前项目之前,获取当前项目中的依赖信息和配置文件,并存储于数据库中备用。
其中,依赖信息包括有和当前项目具有依赖关系的依赖项目和被依赖项目,依赖项目执行完成后,当前项目才能够启动;当前项目执行完成后,被依赖项目才能够启动。当然在被依赖项目还有包括有另外的依赖项目时,需要在被依赖项目的所有依赖项目完成之后才能够启动被依赖项目。
其中,配置文件中包括有时间等待步长,还包括账号、密码、会话ID、依赖项目名称、时间等待步长、最长等待时长、最大等待轮数和最大重启次数等参数。
具体地,可以根据依赖项目名称确认依赖项目是否执行完成,确认执行完成之后启动当前项目;若依赖项目未执行完成,则等待依赖项目执行完成。
具体地,最长等待时长可以是时间等待步长次数的上限,在根据时间等待步长查询当前项目的运行状态次数超过最长等待时长之后,认定为超时响应,进入步骤S103。
具体地,可以根据会话ID登录调度***,在校验账号和密码正确之后,将会话ID注册到调度***中,与调度***建立连接,便于实时对项目运行状态进行监测。
步骤S102,根据依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监测。
具体地,在根据配置文件与调度***建立连接后,根据依赖信息启动当前项目,当前项目可以是初始项目或依赖项目均执行完成的项目,并对当前项目的运行状态进行监测。
在项目实际运行过程中,可以根据依赖信息启动和依赖项目相同个数的线程,分别持续监测各个依赖项目的运行状态,可以根据配置文件配置的内容,每隔一个时间等待步长的时间,查询一次依赖任务的状态,在监控时间超时或者项目运行成功时,进入状态响应阶段;如果监测到项目运行失败,则需等待依赖项目执行成功后再进入状态响应阶段。
步骤S103,在监测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息。
具体地,在检测到当前项目的运行状态存在异常时,例如运行超时或运行失败的情况下,可以根据预先设置的告警规则发送告警信息,便于管理人员进行及时的处理。
在本实施例中,通过采集当前项目中的依赖信息和配置文件,将依赖信息和配置文件存储于数据库中,根据依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行检测,在检测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息,能够对每个项目进行单独持续的监测,精准确认产生异常运行状态的项目,便于管理人员进行精准及时的处理,提高工作效率。
其中,步骤S102具体包括:根据时间等待步长对当前项目的运行状态进行查询,并获取当前项目的监控时间;在监控时间超时或当前项目的运行状态为成功时进入状态响应。
具体地,根据时间等待步长对当前项目的运行状态进行持续查询,每隔一个时间等待步长需要对运行状态查询一次,并获取当前项目的监控时间;预先设置有监控时长阈值,在监控时间超过监控时长阈值时,或监测到当前项目的运行状态为成功时进入状态响应阶段。
其中,状态响应具体包括:若当前项目的运行状态为成功时,通过当前项目,执行下一项目;若当前项目的运行状态为失败时,拒绝当前项目,并调用告警规则发送告警信息;若当前项目的运行状态为超时,且当前项目为下一项目的必须依赖项目,则认定为超时响应。
具体地,在认定为超时响应之后,还包括:根据配置文件的内容,执行继续等待或是对当前项目进行重启操作;若对当前项目进行持续等待操作,则等待的轮数不得超过最大等待轮数,若超过最大等待轮数,则结束当前项目,并根据告警规则进行告警;若对当前项目进行重启操作,则重启次数不得超过最大重启次数,若超过最大重启次数,则结束当前项目,并根据告警规则进行告警。
其中,告警规则具体为:在配置文件或网络页面的短信告警界面中预先添加项目失败后收信人和项目超时后收信人的告警号码;在项目运行状态存在异常触发告警时,获取告警信息,将告警信息进行封装,并发送至告警号码对应的终端。
具体地,在通过网络页面传参进行告警时,需要在原始网络页面的基础上新增短信告警界面,短信界面包括的内容有项目失败后收信人的告警号码和项目超时后收信人的告警号码。界面添加成功后,在项目运行状态存在异常触发告警时,获取告警信息,将告警信息封装为短信,并发送至告警号码对应的终端。
其中,在需要传入多个告警号码时,需要在告警号码之间通过逗号隔开。
具体地,告警号码也可以是邮箱号或微信号,通过邮件或微信消息的方式发送告警信息。
具体地,在通过配置文件传参进行告警时,需要在每个项目的配置文件当中添加添加项目失败后收信人和项目超时后收信人的告警号码,配置文件在被上传到对应的项目当中的时候,首先根据关键字-值的方式解析配置文件当前中的内容,获取告警号码,在项目运行状态存在异常触发告警时,获取告警信息,将告警信息封装为短信,并发送至告警号码对应的终端。
如图2所示,提供了一种项目运行状态监测***20,包括:信息采集模块21、状态监测模块22和告警模块23,其中:
信息采集模块21,用于采集当前项目中的依赖信息和配置文件,将依赖信息和配置文件存储于数据库中,依赖信息包括有当前项目的依赖项目,配置文件包括有时间等待步长;
状态监测模块22,用于根据依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监测;
告警模块23,用于在监测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息。
在一个实施例中,状态监测模块22还用于:根据时间等待步长对当前项目的运行状态进行查询,并获取当前项目的监控时间;预先设置有监控时长阈值,在监控时间超过监控时长阈值或当前项目的运行状态为成功时进入状态响应。
其中,若当前项目的运行状态为成功时,通过当前项目,执行下一项目;若当前项目的运行状态为失败时,拒绝当前项目,并调用告警规则发送告警信息;若当前项目的运行状态为超时,且当前项目为下一项目的必须依赖项目,则认定为超时响应。
在一个实施例中,状态监测模块22还用于:根据配置文件内容,执行继续等待操作或是对当前项目进行重启操作;若对当前项目进行持续等待操作,则等待的轮数不得超过所述最大等待轮数,若超过最大等待轮数,则结束当前项目,并根据告警规则进行告警;若对当前项目进行重启操作,则重启次数不得超过最大重启次数,若超过最大重启次数,则结束当前项目,并根据告警规则进行告警。
在一个实施例中,告警模块23还用于:在配置文件或网络页面的短信告警界面中预先添加项目失败后收信人和项目超时后收信人的告警号码;在项目运行状态存在异常触发告警时,获取告警信息,将所述告警信息进行封装,并发送至告警号码对应的终端。
在一个实施例中,提供了一种设备,该设备可以是服务器,其内部结构图可以如图3所示。该设备包括通过***总线连接的处理器、存储器、网络接口和数据库。其中,该设备的处理器用于提供计算和控制能力。该设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该设备的数据库用于存储配置模板,还可用于存储目标网页数据。该设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种项目运行状态监测方法。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的设备的限定,具体的设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,还可以提供一种存储介质,所述存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的一种项目运行状态监测***的一部分。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(RandomAccessMemory,RAM)等。
显然,本领域的技术人员应该明白,上述本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在计算机存储介质(ROM/RAM、磁碟、光盘)中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。所以,本发明不限制于任何特定的硬件和软件结合。
以上内容是结合具体的实施方式对本发明所做的进一步详细说明,不能认定本发明的具体实施只局限于这些说明。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干简单推演或替换,都应当视为属于本发明的保护范围。

Claims (9)

1.一种项目运行状态监测方法,其特征在于,包括以下步骤:
采集当前项目中的依赖信息和配置文件,将所述依赖信息和配置文件存储于数据库中,所述依赖信息包括有当前项目的依赖项目,所述配置文件包括有时间等待步长;
根据所述依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监测;
在检测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息。
2.根据权利要求1所述的一种项目运行状态监测方法,其特征在于,所述配置文件中还包括账号、密码、会话ID、依赖项目名称、时间等待步长、最长等待时长、最大等待轮数和最大重启次数。
3.根据权利要求2所述的一种项目运行状态监测方法,其特征在于,所述根据所述依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监控,具体包括:
根据所述时间等待步长对所述当前项目的运行状态进行查询,并获取当前项目的监控时间;
预先设置有监控时长阈值,在所述监控时间超过所述监控时长阈值或当前项目的运行状态为成功时进入状态响应。
4.根据权利要求3所述的一种项目运行状态监测方法,其特征在于,所述状态响应具体包括:若当前项目的运行状态为成功时,通过所述当前项目,执行下一项目;若当前项目的运行状态为失败时,拒绝所述当前项目,并调用告警规则发送告警信息;若当前项目的运行状态为超时,且当前项目为下一项目的必须依赖项目,则认定为超时响应。
5.根据权利要求4所述的一种项目运行状态监测方法,其特征在于,在所述若当前项目的运行状态为超时,且当前项目为下一项目的必须依赖项目,则认定为超时响应之后,还包括:
根据配置文件内容,执行继续等待操作或是对当前项目进行重启操作;
若对当前项目进行持续等待操作,则等待的轮数不得超过所述最大等待轮数,若超过所述最大等待轮数,则结束当前项目,并根据所述告警规则进行告警;
若对当前项目进行重启操作,则重启次数不得超过所述最大重启次数,若超过所述最大重启次数,则结束当前项目,并根据所述告警规则进行告警。
6.根据权利要求1所述的一种项目运行状态监测方法,其特征在于,所述告警规则具体为:
在配置文件或网络页面的短信告警界面中预先添加项目失败后收信人和项目超时后收信人的告警号码;在项目运行状态存在异常触发告警时,获取告警信息,将所述告警信息进行封装,并发送至所述告警号码对应的终端。
7.一种项目运行状态监测***,其特征在于,包括:
信息采集模块,用于采集当前项目中的依赖信息和配置文件,将所述依赖信息和配置文件存储于数据库中,所述依赖信息包括有当前项目的依赖项目,所述配置文件包括有时间等待步长;
状态监测模块,用于根据所述依赖信息和配置文件启动当前项目,并对当前项目的运行状态进行监测;
告警模块,用于在监测到当前项目的运行状态存在异常时,根据预先设置的告警规则发送告警信息。
8.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述方法的步骤。
9.一种存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202110043307.XA 2021-01-13 2021-01-13 一种项目运行状态监测方法、***、设备及存储介质 Pending CN112686644A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110043307.XA CN112686644A (zh) 2021-01-13 2021-01-13 一种项目运行状态监测方法、***、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110043307.XA CN112686644A (zh) 2021-01-13 2021-01-13 一种项目运行状态监测方法、***、设备及存储介质

Publications (1)

Publication Number Publication Date
CN112686644A true CN112686644A (zh) 2021-04-20

Family

ID=75457755

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110043307.XA Pending CN112686644A (zh) 2021-01-13 2021-01-13 一种项目运行状态监测方法、***、设备及存储介质

Country Status (1)

Country Link
CN (1) CN112686644A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114090109A (zh) * 2021-09-30 2022-02-25 安胜(天津)飞行模拟***有限公司 一种飞行模拟机的启动方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114090109A (zh) * 2021-09-30 2022-02-25 安胜(天津)飞行模拟***有限公司 一种飞行模拟机的启动方法

Similar Documents

Publication Publication Date Title
CN110661659B (zh) 一种告警方法、装置、***及电子设备
CN110888783B (zh) 微服务***的监测方法、装置以及电子设备
CN108572907B (zh) 一种告警方法、装置、电子设备及计算机可读存储介质
CN111897671A (zh) 故障恢复方法、计算机设备及存储介质
CN109995612B (zh) 一种服务巡检方法、装置及电子设备
CN112446511A (zh) 一种故障处置方法、装置、介质及设备
CN111082986A (zh) 告警通知方法及装置
CN110674149B (zh) 业务数据处理方法、装置、计算机设备和存储介质
CN112686644A (zh) 一种项目运行状态监测方法、***、设备及存储介质
CN107885634B (zh) 监控中异常信息的处理方法和装置
CN111611057A (zh) 分布式重试方法、装置、电子设备和存储介质
CN112583912A (zh) Vpn自动连接方法、装置、设备和存储介质
CN116302989A (zh) 压力测试方法及***、存储介质、计算机设备
CN113472881B (zh) 在线终端设备的统计方法和装置
CN114650218B (zh) 一种数据获取方法、设备、***及存储介质
CN115168137A (zh) 针对定时任务的监控方法及***、计算机设备及存储介质
CN114036032A (zh) 一种实时程序的监控方法及装置
CN115705259A (zh) 故障处理方法、相关设备及存储介质
CN113592108A (zh) 一种充电桩的充电故障管理方法及相关设备
CN111427698A (zh) 基于Azakban的数据同步方法、装置和计算机设备
CN110995500A (zh) 节点日志管控方法、***及相关组件
CN111506446B (zh) 接口故障检测方法及服务器
CN114564369B (zh) 应用程序的异常监测方法、装置、电子设备及存储介质
WO2011054861A1 (en) Monitoring and management of heterogeneous network events
CN114237946A (zh) 一种设备硬件异常处理的方法、***及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination