CN110162443A - 多批量流程监控方法、装置、计算机设备和存储介质 - Google Patents

多批量流程监控方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN110162443A
CN110162443A CN201910367542.5A CN201910367542A CN110162443A CN 110162443 A CN110162443 A CN 110162443A CN 201910367542 A CN201910367542 A CN 201910367542A CN 110162443 A CN110162443 A CN 110162443A
Authority
CN
China
Prior art keywords
job information
tws
warning message
message table
abnormal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910367542.5A
Other languages
English (en)
Inventor
王旭
檀剑凯
朱晓明
沈志峰
肖磊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN201910367542.5A priority Critical patent/CN110162443A/zh
Publication of CN110162443A publication Critical patent/CN110162443A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3017Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3476Data logging

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请提供了一种多批量流程监控方法、装置、计算机设备和存储介质,其中,该方法包括:监控服务器周期性接收ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件;监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,更新后的报警信息表中记录有至当前周期的更新时间点为止未确认的异常作业信息条目;监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警。上述方法通过独立于ZOS平台设置的监控服务器将分散在多个TWS实例中的异常作业信息集中分析处理和监控,可以提升多TWS实例中多批量流程的监控效率。

Description

多批量流程监控方法、装置、计算机设备和存储介质
技术领域
本申请涉及计算机***的批量数据处理技术领域,特别涉及一种多批量流程监控方法、装置、计算机设备和存储介质。
背景技术
TWS(Tivoli Workload Scheduler,Tivoli工作量调度)是IBM提供的基于ZOS(z/OS操作***)平台的任务调度软件。例如,在银行的功能测试环境中,包含核心***在内的几十个***通过TWS运行批量流程,当前银行拥有T1~T5共5个功能测试环境,每个功能测试环境拥有约18万个批量作业,这些作业分散定义在21个TWS实例中。
目前,利用TWS实例自带的查询工具通过人工方式在多个TWS实例中来回切换,查询并监控批量流程中的作业执行情况,这就导致效率低下、人工延迟风险等问题。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种多批量流程监控方法、装置、计算机设备和存储介质,以解决现有技术中多个TWS实例中的多批量流程的监控效率低的问题。
本申请实施例提供了一种多批量流程监控方法,包括:监控服务器周期性接收ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件,其中,监控服务器独立于ZOS平台设置;监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,其中,报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息条目和已确认未处理的异常作业信息条目,更新后的报警信息表中记录有至当前周期的更新时间点为止未确认的异常作业信息条目;监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警。
在一个实施例中,监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,包括:监控服务器将存在于当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中而不存在于报警信息表中的异常作业信息条目增加至报警信息表中;和/或,监控服务器将存在于报警信息表中而不存在于当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目从报警信息表中删除。
在一个实施例中,在监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警之后,还包括:监控服务器接收业务人员对更新后的报警信息表中的一条或多条未确认的异常作业信息条目的确认操作;响应于确认操作,监控服务器停止对更新后的报警信息表中的与该确认操作对应的一条或多条未确认的异常作业信息条目的预警,并将该一条或多条未确认的异常作业信息条目的状态由未确认修改为已确认未处理。
在一个实施例中,在监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新之后,还包括:监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目确定是否存在针对未确认的异常作业信息条目的处理方案;在确定存在针对未确认的异常作业信息条目的处理方案的情况下,监控服务器针对未确认的异常作业信息条目生成对应的处理方案。
在一个实施例中,监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,包括:监控服务器将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中;监控服务器根据数据表对报警信息表进行更新。
在一个实施例中,监控服务器将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中,包括:清空数据表;根据预设作业清单对当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目进行筛选;将筛选后的当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目的环境名和作业名组合成主键导入清空后的数据表中;将数据表中的所有异常作业信息条目的状态置为未确认。
在一个实施例中,监控服务器根据数据表对报警信息表进行更新,包括:获取数据表中的主键以及报警信息表中的主键;确定数据表中的主键是否存在于报警信息表中;在确定数据表中的主键存在于报警信息表中的情况下,根据数据表中的主键将数据表中对应异常作业信息条目的执行时间和执行状态更新至报警信息表中;在确定数据表中的主键不存在于报警信息表中的情况下,根据数据表中的主键将数据表中对应的异常作业信息条目***报警信息表中;确定报警信息表中的主键是否存在于数据表中;在确定报警信息表中的主键不存在于数据表中的情况下,根据报警信息表中的主键删除报警信息表中的对应异常作业信息条目。
在一个实施例中,监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警,包括以下至少之一:通过语音报警的方式向业务人员发出预警信息;通过WEB页面向业务人员展示预警信息;通过短信向业务人员发出预警信息;通过电子邮件向业务人员发出预警信息。
本申请实施例还提供了一种多批量流程监控装置,位于监控服务器中,包括:接收模块,用于周期性接收ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件,其中,监控服务器独立于ZOS平台设置;更新模块,用于根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,其中,报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息条目和已确认未处理的异常作业信息条目,更新后的报警信息表中记录有至当前周期的更新时间点为止未确认的异常作业信息条目;预警模块,用于逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警。
本发明实施例还提供一种计算机设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现上述任意实施例中所述的多批量流程监控方法的步骤。
本发明实施例还提供一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现上述任意实施例中所述的多批量流程监控方法的步骤。
在本申请实施例中,提供了一种多批量流程监控方法,通过独立于ZOS平台设置的监控服务器周期性接收ZOS平台中多个TWS实例中各TWS实例下传的异常作业信息文件,再根据接收到的多个异常作业信息文件对报警信息表进行更新,使得更新后的报警信息表中记录有至当前周期的更新时间点为止的未确认的异常作业信息条目,然后监控服务器逐条针对更新后的报警信息表中的未确认的异常作业信息条目进行预警。上述多批量流程监控方法,通过独立于ZOS平台设置的监控服务器,将分散在ZOS平台上的多个TWS实例中运行异常的作业信息进行集中分析处理,并进行预警,能够实现对多个TWS实例中的多批量流程的作业运行情况的实时监控,并且具有很强的可扩展性,非常适用于同时监控多个TWS实例中的多批量流程,可以提高多批量流程监控的效率,降低人力成本。此外,监控服务器仅对报警信息表中未确认的异常作业信息条目进行预警,而对业务人员已经确认过的异常作业信息条目不进行预警,可以避免重复预警,节约业务人员的操作时间,提高业务人员的处理效率。通过上述方案解决了现有的多批量流程监控方法的效率低下的技术问题,达到了有效提升监控效率、降低人力成本的技术效果。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,并不构成对本申请的限定。在附图中:
图1示出了本申请一实施例中的多批量流程监控方法的流程图;
图2示出了本申请一实施例中的多批量流程监控方法所应用的场景的示意图;
图3示出了本申请一实施例中的多批量流程监控装置的示意图;
图4示出了本申请一实施例中的计算机设备的示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本申请的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本申请,而并非以任何方式限制本申请的范围。相反,提供这些实施方式是为了使本申请公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域的技术人员知道,本申请的实施方式可以实现为一种***、装置设备、方法或计算机程序产品。因此,本申请公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
本发明实施例提供了一种多批量流程监控方法,如图1所示,可以包括以下步骤:
步骤S101,监控服务器周期性接收ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件,其中,监控服务器独立于ZOS平台设置。
其中,监控服务器可以是单一的服务器,也可以是服务器集群,或者是云服务器等都可以,具体的组成形成本申请不作限定。TWS是IBM提供的基于ZOS平台的任务调度软件,定义有批量作业的TWS即称为TWS实例。监控服务器独立于ZOS平台设置。异常作业是指执行失败的作业以及执行时间超过预设时间阈值的作业。
示例性地,如图2所示,ZOS平台中的多个TWS实例(TWS实例1到TWS实例n,n为大于1的整数)可以通过FTP(File Transfer Protocol,文件传输协议)方式将各个TWS实例中周期性采集的批量流程的异常作业信息文件周期性地下传到监控服务器。在ZOS平台的主机端,可以使用TWS提供的REXX接口程序EQQYCOM采集异常作业信息,并可以通过定时提交JCL(Job Control Language,作业控制语言)的方式完成数据采集和下传。由于TWS对象可以定义在ZOS平台的不同LPAR(逻辑分区)上,所以每个LPAR需要提交一个JCL,以实现本LAPR上的TWS异常作业信息的定时采集和下传功能,然后将采集到的不同LPAR的TWS作业信息汇总成异常作业信息文件进行下传,定时休眠一段时间后重复采集下传操作,从而实现异常作业信息的周期性采集和下传功能。在结构上,还可以调整为从调度服务器端发起多个TWS实例中的采集流程,从而将多个TWS实例变成客户端,而调度服务器则相当于服务器控制端,这种客户端-服务器的结构可扩展性强。
ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件可以存储在监控服务器中的预设目录中,监控服务器定时扫描该目录,在所有异常作业信息文件接收完成后,获取接收到的多个异常作业信息文件。
步骤S102,监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,其中,报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息条目和已确认未处理的异常作业信息条目,更新后的报警信息表中记录有至当前周期的更新时间点为止未确认的异常作业信息条目。
具体地,在当前周期进行更新之前,报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息条目和已确认未处理的异常作业信息条目。其中,未确认的异常作业信息条目是指业务人员未进行确认的异常作业信息条目,已确认未处理的异常作业信息条目是指业务人员进行确认但仍然出现异常的异常作业信息条目。监控服务器根据当前周期接收到的多个异常作业信息文件对报警信息表进行更新,使得更新后的报警信息表中极路由至当前周期的更新时间点为止未确认的异常作业信息条目。其中,至当前周期的更新时间点为止是指在当前周期的更新时间点之后的下一时刻未确认的异常作业信息条目。
步骤S103,监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警。
具体地,在根据当前周期接收到的多个异常作业信息文件对报警信息表进行更新之后,监控服务器逐条对更新后的报警信息表中的状态为未确认的异常作业信息文件进行预警。
上述多批量流程监控方法,通过独立于ZOS平台设置的监控服务器,将分散在ZOS平台上的多个TWS实例中运行异常的作业信息进行集中分析处理,并进行预警,能够实现对多个TWS实例中的多批量流程的作业运行情况的实时监控,并且具有很强的可扩展性,非常适用于同时监控多个TWS实例中的多批量流程,可以提高多批量流程监控的效率,降低人力成本。此外,监控服务器仅对报警信息表中未确认的异常作业信息条目进行预警,而对业务人员已经确认过的异常作业信息条目不进行预警,可以避免重复预警,节约业务人员的操作时间,提高业务人员的处理效率。通过上述方案解决了现有的多批量流程监控方法的效率低下的技术问题,达到了有效提升监控效率、降低人力成本的技术效果。
进一步地,在本申请一些实施例中,监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,可以包括:监控服务器将存在于当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中而不存在于报警信息表中的异常作业信息条目增加至报警信息表中;和/或,监控服务器将存在于报警信息表中而不存在于当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目从报警信息表中删除。
具体地,为了使监控服务器根据当前周期接收到的多个异常作业信息文件对报警信息表进行更新后得到的报警信息表中记录有至当前周期的更新时间点为止的未确认的异常作业信息条目,可以将当前周期接收到的多个异常作业信息文件中新增的异常作业信息条目添加到报警信息表中,即将存在于多个异常作业信息文件中而不存在于报警信息表中的异常作业信息条目增加至报警信息表中;还可以将报警信息表中不存在于多个异常作业信息文件中的异常作业信息条目删除,即将存在于报警信息表而不存在于接收到的多个异常作业信息文件中的异常作业信息条目从报警信息表中删除,这是因为存在于报警信息表中而不存在于多个异常作业信息文件中的异常作业信息条目对应的作业为在当前周期获取异常作业信息文件之前已经被处理并且运行成功的作业。通过上述方式,可以使得监控服务器方便地对报警信息表进行更新,从而使得得到的报警信息表中记录有当前周期的更新时间点为止的未确认的异常作业信息条目。
考虑到在监控服务器逐条针对报警信息表中的未确认的异常作业信息条目进行预警之后,业务人员可以响应于预警对一条或多条未确认的异常作业信息条目进行确认,在确认后可以将该一条或多个异常作业信息条目的状态更改为已确认未处理,并且可以停止对该异常作业信息条目的预警。因此,在本申请一些实施例中,在监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警之后,还可以包括:监控服务器接收业务人员对更新后的报警信息表中的一条或多条未确认的异常作业信息条目的确认操作;响应于确认操作,监控服务器停止对更新后的报警信息表中的与确认操作对应的一条或多条未确认的异常作业信息条目的预警,并将该一条或多条未确认的异常作业信息条目的状态由未确认修改为已确认未处理。通过上述方案,可以响应于业务人员的操作,更新报警信息表中的异常作业信息条目的状态,停止对该异常作业信息的预警,避免下一周期对该异常作业信息进行重复预警。
为了提高业务人员对异常作业信息的处理效率,对于某些异常作业,可以在***中存储于针对该异常作业的处理方案,所以,可以先确定是否存在针对该异常作业的处理方案并在确定之后生成处理方案以向业务人员展示。因此,在本申请一些实施例中,在监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新之后,还可以包括:监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目确定是否存在针对未确认的异常作业信息条目的处理方案;在确定存在针对未确认的异常作业信息条目的处理方案的情况下,监控服务器针对未确认的异常作业信息条目生成对应的处理方案。
具体地,可以根据预设的预警预案表逐条对更新后的报警信息表中未确认的异常作业信息条目确定是否存在针对该条未确认的异常作业信息条目的处理方案。例如,可以根据异常作业信息条目的作业名称在预警预案表中查找与作业名称一致的作业全称(如EH380000)或与作业名称匹配的匹配名称(如EH36**0Z),若查找到作业全称或匹配名称,则说明存在针对该条未确认的异常作业信息条目的处理方案。在确定存在针对该条未确认的异常作业信息条目的处理方案的情况下,则根据预警预案表生成处理方案并向业务人员展示该异常作业信息条目及对应的处理方案。通过上述方式,业务人员在看到异常作业信息条目的同时可以获知针对该异常作业的处理方案,从而可以根据该处理方案进行处理,因而可以提高异常作业处理的效率,节约处理时间和人力成本。
为了更方便地根据接收到的多个异常作业信息文件对报警信息表进行更新,可以将多个异常作业信息文件导入数据表中,然后根据数据表对报警信息表进行更新。因此,在本申请一些实施例中,监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,可以包括:监控服务器将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中;监控服务器根据数据表对报警信息表进行更新。
进一步地,在本申请一些实施例中,监控服务器将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中,可以包括:清空数据表;根据预设作业清单对当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目进行筛选;将筛选后的当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目的环境名和作业名组合成主键导入清空后的数据表中;将数据表中的所有异常作业信息条目的状态置为未确认。
具体地,在将当前周期接收到的多个异常作业信息文件中的异常作业信息条目导入数据表中之前,需要先将数据表清空。其中,预设作业清单是指预设的无需报警的作业清单。示例性地,由于TWS实例采集的异常作业信息包括运行失败的异常作业信息以及正在运行并且运行时间超过预设时间阈值的异常作业信息,但是由于有一些作业是常驻作业,这些作业一直运行并且运行时间可能超过预设时间阈值,但并不属于真正的异常作业,所以需要过滤掉。因此,可以根据预设作业清单对当前周期接收到的作业信息条目进行筛选,将存在于预设作业清单中的异常作业信息条目删除。然后,将筛选后的异常作业信息文件中的异常作业信息条目的作业环境名和作业名组合成主键并导入清空后的数据表中。报警信息表中的异常作业信息条目的主键也是作业环境名和作业名组成的。另外,报警信息表中的所有异常作业信息条目的状态都置为未确认。通过上述方式,可以过滤掉明确不属于异常作业的作业,并可以将过滤的异常作业信息文件中的异常作业信息导入数据表中,以方便对报警信息表进行更新。
进一步地,在本申请一些实施例中,监控服务器根据数据表对报警信息表进行更新,可以包括:获取数据表中的主键以及报警信息表中的主键;确定数据表中的主键是否存在于报警信息表中;在确定数据表中的主键存在于报警信息表中的情况下,根据数据表中的主键将数据表中对应异常作业信息条目的执行时间和执行状态更新至报警信息表中;在确定数据表中的主键不存在于报警信息表中的情况下,根据数据表中的主键将数据表中对应的异常作业信息条目***报警信息表中;确定报警信息表中的主键是否存在于数据表中;在确定报警信息表中的主键不存在于数据表中的情况下,根据报警信息表中的主键删除报警信息表中的对应异常作业信息条目。
具体地,监控服务器先获取数据表和报警信息表中的主键,然后确定数据表中的主键是否存在于报警信息表中,若存在,则说明该异常作业在当前周期之前已经出现过,已经记录在报警信息表中,只需要根据数据表中的主键将数据表中对应的异常作业信息条目的执行时间和执行状态更新至报警信息表中;若数据表中主键不存在于报警信息表中,则说明该数据表中对应的异常作业信息是新增的异常作业信息,需要根据数据表中的主键将对应的异常作业信息条目***报警信息表中。由于报警信息表中的所有异常作业信息条目的状态都是未确认,所以报警信息表中新***的异常作业信息条目的状态是未确认。监控服务器还可以判断报警信息表中的主键是否存在于数据表中,如果不存在,则说明该主键对应的异常作业不存在于当前周期获取的异常作业信息中,不属于异常作业,所以需要根据报警信息表中的该主键删除报警信息表中的对应异常作业信息条目。通过上述方式,可以方便地实现报警信息表的更新,使得报警信息表中记录有未确认的异常作业信息以及已确认未处理的异常作业信息,同时对已有的异常作业信息进行更新,实现对多批量流程的作业执行情况的更好的监控。
为了使业务人员及时获知当前周期未确认的异常作业信息,可以向业务人员发出预警信息。因此,在本申请一些实施例中,监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警,可以包括以下至少之一:通过语音报警的方式向业务人员发出预警信息;通过WEB页面向业务人员展示预警信息;通过短信向业务人员发出预警信息;通过电子邮件向业务人员发出预警信息。通过上述方式,可以灵活快捷地向业务人员发送预警信息,以使业务人员及时确认和处理异常作业,提高处理效率。
下面结合一个具体实施例对上述方法进行说明,然而,值得注意的是,该具体实施例仅是为了更好地说明本申请,并不构成对本申请的不当限定。
在本实施例中,提供了一种ZOS平台上的多TWS实例中的多批量流程的监控方法,可以包括以下步骤:
步骤1:在ZOS平台实施,周期性采集在ZOS平台上的不同TWS运行中的异常作业信息,并将得到的异常作业信息文件下传至监控服务器的预设目录;
步骤2:监控服务器周期性合并主机端下传的异常作业信息文件;
步骤3:监控服务器清空数据表,根据预设的无需报警作业清单对异常作业信息文件中的作业信息进行筛选,并将筛选后的异常作业信息文件中的作业信息导入数据表中;
步骤4:监控服务器将数据表逻辑同步至报警信息表,其中,报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息和已确认未处理的异常作业信息,逻辑同步后的报警信息表中记录有在当前周期的更新时间点之后的即刻未确认的异常作业信息,将数据表逻辑同步至报警信息表包括以下步骤:
a.删除报警信息表中主键不存在于数据表中的数据;
b.根据同时存在于数据表和报警信息表中的主键,将数据表中的作业执行时间和作业执行状态更新至报警信息表中;
c.根据存在于数据表中而不存在于报警信息表中的主键,将数据表中的对应数据***报警信息表中;
步骤5:监控服务器逐条针对更新后的报警数据表中的未确认的异常作业信息进行预警;
步骤6:监控服务器根据预设的预警预案数据表确定报警数据表中的未确认的异常作业信息是否存在处理方案,在确定存在处理方案的情况下,生成针对该异常作业的处理方案;
步骤7:监控服务器在web页面展示异常作业信息并对未确认的异常作业信息进行报警,还向业务人员展示处理方案以便于业务人员进行故障处理。
上述方法将分散在ZOS平台上的多个TWS实例中采集的运行异常的作业信息统一下传到单独的监控服务器,再通过监控服务器平台进行数据加工、展示和处理,从而达到有效监控多个TWS实例中的多批量流程和快速定位处理故障作业的效果,这种结构具有很强的可扩展性,非常适应同时监控多个TWS实例中的多批量流程。通过本方法能有效提升对批量流程的运维监控能力,通过及时发现批量运行异常作业并提供相应的处理方案,能够明显缩短批量故障处理时效,增强***运维质量。本方法通过分布式结构汇总分散在不同TWS实例中的批量作业信息,在监控服务器统一处理;实现对多个批量流程的监控、报警、故障处理等功能,在运维批量执行中会出现很多报错作业和异常作业,人工很难及时发现,而且处理故障效率低下,在使用本方法后,可以有效提高运维效率。
基于同一发明构思,本申请实施例中还提供了一种多批量流程监控装置,如下面的实施例所述。由于多批量流程监控装置解决问题的原理与多批量流程监控方法相似,因此多批量流程监控装置的实施可以参见多批量流程监控方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图3是本申请实施例的多批量流程监控装置的一种结构框图,如图3所示,可以包括:接收模块301、更新模块302和预警模块303,下面对该结构进行说明。
接收模块301用于周期性接收ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件,其中,监控服务器独立于ZOS平台设置。
更新模块302用于根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,其中,报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息条目和已确认未处理的异常作业信息条目,更新后的报警信息表中记录有至当前周期的更新时间点为止未确认的异常作业信息条目。
预警模块303用于逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警。
在本申请一些实施例中,更新模块可以具体用于:将存在于当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中而不存在于报警信息表中的异常作业信息条目增加至报警信息表中;和/或,将存在于报警信息表中而不存在于当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目从报警信息表中删除。
在本申请一些实施例中,预警模块还可以具体用于:在逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警之后,接收业务人员对更新后的报警信息表中的一条或多条未确认的异常作业信息条目的确认操作;响应于确认操作,停止针对报警信息表中的与确认操作对应的一条或多条未确认的异常作业信息条目的预警,并将该一条或多条未确认的异常作业信息条目的状态由未确认修改为已确认未处理。
在本申请一些实施例中,该装置还可以包括生成模块,生成模块可以具体用于:在根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新之后,逐条对更新后的报警信息表中未确认的异常作业信息条目确定是否存在针对未确认的异常作业信息条目的处理方案;在确定存在针对未确认的异常作业信息条目的处理方案的情况下,针对未确认的异常作业信息条目生成对应的处理方案。
在本申请一些实施例中,更新模块可以具体用于:将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中;根据数据表对报警信息表进行更新。
在本申请一些实施例中,将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中,可以包括:清空数据表;根据预设作业清单对当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目进行筛选;将筛选后的当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目的环境名和作业名组合成主键导入清空后的数据表中;将数据表中的所有异常作业信息条目的状态置为未确认。
在本申请一些实施例中,根据数据表对报警信息表进行更新,可以包括:获取数据表中的主键以及报警信息表中的主键;确定数据表中的主键是否存在于报警信息表中;在确定数据表中的主键存在于报警信息表中的情况下,根据数据表中的主键将数据表中对应异常作业信息条目的执行时间和执行状态更新至报警信息表中;在确定数据表中的主键不存在于报警信息表中的情况下,根据数据表中的主键将数据表中对应的异常作业信息条目***报警信息表中;确定报警信息表中的主键是否存在于数据表中;在确定报警信息表中的主键不存在于数据表中的情况下,根据报警信息表中的主键删除报警信息表中的对应异常作业信息条目。
在本申请一些实施例中,预警模块还可以具体用于:通过语音报警的方式向业务人员发出预警信息;通过WEB页面向业务人员展示预警信息;通过短信向业务人员发出预警信息;通过电子邮件向业务人员发出预警信息。
从以上的描述中,可以看出,本申请实施例实现了如下技术效果:通过独立于ZOS平台设置的监控服务器,将分散在ZOS平台上的多个TWS实例中运行异常的作业信息进行集中分析处理,并进行预警,能够实现对多个TWS实例中的多批量流程的作业运行情况的实时监控,并且具有很强的可扩展性,非常适用于同时监控多个TWS实例中的多批量流程,可以提高多批量流程监控的效率,降低人力成本。此外,监控服务器仅对报警信息表中未确认的异常作业信息条目进行预警,而对业务人员已经确认过的异常作业信息条目不进行预警,可以避免重复预警,节约业务人员的操作时间,提高业务人员的处理效率。通过上述方案解决了现有的多批量流程监控方法的效率低下的技术问题,达到了有效提升监控效率、降低人力成本的技术效果。
本申请实施方式还提供了一种计算机设备,具体可以参阅图4所示的基于本申请实施例提供的多批量流程监控方法的计算机设备组成结构示意图,所述计算机设备具体可以包括输入设备41、处理器42、存储器43。其中,所述存储器43用于存储处理器可执行指令。所述处理器42执行所述指令时实现上述任意实施例中所述的多批量流程监控方法的步骤。所述输入设备41具体可以用于预设作业清单等。
在本实施方式中,所述输入设备具体可以是业务人员和计算机***之间进行信息交换的主要装置之一。所述输入设备可以包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;输入设备用于把原始数据和处理这些数的程序输入到计算机中。所述输入设备还可以获取接收其他模块、单元、设备传输过来的数据。所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述存储器具体可以是现代信息技术中用于保存信息的记忆设备。所述存储器可以包括多个层次,在数字***中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在***中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
在本实施方式中,该计算机设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
本申请实施方式中还提供了一种基于多批量流程监控方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时实现上述任意实施例中所述多批量流程监控方法的步骤。
在本实施方式中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
显然,本领域的技术人员应该明白,上述的本申请实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请实施例不限制于任何特定的硬件和软件结合。
应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本申请的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请实施例可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (11)

1.一种多批量流程监控方法,其特征在于,包括:
监控服务器周期性接收ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件,其中,所述监控服务器独立于所述ZOS平台设置;
所述监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,其中,所述报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息条目和已确认未处理的异常作业信息条目,更新后的报警信息表中记录有至当前周期的更新时间点为止未确认的异常作业信息条目;
所述监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警。
2.根据权利要求1所述的方法,其特征在于,所述监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,包括:
所述监控服务器将存在于当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中而不存在于所述报警信息表中的异常作业信息条目增加至所述报警信息表中;和/或,
所述监控服务器将存在于所述报警信息表中而不存在于所述当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目从所述报警信息表中删除。
3.根据权利要求2所述的方法,其特征在于,在所述监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警之后,还包括:
所述监控服务器接收业务人员对更新后的报警信息表中的一条或多条未确认的异常作业信息条目的确认操作;
响应于所述确认操作,所述监控服务器停止对所述更新后的报警信息表中的与所述确认操作对应的一条或多条未确认的异常作业信息条目的预警,并将该一条或多条未确认的异常作业信息条目的状态由未确认修改为已确认未处理。
4.根据权利要求1所述的方法,其特征在于,在所述监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新之后,还包括:
所述监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目确定是否存在针对未确认的异常作业信息条目的处理方案;
在确定存在针对未确认的异常作业信息条目的处理方案的情况下,所述监控服务器针对未确认的异常作业信息条目生成对应的处理方案。
5.根据权利要求1所述的方法,其特征在于,所述监控服务器根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,包括:
所述监控服务器将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中;
所述监控服务器根据所述数据表对所述报警信息表进行更新。
6.根据权利要求5所述的方法,其特征在于,所述监控服务器将当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目导入数据表中,包括:
清空数据表;
根据预设作业清单对当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目进行筛选;
将筛选后的当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件中的异常作业信息条目的环境名和作业名组合成主键导入清空后的数据表中;
将所述数据表中的所有异常作业信息条目的状态置为未确认。
7.根据权利要求6所述的方法,其特征在于,所述监控服务器根据所述数据表对所述报警信息表进行更新,包括:
获取所述数据表中的主键以及所述报警信息表中的主键;
确定所述数据表中的主键是否存在于所述报警信息表中;
在确定所述数据表中的主键存在于所述报警信息表中的情况下,根据所述数据表中的主键将所述数据表中对应异常作业信息条目的执行时间和执行状态更新至所述报警信息表中;
在确定所述数据表中的主键不存在于所述报警信息表中的情况下,根据所述数据表中的主键将所述数据表中对应的异常作业信息条目***所述报警信息表中;
确定所述报警信息表中的主键是否存在于所述数据表中;
在确定所述报警信息表中的主键不存在于所述数据表中的情况下,根据所述报警信息表中的主键删除所述报警信息表中的对应异常作业信息条目。
8.根据权利要求1所述的方法,其特征在于,所述监控服务器逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警,包括以下至少之一:
通过语音报警的方式向业务人员发出预警信息;
通过WEB页面向业务人员展示预警信息;
通过短信向业务人员发出预警信息;
通过电子邮件向业务人员发出预警信息。
9.一种多批量流程监控装置,其特征在于,位于所述监控服务器中,包括:
接收模块,用于周期性接收ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件,其中,所述监控服务器独立于所述ZOS平台设置;
更新模块,用于根据当前周期接收到的ZOS平台中的多个TWS实例中各TWS实例下传的批量流程的异常作业信息文件对报警信息表进行更新,其中,所述报警信息表中记录有在当前周期的更新时间点之前未确认的异常作业信息条目和已确认未处理的异常作业信息条目,更新后的报警信息表中记录有至当前周期的更新时间点为止未确认的异常作业信息条目;
预警模块,用于逐条对更新后的报警信息表中未确认的异常作业信息条目进行预警。
10.一种计算机设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现权利要求1至8中任一项所述方法的步骤。
CN201910367542.5A 2019-05-05 2019-05-05 多批量流程监控方法、装置、计算机设备和存储介质 Pending CN110162443A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910367542.5A CN110162443A (zh) 2019-05-05 2019-05-05 多批量流程监控方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910367542.5A CN110162443A (zh) 2019-05-05 2019-05-05 多批量流程监控方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN110162443A true CN110162443A (zh) 2019-08-23

Family

ID=67633397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910367542.5A Pending CN110162443A (zh) 2019-05-05 2019-05-05 多批量流程监控方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN110162443A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949484A (zh) * 2020-08-13 2020-11-17 中国工商银行股份有限公司 信息处理方法、装置、电子设备和介质
CN112819349A (zh) * 2021-02-06 2021-05-18 建信金融科技有限责任公司 应用于数据加工的监控方法、装置、设备及介质
CN115766397A (zh) * 2022-11-15 2023-03-07 中国工商银行股份有限公司 作业数据中断预警方法、装置、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102226890A (zh) * 2011-06-10 2011-10-26 中国工商银行股份有限公司 一种主机批量作业数据监控方法及装置
US20140201747A1 (en) * 2013-01-14 2014-07-17 Wal-Mart Stores, Inc. Cross platform workflow management
CN105607983A (zh) * 2015-11-09 2016-05-25 北京京东尚科信息技术有限公司 数据异常监控方法和装置
CN108737170A (zh) * 2018-05-09 2018-11-02 中国银行股份有限公司 一种批量日志异常数据告警方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102226890A (zh) * 2011-06-10 2011-10-26 中国工商银行股份有限公司 一种主机批量作业数据监控方法及装置
US20140201747A1 (en) * 2013-01-14 2014-07-17 Wal-Mart Stores, Inc. Cross platform workflow management
CN105607983A (zh) * 2015-11-09 2016-05-25 北京京东尚科信息技术有限公司 数据异常监控方法和装置
CN108737170A (zh) * 2018-05-09 2018-11-02 中国银行股份有限公司 一种批量日志异常数据告警方法及装置

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111949484A (zh) * 2020-08-13 2020-11-17 中国工商银行股份有限公司 信息处理方法、装置、电子设备和介质
CN111949484B (zh) * 2020-08-13 2024-01-09 中国工商银行股份有限公司 信息处理方法、装置、电子设备和介质
CN112819349A (zh) * 2021-02-06 2021-05-18 建信金融科技有限责任公司 应用于数据加工的监控方法、装置、设备及介质
CN115766397A (zh) * 2022-11-15 2023-03-07 中国工商银行股份有限公司 作业数据中断预警方法、装置、设备和存储介质

Similar Documents

Publication Publication Date Title
CN108874640B (zh) 一种集群性能的评估方法和装置
CN105357038B (zh) 监控虚拟机集群的方法和***
CN107506451B (zh) 用于数据交互的异常信息监控方法及装置
CN106940677A (zh) 一种应用日志数据告警方法及装置
CN110162443A (zh) 多批量流程监控方法、装置、计算机设备和存储介质
CN104468282B (zh) 集群监控处理***及方法
CN105760240A (zh) 分布式任务处理方法及装置
JP4506520B2 (ja) 管理サーバ、メッセージの抽出方法、及び、プログラム
KR101365840B1 (ko) 이벤트 모니터의 동작의 방법, 컴퓨터 판독가능 매체 및 작업 아이템 이벤트 모니터
CN108737549A (zh) 一种大数据量的日志分析方法及装置
CN114091704B (zh) 一种告警压制方法和装置
WO2019076001A1 (zh) 信息更新方法和装置
CN109408565A (zh) 一种数据同步交互方法、***和数据交互平台
US20150281037A1 (en) Monitoring omission specifying program, monitoring omission specifying method, and monitoring omission specifying device
CN110222039B (zh) 数据存储及垃圾数据清理方法、装置、设备及存储介质
CN104750849B (zh) 用于维护基于树形结构的目录关系的方法和***
WO2017088701A1 (zh) 一种海量图片管理方法和装置
CN110737655A (zh) 用于上报数据的方法和装置
CN110032497A (zh) 一种指标数据的监控***及方法
CN113672452A (zh) 一种数据采集任务的运行监控方法、***
CN105468502A (zh) 一种日志收集的方法、装置和***
CN103297477A (zh) 一种数据采集上报***及数据处理方法和代理服务器
JP2012064155A (ja) 管理装置およびその制御方法、情報処理システム
CN202268912U (zh) 基于云计算架构的数据管理***
CN111212112A (zh) 信息处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190823

RJ01 Rejection of invention patent application after publication