CN111324480B - 大型主机交易故障定位***及方法 - Google Patents

大型主机交易故障定位***及方法 Download PDF

Info

Publication number
CN111324480B
CN111324480B CN202010111536.6A CN202010111536A CN111324480B CN 111324480 B CN111324480 B CN 111324480B CN 202010111536 A CN202010111536 A CN 202010111536A CN 111324480 B CN111324480 B CN 111324480B
Authority
CN
China
Prior art keywords
transaction
transaction data
host
link information
fault
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010111536.6A
Other languages
English (en)
Other versions
CN111324480A (zh
Inventor
谢小舜
李志军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202010111536.6A priority Critical patent/CN111324480B/zh
Publication of CN111324480A publication Critical patent/CN111324480A/zh
Application granted granted Critical
Publication of CN111324480B publication Critical patent/CN111324480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0715Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a system implementing multitasking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明提供了一种大型主机交易故障定位***及方法,所述***包含IBM主机端和平台端;所述IBM主机端包含数据处理装置;所述数据处理装置用于采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;根据所述交易数据于各节点的程序调用状态生成链路信息;根据所述交易数据于各节点的交易状态生成故障标识;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端;所述平台端用于接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;以及根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出。

Description

大型主机交易故障定位***及方法
技术领域
本发明涉及软件故障定位技术领域,特别是涉及IBM大型主机交易故障快速定位及场景可追溯的方法。
背景技术
主机(Mainframe)是国际商业机器公司(以下简称IBM公司)研发的大型计算机,它使用专用的硬件设备以及***软件,具有高稳定性和安全性的特点,主机是各主要商业银行、保险公司、证券公司等大型金融机构都采购使用的一款主流产品,这些金融机构的众多业务,比如银行的开户、存取款、会计出纳等,都是通过运行在主机CICS中间件上的联机交易程序完成的。IBM公司在CICS中提供了CEDF/CEDX跟踪工具,用于主机联机交易故障的跟踪排查。CEDF/CEDX跟踪工具基本能够实现故障的分析定位,但在实际使用过程中,相关的操作涉及步骤繁多、操作复杂,需要具备一定的主机技术水平才能完成对应的操作;同时,交易和程序的调用链路错综繁杂,使用CEDF/CEDX分析起来非常困难,故障的定位分析极为耗时,而金融机构生产***的问题解决时效又非常重要,问题定位分析效率低下可能造成金融机构长时间无法对外提供服务,对金融机构及其客户造成损失;另外,使用CEDF/CEDX或现有的一些联机交易跟踪工具,都需要重现问题,而使用大型主机联机交易的众多场景中,不论生产、测试还是开发环境,经常会有无法重现问题的情况,这就造成主机交易的故障分析依赖于技术人员的技术水平和经验,而且交易的动态链路长,涉及多个应用,涉及众多开发、测试和运维人员,存在较大的沟通成本。开放平台虽有较为完善的报错跟踪工具,但跟IBM主机的***机制完全不同,无法照搬到大型主机上来使用。
发明内容
本发明目的在于提供一种开放平台实现大型主机交易故障快速定位及场景可追溯的***及方法,以通过友好易用的可视化操作模式,简化大型主机联机交易故障跟踪定位和分析的步骤。
为达上述目的,本发明所提供的一种大型主机交易故障定位***,所述***包含IBM主机端和平台端;所述IBM主机端包含数据处理装置;所述数据处理装置用于采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;根据所述交易数据于各节点的程序调用状态生成链路信息;根据所述交易数据于各节点的交易状态生成故障标识;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端;所述平台端用于接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;以及根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出。
在上述大型主机交易故障定位***中,优选的,所述数据处理装置包含采集模块、过滤模块、分析处理模块和主机队列读写模块;所述采集模块设置于主机交易和CICS中间件之间的出口程序处,通过汇编程序采集在CICS中间件运行的交易数据包;所述过滤模块用于于所述交易数据包中提取获得包含交易状态的交易数据;所述分析处理模块用于根据所述交易数据包获得所述交易数据于各节点的程序调用状态并生成链路信息;以及根据所述交易数据于各节点的交易状态生成故障标识;所述主机队列读写模块用于将所述交易数据、所述故障标识和所述链路信息输入至主机队列后,通过REXX程序和socket套接字发送到平台端。
在上述大型主机交易故障定位***中,优选的,所述平台端包含存储模块、任务调度装置和页面端;所述存储模块用于接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库;所述任务调度装置用于接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端;所述页面端将接收到的处理结果展示输出。
在上述大型主机交易故障定位***中,优选的,所述存储模块包含存储监控单元、存储控制单元和非关系型数据库;所述存储监控单元用于监测所述非关系型数据库的运行状态及磁盘的空间状态,当所述运行状态及所述空间状态不符合预设规则时,生成告警信息;所述存储控制单元用于根据所述非关系型数据库中数据文件的访问频率或访问日期,将所述非关系型数据库中预定访问频率内或访问周期内的数据文件备份至预定存储器中;以及,根据所述任务调度装置的调取指令,于预定存储器中调取对应的数据文件并加载至所述非关系型数据库;所述非关系型数据库用于存储所述交易数据、所述故障标识和所述链路信息。
在上述大型主机交易故障定位***中,优选的,所述任务调度装置包含输入解析模块、任务请求模块、任务分发模块、逻辑处理模块和任务跟踪模块;所述输入解析模块用于接收主机交易故障排查处理的任务请求,根据所述任务请求解析获得对应的环境名、交易代码、开始时间及结束时间并提供至所述逻辑处理模块;所述任务请求模块用于响应接收到的请求指令,将请求指令对应的请求类型提供至任务分发模块;所述任务分发模块用于根据所述请求类型提供对应的接口程序进行处理;所述逻辑处理模块用于存储预设的多种接口程序,所述接口程序用于根据所述请求指令和对应的环境名、交易代码、开始时间及结束时间,按预设规则处理对应的请求指令,生成处理结果;所述任务跟踪模块用于将所述处理结果通过JSON标准格式传输给页面端。
在上述大型主机交易故障定位***中,优选的,所述页面端包含输入模块和显示模块;所述输入模块用于根据用户输入信息生成任务请求,并将所述任务请求提供至所述任务调度装置;所述显示模块用于显示所述任务调度装置提供的处理结果。
本发明还提供一种大型主机交易故障定位方法,所述方法包含:IBM主机端采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;根据所述交易数据于各节点的程序调用状态生成链路信息,根据所述交易数据于各节点的交易状态生成故障标识;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端;平台端接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出。
在上述大型主机交易故障定位方法中,优选的,IBM主机端采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端包含:通过汇编程序采集主机交易和CICS中间件之间的出口程序处运行在CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;根据所述交易数据包获得所述交易数据于各节点的程序调用状态并生成链路信息;根据所述交易数据于各节点的交易状态生成故障标识;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后,通过REXX程序和socket套接字发送到平台端。
在上述大型主机交易故障定位方法中,优选的,接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出包含:接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库;接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端;所述页面端将接收到的处理结果展示输出。
在上述大型主机交易故障定位方法中,优选的,接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库还包含:监测所述非关系型数据库的运行状态及磁盘的空间状态,当所述运行状态及所述空间状态不符合预设规则时,生成告警信息;根据所述非关系型数据库中数据文件的访问频率或访问日期,将所述非关系型数据库中预定访问频率内或访问周期内的数据文件备份至预定存储器中;根据所述任务调度装置的调取指令,于预定存储器中调取对应的数据文件并加载至所述非关系型数据库。
在上述大型主机交易故障定位方法中,优选的,接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端包含:将预设的多种接口程序存储于逻辑处理模块;接收主机交易故障排查处理的任务请求,根据所述任务请求解析获得对应的环境名、交易代码、开始时间及结束时间并提供至所述逻辑处理模块;所述逻辑处理模块根据所述请求类型匹配对应的预设接口程序;所述接口程序根据所述请求指令和对应的环境名、交易代码、开始时间及结束时间,按预设规则处理对应的请求指令,生成处理结果;将所述处理结果通过JSON标准格式传输给页面端。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
本发明的有益技术效果在于:通过友好易用的可视化操作模式,简化大型主机联机交易故障跟踪定位和分析的步骤,不但大幅提高了技术人员沟通和解决问题的效率,而且突破了传统CEDF/CEDX跟踪模式对用户需具备较高主机技术能力的限制。同时,所有交易故障都保留现场,业务场景无需重现,任意时间段发生的故障可快速定位并直观展现。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,并不构成对本发明的限定。在附图中:
图1A为本发明一实施例所提供的大型主机交易故障定位***的结构示意图;
图1B为本发明一实施例所提供的大型主机交易故障定位***的应用结构示意图;
图2为本发明一实施例所提供的数据处理功能模块图;
图3为本发明一实施例所提供的存储功能模块图;
图4为本发明一实施例所提供的任务调度***功能模块图;
图5为本发明一实施例所提供的WEB页面前端功能模块图;
图6为本发明一实施例所提供的大型主机交易故障定位方法的流程示意图;
图7为本发明一实施例所提供的大型主机交易故障定位方法的采集和存储流程图;
图8为本发明一实施例所提供的大型主机交易故障定位方法的分析流程示意图;
图9为本发明一实施例所提供的电子设备的结构示意图。
具体实施方式
以下将结合附图及实施例来详细说明本发明的实施方式,借此对本发明如何应用技术手段来解决技术问题,并达成技术效果的实现过程能充分理解并据以实施。需要说明的是,只要不构成冲突,本发明中的各个实施例及各实施例中的各个特征可以相互结合,所形成的技术方案均在本发明的保护范围之内。
另外,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机***中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
请参考图1A所示,本发明所提供的一种大型主机交易故障定位***,所述***包含IBM主机端100和平台端200;所述IBM主机端100包含数据处理装置004;所述数据处理装置004用于采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;根据所述交易数据于各节点的程序调用状态生成链路信息;根据所述交易数据于各节点的交易状态生成故障标识;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端;所述平台端200用于接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;以及根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出。实际工作中,IBM主机端:通过在主机交易数据包和CICS中间件之间的出口程序处,部署一个使用大机汇编开发的执行效率极高的数据处理模块,具体的,可采用应用程序在执行CICS API指令时,***提供了对应的出口,用户客户化这些对应的出口程序,应用程序在执行这些CICS API时就会调用到相应的出口程序。交易启动时,出口程序通过GETMAIN在CICS申请一块内存,并将内存地址存放在TWA,后续该TASK其他出口程序通过TWA获取内存地址,并将交易链路信息存储于此;发生跨分区调用时,出口程序通过交易级共享内存Channel将交易链路数据传输到目标分区,垮分区返回时,通过交易级共享内存Channel传送回来。数据处理模块通过这些内存实时获取和保存交易数据,交易结束时,将获取的交易链路信息写入TDQ队列中,以此,实现数据的高效采集、过滤、初步分析和队列读写。通过REXX程序和socket套接字实现交易链路数据报文的垮平台传输;开放平台端:通过java编程开发开放平台端软件***,实现交易数据接收、数据入库、存储监控、存储控制、数据归档、历史数据文件查询、输入解析、任务分发、逻辑处理、任务存储、任务跟踪、交互通讯、结果可视化、日志登记及查询等系列功能。
请参考图2所示,在本发明一实施例中,所述数据处理装置,亦即图中的数据处理***004包含采集模块401、过滤模块402、分析处理模块403和主机队列读写模块404;所述采集模块401设置于主机交易和CICS中间件之间的出口程序处,通过汇编程序采集在CICS中间件运行的交易数据包;所述过滤模块402用于于所述交易数据包中提取获得包含交易状态的交易数据;所述分析处理模块403用于根据所述交易数据包获得所述交易数据于各节点的程序调用状态并生成链路信息;以及根据所述交易数据于各节点的交易状态生成故障标识;所述主机队列读写模块404用于将所述交易数据、所述故障标识和所述链路信息输入至主机队列后,通过REXX程序和socket套接字发送到平台端。实际工作中,其中采集模块401是核心程序,因为主机交易的并发很大,同一时间有大量交易从网关上到CICS,数据的采集不能影响到交易的性能,所以采集模块401采用大机汇编程序开发,部署在主机交易和CICS中间件之间的出口程序这个必经之路,完成交易数据的高效采集;过滤模块402,对采集到的交易数据进行初步过滤,只保留有用的数据;分析处理模块403判断交易链路逻辑和故障情况,对数据进行必要的加工处理(比如生成哈希值,方便梳理后续链路对应关系;对通讯区进行转码和格式化,方便后续处理和阅读,等等),另外,与过滤模块402结合,为过滤模块提供更为细致的过滤规则(比如因程序死循环或其他原因导致的重复链路进行过滤和截断处理,等等);主机队列读写模块404使用REXX程序和socket套接字,实现主机交易数据到平台侧的垮平台传输。
请参考图1B所示,在本发明一实施例中,所述平台端200包含存储模块007、任务调度装置008和页面端009;所述存储模块007用于接收所述IBM主机端100发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库;所述任务调度装置008用于接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端009;所述页面端009将接收到的处理结果展示输出;进一步的,所述平台端200还包含日志模块010和平台通信模块006,所述平台通信模块006通过IBM主机端的额主机通讯模块005与之通信,IBM主机端可包含主机交易001,CICS中间件入口程序002,CICS003,数据处理***004。
请参考图3所示,在上述实施例中,所述存储模块007包含存储监控单元701、存储控制单元702和非关系型数据库703;所述存储监控单元701用于监测所述非关系型数据库的运行状态及磁盘的空间状态,当所述运行状态及所述空间状态不符合预设规则时,生成告警信息;所述存储控制单元702用于根据所述非关系型数据库703中数据文件的访问频率或访问日期,将所述非关系型数据库703中预定访问频率内或访问周期内的数据文件备份至预定存储器中;以及,根据所述任务调度装置的调取指令,于预定存储器中调取对应的数据文件并加载至所述非关系型数据库;所述非关系型数据库703用于存储所述交易数据、所述故障标识和所述链路信息。在实际工作中,存储模块007可包括存储监控单元701、存储控制单元702、非关系型数据库703和数据文件704。其中,存储监控单元701对数据库可用性和磁盘空间等进行持续检测,若检测到数据库不可用或磁盘空间达到预设阀值,则触发警报,自动发送邮件通知运维人员;存储控制单元702,控制非关系型数据库703和数据文件704的写入,其控制策略是,用数据库存储使用频率高的新鲜日期数据,而较为久远的数据使用频率很小,每天定期从数据库剥离到备份文件存放,需要使用时由存储控制单元把对应日期的备份文件加载到数据库,该策略保证了数据库性能并控制了整体存储成本。
任务调度***008是一套常态运行在平台服务器端的程序,用于任务处理和交易链路逻辑分析处理的集中管理。通过MVC架构模式(Model、View、Controller)开发,实现对任务调度功能的封装,提供JSON标准格式输入输出的对外服务接口,第三方可直接调用,实现主机交易故障的快速定位和自动分析。请参考图4所示,在本发明一实施例中,所述任务调度装置亦即图中的任务调度***008包含输入解析模块801、任务请求模块802、任务分发模块803、逻辑处理模块804和任务跟踪模块806;所述输入解析模块801用于接收主机交易故障排查处理的任务请求,根据所述任务请求解析获得对应的环境名、交易代码、开始时间及结束时间并提供至所述逻辑处理模块;所述任务请求模块802用于响应接收到的请求指令,将请求指令对应的请求类型提供至任务分发模块;所述任务分发模块803用于根据所述请求类型提供对应的接口程序进行处理;所述逻辑处理模块804用于存储预设的多种接口程序,所述接口程序用于根据所述请求指令和对应的环境名、交易代码、开始时间及结束时间,按预设规则处理对应的请求指令,生成处理结果;所述任务跟踪模块806用于将所述处理结果通过JSON标准格式传输给页面端。实际工作中,页面端009包含WEB页面前端和WEB页面后端,所述任务调度***008包括输入解析模块801、任务请求模块802、任务分发模块803、逻辑处理模块804、任务存储模块805、任务跟踪模块806和通讯模块807。其中,输入解析模块801通过读取前端输入的数据包,解析任务请求的环境名、交易代码、开始时间以及结束时间,并将信息提供给后续处理模块;任务请求模块802用于响应用户的请求,将请求类型提供给任务分发模块803;任务分发模块803根据任务请求模块802提供的请求类型,指派对应的接口程序去处理;逻辑处理模块804,包含各种功能的接口程序,每个接口程序完成相应的逻辑功能处理;任务存储模块805主要用于存储WEB前端接收的输入信息、故障定位和问题分析等事务状态及任务处理结果,以便用于任务处理和跟踪;任务跟踪模块806实现了任务输入后的全流程跟踪管理,包括任务分发、任务处理、任务结束,并将结果返回给WEB页面前端;通讯模块807用于与WEB页面前端之间的网络连接与数据传输。
请参考图5所示,WEB页面前端与任务调度***008通过通讯模块902连接,提供面向用户的输入及操作界面,同时用于显示处理结果。在本发明一实施例中,所述页面端009包含输入模块901和显示模块903;所述输入模块901用于根据用户输入信息生成任务请求,并将所述任务请求提供至所述任务调度装置;所述显示模块903用于显示所述任务调度装置提供的处理结果。具体的,实际工作中所述页面端009还可包含显示模块903,输入模块901用于接收用户输入,输入项包括环境名、交易代码、开始时间、结束时间等,同时输入模块也包括查询、取消等操作按钮;通讯模块902实现页面端009与任务调度***008的网络连接及数据传输;显示模块903根据任务调度***008返回的结果,在页面前端展示给用户。
请参考图6所示,本发明还提供一种大型主机交易故障定位方法,所述方法包含:
S601IBM主机端采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;
S602根据所述交易数据于各节点的程序调用状态生成链路信息,根据所述交易数据于各节点的交易状态生成故障标识;
S603将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端;
S604平台端接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;
S605根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出。
具体的,在上述实施例中,步骤S601至步骤S603可包含:通过汇编程序采集主机交易和CICS中间件之间的出口程序处运行在CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;根据所述交易数据包获得所述交易数据于各节点的程序调用状态并生成链路信息;根据所述交易数据于各节点的交易状态生成故障标识;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后,通过REXX程序和socket套接字发送到平台端。其中,接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出包含:接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库;接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端;所述页面端将接收到的处理结果展示输出。
在上述实施例中,接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库还包含:监测所述非关系型数据库的运行状态及磁盘的空间状态,当所述运行状态及所述空间状态不符合预设规则时,生成告警信息;根据所述非关系型数据库中数据文件的访问频率或访问日期,将所述非关系型数据库中预定访问频率内或访问周期内的数据文件备份至预定存储器中;根据所述任务调度装置的调取指令,于预定存储器中调取对应的数据文件并加载至所述非关系型数据库。
在本发明一实施例中,接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端可包含:将预设的多种接口程序存储于逻辑处理模块;接收主机交易故障排查处理的任务请求,根据所述任务请求解析获得对应的环境名、交易代码、开始时间及结束时间并提供至所述逻辑处理模块;所述逻辑处理模块根据所述请求类型匹配对应的预设接口程序;所述接口程序根据所述请求指令和对应的环境名、交易代码、开始时间及结束时间,按预设规则处理对应的请求指令,生成处理结果;将所述处理结果通过JSON标准格式传输给页面端。其中,所述预设接口程序可由工作人员根据实际需要提前编写保存,当后续实际需要使用时,可直接调取,采用解析获得的环境名、交易代码、开始时间及结束时间予以分析具体故障情况,而无需采取现有的环境重建,大大降低了故障定位的技术门槛。
本发明解决了大型主机联机交易故障排查过程中对技术人员的技术能力水平要求高、经验要求高、操作步骤多且繁杂、故障定位和分析效率较低的问题,提供了一种简单易用的大型主机交易故障快速定位、自动辅助分析的***及方法;同时,交易故障的业务场景无需重现,任意时间段发生的故障可快速定位并直观展现。本发明的具体优点如下:通过本发明,用户只需在前端网页填写简单的环境名、交易名和时间段等输入项即可以完成主机交易故障快速定位,而无需依赖大型主机中间件技术及主机交易跟踪技术。通过本发明,交易故障的业务场景无需重现,任意时间段发生的故障可快速定位并直观展现。本发明设计的故障辅助分析功能,大幅提高故障分析解决的时效。本发明可开发通用的接口,提供给第三方应用直接调用,满足第三方应用定位分析故障的需求。
再请参考图7所示,结合上述实施例,本发明主机交易数据采集及存储流程可包含如下步骤:
步骤S101,用大机汇编开发一个高效的数据采集模块,部署在主机交易和CICS中间件之间的出口程序处,采集主机交易数据;
步骤S102,数据采集模块对数据进行过滤,并提取和补充相关的有用信息。
步骤S103,将交易数据、链路信息和通讯区信息等输出到主机队列。
步骤S104,用REXX语言开发程序,获取主机队列数据并进行格式处理后,通过socket套接字发送到平台侧;
步骤S105:平台侧的定时任务扫描并接收主机侧发送过来的交易数据后,写入到NoSQL平台数据库;
步骤S106:平台数据库保留最近一段时间的交易数据,过期的交易数据自动迁移到数据文件存放。
再请参考图7及图8所示,主机交易故障定位及分析处理流程具体步骤可包含如下:
步骤S201:任务调度***接收并响应主机交易故障排查处理任务请求,将请求类型提供给任务分发模块处理;
步骤S202:任务分发模块处理接收请求后,判断请求类型,并分发给相应的任务处理接口程序;
步骤S203:接口程序接收请求参数,从非关系型平台数据库NoSQL获取交易数据,进行逻辑加工处理;
步骤S204:接口程序完成逻辑处理后,将处理结果数据通过JSON标准格式传输给WEB页面后台程序;
步骤S205:页面后台程序根据开源Echarts图表插件格式重构数据,然后将数据存放到各变量传输给页面前端;
步骤S206:WEB页面前端接收后台程序的处理结果数据后,调用开源Echarts图表插件,完成交易链路、报错信息、自动分析结果、通讯区等信息的可视化展示。
本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法。
本发明还提供一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述方法的计算机程序。
如图9所示,该电子设备还可以包括:通信模块110、输入单元120、音频处理单元130、显示器160、电源170。值得注意的是,电子设备600也并不是必须要包括图9中所示的所有部件;此外,电子设备600还可以包括图9中没有示出的部件,可以参考现有技术。
如图9所示,中央处理器900有时也称为控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该中央处理器900接收输入并控制电子设备600的各个部件的操作。
其中,存储器140,例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其它合适装置中的一种或更多种。可储存上述与失败有关的信息,此外还可存储执行有关信息的程序。并且中央处理器900可执行该存储器140存储的该程序,以实现信息存储或处理等。
输入单元120向中央处理器900提供输入。该输入单元120例如为按键或触摸输入装置。电源170用于向电子设备600提供电力。显示器160用于进行图像和文字等显示对象的显示。该显示器例如可为LCD显示器,但并不限于此。
该存储器140可以是固态存储器,例如,只读存储器(ROM)、随机存取存储器(RAM)、SIM卡等。还可以是这样的存储器,其即使在断电时也保存信息,可被选择性地擦除且设有更多数据,该存储器的示例有时被称为EPROM等。存储器140还可以是某种其它类型的装置。存储器140包括缓冲存储器141(有时被称为缓冲器)。存储器140可以包括应用/功能存储部142,该应用/功能存储部142用于存储应用程序和功能程序或用于通过中央处理器900执行电子设备600的操作的流程。
存储器140还可以包括数据存储部143,该数据存储部143用于存储数据,例如联系人、数字数据、图片、声音和/或任何其他由电子设备使用的数据。存储器140的驱动程序存储部144可以包括电子设备的用于通信功能和/或用于执行电子设备的其他功能(如消息传送应用、通讯录应用等)的各种驱动程序。
通信模块110即为经由天线111发送和接收信号的发送机/接收机110。通信模块(发送机/接收机)110耦合到中央处理器900,以提供输入信号和接收输出信号,这可以和常规移动通信终端的情况相同。
基于不同的通信技术,在同一电子设备中,可以设置有多个通信模块110,如蜂窝网络模块、蓝牙模块和/或无线局域网模块等。通信模块(发送机/接收机)110还经由音频处理器130耦合到扬声器131和麦克风132,以经由扬声器131提供音频输出,并接收来自麦克风132的音频输入,从而实现通常的电信功能。音频处理器130可以包括任何合适的缓冲器、解码器、放大器等。另外,音频处理器130还耦合到中央处理器900,从而使得可以通过麦克风132能够在本机上录音,且使得可以通过扬声器131来播放本机上存储的声音。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (11)

1.一种大型主机交易故障定位***,其特征在于,所述***包含IBM主机端和平台端;
所述IBM主机端包含数据处理装置;
所述数据处理装置用于采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;根据所述交易数据于各节点的程序调用状态生成链路信息;根据所述交易数据于各节点的交易状态生成故障标识;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端;
所述平台端用于接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;以及根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出;
所述数据处理装置包含采集模块、过滤模块、分析处理模块和主机队列读写模块;
所述采集模块设置于主机交易和CICS中间件之间的出口程序处,通过汇编程序采集在CICS中间件运行的交易数据包;
所述过滤模块用于于所述交易数据包中提取获得包含交易状态的交易数据;
所述分析处理模块用于根据所述交易数据包获得所述交易数据于各节点的程序调用状态并生成链路信息;以及根据所述交易数据于各节点的交易状态生成故障标识;
所述主机队列读写模块用于将所述交易数据、所述故障标识和所述链路信息输入至主机队列后,通过REXX程序和socket套接字发送到平台端。
2.根据权利要求1所述的大型主机交易故障定位***,其特征在于,所述平台端包含存储模块、任务调度装置和页面端;
所述存储模块用于接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库;
所述任务调度装置用于接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端;
所述页面端将接收到的处理结果展示输出。
3.根据权利要求2所述的大型主机交易故障定位***,其特征在于,所述存储模块包含存储监控单元、存储控制单元和非关系型数据库;
所述存储监控单元用于监测所述非关系型数据库的运行状态及磁盘的空间状态,当所述运行状态及所述空间状态不符合预设规则时,生成告警信息;
所述存储控制单元用于根据所述非关系型数据库中数据文件的访问频率或访问日期,将所述非关系型数据库中预定访问频率内或访问周期内的数据文件备份至预定存储器中;以及,根据所述任务调度装置的调取指令,于预定存储器中调取对应的数据文件并加载至所述非关系型数据库;
所述非关系型数据库用于存储所述交易数据、所述故障标识和所述链路信息。
4.根据权利要求2所述的大型主机交易故障定位***,其特征在于,所述任务调度装置包含输入解析模块、任务请求模块、任务分发模块、逻辑处理模块和任务跟踪模块;
所述输入解析模块用于接收主机交易故障排查处理的任务请求,根据所述任务请求解析获得对应的环境名、交易代码、开始时间及结束时间并提供至所述逻辑处理模块;
所述任务请求模块用于响应接收到的请求指令,将请求指令对应的请求类型提供至任务分发模块;
所述任务分发模块用于根据所述请求类型提供对应的接口程序进行处理;
所述逻辑处理模块用于存储预设的多种接口程序,所述接口程序用于根据所述请求指令和对应的环境名、交易代码、开始时间及结束时间,按预设规则处理对应的请求指令,生成处理结果;
所述任务跟踪模块用于将所述处理结果通过JSON标准格式传输给页面端。
5.根据权利要求2所述的大型主机交易故障定位***,其特征在于,所述页面端包含输入模块和显示模块;
所述输入模块用于根据用户输入信息生成任务请求,并将所述任务请求提供至所述任务调度装置;
所述显示模块用于显示所述任务调度装置提供的处理结果。
6.一种大型主机交易故障定位方法,其特征在于,所述方法包含:
IBM主机端采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;
根据所述交易数据于各节点的程序调用状态生成链路信息,根据所述交易数据于各节点的交易状态生成故障标识;
将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端;
平台端接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;
根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出;
IBM主机端采集主机交易和CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;将所述交易数据、所述故障标识和所述链路信息输入至主机队列后发送到平台端包含:
通过汇编程序采集主机交易和CICS中间件之间的出口程序处运行在CICS中间件的交易数据包,于所述交易数据包中提取获得包含交易状态的交易数据;
根据所述交易数据包获得所述交易数据于各节点的程序调用状态并生成链路信息;
根据所述交易数据于各节点的交易状态生成故障标识;
将所述交易数据、所述故障标识和所述链路信息输入至主机队列后,通过REXX程序和socket套接字发送到平台端。
7.根据权利要求6所述的大型主机交易故障定位方法,其特征在于,接收并保存所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息;根据接收到的主机交易故障排查处理的任务请求调取对应的交易数据、故障标识及所述链路信息并展示输出包含:
接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库;
接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;
根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端;
所述页面端将接收到的处理结果展示输出。
8.根据权利要求7所述的大型主机交易故障定位方法,其特征在于,接收所述IBM主机端发送的所述交易数据、所述故障标识和所述链路信息,将所述交易数据、所述故障标识和所述链路信息写入非关系型数据库还包含:
监测所述非关系型数据库的运行状态及磁盘的空间状态,当所述运行状态及所述空间状态不符合预设规则时,生成告警信息;
根据所述非关系型数据库中数据文件的访问频率或访问日期,将所述非关系型数据库中预定访问频率内或访问周期内的数据文件备份至预定存储器中;
根据任务调度装置的调取指令,于预定存储器中调取对应的数据文件并加载至所述非关系型数据库。
9.根据权利要求7所述的大型主机交易故障定位方法,其特征在于,接收用户输入的主机交易故障排查处理的任务请求,根据所述任务请求的类型于所述非关系型数据库调取对应的交易数据、故障标识及链路信息;根据所述交易数据、所述故障标识及所述链路信息分析获得处理结果,将所述处理结果通过JSON标准格式传输给页面端包含:
将预设的多种接口程序存储于逻辑处理模块;
接收主机交易故障排查处理的任务请求,根据所述任务请求解析获得对应的环境名、交易代码、开始时间及结束时间并提供至所述逻辑处理模块;
所述逻辑处理模块根据所述请求类型匹配对应的预设接口程序;
所述接口程序根据所述请求指令和对应的环境名、交易代码、开始时间及结束时间,按预设规则处理对应的请求指令,生成处理结果;
将所述处理结果通过JSON标准格式传输给页面端。
10.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求6至9任一所述方法。
11.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有执行权利要求6至9任一所述方法的计算机程序。
CN202010111536.6A 2020-02-24 2020-02-24 大型主机交易故障定位***及方法 Active CN111324480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010111536.6A CN111324480B (zh) 2020-02-24 2020-02-24 大型主机交易故障定位***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010111536.6A CN111324480B (zh) 2020-02-24 2020-02-24 大型主机交易故障定位***及方法

Publications (2)

Publication Number Publication Date
CN111324480A CN111324480A (zh) 2020-06-23
CN111324480B true CN111324480B (zh) 2023-07-25

Family

ID=71165208

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010111536.6A Active CN111324480B (zh) 2020-02-24 2020-02-24 大型主机交易故障定位***及方法

Country Status (1)

Country Link
CN (1) CN111324480B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112035550A (zh) * 2020-09-01 2020-12-04 中国银行股份有限公司 一种故障定位方法及装置
CN112181697A (zh) * 2020-09-21 2021-01-05 厦门南讯股份有限公司 一种快速分析问题的方法及***
CN112784133B (zh) * 2021-01-22 2024-05-17 中信银行股份有限公司 链路可视化方法、装置、设备及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6140691A (ja) * 1984-07-31 1986-02-26 オムロン株式会社 取引処理装置における異常処理方法
WO2005101214A1 (en) * 2004-04-19 2005-10-27 Oneempower Pte Ltd Transaction system
CN104572351A (zh) * 2014-12-23 2015-04-29 中国工商银行股份有限公司 基于主机***的数据恢复***及方法
CN106681909A (zh) * 2016-12-02 2017-05-17 中国工商银行股份有限公司 一种联机交易故障定位方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6140691A (ja) * 1984-07-31 1986-02-26 オムロン株式会社 取引処理装置における異常処理方法
WO2005101214A1 (en) * 2004-04-19 2005-10-27 Oneempower Pte Ltd Transaction system
CN104572351A (zh) * 2014-12-23 2015-04-29 中国工商银行股份有限公司 基于主机***的数据恢复***及方法
CN106681909A (zh) * 2016-12-02 2017-05-17 中国工商银行股份有限公司 一种联机交易故障定位方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陆坤.大型主机***性能可视化监控与管理平台.实验室科学.2017,第第20卷卷(第第20卷期),第2.1、2.2、3.2节. *

Also Published As

Publication number Publication date
CN111324480A (zh) 2020-06-23

Similar Documents

Publication Publication Date Title
CN111324480B (zh) 大型主机交易故障定位***及方法
CN100412802C (zh) 有计划的计算机问题诊断和解决及其自动报告和更新
WO2020088326A1 (zh) 接口运维的方法及装置
CN102831052B (zh) 测试用例自动化生成装置及方法
CN108076098A (zh) 一种业务处理方法及***
US20150169288A1 (en) System operation tracing method on distributed system
CN111061696B (zh) 一种交易报文日志的解析方法及装置
CN111625535B (zh) 一种实现业务数据关联的方法、装置和存储介质
CN113242159B (zh) 应用访问关系确定方法及装置
CN106815089A (zh) 基于日志的故障排查方法及装置
CN116204438A (zh) 测试用例生成方法、自动化测试方法和相关装置
CN113760611B (zh) ***站点切换方法、装置、电子设备及存储介质
CN109753530B (zh) 一种数据处理方法及其装置、介质、终端
CN111078506A (zh) 业务数据跑批任务监控方法及装置
CN117291517A (zh) 审批流程的构建方法及装置
CN112785201B (zh) 异构***准实时高可靠交互***及方法
CN111859041B (zh) 数据报送方法及装置
CN114490402A (zh) 一种报文字段合法性检查方法及装置
CN112948195A (zh) 接口测试的方法、装置、电子设备和存储介质
CN112101810A (zh) 风险事件控制方法、装置及***
CN112965873A (zh) 页面处理方法、装置、存储介质及处理器
CN112116467B (zh) 一种异构柜台并行运行方法和***
CN113110995B (zh) ***迁移的测试方法及装置
CN115277887A (zh) 一种报文内容发送处理方法及装置
CN115840699A (zh) 一种实现多银行电子票据业务仿真的方法和工具

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant