CN107992415B - 一种交易***的故障定位和分析方法及相关服务器 - Google Patents

一种交易***的故障定位和分析方法及相关服务器 Download PDF

Info

Publication number
CN107992415B
CN107992415B CN201711217381.9A CN201711217381A CN107992415B CN 107992415 B CN107992415 B CN 107992415B CN 201711217381 A CN201711217381 A CN 201711217381A CN 107992415 B CN107992415 B CN 107992415B
Authority
CN
China
Prior art keywords
transaction
application server
process data
processing
failed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711217381.9A
Other languages
English (en)
Other versions
CN107992415A (zh
Inventor
邱鹏
杨燕明
杨宏斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Unionpay Co Ltd
Original Assignee
China Unionpay Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Unionpay Co Ltd filed Critical China Unionpay Co Ltd
Priority to CN201711217381.9A priority Critical patent/CN107992415B/zh
Publication of CN107992415A publication Critical patent/CN107992415A/zh
Application granted granted Critical
Publication of CN107992415B publication Critical patent/CN107992415B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/362Software debugging
    • G06F11/3636Software debugging by tracing the execution of the program
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • Technology Law (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • General Engineering & Computer Science (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明实施例提供一种交易***的故障定位和分析方法及相关服务器,故障定位服务器获取失败交易的标识,根据失败交易的标识确定失败交易的交易链,交易链是根据处理交易的过程数据确定的,过程数据至少包括应用服务器标识、交易的标识、处理时间。然后根据失败交易的交易链确定失败交易的故障应用服务器。由于应用服务器在处理交易时采集处理交易的过程数据并将过程数据发送至故障定位服务器。故障定位服务器根据处理交易的过程数据确定交易的交易链,故在出现交易失败时,可根据失败交易的标识确定失败交易的交易链,进一步根据交易链确定故障应用服务器,而不需要登录每个主机上查询日志确定故障主机,从而提高了失败交易分析的效率。

Description

一种交易***的故障定位和分析方法及相关服务器
技术领域
本发明实施例涉及***性能监控领域,尤其涉及一种交易***的故障定位和分析方法及相关服务器。
背景技术
现有的交易***为分布式***,分布式***中的主机有几百上千台,当交易***在处理交易时,若出现一笔交易出现故障,很难确认是哪个***或哪个主机引发的交易失败。为了跟踪一笔交易失败的原因,现有技术中采用登录所有可能的主机上分析日志的方法,有时甚至需要登录不同分布式***的主机分析日志,确定发生故障的位置,从而导致失败交易分析的效率非常低下。
发明内容
本发明实施例提供一种交易***的故障定位和分析方法及相关服务器,用于解决现有技术中通过登录所有主机确定交易失败位置的方法效率低的问题。
本发明实施例提供了一种交易***的故障定位和分析方法,包括:
故障定位服务器获取失败交易的标识;
所述故障定位服务器根据所述失败交易的标识确定所述失败交易的交易链,所述交易链是根据处理交易的过程数据确定的,所述过程数据至少包括应用服务器标识、交易的标识、处理时间;
所述故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器。
可选地,所述故障定位服务器根据所述失败交易的标识确定所述失败交易的交易链,包括:
所述故障定位服务器根据所述失败交易的标识从存储区中索引出处理所述失败交易的过程数据,所述存储区中保存了各应用服务器发送的处理交易的过程数据;
所述故障定位服务器将所述失败交易的过程数据中的应用服务器标识按照处理时间进行排序后,确定所述失败交易的交易链;
所述故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器,包括:
所述故障定位服务器将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
可选地,所述故障定位服务器根据所述失败交易的标识确定所述失败交易的交易链,包括:
所述故障定位服务器根据所述失败交易的标识从存储区中索引出所述失败交易的交易链,所述存储区中保存了各应用服务器处理的交易对应的交易链,所述交易链为按照处理时间排序的应用服务器标识;
所述故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器,包括:
所述故障定位服务器将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
可选地,所述过程数据还包括业务模块标识,所述交易链为按照处理时间排序的业务模块标识;
所述故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器,包括:
所述故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器和故障业务模块。
可选地,还包括:
所述过程数据还包括处理结果;
针对任意一个应用服务器,所述故障定位服务器根据所述应用服务器的应用服务器标识确定所述应用服务器在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述应用服务器的处理速度和处理成功率;
针对任意一个业务模块,所述故障定位服务器根据所述业务模块的业务模块标识确定所述业务模块在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述务模块的处理速度和处理成功率。
本发明实施例还提供了一种交易***的故障定位和分析方法,包括:
应用服务器获取携带标识的交易,所述交易的标识是由交易***的入口服务器根据所述交易的交易报文确定的;
所述应用服务器对所述交易进行处理并采集处理所述交易的过程数据,所述过程数据至少包括应用服务器标识、交易的标识及处理时间;
所述应用服务器将采集的过程数据发送至故障定位服务器。
可选地,所述过程数据还包括业务模块标识和处理结果;
所述应用服务器对所述交易进行处理并采集处理所述交易的过程数据,包括:
所述应用服务器通过各个业务模块对所述交易进行处理;
针对任意一个业务模块,所述应用服务器采集所述业务模块处理所述交易的过程数据;
所述应用服务器将采集的过程数据发送至故障定位服务器,包括:
所述应用服务器将采集的各个业务模块处理所述交易的过程数据发送至故障定位服务器。
相应地,本发明实施例提供了一种故障定位服务器,包括:
第一获取模块,用于获取失败交易的标识;
第一处理模块,用于根据所述失败交易的标识确定所述失败交易的交易链,所述交易链是根据处理交易的过程数据确定的,所述过程数据至少包括应用服务器标识、交易的标识、处理时间;根据所述失败交易的交易链确定所述失败交易的故障应用服务器。
可选地,所述第一处理模块具体用于:
根据所述失败交易的标识从存储区中索引出处理所述失败交易的过程数据,所述存储区中保存了各应用服务器发送的处理交易的过程数据;
将所述失败交易的过程数据中的应用服务器标识按照处理时间进行排序后,确定所述失败交易的交易链;
所述第一处理模块具体用于:
将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
可选地,所述第一处理模块具体用于:
根据所述失败交易的标识从存储区中索引出所述失败交易的交易链,所述存储区中保存了各应用服务器处理的交易对应的交易链,所述交易链为按照处理时间排序的应用服务器标识;
所述第一处理模块具体用于:
将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
可选地,所述过程数据还包括业务模块标识,所述交易链为按照处理时间排序的业务模块标识;
所述第一处理模块具体用于:
根据所述失败交易的交易链确定所述失败交易的故障应用服务器和故障业务模块。
可选地,所述第一处理模块还用于:
所述过程数据还包括处理结果;
针对任意一个应用服务器,根据所述应用服务器的应用服务器标识确定所述应用服务器在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述应用服务器的处理速度和处理成功率;
针对任意一个业务模块,根据所述业务模块的业务模块标识确定所述业务模块在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述务模块的处理速度和处理成功率。
本发明实施例还提供了一种应用服务器,包括:
第二获取模块,用于获取携带标识的交易,所述交易的标识是由交易***的入口服务器根据所述交易的交易报文确定的;
第二处理模块,用于对所述交易进行处理并采集处理所述交易的过程数据,所述过程数据至少包括应用服务器标识、交易的标识及处理时间;将采集的过程数据发送至故障定位服务器。
可选地,所述过程数据还包括业务模块标识和处理结果;
所述第二处理模块具体用于:
通过各个业务模块对所述交易进行处理;针对任意一个业务模块,采集所述业务模块处理所述交易的过程数据;
所述第二处理模块具体用于:
将采集的各个业务模块处理所述交易的过程数据发送至故障定位服务器。
本发明实施例提供了一种计算设备,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行上述任一项所述的方法。
本发明实施例提供了一种计算机存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行上述任一项所述的方法。
本发明实施例表明,故障定位服务器获取失败交易的标识;根据所述失败交易的标识确定所述失败交易的交易链,所述交易链是根据处理交易的过程数据确定的,所述过程数据至少包括应用服务器标识、交易的标识、处理时间;故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器。由于应用服务器在处理交易时采集处理交易的过程数据,并将过程数据发送至故障定位服务器,过程数据至少包括应用服务器标识、交易的标识、处理时间。故障定位服务器根据处理交易的过程数据确定交易的交易链,故在出现交易失败时,故障定位服务器可根据失败交易的标识确定失败交易的交易链,进一步根据失败交易的交易链确定故障应用服务器,而不需要登录每个主机上查询日志确定故障主机,从而提高了失败交易分析的效率。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例适用的一种***架构示意图;
图2为本发明实施例提供的一种交易***的故障定位和分析方法的流程示意图;
图3为本发明实施例提供的一种应用服务器采集过程数据的方法的流程示意图;
图4为本发明实施例提供的一种故障定位服务器的结构示意图;
图5为本发明实施例提供的一种应用服务器的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及有益效果更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
图1示例性示出了本发明实施例适用的一种***架构示意图,如图1所示,本发明实施例适用的***架构包括故障定位服务器101和应用服务器102。故障定位服务器101和应用服务器102通过有线或无线的方式连接。具体实施中与故障定位服务器101连接的应用服务器为一个或多个。与故障定位服务器101连接的多个应用服务器可以属于一个分布式***,也可以属于不同的分布式***。每一个应用服务器中包括一个或多个业务模块。
基于图1所示的***架构,如图2所示,本发明实施例提供了一种交易***的故障定位和分析方法,包括以下步骤:
步骤S201,故障定位服务器获取失败交易的标识。
步骤S202,故障定位服务器根据失败交易的标识确定失败交易的交易链,交易链是根据处理交易的过程数据确定的。
步骤S203,故障定位服务器根据失败交易的交易链确定失败交易的故障应用服务器。
具体地,在步骤S201中,故障定位服务器可通过接收运维人员输入的指令获取失败交易的标识。
在步骤S202中,过程数据是由应用服务器在处理交易时采集并发送至故障定位服务器,过程数据至少包括应用服务器标识、交易的标识、处理时间。故障定位服务器根据失败交易的标识确定失败交易的交易链的方法至少包括以下两种:
方法一、故障定位服务器根据失败交易的标识从存储区中索引出处理失败交易的过程数据,存储区中保存了各应用服务器发送的处理交易的过程数据。然后将失败交易的过程数据中的应用服务器标识按照处理时间进行排序后,确定失败交易的交易链。具体的排序方法可以处理时间越早越靠前,也可以是处理时间越晚越靠前。
方法二、故障定位服务器接收应用服务器发送的处理交易的过程数据之后,针对任意一条交易,根据该交易的交易标识从存储区中索引出处理该交易的过程数据,存储区中保存了各应用服务器发送的处理交易的过程数据。然后将该交易的过程数据中的应用服务器标识按照处理时间进行排序后,确定该交易的交易链。将确定出的所有交易的交易链与交易的标识对应保存在存储区中。故障定位服务器在获取失败交易的标识之后,根据失败交易的标识从存储区中索引出失败交易的交易链。
在步骤S203中,故障定位服务器可以将失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为失败交易的故障应用服务器。由于故障定位服务器根据处理交易的过程数据确定交易的交易链,故在出现交易失败时,故障定位服务器可根据失败交易的标识快速确定失败交易的交易链,进一步根据交易链确定故障应用服务器,而不需要登录每个主机上查询日志确定故障主机,从而提高了失败交易分析的效率。
进一步地,过程数据还包括业务模块标识,故交易链也可以为按照处理时间排序的业务模块标识。故障定位服务器根据失败交易的交易链可同时确定故障应用服务器和故障业务模块,具体包括以下两种方法:
方法一、故障定位服务器根据失败交易的标识从存储区中索引出处理失败交易的过程数据,存储区中保存了各应用服务器发送的处理交易的过程数据。然后将失败交易的过程数据中的业务模块标识按照处理时间进行排序后,确定失败交易的交易链。然后将失败交易的交易链中处理时间最晚的业务模块标识对应的业务模块确定为失败交易的故障业务模块,将故障业务模块所属的应用服务器确定为故障应用服务器。
方法二、故障定位服务器接收应用服务器发送的处理交易的过程数据之后,针对任意一条交易,根据该交易的标识从存储区中索引出处理该交易的过程数据,存储区中保存了各应用服务器发送的处理交易的过程数据。然后将该交易的过程数据中的业务模块标识按照处理时间进行排序后,确定该交易的交易链。将确定出的所有交易的交易链与交易的标识对应保存在存储区中。故障定位服务器在获取失败交易的标识之后,根据失败交易的标识从存储区中索引出失败交易的交易链。然后将失败交易的交易链中处理时间最晚的业务模块标识对应的业务模块确定为失败交易的故障业务模块,将故障业务模块所属的应用服务器确定为故障应用服务器。
由于故障定位服务器根据过程数据中包含的业务模块标识排序后确定交易链,故在出现交易失败时,根据失败交易的标识确定的交易链,不仅可以用于确定处理该失败交易的故障应用服务器,还可以确定故障业务模块,从而能更精确地确定交易失败的位置,进一步提高失败交易的处理效率。
可选地,过程数据还包括处理结果。故障定位服务器根据处理交易的过程数据可进一步评估各个应用服务器和业务模块的性能,下面分别针对应用服务器和业务模块进行介绍。
针对任意一个应用服务器,故障定位服务器根据应用服务器的应用服务器标识确定应用服务器在预设周期内处理交易的过程数据。故障定位服务器根据应用服务器处理交易的过程数据中的处理时间确定应用服务器在预设周期内的处理速度。故障定位服务器根据应用服务器处理交易的过程数据中的处理结果确定应用服务器在预设周期内的处理成功率。故障定位服务器将应用服务器在预设周期内的处理速度和处理成功率进行展示。故障定位服务器在确定应用服务器在预设周期内的处理速度小于第一预设阈值或者应用服务器在预设周期内的处理交易的成功率小于第二阈值时,启动告警并以预设的提醒方式提醒运维人员。需要说明的是,在评估应用服务器的性能时,若采样率不是设置为100%,即交易***的入口服务器只为接收的部分交易生成该交易对应的标识,则需同时采集并统计携带标识的交易和没携带标识的交易的过程数据用于评估应用服务器的性能。
针对任意一个业务模块,故障定位服务器根据业务模块的业务模块标识确定业务模块在预设周期内处理交易的过程数据。故障定位服务器根据业务模块处理交易的过程数据中的处理时间确定业务模块在预设周期内的处理速度。故障定位服务器根据业务模块处理交易的过程数据中的处理结果确定业务模块在预设周期内的处理成功率。故障定位服务器将业务模块在预设周期内的处理速度和处理成功率进行展示。故障定位服务器在确定业务模块在预设周期内的处理速度小于第三预设阈值或者业务模块在预设周期内的处理交易的成功率小于第四阈值时,启动告警并以预设的提醒方式提醒运维人员。需要说明的是,在评估业务模块的性能时,若采样率不是设置为100%,即交易***的入口服务器只为接收的部分交易生成该交易对应的标识,则需同时采集并统计携带标识的交易和没携带标识的交易的过程数据用于评估应用业务模块的性能。故障定位服务器根据获取的过程数据实时监控各个应用服务器和业务模块的运行状态,故在应用服务器或业务模块的运行状态异常而导致整个***运行效率降低时,能够快速定位出异常的应用服务器或业务模块,从而提高***的运维效率。
可选地,具体实施中,过程数据是由应用服务器在处理交易时采集并发送至故障定位服务器,下面具体介绍应用服务器采集过程数据的方法,具体过程如图3所示,包括以下步骤:
步骤S301,应用服务器获取携带标识的交易,交易的标识是由交易***的入口服务器根据交易的交易报文确定的。
步骤S302,应用服务器对交易进行处理并采集处理交易的过程数据,过程数据至少包括应用服务器标识、交易的标识、处理时间及处理结果。
步骤S303,应用服务器将采集的过程数据发送至故障定位服务器。
具体地,在步骤S301中,交易***的入口服务器根据交易的交易报文生成该交易的标识,每一条交易的标识与其他交易的标识均不同,且交易的标识将跟随交易报文经过各个应用服务器以及各个应用服务器的业务模块。在具体实施中,交易***的入口服务器可以为每一条交易生成对应的标识,比如在交易***上线不久,由于此时正是问题出现概率比较大的时期,故可以将采样率配置为100%,即交易***的入口服务器为接收的每一条交易生成该交易对应的标识。交易***的入口服务器也可以为接收的交易中的部分交易生成对应的标识,比如交易当***稳定运行后,考虑对每条交易进行处理并生成对应的交易量对应用服务器和故障定位服务器的性能有影响,可以考虑调低采样率,即交易***的入口服务器为接收的部分交易生成该交易对应的标识。
在步骤S302和步骤S303中,过程数据中的处理时间包括开始处理时间和结束处理时间。应用服务器采集过程数据之前,在应用服务器的入口和出口设置采集点。应用服务器对交易处理的过程中,预先设置的采集点将采集应用服务器开始处理交易的时间、应用服务器结束处理的时间以及处理结果,若处理的交易携带了的标识,则应用服务器同时采集该交易的标识。应用服务器将采集的数据以及应用服务器标识作为过程数据发送至故障定位服务器。
进一步地,过程数据还包括业务模块标识,应用服务器还可采集应用服务器中各个业务模块处理交易的过程数据。具体为:在各个业务模块的入口和出口设置采集点,业务模块在处理交易的过程中,采集处理该交易的开始处理时间、结束处理时间、处理结果,若该交易携带了的标识,则应用服务器同时采集该交易的标识。然后将采集的数据以及业务模块标识和业务模块所属应用服务器的标识作为过程数据发送至故障定位服务器。另外,也可以在一个业务模块中设置多个采样点,采集一个业务模块中各个操作的过程数据,比如一个业务模块中可能会进行数据库操作、加密操作以及网络操作,则可以分别设置上述三个操作的采样点,采集该业务模块在处理交易时数据库操作的过程数据、加密操作的过程数据以及网络操作的过程数据。由于为交易添加了唯一标识,然后根据预先设置的采样点采集应用服务器以及应用服务器中各业务模块处理该交易的过程数据,然后将过程数据发送至故障定位服务器。故在发生交易失败时,故障定位服务器根据交易的唯一标识能索引出处理失败交易的过程数据,进一步能确定失败交易的故障位置,从而方便了运维人员对失败交易进行定位和处理。
为了更好的解释本发明实施例,下面通过具体的实施场景描述本发明实施例提供的一种交易***的故障定位和分析方法的流程。设定入口服务器I接收一条交易后为该交易添加标识M,交易***中的应用服务器A、应用服务器B先后对该交易进行了处理,其中应用服务器A中业务模块a1对该交易进行了处理,应用服务器B中业务模块b1和业务模块b2对该交易进行了处理。应用服务器A中业务模块a1对交易M进行处理时采集的过程数据为:交易M、服务器A、业务模块a1、处理时间为8:00-8:01、处理结果为成功。应用服务器B中业务模块b1对交易M进行处理时采集的过程数据为:交易M、服务器B、业务模块b1、处理时间为8:01-8:02、处理结果为成功。应用服务器B中业务模块b2对交易M进行处理时采集的过程数据为:交易M、服务器B、业务模块b2、处理时间为8:02-8:03、处理结果为失败。应用服务器A、应用服务器B分别将采集的过程数据发送至故障定位服务器。故障定位服务器在接收应用服务器发送的过程数据之后,获取交易M对应的过程数据,然后根据过程数据中的处理时间先后对业务模块标识进行排序后确定的交易M的交易链为:入口服务器I—业务模块a1—业务模块b1—业务模块b2。故障定位服务器将交易M的交易链保存至存储区。当运维人员获知交易M交易失败时,根据交易标识M从故障定位服务器的存储区中检索出交易链:入口服务器I—业务模块a1—业务模块b1—业务模块b2。根据查询的结构可知,交易M的交易链中最后一个模块并不是出口服务器,则可确定业务模块b2为交易M的故障业务模块。由于业务模块b2属于应用服务器B,则可进一步将应用服务器B确定为故障应用服务器。
本发明实施例表明,故障定位服务器获取失败交易的标识;根据所述失败交易的标识确定所述失败交易的交易链,所述交易链是根据处理交易的过程数据确定的,所述过程数据至少包括应用服务器标识、交易的标识、处理时间;故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器。由于应用服务器在处理交易时采集处理交易的过程数据,并将过程数据发送至故障定位服务器,过程数据至少包括应用服务器标识、交易的标识、处理时间。故障定位服务器根据处理交易的过程数据确定交易的交易链,故在出现交易失败时,故障定位服务器可根据失败交易的标识确定失败交易的交易链,进一步根据失败交易的交易链确定故障应用服务器,而不需要登录每个主机上查询日志确定故障主机,从而提高了失败交易分析的效率。
基于相同的技术构思,本发明实施例还提供了一种故障定位服务器,如图4所示,包括:
第一获取模块401,用于获取失败交易的标识;
第一处理模块402,用于根据所述失败交易的标识确定所述失败交易的交易链,所述交易链是根据处理交易的过程数据确定的,所述过程数据至少包括应用服务器标识、交易的标识、处理时间;根据所述失败交易的交易链确定所述失败交易的故障应用服务器。
可选地,所述第一处理模块402具体用于:
根据所述失败交易的标识从存储区中索引出处理所述失败交易的过程数据,所述存储区中保存了各应用服务器发送的处理交易的过程数据;
将所述失败交易的过程数据中的应用服务器标识按照处理时间进行排序后,确定所述失败交易的交易链;
所述第一处理模块402具体用于:
将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
可选地,所述第一处理模块402具体用于:
根据所述失败交易的标识从存储区中索引出所述失败交易的交易链,所述存储区中保存了各应用服务器处理的交易对应的交易链,所述交易链为按照处理时间排序的应用服务器标识;
所述第一处理模块402具体用于:
将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
可选地,所述过程数据还包括业务模块标识,所述交易链为按照处理时间排序的业务模块标识;
所述第一处理模块402具体用于:
根据所述失败交易的交易链确定所述失败交易的故障应用服务器和故障业务模块。
可选地,所述第一处理模块402还用于:
所述过程数据还包括处理结果;
针对任意一个应用服务器,根据所述应用服务器的应用服务器标识确定所述应用服务器在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述应用服务器的处理速度和处理成功率;
针对任意一个业务模块,根据所述业务模块的业务模块标识确定所述业务模块在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述务模块的处理速度和处理成功率。
基于相同的技术构思,本发明实施例还提供了一种应用服务器,如图5所示,包括:
第二获取模块501,用于获取携带标识的交易,所述交易的标识是由交易***的入口服务器根据所述交易的交易报文确定的;
第二处理模块502,用于对所述交易进行处理并采集处理所述交易的过程数据,所述过程数据至少包括应用服务器标识、交易的标识及处理时间;将采集的过程数据发送至故障定位服务器。
可选地,所述过程数据还包括业务模块标识和处理结果;
所述第二处理模块502具体用于:
通过各个业务模块对所述交易进行处理;针对任意一个业务模块,采集所述业务模块处理所述交易的过程数据;
所述第二处理模块502具体用于:
将采集的各个业务模块处理所述交易的过程数据发送至故障定位服务器。
本发明实施例提供了一种计算设备,该计算设备具体可以为桌面计算机、便携式计算机、智能手机、平板电脑、个人数字助理(Personal Digital Assistant,PDA)等。该计算设备可以包括中央处理器(Center Processing Unit,CPU)、存储器、输入/输出设备等,输入设备可以包括键盘、鼠标、触摸屏等,输出设备可以包括显示设备,如液晶显示器(Liquid Crystal Display,LCD)、阴极射线管(Cathode Ray Tube,CRT)等。
存储器,可以包括只读存储器(ROM)和随机存取存储器(RAM),并向处理器提供存储器中存储的程序指令和数据。在本发明实施例中,存储器可以用于存储交易***的故障定位和分析方法的程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行交易***的故障定位和分析方法。
本发明实施例提供了一种计算机存储介质,所述计算机可读存储介质存储有计算机可执行指令,所述计算机可执行指令用于使所述交易***的故障定位和分析方法。
本领域内的技术人员应明白,本发明的实施例可提供为方法、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (16)

1.一种交易***的故障定位和分析方法,其特征在于,包括:
故障定位服务器获取失败交易的标识;
所述故障定位服务器根据所述失败交易的标识确定所述失败交易的交易链,所述交易链是将处理交易的过程数据中的应用服务器标识按照处理时间进行排序获得的;
所述故障定位服务器将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
2.如权利要求1所述的方法,其特征在于,所述故障定位服务器根据所述失败交易的标识确定所述失败交易的交易链,包括:
所述故障定位服务器根据所述失败交易的标识从存储区中索引出处理所述失败交易的过程数据,所述存储区中保存了各应用服务器发送的处理交易的过程数据;
所述故障定位服务器将所述失败交易的过程数据中的应用服务器标识按照处理时间进行排序后,确定所述失败交易的交易链。
3.如权利要求1所述的方法,其特征在于,所述故障定位服务器根据所述失败交易的标识确定所述失败交易的交易链,包括:
所述故障定位服务器根据所述失败交易的标识从存储区中索引出所述失败交易的交易链,所述存储区中保存了各应用服务器处理的交易对应的交易链,所述交易链为按照处理时间排序的应用服务器标识。
4.如权利要求1所述的方法,其特征在于,所述过程数据还包括业务模块标识,所述交易链为按照处理时间排序的业务模块标识;
所述故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器,包括:
所述故障定位服务器根据所述失败交易的交易链确定所述失败交易的故障应用服务器和故障业务模块。
5.如权利要求4所述的方法,其特征在于,还包括:
所述过程数据还包括处理结果;
针对任意一个应用服务器,所述故障定位服务器根据所述应用服务器的应用服务器标识确定所述应用服务器在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述应用服务器的处理速度和处理成功率;
针对任意一个业务模块,所述故障定位服务器根据所述业务模块的业务模块标识确定所述业务模块在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述业务模块的处理速度和处理成功率。
6.一种交易***的故障定位和分析方法,其特征在于,包括:
应用服务器获取携带标识的交易,所述交易的标识是由交易***的入口服务器根据所述交易的交易报文确定的;
所述应用服务器对所述交易进行处理并采集处理所述交易的过程数据;
所述应用服务器将采集的过程数据发送至故障定位服务器,以使所述故障定位服务器在获取失败交易的标识时,根据所述失败交易的标识确定所述失败交易的交易链,将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器,所述交易链是将处理交易的过程数据中的应用服务器标识按照处理时间进行排序获得的。
7.如权利要求6所述的方法,其特征在于,所述过程数据还包括业务模块标识和处理结果;
所述应用服务器对所述交易进行处理并采集处理所述交易的过程数据,包括:
所述应用服务器通过各个业务模块对所述交易进行处理;
针对任意一个业务模块,所述应用服务器采集所述业务模块处理所述交易的过程数据;
所述应用服务器将采集的过程数据发送至故障定位服务器,包括:
所述应用服务器将采集的各个业务模块处理所述交易的过程数据发送至故障定位服务器。
8.一种故障定位服务器,其特征在于,包括:
第一获取模块,用于获取失败交易的标识;
第一处理模块,用于根据所述失败交易的标识确定所述失败交易的交易链,所述交易链是将处理交易的过程数据中的应用服务器标识按照处理时间进行排序获得的;将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器。
9.如权利要求8所述的故障定位服务器,其特征在于,所述第一处理模块具体用于:
根据所述失败交易的标识从存储区中索引出处理所述失败交易的过程数据,所述存储区中保存了各应用服务器发送的处理交易的过程数据;
将所述失败交易的过程数据中的应用服务器标识按照处理时间进行排序后,确定所述失败交易的交易链。
10.如权利要求8所述的故障定位服务器,其特征在于,所述第一处理模块具体用于:
根据所述失败交易的标识从存储区中索引出所述失败交易的交易链,所述存储区中保存了各应用服务器处理的交易对应的交易链,所述交易链为按照处理时间排序的应用服务器标识。
11.如权利要求8所述的故障定位服务器,其特征在于,
所述过程数据还包括业务模块标识,所述交易链为按照处理时间排序的业务模块标识;
所述第一处理模块具体用于:
根据所述失败交易的交易链确定所述失败交易的故障应用服务器和故障业务模块。
12.如权利要求11所述的故障定位服务器,其特征在于,所述第一处理模块还用于:
所述过程数据还包括处理结果;
针对任意一个应用服务器,根据所述应用服务器的应用服务器标识确定所述应用服务器在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述应用服务器的处理速度和处理成功率;
针对任意一个业务模块,根据所述业务模块的业务模块标识确定所述业务模块在预设周期内处理交易的过程数据;根据所述预设周期内处理交易的过程数据,确定所述业务模块的处理速度和处理成功率。
13.一种应用服务器,其特征在于,包括:
第二获取模块,用于获取携带标识的交易,所述交易的标识是由交易***的入口服务器根据所述交易的交易报文确定的;
第二处理模块,用于对所述交易进行处理并采集处理所述交易的过程数据;将采集的过程数据发送至故障定位服务器,以使所述故障定位服务器在获取失败交易的标识时,根据所述失败交易的标识确定所述失败交易的交易链,将所述失败交易的交易链中处理时间最晚的应用服务器标识对应的应用服务器确定为所述失败交易的故障应用服务器,所述交易链是将处理交易的过程数据中的应用服务器标识按照处理时间进行排序获得的。
14.如权利要求13所述的应用服务器,其特征在于,所述过程数据还包括业务模块标识和处理结果;
所述第二处理模块具体用于:
通过各个业务模块对所述交易进行处理;针对任意一个业务模块,采集所述业务模块处理所述交易的过程数据;
所述第二处理模块具体用于:
将采集的各个业务模块处理所述交易的过程数据发送至故障定位服务器。
15.一种计算设备,其特征在于,包括:
存储器,用于存储程序指令;
处理器,用于调用所述存储器中存储的程序指令,按照获得的程序执行如权利要求1至5任一项所述的方法或权利要求6至7任一项所述的方法。
16.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于使计算机执行如权利要求1至5任一项所述的方法或权利要求6至7任一项所述的方法。
CN201711217381.9A 2017-11-28 2017-11-28 一种交易***的故障定位和分析方法及相关服务器 Active CN107992415B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711217381.9A CN107992415B (zh) 2017-11-28 2017-11-28 一种交易***的故障定位和分析方法及相关服务器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711217381.9A CN107992415B (zh) 2017-11-28 2017-11-28 一种交易***的故障定位和分析方法及相关服务器

Publications (2)

Publication Number Publication Date
CN107992415A CN107992415A (zh) 2018-05-04
CN107992415B true CN107992415B (zh) 2021-04-16

Family

ID=62033968

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711217381.9A Active CN107992415B (zh) 2017-11-28 2017-11-28 一种交易***的故障定位和分析方法及相关服务器

Country Status (1)

Country Link
CN (1) CN107992415B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108683562B (zh) * 2018-05-18 2022-05-17 深圳壹账通智能科技有限公司 异常检测定位方法、装置、计算机设备及存储介质
CN109995585B (zh) * 2019-03-22 2021-12-31 杭州复杂美科技有限公司 一种异常处理方法、设备和存储介质
CN110223173A (zh) * 2019-05-20 2019-09-10 深圳壹账通智能科技有限公司 交易链路异常处理方法以及相关设备
CN111192130B (zh) * 2019-12-11 2023-11-17 中国建设银行股份有限公司 交易监控中确定故障根源的方法、***、装置及存储介质
CN111488289B (zh) * 2020-04-26 2024-01-23 支付宝实验室(新加坡)有限公司 一种故障定位方法、装置和设备
CN111563002B (zh) * 2020-05-15 2023-07-25 中国工商银行股份有限公司 交易故障的处理方法和装置、以及电子设备和存储介质
CN112035550A (zh) * 2020-09-01 2020-12-04 中国银行股份有限公司 一种故障定位方法及装置
CN113282465A (zh) * 2021-06-17 2021-08-20 中国建设银行股份有限公司 一种故障定位方法、装置、电子设备及计算机存储介质
CN114170741B (zh) * 2021-12-03 2023-11-24 建信金融科技有限责任公司 交易效率监控方法、atm前置***和自助业务控管***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102833093A (zh) * 2012-07-04 2012-12-19 国家计算机网络与信息安全管理中心 网络故障处理方法、装置及***
CN107018042A (zh) * 2017-04-13 2017-08-04 广东神马搜索科技有限公司 用于在线服务***的追踪方法及追踪***

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6212947B2 (ja) * 2013-05-16 2017-10-18 富士通株式会社 情報処理装置、制御装置及び制御プログラム
CN105095052B (zh) * 2014-05-22 2018-08-31 阿里巴巴集团控股有限公司 Soa环境下的故障检测方法及装置
US10778748B2 (en) * 2015-06-05 2020-09-15 Apple Inc. Rapid reconfiguration of device location system
CN105978723A (zh) * 2016-05-11 2016-09-28 广州唯品会信息科技有限公司 网络信息管理方法及装置
CN106681909A (zh) * 2016-12-02 2017-05-17 中国工商银行股份有限公司 一种联机交易故障定位方法及装置
CN107181633A (zh) * 2017-07-27 2017-09-19 郑州云海信息技术有限公司 一种远程获取业务日志的方法及***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102833093A (zh) * 2012-07-04 2012-12-19 国家计算机网络与信息安全管理中心 网络故障处理方法、装置及***
CN107018042A (zh) * 2017-04-13 2017-08-04 广东神马搜索科技有限公司 用于在线服务***的追踪方法及追踪***

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种分布式并行服务器节点故障检测算法;左朝树等;《电子科技大学学报》;20070228;第36卷(第1期);全文 *

Also Published As

Publication number Publication date
CN107992415A (zh) 2018-05-04

Similar Documents

Publication Publication Date Title
CN107992415B (zh) 一种交易***的故障定位和分析方法及相关服务器
CN110730246A (zh) 一种微服务架构下的分布式链路跟踪方法
CN106104496A (zh) 用于任意时序的不受监督的异常检测
CN109388556B (zh) 一种测试过程的分析方法及装置
CN106874135B (zh) 用于检测机房故障的方法、装置及设备
CN113360376A (zh) 埋点测试方法和装置
CN110807050B (zh) 性能分析方法、装置、计算机设备及存储介质
CN107885634B (zh) 监控中异常信息的处理方法和装置
CN106844170A (zh) 一种故障处理、分析故障的影响面方法和设备
CN111913824A (zh) 确定数据链路故障原因的方法及相关设备
CN110737655A (zh) 用于上报数据的方法和装置
CN108804501B (zh) 一种检测有效信息的方法及装置
CN113595886A (zh) 即时通讯消息的处理方法、装置、电子设备及存储介质
CN111708672B (zh) 数据传输方法、装置、设备及存储介质
CN110609761B (zh) 确定故障源的方法、装置、存储介质和电子设备
CN115687406A (zh) 一种调用链数据的采样方法、装置、设备及存储介质
CN113285978B (zh) 基于区块链和大数据的故障识别方法及通用计算节点
CN114996328A (zh) 一种用于路桥建材检测数据的采集整理方法和***
CN114416417A (zh) ***异常监测方法、装置、设备及存储介质
CN113781068A (zh) 线上问题解决方法、装置、电子设备和存储介质
CN113127362A (zh) 对象测试方法、对象测试装置、电子设备及可读存储介质
CN112671593B (zh) 一种服务器的管理方法及相关设备
CN111651753A (zh) 用户行为分析***及方法
CN114598624B (zh) 集群监控方法、装置、电子设备及可读存储介质
CN115190008B (zh) 故障处理方法、故障处理装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant