CN118014726A - 交易链路数据处理方法、装置、设备、存储介质和程序产品 - Google Patents

交易链路数据处理方法、装置、设备、存储介质和程序产品 Download PDF

Info

Publication number
CN118014726A
CN118014726A CN202410244969.7A CN202410244969A CN118014726A CN 118014726 A CN118014726 A CN 118014726A CN 202410244969 A CN202410244969 A CN 202410244969A CN 118014726 A CN118014726 A CN 118014726A
Authority
CN
China
Prior art keywords
data
log
service
transaction
unique
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202410244969.7A
Other languages
English (en)
Inventor
王岩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
ICBC Technology Co Ltd
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
ICBC Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC, ICBC Technology Co Ltd filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202410244969.7A priority Critical patent/CN118014726A/zh
Publication of CN118014726A publication Critical patent/CN118014726A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开提供了一种交易链路数据处理方法,涉及云计算技术领域,可以应用于金融技术领域。所述方法包括:在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;根据所述服务日志和所述唯一链路标识生成交易链路数据;以及根据所述交易链路数据的时效性对日志数据进行自动迁移。本公开还提供了一种交易链路数据处理装置、设备、存储介质和程序产品。

Description

交易链路数据处理方法、装置、设备、存储介质和程序产品
技术领域
本公开涉及云计算技术领域,具体的涉及分布式技术领域,更具体地涉及一种交易链路数据处理方法、装置、设备、存储介质和程序产品。
背景技术
现有分布式***链路追踪***通常采用sky walking和zipkin。然而这两种技术方案由于架构复杂、兼容性等问题,导致在引入现有业务***时引入改造成本高。因此,如何实现一种轻量级的链路追踪***方法极为重要。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
鉴于上述问题,本公开提供了一种提高轻量级的交易链路数据处理方法方法、装置、设备、存储介质和程序产品。
根据本公开的第一个方面,提供了一种交易链路数据处理方法,所述方法包括:
在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;
将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;
基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;
根据所述服务日志和所述唯一链路标识生成交易链路数据;以及
根据所述交易链路数据的时效性对日志数据进行自动迁移。
根据本公开的实施例,所述将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递包括:
在服务调用的过程中,通过日志上下文信息完成父子线程间唯一链路标识的传递;以及
通过负载均衡器完成集群间唯一链路标识的传递。
根据本公开的实施例,所述通过日志上下文信息完成父子线程间唯一链路标识的传递包括:
在手动创建子线程时,复用父线程中线程本地变量,所述线程本地变量存储有日志上下文信息;以及
在线程池中线程执行用户任务前,将上一线程的上下文信息设置到当前线程上下文中。
根据本公开的实施例,所述通过负载均衡器完成集群间唯一链路标识的传递包括:
在调用服务方法时,通过微服务调用组件***拦截服务调用请求;
根据负载均衡策略选择请求地址;以及
在请求头中添加所述唯一链路标识,使得调用方服务的唯一链路标识传递至被调用服务方。
根据本公开的实施例,所述基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中,包括:
在日志模板中添加链路标识字段;
在日志上下文信息中读取唯一链路标识,并按照预设数据格式登记到服务日志中;
在应用服务器部署filebeat组件对服务日志进行初次整形;以及
数据收集引擎将初次整形的服务日志进行二次整形,以数据片的方式存储在分布式数据库集群中。
根据本公开的实施例,所述根据所述交易链路数据的时效性对日志数据进行自动迁移包括:
根据所述交易链路数据的时序确定数据阶段;以及
根据所述数据阶段对日志数据进行自动迁移。
根据本公开的实施例,所述根据所述数据阶段对日志数据进行自动迁移包括:
若确定日志数据的数据阶段为热点数据,将所述日志数据迁移至第一服务器;以及
若确定日志数据的数据阶段为非热点数据,将所述日志数据迁移至第二服务器,所述第一服务器硬件性能大于所述第二服务器硬件性能。
本公开的第二方面提供了一种交易链路数据处理装置,所述装置包括:
交易链路标识生成模块,用于在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;
交易链路标识标记模块,用于将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;
交易链路数据收集模块,用于基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;
交易链路数据生成模块,用于根据所述服务日志和所述唯一链路标识生成交易链路数据;以及
交易链路数据迁移模块,用于根据所述交易链路数据的时效性对日志数据进行自动迁移。
根据本公开的实施例,所述交易链路标识标记模块包括:第一传递子模块和第二传递子模块,
第一传递子模块,用于在服务调用的过程中,通过日志上下文信息完成父子线程间唯一链路标识的传递;以及
第二传递子模块,用于通过负载均衡器完成集群间唯一链路标识的传递。
根据本公开的实施例,所述第一传递子模块包括第一复用单元和第二复用单元。
第一复用单元,用于在手动创建子线程时,复用父线程中线程本地变量,所述线程本地变量存储有日志上下文信息;以及
第二复用单元,用于在线程池中线程执行用户任务前,将上一线程的上下文信息设置到当前线程上下文中。
根据本公开的实施例,所述第二传递子模块包括拦截单元、负载均衡单元和传递单元。
拦截单元,用于在调用服务方法时,通过微服务调用组件***拦截服务调用请求;
负载均衡单元,用于根据负载均衡策略选择请求地址;以及
传递单元,在请求头中添加所述唯一链路标识,使得调用方服务的唯一链路标识传递至被调用服务方。
根据本公开的实施例,交易链路数据收集模块包括:链路标识字段添加子模块、唯一链路标识读取子模块、数据初次整形子模块和数据二次整形子模块。
链路标识字段添加子模块,用于在日志模板中添加链路标识字段;
唯一链路标识读取子模块,用于在日志上下文信息中读取唯一链路标识,并按照预设数据格式登记到服务日志中;
数据初次整形子模块,用于在应用服务器部署filebeat组件对服务日志进行初次整形;以及
数据二次整形子模块,用于数据收集引擎将初次整形的服务日志进行二次整形,以数据片的方式存储在分布式数据库集群中。
根据本公开的实施例,所述交易链路数据迁移模块包括:第一确定子模块和数据迁移子模块。
第一确定子模块,用于根据所述交易链路数据的时序确定数据阶段;以及
数据迁移子模块,用于根据所述数据阶段对日志数据进行自动迁移。
根据本公开的实施例,所述数据迁移子模块包括第一确定单元和第二确定单元。
第一确定单元,用于若确定日志数据的数据阶段为热点数据,将所述日志数据迁移至第一服务器;以及
第二确定单元,用于若确定日志数据的数据阶段为非热点数据,将所述日志数据迁移至第二服务器,所述第一服务器硬件性能大于所述第二服务器硬件性能。
本公开的第三方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述交易链路数据处理方法。
本公开的第四方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述交易链路数据处理方法。
本公开的第五方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述交易链路数据处理方法。
通过本公开的实施例提供的一种交易链路数据处理方法,在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;根据所述服务日志和所述唯一链路标识生成交易链路数据;以及根据所述交易链路数据的时效性对日志数据进行自动迁移。本公开实施例提供了一种轻量级的链路追踪***的方法与实现,是针对现有业务无入侵、无感知、不影响现有的代码框架,同时兼具日志全生命周期的管理功能,从而减少存储成本。
附图说明
通过以下参照附图对本公开实施例的描述,本公开的上述内容以及其他目的、特征和优点将更为清楚,在附图中:
图1示意性示出了根据本公开实施例的交易链路数据处理方法、装置、设备、存储介质和程序产品的应用场景图;
图2示意性示出了根据本公开一实施例提供的一种交易链路数据处理方法的流程图;
图3示意性示出了根据本公开另一实施例提供的交易链路数据的生成方法的流程图之一;
图4示意性示出了根据本公开另一实施例提供的交易链路数据的生成方法的流程图之二;
图5示意性示出了根据本公开另一实施例提供的交易链路数据的生成方法的流程图之三;
图6示意性示出了根据本公开另一实施例提供的交易链路数据的处理方法的流程图之一;
图7示意性示出了根据本公开另一实施例提供的交易链路数据的处理方法的流程图之二;
图8示意性示出了根据本公开另一实施例提供的交易链路数据的处理方法的流程图之三;
图9示意性示出了根据本公开实施例的一种交易链路数据处理装置的结构框图;以及
图10示意性示出了根据本公开实施例的适于实现交易链路数据处理方法的电子设备的方框图。
具体实施方式
以下,将参照附图来描述本公开的实施例。但是应该理解,这些描述只是示例性的,而并非要限制本公开的范围。在下面的详细描述中,为便于解释,阐述了许多具体的细节以提供对本公开实施例的全面理解。然而,明显地,一个或多个实施例在没有这些具体细节的情况下也可以被实施。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本公开的概念。
在此使用的术语仅仅是为了描述具体实施例,而并非意在限制本公开。在此使用的术语“包括”、“包含”等表明了所述特征、步骤、操作和/或部件的存在,但是并不排除存在或添加一个或多个其他特征、步骤、操作或部件。
在此使用的所有术语(包括技术和科学术语)具有本领域技术人员通常所理解的含义,除非另外定义。应注意,这里使用的术语应解释为具有与本说明书的上下文相一致的含义,而不应以理想化或过于刻板的方式来解释。
在使用类似于“A、B和C等中至少一个”这样的表述的情况下,一般来说应该按照本领域技术人员通常理解该表述的含义来予以解释(例如,“具有A、B和C中至少一个的***”应包括但不限于单独具有A、单独具有B、单独具有C、具有A和B、具有A和C、具有B和C、和/或具有A、B、C的***等)。
首先对本公开实施例出现的术语进行解释:
ES:elasticsearch是位于Elastic Stack核心的分布式搜索和分析引擎,是一个基于Lucene的搜索服务器。
Filebeat:beats是elastic公司开源的一款采集***监控数据的代理agent,是在被监控服务器上以客户端形式运行的数据器。
Logstash:logstash基于java实现,是一个开源的用于收集、分析和存储日志的工具。
SL4J-MDC(Mapped Diagnostic Context):全称诊断上线文映射,是slf4j提供的一个支持动态打印日志信息的工具。
服务器:用于发布前端网站、后台数据的集中控制服务,给用户提供可视化的网站资源文件以及保存用户数据的地方。
主流的分布式***链路追踪***通常采用skywalking和zipkin。其中,Skywalking是观察性分析平台和应用性能管理***,提供分布式追踪、服务网格遥测分析、度量聚合和可视化一体解决方案。Skywalking采用探针的方式进行埋点,以java为例,skywalking只需要在java程序启动时指定其为java agent,以这种二进制注入的方式,拦截应用程序的流量,截取其中的链路流转信息。Skywalking支持多语言探针,提供了java、.Net Core和Node.JS等主流开发语言的探针插件。Zipkin分为client端和server端,client端需要应用***代码引入,并可以进行灵活的二次开发,client端实现数据采集,server端负责链路输入的分析入库等。应用***引入client端代码,应用请求会被Trace框架拦截,将调用链信息添加到Header中,并传递到后续的服务调用中,每次跳转都会传递调用信息,上报trace信息(时间戳、耗时等指标),server端的collecter会汇所有的跳转信息,合并成一条完整的调用链信息。二者虽是两个独立的***,有着不同的特性,但是都是基于opentracing规范的实现。
在项目现有稳定架构的基础上集成skywalking或zipkin会引入很多风险。例如:
1)门槛高架构复杂短时间不能熟练的使用。
2)兼容性新特性版本与现有架构冲突。
3)组件本身的bug。
4)功能大而全对微小项目不友好,引入成本高。
基于上述技术问题,本公开的实施例提供了一种交易链路数据处理方法,所述方法包括:在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;根据所述服务日志和所述唯一链路标识生成交易链路数据;以及根据所述交易链路数据的时效性对日志数据进行自动迁移。
图1示意性示出了根据本公开实施例的交易链路数据处理方法、装置、设备、存储介质和程序产品的应用场景图。
如图1所示,根据该实施例的应用场景100可以包括交易链路数据处理场景。网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等(仅为示例)。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器105可以是后端服务器,该服务器可以执行本公开实施例提供的交易链路数据处理方法,在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;根据所述服务日志和所述唯一链路标识生成交易链路数据;以及根据所述交易链路数据的时效性对日志数据进行自动迁移。
需要说明的是,本公开实施例所提供的交易链路数据处理方法一般可以由服务器105执行。相应地,本公开实施例所提供的交易链路数据处理装置一般可以设置于服务器105中。本公开实施例所提供的交易链路数据处理方法也可以由不同于服务器105且能够与终端设备101、102、103和/或服务器105通信的服务器或服务器集群执行。相应地,本公开实施例所提供的交易链路数据处理装置也可以设置于不同于服务器105且能够与终端设备101、102、1 03和/或服务器105通信的服务器或服务器集群中。
应该理解,图2中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
需要说明的是,本公开实施例确定的交易链路数据处理方法和装置可用于互联网技术领域,也可用于金融技术领域,还可用于除金融领域之外的任意领域,本公开实施例确定的交易链路数据处理方法和装置的应用领域不做限定。
以下将基于图1描述的应用场景,通过图2~图8对本公开实施例的交易链路数据处理方法进行详细描述。
图2示意性示出了根据本公开一实施例提供的一种交易链路数据处理方法的流程图。如图2所示,该实施例的交易链路数据处理方法包括操作S210~操作S250,该方法可以由服务器或其他计算设备执行。
在操作S210,在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中。
在操作S220,将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递。
一个示例中,通过SL4J-mdc技术,在请求入口网关处为每一个请求生成对应标识,每一请求唯一对应一个链路标识,并将该唯一链路标识添加到http请求头中。在当前服务进行MDC.pu操作,将traceId保存在当前工作线程中,为logback的读取做准备。
在操作S230,基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中。
在操作S240,根据所述服务日志和所述唯一链路标识生成交易链路数据。
一个示例中,在服务调用的过程中,唯一链路标识随着日志上下文信息传递至下游服务,在打印服务日志时读取日志上下文信息中的唯一链路标识,即服务日志中包含交易链路数据,通过收集服务日志即可实现交易链路的追踪。具体的,可以通过ES、filebeat、logstash、SL4J-mdc等技术实现,服务器生成的日志通过filebeat收集整理后推送到logstash,由logsash最终汇集到elasticsearch中,然后通过kibana完成数据的展示。
在操作S250,根据所述交易链路数据的时效性对日志数据进行自动迁移。
一个示例中,Elasticseaerch中存储日志数据的索引,利用elasticsearch的ILM能力也可以实现数据的自动迁移,可以充分利用服务器资源的硬件能力,将热点数据存储在配置高的服务器主机,针对时效性不高的数据根据策略配置自动迁移到性价比更高的机器,避免存储资源的浪费。
通过本公开的实施例提供的一种交易链路数据处理方法,在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;根据所述服务日志和所述唯一链路标识生成交易链路数据;以及根据所述交易链路数据的时效性对日志数据进行自动迁移。本公开实施例提供了一种轻量级的链路追踪***的方法与实现,是针对现有业务无入侵、无感知、不影响现有的代码框架,同时兼具日志全生命周期的管理功能,从而减少存储成本。
结合图3~图5介绍本公开实施例中唯一链路标识的传递过程,图3示意性示出了根据本公开另一实施例提供的交易链路数据的生成方法的流程图之一;图4示意性示出了根据本公开另一实施例提供的交易链路数据的生成方法的流程图之二;图5示意性示出了根据本公开另一实施例提供的交易链路数据的生成方法的流程图之三。
如图3所示,操作S220包括操作S221和操作S222。
在操作S221,在服务调用的过程中,通过日志上下文信息完成父子线程间唯一链路标识的传递。
如图4所示,操作S221包括操作S2211和操作S2212。
在操作S2211,在手动创建子线程时,复用父线程中线程本地变量,所述线程本地变量存储有日志上下文信息。
一个示例中,MDC中包含的内容可以被同一线程中执行的代码所访问。当前线程的子线程会继承其父线程中的MDC的内容。当需要记录日志时,只需要从MDC中获取所需的信息即可。MDC的内容则由程序在适当的时候保存进去。对于一个Web应用来说,通常是在请求被处理的最开始保存这些数据。上述流程中会产生如下问题:traceId如何在父子线程间传递,实现子线程traceId的打印。当请求接入***以后,为提高***吞吐能力通常会异步线程处理。而MDC的本质是ThreadLocal。ThreadLocal解决的是让每个线程读取的ThreadLocal变量是相互独立的,为了能够实现子线程直接复用父线程的ThreadLocal变量里的内容。在本公开实施例中,通过重写MDC Adapter,使用InheritableThreadLocal变量替换原ThreadLocal变量实现在子线程中使用父线程中的线程本地变量。在子线程设置值之前,就已经能够get到主线程设置的值,即在父子进制之间传递了InheritableThreadLocal变量。通过上述操作解决了手动创建子线程时,父子线程传递的问题。
在操作S2212,在线程池中线程执行用户任务前,将上一线程的上下文信息设置到当前线程上下文中。
一个示例中,InheritableThreadLocal和线程池搭配使用时,可能得不到想要的结果,因为线程池中的线程是复用的,并没有重新初始化线程,InheritableThreadLocal之所以起作用是因为在Thread类中最终会调用init()方法去把InheritableThreadLocal的map复制到子线程中。由于线程池复用了已有线程,所以没有调用init()方法这个过程,也就不能将父线程中的InheritableThreadLocal值传给子线程。为了克服这一问题,实现线程池的线程上下文传递,在提交任务时记录当前线程上下文信息,在线程池中线程执行用户任务前将之前保存的上下文塞到当前线程的上下文中,在执行用户任务之后移除该上下文即可。简单来说就是,外部线程提交任务时要记录上下文信息,内部线程执行任务时获取之前记录的上下文信息设置到当前线程上下文中。在用户任务中直接进行手动获取/设置上下文逻辑。实现一个自定义的线程池,在提交任务时对任务进行包装并保存上下文信息,然后任务执行前设置上下文信息。
在操作S222,通过负载均衡器完成集群间唯一链路标识的传递。
如图5所示,操作S222包括操作S2221~操作S2223。
在操作S2221,在调用服务方法时,通过微服务调用组件***拦截服务调用请求。
在操作S2222,根据负载均衡策略选择请求地址。
在操作S2223,在请求头中添加所述唯一链路标识,使得调用方服务的唯一链路标识传递至被调用服务方。
一个示例中,Openfeign是一种声明式的、模板化的http客户端,可以做到http请求访问远程服务就像调用本地方法一样。Openfeign内部维护了服务列表,实现了客户端的负载均衡。OpenFeign有自己的***机制,可以通过requesttemplate对象对请求进行处理,统一将当前服务MDC中traceId赋值到新的请求头中当中,达到向下一个服务传递的效果,而且在开发环节无感知,***需实现RequestInterceptor接口。
结合图6~图8介绍本公开实施例中交易链路数据的处理过程。图6示意性示出了根据本公开另一实施例提供的交易链路数据的处理方法的流程图之一;图7示意性示出了根据本公开另一实施例提供的交易链路数据的处理方法的流程图之二。图8示意性示出了根据本公开另一实施例提供的交易链路数据的处理方法的流程图之三。
如图6所示,操作S230包括操作S310~操作S340。
在操作S310,在日志模板中添加链路标识字段。
在操作S320,在日志上下文信息中读取唯一链路标识,并按照预设数据格式登记到服务日志中。
在操作S330,在应用服务器部署filebeat组件对服务日志进行初次整形。
在操作S340,数据收集引擎将初次整形的服务日志进行二次整形,以数据片的方式存储在分布式数据库集群中。
一个示例中,在Logback日志模板中加入traceId标识,取值方式为%X{traceId},然后logback会在MDC中读取存放的traceId,然后将traceId按照预设格式登记到日志中。本实施例中,会用到elastic stack先关技术组件,首先在应用服务器部署filebeat组件进行初步整形;然后,多台filebeat将提取的日志汇总到logstash。最后logstash将收集的日志按需进行二次整形后,最终以数据片的方式存储在elasticsearch集群。
如图7所示,包括操作S410和操作S420。
在操作S410,根据所述交易链路数据的时序确定数据阶段。
在操作S420,根据所述数据阶段对日志数据进行自动迁移。
如图8所示,操作S420包括操作S421和操作S422。
在操作S421,若确定日志数据的数据阶段为热点数据,将所述日志数据迁移至第一服务器。
在操作S422,若确定日志数据的数据阶段为非热点数据,将所述日志数据迁移至第二服务器,所述第一服务器硬件性能大于所述第二服务器硬件性能。
一个示例中,在业务搜索场景,用户会将业务数据存储在Elasticsearch中,比如商品数据、订单数据、用户数据等,实现快速的全文检索功能。像这类数据是累加的,不会删除。只有在业务下线或业务升级时才会删除。而在日志场景中,用户将各种日志,如***、防火墙、中间件、数据库、web服务器、应用日志等全部实施地存入Elasticsearch中,进行及时日志查询和分析。这种类型的数据都是时序性的数据。如果日志的数据量过大,通常不会存储全量的数据,一般都是在es中存储热数据,比如最近7天、30天、90天数据等,而7天30天90天之前的数据都会被删除或被归档存在。因此在本公开实施例中,为了更好的利用存储资源,引入日志的生命周期管理概念,优化索引的性能和减少存储成本。ES的ILM机制通过在索引生命周期的不通阶段执行不同的动作来实现自动化管理,针对时效性不高的数据根据策略配置自动迁移到性价比更高的机器,避免资源浪费。具体的,定期轮询确定交易链路数据的热度,例如可以根据交易链路数据的时序和当前时间确定交易链路数据所处数据阶段,进而判断交易链路数据是否为热点数据,若确定交易链路数据为热点数据,将热点数据存储在第一服务器,若确定交易链路数据不为热点数据,将日志数据迁移至第一服务器,第一服务器的硬件配置优于第二服务器,因此第一服务器的数据处理性能优于第二服务器。
基于上述交易链路数据处理方法,本公开还提供了一种交易链路数据处理装置。以下将结合图9对该装置进行详细描述。
图9示意性示出了根据本公开实施例的一种交易链路数据处理装置的结构框图。如图9所示,该实施例的交易链路数据处理装置700包括交易链路标识生成模块710、交易链路标识标记模块720、交易链路数据收集模块730、交易链路数据生成模块740和交易链路数据迁移模块750。
交易链路标识生成模块710用于在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中。在一实施例中,交易链路标识生成模块710可以用于执行前文描述的操作S210,在此不再赘述。
交易链路标识标记模块720用于将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递。在一实施例中,交易链路标识标记模块720可以用于执行前文描述的操作S220,在此不再赘述。
交易链路数据收集模块730用于基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中。在一实施例中,交易链路数据收集模块730可以用于执行前文描述的操作S230,在此不再赘述。
交易链路数据生成模块740用于根据所述服务日志和所述唯一链路标识生成交易链路数据。在一实施例中,交易链路数据生成模块740可以用于执行前文描述的操作S240,在此不再赘述。
交易链路数据迁移模块750用于根据所述交易链路数据的时效性对日志数据进行自动迁移。在一实施例中,交易链路数据迁移模块750可以用于执行前文描述的操作S250,在此不再赘述。
根据本公开的实施例,所述交易链路标识标记模块包括:第一传递子模块和第二传递子模块,
第一传递子模块,用于在服务调用的过程中,通过日志上下文信息完成父子线程间唯一链路标识的传递。在一实施例中,第一传递子模块可以用于执行前文描述的操作S221,在此不再赘述。
第二传递子模块,用于通过负载均衡器完成集群间唯一链路标识的传递。在一实施例中,第二传递子模块可以用于执行前文描述的操作S222,在此不再赘述。
根据本公开的实施例,所述第一传递子模块包括第一复用单元和第二复用单元。
第一复用单元,用于在手动创建子线程时,复用父线程中线程本地变量,所述线程本地变量存储有日志上下文信息。在一实施例中,第一复用单元可以用于执行前文描述的操作S2211,在此不再赘述。
第二复用单元,用于在线程池中线程执行用户任务前,将上一线程的上下文信息设置到当前线程上下文中。在一实施例中,第二复用单元可以用于执行前文描述的操作S2212,在此不再赘述。
根据本公开的实施例,所述第二传递子模块包括拦截单元、负载均衡单元和传递单元。
拦截单元,用于在调用服务方法时,通过微服务调用组件***拦截服务调用请求。在一实施例中,拦截单元可以用于执行前文描述的操作S2221,在此不再赘述。
负载均衡单元,用于根据负载均衡策略选择请求地址。在一实施例中,负载均衡单元可以用于执行前文描述的操作S2222,在此不再赘述。
传递单元,在请求头中添加所述唯一链路标识,使得调用方服务的唯一链路标识传递至被调用服务方。在一实施例中,传递单元可以用于执行前文描述的操作S2223,在此不再赘述。
根据本公开的实施例,交易链路数据收集模块包括:链路标识字段添加子模块、唯一链路标识读取子模块、数据初次整形子模块和数据二次整形子模块。
链路标识字段添加子模块,用于在日志模板中添加链路标识字段。在一实施例中,链路标识字段添加子模块可以用于执行前文描述的操作310,在此不再赘述。
唯一链路标识读取子模块,用于在日志上下文信息中读取唯一链路标识,并按照预设数据格式登记到服务日志中。在一实施例中,唯一链路标识读取子模块可以用于执行前文描述的操作S320,在此不再赘述。
数据初次整形子模块,用于在应用服务器部署filebeat组件对服务日志进行初次整形。在一实施例中,数据初次整形子模块可以用于执行前文描述的操作S330,在此不再赘述。
数据二次整形子模块,用于数据收集引擎将初次整形的服务日志进行二次整形,以数据片的方式存储在分布式数据库集群中。在一实施例中,数据初次整形子模块可以用于执行前文描述的操作S340,在此不再赘述。
根据本公开的实施例,所述交易链路数据迁移模块包括:第一确定子模块和数据迁移子模块。
第一确定子模块,用于根据所述交易链路数据的时序确定数据阶段。在一实施例中,第一确定子模块可以用于执行前文描述的操作S410,在此不再赘述。
数据迁移子模块,用于根据所述数据阶段对日志数据进行自动迁移。在一实施例中,数据迁移子模块可以用于执行前文描述的操作S420,在此不再赘述。
根据本公开的实施例,所述数据迁移子模块包括第一确定单元和第二确定单元。
第一确定单元,用于若确定日志数据的数据阶段为热点数据,将所述日志数据迁移至第一服务器。在一实施例中,第一确定单元可以用于执行前文描述的操作S421,在此不再赘述。
第二确定单元,用于若确定日志数据的数据阶段为非热点数据,将所述日志数据迁移至第二服务器,所述第一服务器硬件性能大于所述第二服务器硬件性能。在一实施例中,第二确定单元可以用于执行前文描述的操作S422,在此不再赘述。
根据本公开的实施例,交易链路标识生成模块710、交易链路标识标记模块720、交易链路数据收集模块730、交易链路数据生成模块740和交易链路数据迁移模块750中的任意多个模块可以合并在一个模块中实现,或者其中的任意一个模块可以被拆分成多个模块。或者,这些模块中的一个或多个模块的至少部分功能可以与其他模块的至少部分功能相结合,并在一个模块中实现。根据本公开的实施例,交易链路标识生成模块710、交易链路标识标记模块720、交易链路数据收集模块730、交易链路数据生成模块740和交易链路数据迁移模块750中的至少一个可以至少被部分地实现为硬件电路,例如现场可编程门阵列(FPGA)、可编程逻辑阵列(PLA)、片上***、基板上的***、封装上的***、专用集成电路(ASIC),或可以通过对电路进行集成或封装的任何其他的合理方式等硬件或固件来实现,或以软件、硬件以及固件三种实现方式中任意一种或以其中任意几种的适当组合来实现。或者,交易链路标识生成模块710、交易链路标识标记模块720、交易链路数据收集模块730、交易链路数据生成模块740和交易链路数据迁移模块750中的至少一个可以至少被部分地实现为计算机程序模块,当该计算机程序模块被运行时,可以执行相应的功能。
图10示意性示出了根据本公开实施例的适于实现交易链路数据处理方法的电子设备的方框图。
如图10所示,根据本公开实施例的电子设备900包括处理器901,其可以根据存储在只读存储器(ROM)902中的程序或者从存储部分908加载到随机访问存储器(RAM)903中的程序而执行各种适当的动作和处理。处理器901例如可以包括通用微处理器(例如CPU)、指令集处理器和/或相关芯片组和/或专用微处理器(例如,专用集成电路(ASIC))等等。处理器901还可以包括用于缓存用途的板载存储器。处理器901可以包括用于执行根据本公开实施例的方法流程的不同动作的单一处理单元或者是多个处理单元。
在RAM 903中,存储有电子设备900操作所需的各种程序和数据。处理器901、ROM902以及RAM 903通过总线904彼此相连。处理器901通过执行ROM 902和/或RAM 903中的程序来执行根据本公开实施例的方法流程的各种操作。需要注意,所述程序也可以存储在除ROM 902和RAM 903以外的一个或多个存储器中。处理器901也可以通过执行存储在所述一个或多个存储器中的程序来执行根据本公开实施例的方法流程的各种操作。
根据本公开的实施例,电子设备900还可以包括输入/输出(I/O)接口905,输入/输出(I/O)接口905也连接至总线904。电子设备900还可以包括连接至I/O接口905的以下部件中的一项或多项:包括键盘、鼠标等的输入部分906;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分907;包括硬盘等的存储部分908;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分909。通信部分909经由诸如因特网的网络执行通信处理。驱动器909也根据需要连接至I/O接口905。可拆卸介质911,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器909上,以便于从其上读出的计算机程序根据需要被安装入存储部分908。
本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中描述的设备/装置/***中所包含的;也可以是单独存在,而未装配入该设备/装置/***中。上述计算机可读存储介质承载有一个或者多个程序,当上述一个或者多个程序被执行时,实现根据本公开实施例的交易链路数据处理方法。
根据本公开的实施例,计算机可读存储介质可以是非易失性的计算机可读存储介质,例如可以包括但不限于:便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行***、装置或者器件使用或者与其结合使用。例如,根据本公开的实施例,计算机可读存储介质可以包括上文描述的ROM 902和/或RAM 903和/或ROM 902和RAM 903以外的一个或多个存储器。
本公开的实施例还包括一种计算机程序产品,其包括计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。当计算机程序产品在计算机***中运行时,该程序代码用于使计算机***实现本公开实施例所提供的交易链路数据处理方法。
在该计算机程序被处理器901执行时执行本公开实施例的***/装置中限定的上述功能。根据本公开的实施例,上文描述的***、装置、模块、单元等可以通过计算机程序模块来实现。
在一种实施例中,该计算机程序可以依托于光存储器件、磁存储器件等有形存储介质。在另一种实施例中,该计算机程序也可以在网络介质上以信号的形式进行传输、分发,并通过通信部分909被下载和安装,和/或从可拆卸介质911被安装。该计算机程序包含的程序代码可以用任何适当的网络介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
在这样的实施例中,该计算机程序可以通过通信部分909从网络上被下载和安装,和/或从可拆卸介质911被安装。在该计算机程序被处理器901执行时,执行本公开实施例的***中限定的上述功能。根据本公开的实施例,上文描述的***、设备、装置、模块、单元等可以通过计算机程序模块来实现。
根据本公开的实施例,可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例提供的计算机程序的程序代码,具体地,可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。程序设计语言包括但不限于诸如Java,C++,python,“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
本领域技术人员可以理解,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合或/或结合,即使这样的组合或结合没有明确记载于本公开中。特别地,在不脱离本公开精神和教导的情况下,本公开的各个实施例和/或权利要求中记载的特征可以进行多种组合和/或结合。所有这些组合和/或结合均落入本公开的范围。
以上对本公开的实施例进行了描述。但是,这些实施例仅仅是为了说明的目的,而并非为了限制本公开的范围。尽管在以上分别描述了各实施例,但是这并不意味着各个实施例中的措施不能有利地结合使用。本公开的范围由所附权利要求及其等同物限定。不脱离本公开的范围,本领域技术人员可以做出多种替代和修改,这些替代和修改都应落在本公开的范围之内。

Claims (11)

1.一种交易链路数据处理方法,其特征在于,所述方法包括:
在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;
将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;
基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;
根据所述服务日志和所述唯一链路标识生成交易链路数据;以及
根据所述交易链路数据的时效性对日志数据进行自动迁移。
2.根据权利要求1所述的方法,其特征在于,所述将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递包括:
在服务调用的过程中,通过日志上下文信息完成父子线程间唯一链路标识的传递;以及
通过负载均衡器完成集群间唯一链路标识的传递。
3.根据权利要求2所述的方法,其特征在于,所述通过日志上下文信息完成父子线程间唯一链路标识的传递包括:
在手动创建子线程时,复用父线程中线程本地变量,所述线程本地变量存储有日志上下文信息;以及
在线程池中线程执行用户任务前,将上一线程的上下文信息设置到当前线程上下文中。
4.根据权利要求2所述的方法,其特征在于,所述通过负载均衡器完成集群间唯一链路标识的传递包括:
在调用服务方法时,通过微服务调用组件***拦截服务调用请求;
根据负载均衡策略选择请求地址;以及
在请求头中添加所述唯一链路标识,使得调用方服务的唯一链路标识传递至被调用服务方。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中,包括:
在日志模板中添加链路标识字段;
在日志上下文信息中读取唯一链路标识,并按照预设数据格式登记到服务日志中;
在应用服务器部署filebeat组件对服务日志进行初次整形;以及
数据收集引擎将初次整形的服务日志进行二次整形,以数据片的方式存储在分布式数据库集群中。
6.根据权利要求5所述的方法,其特征在于,所述根据所述交易链路数据的时效性对日志数据进行自动迁移包括:
根据所述交易链路数据的时序确定数据阶段;以及
根据所述数据阶段对日志数据进行自动迁移。
7.根据权利要求6所述的方法,其特征在于,所述根据所述数据阶段对日志数据进行自动迁移包括:
若确定日志数据的数据阶段为热点数据,将所述日志数据迁移至第一服务器;以及
若确定日志数据的数据阶段为非热点数据,将所述日志数据迁移至第二服务器,所述第一服务器硬件性能大于所述第二服务器硬件性能。
8.一种交易链路数据处理装置,其特征在于,所述装置包括:
交易链路标识生成模块,用于在请求入口网关处为每一交易请求生成唯一链路标识,并将所述唯一链路标识添加到http请求头中;
交易链路标识标记模块,用于将所述唯一链路标识写入日志上下文信息中,使得所述唯一链路标识随着日志上下文信息在上下游服务间传递;
交易链路数据收集模块,用于基于数据收集引擎收集服务器生成的服务日志并以数据片形式存储在分布式数据库集群中;
交易链路数据生成模块,用于根据所述服务日志和所述唯一链路标识生成交易链路数据;以及
交易链路数据迁移模块,用于根据所述交易链路数据的时效性对日志数据进行自动迁移。
9.一种电子设备,包括:
一个或多个处理器;
存储装置,用于存储一个或多个计算机程序,
其特征在于,所述一个或多个处理器执行所述一个或多个计算机程序以实现根据权利要求1~7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现根据权利要求1~7中任一项所述方法的步骤。
11.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1~7中任一项所述方法的步骤。
CN202410244969.7A 2024-03-04 2024-03-04 交易链路数据处理方法、装置、设备、存储介质和程序产品 Pending CN118014726A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410244969.7A CN118014726A (zh) 2024-03-04 2024-03-04 交易链路数据处理方法、装置、设备、存储介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410244969.7A CN118014726A (zh) 2024-03-04 2024-03-04 交易链路数据处理方法、装置、设备、存储介质和程序产品

Publications (1)

Publication Number Publication Date
CN118014726A true CN118014726A (zh) 2024-05-10

Family

ID=90959376

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410244969.7A Pending CN118014726A (zh) 2024-03-04 2024-03-04 交易链路数据处理方法、装置、设备、存储介质和程序产品

Country Status (1)

Country Link
CN (1) CN118014726A (zh)

Similar Documents

Publication Publication Date Title
US8656021B2 (en) Methods and apparatus for constructing an execution environment in which the application operates
US11294758B2 (en) Automated methods and systems to classify and troubleshoot problems in information technology systems and services
CN107370806B (zh) Http状态码监控方法、装置、存储介质和电子设备
US11556348B2 (en) Bootstrapping profile-guided compilation and verification
US9971563B2 (en) Systems and methods for low interference logging and diagnostics
US20130254376A1 (en) Dynamic control over tracing of messages received by a message broker
CN112104709A (zh) 智能合约的处理方法、装置、介质及电子设备
CN109783562B (zh) 一种业务处理方法和装置
CN111666201A (zh) 回归测试方法、装置、介质及电子设备
CN115357761A (zh) 链路追踪方法、装置、电子设备及存储介质
CN113722114A (zh) 一种数据服务的处理方法、装置、计算设备及存储介质
CN112860538A (zh) 基于线上日志进行接口回归测试的方法和装置
US10831590B2 (en) Error handling
CN112491943A (zh) 数据请求方法、装置、存储介质和电子设备
CN111698109A (zh) 监控日志的方法和装置
CN115934537A (zh) 接口测试工具生成方法、装置、设备、介质及产品
CN111078905A (zh) 一种数据处理方法、装置、介质以及设备
CN113495498B (zh) 用于硬件设备的模拟方法、模拟器、设备和介质
CN118014726A (zh) 交易链路数据处理方法、装置、设备、存储介质和程序产品
CN111881025B (zh) 一种自动化测试任务调度方法、装置及***
CN115202973A (zh) 应用运行状态的确定方法、装置、电子设备和介质
CN113064987A (zh) 数据处理方法、装置、电子设备、介质和程序产品
CN111639936A (zh) 交易信息的获取方法、装置、电子设备及可读存储介质
US11392433B1 (en) Generation of asynchronous application programming interface specifications for messaging topics
CN112988528B (zh) 日志处理方法、装置及容器组

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination