CN118113530A - 芯片故障定位方法、装置、计算机设备和存储介质 - Google Patents

芯片故障定位方法、装置、计算机设备和存储介质 Download PDF

Info

Publication number
CN118113530A
CN118113530A CN202311857589.2A CN202311857589A CN118113530A CN 118113530 A CN118113530 A CN 118113530A CN 202311857589 A CN202311857589 A CN 202311857589A CN 118113530 A CN118113530 A CN 118113530A
Authority
CN
China
Prior art keywords
data processing
abnormal
processing node
program
determining
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202311857589.2A
Other languages
English (en)
Inventor
张巧惠
习伟
陈军健
陶伟
向柏澄
关志华
董飞龙
谢心昊
孙沁
张泽林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Southern Power Grid Digital Grid Research Institute Co Ltd
Original Assignee
Southern Power Grid Digital Grid Research Institute Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Southern Power Grid Digital Grid Research Institute Co Ltd filed Critical Southern Power Grid Digital Grid Research Institute Co Ltd
Priority to CN202311857589.2A priority Critical patent/CN118113530A/zh
Publication of CN118113530A publication Critical patent/CN118113530A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

本申请涉及一种芯片故障定位方法、装置、计算机设备和存储介质。所述方法包括:获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;根据各运行程序的运行状态,确定异常运行程序;根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。采用本方法,能够提高故障定位的效率与芯片故障定位信息的精准度。

Description

芯片故障定位方法、装置、计算机设备和存储介质
技术领域
本申请涉及物联网芯片技术领域,特别是涉及一种芯片故障定位方法、装置、计算机设备和存储介质。
背景技术
随着物联网芯片的高速发展,物联网芯片的数据处理速率与日俱增,然而,由于在大量不同类型数据进行数据处理,加速了物联网芯片的数据处理量和数据处理难度,从而导致芯片时常出现处理故障信息,但是由于故障信息涉及芯片的每个运行程序,因此如何定位芯片的故障信息是当前的研究重点。
传统芯片故障信息定位方式是基于工作人员人工逐线程排查该芯片的每个运行程序,从而得到该芯片故障信息的定位信息,但是该方式需要耗费大量人力成本,且单纯通过人工排查容易遗漏故障信息,从而导致芯片故障信息的定位精准度较低。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高芯片故障信息的定位精准度的芯片故障定位方法。
第一方面,本申请提供了一种芯片故障定位方法,该方法包括:
获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
在其中一个实施例中,包括:
获取异常运行程序的日志记录信息;其中,异常运行程序的日志记录信息包括各数据处理节点的子日志记录信息;根据各数据处理节点的子日志记录信息,确定各个异常运行程序对应的各数据处理节点的数据处理结果。
在其中一个实施例中,根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点,包括:
针对于异常运行程序对应的任一数据处理节点,若该数据处理节点的数据处理结果存在异常,则确定该数据处理节点为异常程序对应的异常数据处理节点。
在其中一个实施例中,数据处理进程的数据处理状态包括异常执行状态和正常执行状态;根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程,包括:
针对于异常数据处理节点中的任一数据处理进程,若该数据处理进程的数据处理状态为异常执行状态,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程;若该数据处理进程的数据处理状态为正常执行状态,则根据该数据处理进程的数据处理速率,确定该数据处理进程是否为异常数据处理节点中的异常数据处理进程。
在其中一个实施例中,根据该数据处理进程的数据处理速率,确定该数据处理进程是否为异常数据处理节点中的异常数据处理进程,包括:
将该数据处理进程的数据处理速率与该数据处理进程的历史处理速率进行比对,若比对结果超过波动阈值,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程。
在其中一个实施例中,将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息,包括:
异常数据处理节点、异常数据处理节点对应的异常数据处理进程,以及异常数据处理进程的处理时间,确定为目标芯片的故障信息。
第二方面,本申请还提供了一种芯片故障定位装置,该装置包括:
获取模块:用于获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
程序确定模块:用于根据各运行程序的运行状态,确定异常运行程序;
节点确定模块:用于根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
进程确定模块:用于根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
故障确定模块:用于将异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
第三方面,本申请还提供了一种计算机设备,该计算机设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现以下步骤:
获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
第四方面,本申请还提供了一种计算机可读存储介质,该计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
第五方面,本申请还提供了一种计算机程序产品,该计算机程序产品包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
上述芯片故障定位方法、装置、计算机设备和存储介质,在目标芯片发生故障时,根据各运行程序的运行状态,确定异常运行程序;而后,根据各数据处理节点的数据处理结果,确定异常数据处理节点;再进一步的,根据各数据处理进程的数据处理状态,确定异常数据处理进程;最终,根据异常运行程序、异常数据处理节点,以及异常数据处理进程,确定目标芯片上发生故障的故障定位信息,实现了芯片故障定位的准确性。相比于现有技术通过人工排查故障信息,提高了故障定位的效率与芯片故障定位信息的精准度。
附图说明
图1为一个实施例中芯片故障定位方法的应用环境图;
图2为一个实施例中芯片故障定位方法的流程示意图;
图3为一个实施例中确定异常数据处理节点中的异常数据处理进程的流程示意图;
图4为一个实施例中芯片故障定位装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的芯片故障定位方法,可以应用于如图1所示的应用环境中的终端102,和/或服务器104。其中,终端102通过网络与服务器104进行通信。数据存储***可以存储服务器104需要处理的数据。数据存储***可以集成在服务器104上,也可以放在云上或其他网络服务器上。
其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种芯片故障定位方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
S201,获取目标芯片上的各运行程序。
其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务。
具体的,在目标芯片执行某一数据处理任务的过程中,检测到目标芯片出现故障时,获取该目标芯片的当前处理任务,确定当前处理任务所涉及到的程序,从当前处理任务所涉及到的程序中进行筛选,将已完成相应数据处理任务和正在进行相应数据处理任务的程序,作为运行程序。
需要说明的是,目标芯片可以处理多种数据类型的数据,例如,图片数据、音频数据、视频数据、文本数据、表格数据、数值数据、文字数据等;目标芯片在处理不同数据类型的数据以及处理不同的数据处理任务时,可能会涉及不同的程序,例如,在对图片A进行清晰化的数据处理任务时涉及到程序a和e;在对图片A进行色调调整的数据处理任务时涉及到程序c和e。
示例性的,当目标芯片在执行对图片A进行文字识别任务的过程中,会依次程序a、b、c、d和e。在发生故障时,程序a和b已完成相对应的数据处理任务,程序c正在进行相对应的数据处理任务,程序d和e还未进行对应的数据处理任务,此时,将程序a、b和c确定为目标芯片上的运行程序。
S202,根据各运行程序的运行状态,确定异常运行程序。
其中,运行程序的运行状态可以包括运行结果和当前运行速率;相应的,异常运行程序是运行报错、运行速率异常的程序。
示例性的,针对任一运行程序,根据该运行程序在数据处理时的数据量,以及该运行程序的处理时长,确定该运行程序的当前运行速率。其中,各运行程序的当前运行速率的计算过程如下:
(1)
其中,为第i个运行程序的当前运行速率,/>为数据信息的数据量,/>为第i个运行程序的处理时长,i为各运行程序的随机虚拟编号。
进一步的,针对各运行程序,根据该运行程序在数据处理时的数据类型以及数据量,在历史数据库中确定与该数据类型相同、数据量类似以及与该处理任务相同的历史数据;确定该历史数据在该运行程序阶段的处理时间;最后基于该历史数据在该运行程序数据处理时的数据量以及处理时长,确定该运行程序的正常运行速率。其中,各运行程序的正常运行速率的计算过程与当前运行速率的计算过程相同。确定各运行程序的当前运行速率、与各运行程序的正常运行速率之间的速率差,将速率差大于预设速率差阈值所对应的运行程序,确定为异常运行程序;另外,针对于任一运行程序,若该运行程序的运行结果表征运行报错,则确定该运行程序为异常运行程序。
S203,根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点。
其中,每个运行程序应用多个顺序连接的数据处理节点执行数据处理任务;每个数据处理节点包括多个数据处理进程。
其中,数据处理节点的数据处理结果包括正常和异常。
具体的,当数据处理节点中的任一数据处理进程出现异常时,该数据处理节点的数据处理结果为异常;当数据处理节点中的所有数据处理进程正常时,该数据处理节点的数据处理结果为正常。
S204,根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程。
其中,数据处理进程的数据处理状态用于表征数据处理进程的运行状态,运行状态可以通过各运行参数确定,运行状态包括异常执行状态和正常执行状态。
具体的,当数据处理进程的数据处理状态为异常执行状态时,确定该数据处理进程为异常数据处理进程。
S205,将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
其中,故障信息包括异常运行程序异常数据处理节点以及异常数据处理进程。
上述芯片故障定位方法中,在目标芯片发生故障时,根据各运行程序的运行状态,确定异常运行程序;而后,根据各数据处理节点的数据处理结果,确定异常数据处理节点;再进一步的,根据各数据处理进程的数据处理状态,确定异常数据处理进程;最终,根据异常运行程序、异常数据处理节点,以及异常数据处理进程,确定目标芯片上发生故障的故障定位信息。相比于现有技术,实现了芯片故障定位的准确性。相比于现有技术通过人工排查故障信息,提高了故障定位的效率与芯片故障定位信息的精准度。
在一个实施例中,该芯片故障定位方法还包括:获取异常运行程序的日志记录信息;其中,异常运行程序的日志记录信息包括各数据处理节点的子日志记录信息;根据各数据处理节点的子日志记录信息,确定各个异常运行程序对应的各数据处理节点的数据处理结果。
需要说明的是,每个运行程序包含至少一个数据处理节点,因此,每个运行程序的日志记录信息包含该至少一个数据处理节点的子日志记录信息。其中,子日志记录信息包含对应数据处理节点的数据处理结果(输出结果)。
可选的,针对于所述异常运行程序对应的任一数据处理节点,若该数据处理节点的数据处理结果存在异常,则确定该数据处理节点为所述异常程序对应的异常数据处理节点。
可以理解的是,针对于所述异常运行程序对应的任一数据处理节点,通过该数据处理节点的数据处理策略,对该数据处理节点的数据处理结果进行核验,以确定该数据处理节点是否存在异常。
进一步的,如图3所示,上述根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程,包括:
S301,针对于异常数据处理节点中的任一数据处理进程,若该数据处理进程的数据处理状态为异常执行状态,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程。
可以理解的是,数据处理状态包含的至少一个状态参数中的状态参数,将该状态参数的取值与状态指标参照表进行比较,确定该状态参数是否异常,其中,上述状态指标参照表包含数据处理状态信息包含的至少一个状态参数中每个状态参数在正常运行时的参数取值范围;响应于不存在异常的状态参数,确定该数据处理状态信息对应数据处理进程的运行状态为正常运行,否则,为异常执行状态。其中,数据处理状态信息包括以下至少一个状态参数:处理器使用率、内存占用量、磁盘占用量、网络带宽占用量。
S302,若该数据处理进程的数据处理状态为正常执行状态,则根据该数据处理进程的数据处理速率,确定该数据处理进程是否为异常数据处理节点中的异常数据处理进程。
可选的,将该数据处理进程的数据处理速率与该数据处理进程的历史处理速率进行比对,若比对结果超过波动阈值,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程。
具体的,历史处理速率根据该数据处理进程处理历史数据的过程采集得到,其中,历史数据与该数据处理程序当前处理的当前数据的数据类型和数据量均相同。
本实施例中,通过数据处理进程的数据处理状态和数据处理速率,实现了对异常数据处理进程的多维度分析。
进一步的,将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息,包括:异常数据处理节点、异常数据处理节点对应的异常数据处理进程,以及异常数据处理进程的处理时间,确定为目标芯片的故障信息。
可以理解的是,异常数据处理进程的处理时间用于表征该数据处理进程处于异常状态所持续的时间长度。
本实施例中,将异常数据处理节点、异常数据处理节点对应的异常数据处理进程,以及异常数据处理进程的处理时间,确定为目标芯片的故障信息,能够准确记录目标芯片发生故障的时间点,以及该时间点对应的故障位置。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的芯片故障定位方法的芯片故障定位装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个芯片故障定位装置实施例中的具体限定可以参见上文中对于芯片故障定位方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种芯片故障定位装置1,包括:获取模块10、程序确定模块20、节点确定模块30、进程确定模块40和故障确定模块50,其中:
获取模块10:用于获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务。
程序确定模块20:用于根据各运行程序的运行状态,确定异常运行程序。
节点确定模块30:用于根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点。
进程确定模块40:用于根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程。
故障确定模块50:用于将异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
在一个实施例中,芯片故障定位装置1,具体用于:
获取异常运行程序的日志记录信息;其中,异常运行程序的日志记录信息包括各数据处理节点的子日志记录信息;根据各数据处理节点的子日志记录信息,确定各个异常运行程序对应的各数据处理节点的数据处理结果。
在一个实施例中,节点确定模块30,具体用于:
针对于异常运行程序对应的任一数据处理节点,若该数据处理节点的数据处理结果存在异常,则确定该数据处理节点为异常程序对应的异常数据处理节点。
在一个实施例中,数据处理进程的数据处理状态包括异常执行状态和正常执行状态,进程确定模块40,具体用于:
针对于异常数据处理节点中的任一数据处理进程,若该数据处理进程的数据处理状态为异常执行状态,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程;若该数据处理进程的数据处理状态为正常执行状态,则根据该数据处理进程的数据处理速率,确定该数据处理进程是否为异常数据处理节点中的异常数据处理进程。
在一个实施例中,进程确定模块40,具体用于:
将该数据处理进程的数据处理速率与该数据处理进程的历史处理速率进行比对,若比对结果超过波动阈值,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程。
在一个实施例中,故障确定模块50,具体用于:
异常数据处理节点、异常数据处理节点对应的异常数据处理进程,以及异常数据处理进程的处理时间,确定为目标芯片的故障信息。
上述芯片故障定位装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作***、计算机程序和数据库。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的数据库用于存储芯片故障定位数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种芯片故障定位方法。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过***总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作***和计算机程序。该内存储器为非易失性存储介质中的操作***和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种芯片故障定位方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取异常运行程序的日志记录信息;其中,异常运行程序的日志记录信息包括各数据处理节点的子日志记录信息;根据各数据处理节点的子日志记录信息,确定各个异常运行程序对应的各数据处理节点的数据处理结果。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
针对于异常运行程序对应的任一数据处理节点,若该数据处理节点的数据处理结果存在异常,则确定该数据处理节点为异常程序对应的异常数据处理节点。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
针对于异常数据处理节点中的任一数据处理进程,若该数据处理进程的数据处理状态为异常执行状态,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程;若该数据处理进程的数据处理状态为正常执行状态,则根据该数据处理进程的数据处理速率,确定该数据处理进程是否为异常数据处理节点中的异常数据处理进程。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
将该数据处理进程的数据处理速率与该数据处理进程的历史处理速率进行比对,若比对结果超过波动阈值,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
异常数据处理节点、异常数据处理节点对应的异常数据处理进程,以及异常数据处理进程的处理时间,确定为目标芯片的故障信息。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取异常运行程序的日志记录信息;其中,异常运行程序的日志记录信息包括各数据处理节点的子日志记录信息;根据各数据处理节点的子日志记录信息,确定各个异常运行程序对应的各数据处理节点的数据处理结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
针对于异常运行程序对应的任一数据处理节点,若该数据处理节点的数据处理结果存在异常,则确定该数据处理节点为异常程序对应的异常数据处理节点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
针对于异常数据处理节点中的任一数据处理进程,若该数据处理进程的数据处理状态为异常执行状态,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程;若该数据处理进程的数据处理状态为正常执行状态,则根据该数据处理进程的数据处理速率,确定该数据处理进程是否为异常数据处理节点中的异常数据处理进程。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将该数据处理进程的数据处理速率与该数据处理进程的历史处理速率进行比对,若比对结果超过波动阈值,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
异常数据处理节点、异常数据处理节点对应的异常数据处理进程,以及异常数据处理进程的处理时间,确定为目标芯片的故障信息。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取目标芯片上的各运行程序;其中,运行程序通过目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据异常运行程序对应的各数据处理节点的数据处理结果,确定异常程序对应的异常数据处理节点;
根据异常数据处理节点中各数据处理进程的数据处理状态,确定异常数据处理节点中的异常数据处理进程;
将异常运行程序、异常数据处理节点,以及异常数据处理节点对应的异常数据处理进程,确定为目标芯片的故障信息。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取异常运行程序的日志记录信息;其中,异常运行程序的日志记录信息包括各数据处理节点的子日志记录信息;根据各数据处理节点的子日志记录信息,确定各个异常运行程序对应的各数据处理节点的数据处理结果。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
针对于异常运行程序对应的任一数据处理节点,若该数据处理节点的数据处理结果存在异常,则确定该数据处理节点为异常程序对应的异常数据处理节点。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
针对于异常数据处理节点中的任一数据处理进程,若该数据处理进程的数据处理状态为异常执行状态,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程;若该数据处理进程的数据处理状态为正常执行状态,则根据该数据处理进程的数据处理速率,确定该数据处理进程是否为异常数据处理节点中的异常数据处理进程。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
将该数据处理进程的数据处理速率与该数据处理进程的历史处理速率进行比对,若比对结果超过波动阈值,则确定该数据处理进程为异常数据处理节点中的异常数据处理进程。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
异常数据处理节点、异常数据处理节点对应的异常数据处理进程,以及异常数据处理进程的处理时间,确定为目标芯片的故障信息。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (10)

1.一种芯片故障定位方法,其特征在于,所述方法包括:
获取目标芯片上的各运行程序;其中,运行程序通过所述目标芯片上的至少一个数据处理节点执行数据处理任务;
根据各运行程序的运行状态,确定异常运行程序;
根据所述异常运行程序对应的各数据处理节点的数据处理结果,确定所述异常程序对应的异常数据处理节点;
根据所述异常数据处理节点中各数据处理进程的数据处理状态,确定所述异常数据处理节点中的异常数据处理进程;
将所述异常运行程序、所述异常数据处理节点,以及所述异常数据处理节点对应的异常数据处理进程,确定为所述目标芯片的故障信息。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述异常运行程序的日志记录信息;其中,所述异常运行程序的日志记录信息包括所述异常运行程序对应的各数据处理节点的子日志记录信息;
根据各数据处理节点的子日志记录信息,确定所述异常运行程序对应的各数据处理节点的数据处理结果。
3.根据权利要求1所述的方法,其特征在于,所述根据所述异常运行程序对应的各数据处理节点的数据处理结果,确定所述异常程序对应的异常数据处理节点,包括:
针对于所述异常运行程序对应的任一数据处理节点,若该数据处理节点的数据处理结果存在异常,则确定该数据处理节点为所述异常程序对应的异常数据处理节点。
4.根据权利要求1所述的方法,其特征在于,所述数据处理进程的数据处理状态包括异常执行状态和正常执行状态;所述根据所述异常数据处理节点中各数据处理进程的数据处理状态,确定所述异常数据处理节点中的异常数据处理进程,包括:
针对于所述异常数据处理节点中的任一数据处理进程,若该数据处理进程的数据处理状态为所述异常执行状态,则确定该数据处理进程为所述异常数据处理节点中的异常数据处理进程;
若该数据处理进程的数据处理状态为所述正常执行状态,则根据该数据处理进程的数据处理速率,确定该数据处理进程是否为所述异常数据处理节点中的异常数据处理进程。
5.根据权利要求4所述的方法,其特征在于,所述根据该数据处理进程的数据处理速率,确定该数据处理进程是否为所述异常数据处理节点中的异常数据处理进程,包括:
将该数据处理进程的数据处理速率与该数据处理进程的历史处理速率进行比对,若比对结果超过波动阈值,则确定该数据处理进程为所述异常数据处理节点中的异常数据处理进程。
6.根据权利要求1所述的方法,其特征在于,所述将所述异常运行程序、所述异常数据处理节点,以及所述异常数据处理节点对应的异常数据处理进程,确定为所述目标芯片的故障信息,包括:
所述异常数据处理节点、所述异常数据处理节点对应的异常数据处理进程,以及所述异常数据处理进程的处理时间,确定为所述目标芯片的故障信息。
7.一种芯片故障定位装置,其特征在于,所述装置包括:
获取模块:用于获取目标芯片上的各运行程序;其中,运行程序通过所述目标芯片上的至少一个数据处理节点执行数据处理任务;
程序确定模块:用于根据各运行程序的运行状态,确定异常运行程序;
节点确定模块:用于根据所述异常运行程序对应的各数据处理节点的数据处理结果,确定所述异常程序对应的异常数据处理节点;
进程确定模块:用于根据所述异常数据处理节点中各数据处理进程的数据处理状态,确定所述异常数据处理节点中的异常数据处理进程;
故障确定模块:用于将所述异常数据处理节点,以及所述异常数据处理节点对应的异常数据处理进程,确定为所述目标芯片的故障信息。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
CN202311857589.2A 2023-12-29 2023-12-29 芯片故障定位方法、装置、计算机设备和存储介质 Pending CN118113530A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202311857589.2A CN118113530A (zh) 2023-12-29 2023-12-29 芯片故障定位方法、装置、计算机设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202311857589.2A CN118113530A (zh) 2023-12-29 2023-12-29 芯片故障定位方法、装置、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
CN118113530A true CN118113530A (zh) 2024-05-31

Family

ID=91207754

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311857589.2A Pending CN118113530A (zh) 2023-12-29 2023-12-29 芯片故障定位方法、装置、计算机设备和存储介质

Country Status (1)

Country Link
CN (1) CN118113530A (zh)

Similar Documents

Publication Publication Date Title
CN114089921A (zh) 电力***数据存储方法、装置、计算机设备和存储介质
CN116894721A (zh) 一种指标预测方法、装置、计算机设备
CN118113530A (zh) 芯片故障定位方法、装置、计算机设备和存储介质
CN114201271A (zh) 节点确定方法、装置、计算机设备、存储介质
CN114528045B (zh) 插件操作方法、装置、计算机设备和存储介质
CN114036171B (zh) 应用数据管理方法、装置、计算机设备和存储介质
CN116521546A (zh) 接口性能的调整方法、装置、计算机设备及存储介质
CN117951135A (zh) 数据处理方法、装置、计算机设备和存储介质
CN116681203A (zh) 基于大数据分析的企业管理咨询方法与***
CN118295664A (zh) 代码生成方法、装置、计算机设备、存储介质和产品
CN117076274A (zh) 性能确定方法、装置、计算机设备和存储介质
CN117875232A (zh) 芯片异常识别方法、装置、计算机设备和存储介质
CN116245637A (zh) 变量生成方法、装置、计算机设备和存储介质
CN114138196A (zh) 电力***数据存储方法、装置、计算机设备和存储介质
CN115270766A (zh) 一种针对长文本提取结果的数据质量校验方法
CN118035052A (zh) 一种断点事件的处理方法、装置、计算机设备
CN118338337A (zh) 可靠性检测方法、装置、计算机设备和存储介质
CN116910039A (zh) 异常数据检测方法、装置、设备、存储介质和程序产品
CN117908825A (zh) 芯片数据的按序处理方法、装置、计算机设备和存储介质
CN117312653A (zh) 服务策略确定方法、装置、计算机设备和存储介质
CN116910115A (zh) 客群查询方法、装置、计算机设备和存储介质
CN117376114A (zh) 参数配置方法、装置、计算机设备和存储介质
CN116894031A (zh) 一种数据质量检测方法、装置、计算机设备
CN118158094A (zh) 配置信息处理方法、装置、网络设备和存储介质
CN117909093A (zh) 针对芯片接口的数据分配处理方法和装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination