CN116185689A - 错误信息注入能力的配置方法、验证方法、设备和介质 - Google Patents

错误信息注入能力的配置方法、验证方法、设备和介质 Download PDF

Info

Publication number
CN116185689A
CN116185689A CN202310154396.4A CN202310154396A CN116185689A CN 116185689 A CN116185689 A CN 116185689A CN 202310154396 A CN202310154396 A CN 202310154396A CN 116185689 A CN116185689 A CN 116185689A
Authority
CN
China
Prior art keywords
capability
error information
error
target device
injection
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310154396.4A
Other languages
English (en)
Inventor
张善伟
谭凌云
黄伟
邓治国
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Yuxian Microelectronics Co ltd
Original Assignee
Shanghai Yuxian Microelectronics Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shanghai Yuxian Microelectronics Co ltd filed Critical Shanghai Yuxian Microelectronics Co ltd
Priority to CN202310154396.4A priority Critical patent/CN116185689A/zh
Publication of CN116185689A publication Critical patent/CN116185689A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F13/00Interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F13/38Information transfer, e.g. on bus
    • G06F13/42Bus transfer protocol, e.g. handshake; Synchronisation
    • G06F13/4282Bus transfer protocol, e.g. handshake; Synchronisation on a serial bus, e.g. I2C bus, SPI bus
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2213/00Indexing scheme relating to interconnection of, or transfer of information or other signals between, memories, input/output devices or central processing units
    • G06F2213/0026PCI express
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

本申请涉及一种错误信息注入能力的配置方法、验证方法、设备和介质,所述方法包括:确定用于提供错误信息注入能力格式的扩展能力数据结构;根据扩展能力数据结构对目标设备的扩展能力寄存器进行配置,以使***软件根据扩展能力寄存器的配置信息对目标设备执行错误信息注入操作;其中,所述目标设备包括高速串行计算机扩展总线标准设备。通过自定义的扩展能力数据结构,对目标设备的扩展能力寄存器进行配置,使不同目标设备存储相同的关于错误信息注入能力的属性信息,由此提供了统一的错误信息注入机制的软件接口,以使***软件根据扩展能力寄存器的配置信息对目标设备执行错误信息注入操作,简化对目标设备的错误信息注入的验证过程。

Description

错误信息注入能力的配置方法、验证方法、设备和介质
技术领域
本申请涉及计算机技术领域,特别是涉及一种错误信息注入能力的配置方法、验证方法、设备和介质。
背景技术
高速串行计算机扩展总线标准(peripheral component interconnect express,PCIE)属于高速串行点对点双通道高带宽传输,所连线的设备分配独享通道频宽,不共享汇流排频宽,PCIE的主要优势之一是数据传输速率高,具有相当大的发展潜力和***设计灵活性,而PCIE设备在计算机***中若出现故障,通常会导致***性能降低,甚至发生宕机和重启等现象,易影响业务的正常运行,故可以通过向PCIE设备进行错误信息的注入,对PCIE设备的运行状态进行评估,以保证服务器***的工作稳定性。然而,不同PCIE设备对于错误信息注入能力的属性配置不同,导致软件接口不统一,进而使***软件对PCIE设备的错误信息注入的测试验证复杂化。
发明内容
基于此,有必要针对现有技术中针对PCIE设备在错误信息信息注入方面没有一个统一的软件接口的问题提供一种错误信息注入能力的配置方法、验证方法、设备和介质。
为了实现上述目的,本申请提供了一种错误信息注入能力的配置方法,所述方法包括:
确定用于提供错误信息注入能力格式的扩展能力数据结构;
根据所述扩展能力数据结构对目标设备的扩展能力寄存器进行配置,以使***软件根据所述扩展能力寄存器的配置信息对所述目标设备执行错误信息注入操作;
其中,所述目标设备包括高速串行计算机扩展总线标准设备。
在其中一个实施例中,所述扩展能力数据结构包括标头部分和需求写入部分;所述确定用于提供错误信息注入能力格式的扩展能力数据结构包括:
确定所述标头部分中的扩展能力标头和错误信息注入能力标头;
确定所述需求写入部分中的所述目标设备的错误信息注入能力策略;
其中,所述扩展能力标头用于指示所述目标设备的性质和版本信息,所述错误信息注入能力标头用于指示后续的所述需求写入部分将提供所述错误信息注入能力策略。
在其中一个实施例中,所述需求写入部分包括第一部分;所述确定所述需求写入部分中的所述目标设备的错误信息注入能力策略包括:
确定所述第一部分所需占据的多个第一比特位置,各所述第一比特位置被配置有对应的错误事件类型;
根据所述目标设备能够支持的所述错误事件类型的注入能力,在各所述第一比特位置对应写入第一设定值,以形成所述目标设备的错误信息注入能力的查询策略;
其中,所述查询策略用于提供所述***软件查询所述目标设备所支持的错误事件类型的注入能力。
在其中一个实施例中,所述根据所述目标设备能够支持的所述错误事件类型的注入能力,在各所述第一比特位置对应写入第一设定值包括:
若所述第一比特位置的第一设定值为1,则指示所述目标设备支持所述第一比特位置对应的错误事件类型的注入能力;
若所述第一比特位置的第一设定值为0,则指示所述目标设备不支持所述第一比特位置对应的错误事件类型的注入能力。
在其中一个实施例中,所述需求写入部分还包括第二部分,所述确定所述需求写入部分中的所述目标设备的错误信息注入能力策略,还包括:
确定所述第二部分所需占据的多个第二比特位置,多个所述第二比特位置与多个所述第一比特位置一一对应;
基于外部输入的目标执行信息对各所述第二比特位置的第二设定值进行置位,以形成所述目标设备的错误信息注入能力的执行策略,所述目标执行信息与各所述第一比特位置的第一设定值相关联,所述执行策略用于指示所述***软件执行错误信息注入操作。
在其中一个实施例中,所述错误事件类型包括多种不可纠正错误事件和/或多种可纠正错误事件。在其中一个实施例中,
在其中一个实施例中,所述错误信息注入能力标头包括功能标识字段和功能版本字段;所述确定所述标头部分中的错误信息注入能力标头包括:
对应于所述功能标识字段,确定所述扩展能力数据结构的功能标识号,所述功能标识号用于指示后续的存储空间将提供所述需求写入部分;
对应于所述功能版本字段,确定所述扩展能力数据结构的功能版本号,所述功能版本号用于指示所述***软件对所述需求写入部分进行解析处理。
在其中一个实施例中,所述扩展能力标头包括扩展标识字段和扩展版本字段,所述确定所述标头部分中的扩展能力标头包括:
对应于所述扩展标识字段,确定所述目标设备的扩展标识号,所述扩展标识号用于指示所述目标设备厂家的标识信息;
对应于所述扩展版本字段,确定所述目标设备的扩展版本号,所述扩展版本号用于指示所述目标设备厂家的扩展能力版本信息。
本申请提供一种验证方法,包括:
如上所述的错误信息注入能力的配置方法;
获取目标设备的扩展能力寄存器的配置信息,根据所述配置信息对目标设备执行错误信息注入操作;
根据所述目标设备响应于所述错误信息注入操作的处理结果验证所述目标设备对错误信息的处理能力。
本申请提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。
本申请提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
上述错误信息注入能力的配置方法,通过自定义的扩展能力数据结构,对目标设备的扩展能力寄存器进行配置,使不同目标设备存储相同的关于错误信息注入能力的属性信息,由此提供了统一的错误信息注入机制的软件接口,以使***软件根据扩展能力寄存器的配置信息对目标设备执行错误信息注入操作,简化对目标设备的错误信息注入的验证过程。
附图说明
为了更清楚地说明本申请实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为一实施例中提供的错误信息注入能力的配置方法的流程示意图;
图2为一实施例中提供的扩展能力标头的第一标头示意图;
图3为一实施例中提供的扩展能力标头的第二标头示意图;
图4为一实施例中提供的错误信息注入能力标头示意图;
图5为一实施例中提供的不可纠正错误信息注入能力寄存器示意图;
图6为一实施例中提供的可纠正错误信息注入能力寄存器示意图;
图7为一实施例中提供的不可纠正错误信息注入使能寄存器示意图;
图8为一实施例中提供的可纠正错误信息注入使能寄存器示意图;
图9为一实施例中提供的验证方法的流程示意图。
具体实施方式
为了便于理解本申请,下面将参照相关附图对本申请进行更全面的描述。附图中给出了本申请的实施例。但是,本申请可以以许多不同的形式来实现,并不限于本文所描述的实施例。相反地,提供这些实施例的目的是使本申请的公开内容更加透彻全面。
除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中在本申请的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本申请。
在此使用时,单数形式的“一”、“一个”和“所述/该”也可以包括复数形式,除非上下文清楚指出另外的方式。还应当理解的是,术语“包括/包含”或“具有”等指定所陈述的特征、整体、步骤、操作、组件、部分或它们的组合的存在,但是不排除存在或添加一个或更多个其他特征、整体、步骤、操作、组件、部分或它们的组合的可能性。同时,在本说明书中,术语“和/或”包括相关所列项目的任何及所有组合。
请参阅图1,本申请提供一种错误信息注入能力的配置方法,所述方法包括步骤S100和步骤S200。
步骤S100:确定用于提供错误信息注入能力格式的扩展能力数据结构。其中,所述扩展能力数据结构为目标设备引入一个新的自定义扩展能力,所述目标设备包括高速串行计算机扩展总线标准PCIE设备。
可选地,目标设备包括但不限于网卡、声卡、显卡、图像处理器卡和通信接口卡等符合外设组件互联标准的PCIE设备,本申请对目标设备的类型不做限定。而PCIE设备作为计算机***的***设备,其安装在计算机***的PCIE插槽中,通过PCIE总线与计算机***通信。
进一步地,每个PCIE设备包括PCIE基本配置空间和PCIE扩展配置空间。由于PCIE是在PCI的基础上发展的协议,为了兼容PCI,PCIE基本配置空间(整个配置空间的前256字节)与PCI保持一致,其中的前64字节是标准配置空间头,该标准配置空间头分为type0和type1两种,type0主要是针对PCI的终端(endpoint)设备,type1主要是针对PCI桥设备和交换器设备,type0和type1的配置信息是用于指示该PCIE设备的类型和所属厂家等相关的基本属性。
而PCIE基本配置空间的后面192字节是能力(Capability)结构,所述能力结构用于展示PCI所能提供的“能力”,所述能力即为功能、特性,其包括与电源管理相关、与PCIE总线相关、与中断请求相关等能力结构。
进一步地,当进入PCIE时代,192字节不足以展示PCIE增加的功能特性,为了保持后向兼容PCI的能力结构,PCIE将原先256字节的基本配置空间扩展成4KB,即前面256字节的PCIE基本配置空间仍保持与PCI兼容,而后256~4096字节为PCIE的扩展配置空间,所述扩展配置空间用于存储PCIE设备所独有的一些能力结构,例如高级错误报告(AdvancedError Reporting,AER)和虚拟化(Single Root IO Virtualization,SR-IOV)等扩展能力。需要说明的是,整个配置空间就是一系列寄存器的集合,***软件可以读取各寄存器以获得所属PCIE设备的属性信息,也可以通过各寄存器对PCIE设备进行配置。
基于此,随着数据中心数量和规模的急速增长,对计算机***RAS方面的要求越来越高,其中,RAS代表可信(Reliability)、可用(Availablity)以及服务能力(Service-ability),由于PCIE设备在计算机***当中扮演着举足轻重的角色,当PCIE设备出现错误或故障时,会直接影响计算机***的可靠***,故PCIE设备通过在扩展配置空间的特定能力结构中定义高级错误报告AER机制以处理PCIE故障,由此实现向***软件报告PCIE设备当前的错误状态信息,以便对PCIE设备的异常提供及时的技术支持,可最大限度地降低PCIE设备异常对计算机***运行产生的影响。而对于错误信息的搜集和处理,涉及到的软件栈,从底层固件到上层操作***,从带内到带外,从静态错误数据库的建立到动态信息的捕捉更新,是一个***工程。为了及时对PCIE设备进行故障定位、纠正和分析、提供故障解决方案,以增强计算机***的健壮性和可靠性,可以通过主动向PCIE设备注入错误信息以模拟用户的使用过程,并监测和测试目标PCIE设备在错误发生时是否会正确应对,如给出错误提醒或者执行错误校正等响应,从而验证目标PCIE设备对错误的处理能力。
然而在实际工程项目中,对于PCIE设备错误信息注入的测试验证,不同PCIE设备在各自扩展配置空间关于错误信息注入能力结构的定义不同,进而导致无法提供统一的软件接口,提高了***软件处理复杂度。
因此,本申请在现有PCIE规范6.0的基础上,确定一个新的自定义扩展能力数据结构,以提供与现有的高级错误报告AER机制相对应的错误信息注入扩展能力结构体,进而实现软件接口的统一。其中,上述扩展能力数据结构是基于特定于供应商的扩展能力(Designated Vendor Specific Extended Capability,DVSEC)的方式,该扩展能力数据结构用于反映自定义的一套错误信息注入机制的格式,比如能够反映将错误信息注入机制写入扩展能力寄存器时所需要对应写入信息的字段、规定的各个字段的长度以及字段之间的顺序等格式信息。
步骤S200:根据扩展能力数据结构对目标设备的扩展能力寄存器进行配置,以使***软件根据扩展能力寄存器的配置信息对目标设备执行错误信息注入操作。
由于目标设备的扩展配置空间是一系列寄存器的集合,供应商可以使用该扩展能力数据结构定义的错误信息注入机制对寄存器结构进行配置,以形成扩展能力寄存器,也即,扩展能力寄存器是用于实现自定义扩展能力数据结构的寄存器,扩展能力寄存器的比特位置用于写入与错误信息注入能力相关联的信息,进一步地,***软件通过读取扩展能力寄存器的配置信息以对目标设备执行错误信息注入操作。
在上述示例中,通过自定义的扩展能力数据结构,对目标设备的扩展能力寄存器进行配置,使不同目标设备存储相同的关于错误信息注入能力的属性信息,由此提供了统一的错误信息注入机制的软件接口,以使***软件根据扩展能力寄存器的配置信息对目标设备执行错误信息注入操作,简化对目标设备的错误信息注入的验证过程。
在一实施例中,扩展能力数据结构包括标头部分和需求写入部分,步骤S100确定用于提供错误信息注入能力格式的扩展能力数据结构包括步骤S110和步骤S120。
步骤S110:确定标头部分中的扩展能力标头和错误信息注入能力标头。其中,扩展能力标头用于指示目标设备的性质和版本信息。
可以理解,标头部分记录有针对扩展能力数据结构的结构描述信息,具体地,需要先确定标头部分所需的空间大小,进而得到标头部分的数据长度,所述标头部分的数据长度用于指示写入标头部分的信息所需的比特位置。进一步地,扩展能力数据结构在标头部分规定了需要写入的字段和字段对应的比特位数,对应地,目标设备所属厂家则按照标头部分中的字段和字段对应的比特位数,将与字段匹配的信息写入到标头部分对应的扩展寄存器中。具体地,标头部分又分为扩展能力标头和错误信息注入能力标头,所述扩展能力标头的格式用于指示寄存器为扩展能力寄存器,及该扩展能力寄存器对应目标设备的相关信息。
步骤S120:确定需求写入部分中的目标设备的错误信息注入能力策略。其中,错误信息注入能力标头用于指示后续的需求写入部分将提供错误信息注入能力策略。
其中,在错误信息注入能力标头之后定义需求写入部分,所述需求写入部分用于指示扩展能力寄存器可以实现哪种扩展机制,在本申请中,该需求写入部分将指示扩展能力寄存器实现错误信息注入能力。具体地,需要先确定需求写入部分所需的空间大小,进而得到需求写入部分的数据长度,所述需求写入部分的数据长度用于指示写入需求写入部分所需的比特位置。进一步地,扩展能力数据结构在需求写入部分规定了需要写入的字段和字段对应的比特位数,对应地,目标设备所属厂家则按照需求写入部分中的字段和字段对应的比特位数,将与字段匹配的信息写入到需求写入部分对应的扩展寄存器中,各所述字段内容组成目标设备的错误信息注入能力策略。
在一实施例中,扩展能力标头包括扩展标识字段和扩展版本字段,步骤S110确定所述标头部分中的扩展能力标头包括步骤S111和步骤S112。
步骤S111:对应于扩展标识字段,确定目标设备的扩展标识号,扩展标识号用于指示目标设备厂家的标识信息。
结合参考图2和图3,图2提供了扩展能力标头的第一标头示意图,图3提供了扩展能力标头的第二标头示意图。扩展能力标头包括第一标头和第二标头,在第一标头中定义有第一扩展标识字段、第一扩展版本字段和下一能力偏移地址字段,第一标头用于指示寄存器为位于扩展配置空间的扩展能力寄存器;在第二标头定义有第二扩展标识字段、第二扩展版本字段和第二扩展标识长度字段,第二标头用于指示目标设备所属厂家的相关信息。
其中,如图2所示,第一扩展标识字段为供应商指定扩展能力标识字段(ExpressExtended Capability ID),根据PCIE4.0及以后的版本,供应商指定扩展能力标识为0x0023,且由于PCIE扩展配置空间中定义有多种扩展能力结构,多个扩展能力结构组成一个链表,通过在下一能力偏移地址字段(Next Capability Offset)写入下一扩展能力寄存器的偏移地址信息,以指针的形式指向下一个新的扩展能力寄存器地址。具体地,第一标头占4个字节长度,第一扩展标识字段占16bit,第一扩展版本字段占4bit,下一能力偏移地址字段占12bit。
进一步地,如图3所示,在第二标头中的第二扩展标识字段为目标设备厂家的标识字段(DVSEC Vendor ID),对应于目标设备厂家的标识字段写入目标设备厂家的标识号。具体地,第二标头占4个字节长度,第二扩展标识字段占16bit,第二扩展版本字段占4bit,第二扩展标识长度字段占12bit,且第二标头的各字段均为只读(Read Only,RO)权限。
步骤S112:对应于扩展版本字段,确定目标设备的扩展版本号,扩展版本号用于指示目标设备厂家的扩展能力版本信息。
其中,如图2所示,第一扩展版本字段为供应商指定扩展能力版本字段(Capability Version),对应于供应商指定扩展能力版本字段写入供应商指定扩展能力版本号。
如图3所示,第二扩展版本字段为目标设备厂家的扩展能力版本字段(DV SECVersion),需要说明的是,对应于目标设备厂家的扩展能力版本字段写入目标设备厂家的扩展能力版本号,可以理解,当DVSEC扩展能力结构的版本新增了其他能力结构体时,需要改变第二扩展版本字段的版本号,以便在增加新功能时***软件能够兼容识别新老版本的DVSEC扩展能力结构。而第二扩展标识长度字段(DVSEC Length)用于指示第二扩展标识字段所占用的数据长度。
在一实施例中,错误信息注入能力标头包括功能标识字段和功能版本字段,步骤S110确定标头部分中的错误信息注入能力标头包括步骤S113和步骤S114。
步骤S113:对应于功能标识字段,确定扩展能力数据结构的功能标识号,功能标识号用于指示后续的存储空间将提供需求写入部分。
具体地,如图4所示,图4提供了错误信息注入能力标头示意图。错误信息注入能力标头的功能标识字段(DVSEC ID)用于指示扩展能力数据结构的性质和格式,对应于功能标识字段写入扩展能力数据结构的功能标识号,以表面接下来的存储空间将提供错误信息注入方面的内容,也即,该功能标识字段可以表明扩展能力数据结构是用来实现错误信息注入机制的。
步骤S114:对应于功能版本字段,确定扩展能力数据结构的功能版本号,功能版本号用于指示***软件对需求写入部分进行解析处理。
具体地,错误信息注入能力标头的功能版本字段(Version)用于表明扩展能力数据结构的版本信息,对应于功能版本字段写入扩展能力数据结构的功能版本号,以使***软件兼容识别不同版本的扩展能力数据结构,进而对错误信息注入写入部分进行解析处理。此外,错误信息注入能力标头还包括功能标识长度字段(Entry Length),该功能标识长度字段用于指示功能标识字段所占用的数据长度。需要说明的是,错误信息注入能力标头占4个字节长度,其中的功能标识字段占16bit,功能版本字段占4bit,功能标识长度字段占12bit,且错误信息注入能力标头的各字段均为只读(Read Only,RO)权限。
在一实施例中,需求写入部分包括第一部分,步骤S120确定需求写入部分中的目标设备的错误信息注入能力策略包括步骤S121和步骤S122。
步骤S121:确定第一部分所需占据的多个第一比特位置,各所述第一比特位置被配置有对应的错误事件类型。
其中,根据PCIE规范定义的已有的错误信息报告能力格式,将需求写入部分的第一部分定义为错误信息注入能力的查询策略。具体地,需要先确定第一部分所需的空间大小,进而得到第一部分的数据长度,所述第一部分的数据长度用于指示第一部分所需占据的第一比特位置。进一步地,各个第一比特位置对应不同的错误事件类型。在另一实施例中,错误事件类型包括多种不可纠正错误事件和/或多种可纠正错误事件,也即,第一种情况是可以在一个需求写入寄存器的各第一比特位置配置相应的不可纠正错误事件;第二种情况是可以在一个需求写入寄存器的各第一比特位置配置相应的可纠正错误事件;第三种情况是可以设置两个需求写入寄存器,一个用于在各第一比特位置配置相应的不可纠正错误事件,而另一个用于在各第一比特位置配置相应的可纠正错误事件,本实施例以第三种情况为例进行解释说明,如图5所示,图5提供了不可纠正错误信息注入能力寄存器示意图,其中各个非保留(Reserved)字段均为配置有对应的不可纠正错误事件的第一比特位置,各个第一比特位置对应的不可纠正错误事件如表1所示。需要说明的是,本申请对不可纠正错误信息注入能力寄存器的第一比特位置的数量、具***置及对应的不可纠正错误事件类型不做限定。
表1
Figure BDA0004093703740000131
进一步地,如图6所示,图6提供了可纠正错误信息注入能力寄存器示意图,其中各个非保留(Reserved)字段均为配置有对应的可纠正错误事件的第一比特位置,各个第一比特位置对应的可纠正错误事件如表2所示。
表2
Figure BDA0004093703740000132
Figure BDA0004093703740000141
需要说明的是,本申请对可纠正错误信息注入能力寄存器的第一比特位置的数量、具***置及对应的可纠正错误事件类型不做限定。
步骤S122:根据目标设备能够支持的错误事件类型的注入能力,在各所述第一比特位置对应写入第一设定值,以形成目标设备的错误信息注入能力的查询策略。其中,所述查询策略用于提供***软件查询目标设备所支持的错误事件类型的注入能力。
可以理解,不可纠正错误信息注入能力寄存器的各第一比特位置对应着不同的不可纠正错误事件,可纠正错误信息注入能力寄存器的各第一比特位置对应着不同的可纠正错误事件,所以各第一比特位置存储的第一设定值用于指示目标设备是否支持对应的错误事件类型的注入,故***软件根据各所述第一设定值的数值可以获取目标设备所支持的错误事件类型,以达到错误信息注入能力查询的效果。
在一实施例中,步骤S122根据目标设备能够支持的错误事件类型的注入能力,在各所述第一比特位置对应写入第一设定值包括步骤S1221和步骤S1222。
步骤S1221:若第一比特位置的第一设定值为1,则指示目标设备支持第一比特位置对应的错误事件类型的注入能力。
对于不可纠正错误信息注入能力寄存器中定义的每一个不可纠正错误事件,若其中相应的比特位置的第一设定值为1,则说明目标设备支持该比特位置对应的不可纠正错误事件的注入能力。对于可纠正错误信息注入能力寄存器中定义的每一个可纠正错误事件,若其中相应的比特位置的第一设定值为1,则说明目标设备支持该比特位置对应的可纠正错误事件的注入能力。
步骤S1222:若第一比特位置的第一设定值为0,则指示目标设备不支持第一比特位置对应的错误事件类型的注入能力。
对于不可纠正错误信息注入能力寄存器中定义的每一个不可纠正错误事件,若其中相应的比特位置的第一设定值为0,则说明目标设备不支持该比特位置对应的不可纠正错误事件的注入能力。对于可纠正错误信息注入能力寄存器中定义的每一个可纠正错误事件,若其中相应的比特位置的第一设定值为0,则说明目标设备不支持该比特位置对应的可纠正错误事件的注入能力。
在一实施例中,需求写入部分还包括第二部分,步骤S120确定需求写入部分中的目标设备的错误信息注入能力策略包括步骤S123和步骤S124。
步骤S123:确定第二部分所需占据的多个第二比特位置,多个第二比特位置与多个第一比特位置一一对应。
其中,所述第二部分针对不可纠正错误信息注入能力寄存器定义为不可纠正错误信息注入使能寄存器,如图7所示,图7提供了不可纠正错误信息注入使能寄存器示意图,其中各第二比特位置代表的不可纠正错误事件类型与不可纠正错误信息注入能力寄存器保持一致。且所述第二部分针对可纠正错误信息注入能力寄存器定义为可纠正错误信息注入使能寄存器,如图8所示,图8提供了可纠正错误信息注入使能寄存器示意图,其中各第二比特位置代表的可纠正错误事件类型与可纠正错误信息注入能力寄存器保持一致。
步骤S124:基于外部输入的目标执行信息对各所述第二比特位置的第二设定值进行置位,以形成目标设备的错误信息注入能力的执行策略,目标执行信息与各所述第一比特位置的第一设定值相关联,执行策略用于指示***软件执行错误信息注入操作。
可以理解,对于不可纠正错误信息注入使能寄存器的各第二比特位置的第二设定值默认为0,当***软件通过查询不可纠正错误信息注入能力寄存器中各第一比特位置的第一设定值为1时,***软件可以根据外部输入的目标执行信息对第二设定值进行选择性置位,即当选择将第二设定值置位为1时,不可纠正错误信息注入使能寄存器将执行使能对应的不可纠正错误事件的注入,当选择对第二设定值不置位时,即第二设定值仍保持为0,不可纠正错误信息注入使能寄存器将不执行使能错误信息的注入。同理,可纠正错误信息注入使能寄存器的工作机制与不可纠正错误信息注入使能寄存器一致,在此不再赘述。基于此,***软件根据所述两个使能寄存器可以实现注入使能不可纠正错误事件和可纠正错误事件的功能。
本实施例以不可纠正错误信息注入能力寄存器的Bit 4为例进行示意,若***软件查询到Bit 4存储的第一设定值为1,则说明目标设备支持Bit 4对应的不可纠正错误事件的注入,进一步地,***软件根据测试人员下发的指令,也即外部输入的目标执行信息,当该目标执行信息指示使能该不可纠正错误事件注入,***软件则对不可纠正错误信息注入使能寄存器中的Bit 4的第二设定值置位为1,从而对目标设备使能注入该不可纠正错误事件,由此可以获取目标设备对该不可纠正错误事件的处理情况,如是否会给出错误提醒或者执行校正;而当该目标执行信息指示不使能该不可纠正错误事件注入,***软件则不置位不可纠正错误信息注入使能寄存器中的Bit 4的第二设定值,使所述第二设定值仍保持为0,从而使目标设备不发生使能注入该不可纠正错误事件;而若***软件查询到Bit 4存储的第一设定值为0,则说明目标设备不支持Bit 4对应的不可纠正错误事件的注入,则不可纠正错误信息注入使能寄存器中的Bit 4的第二设定值将被忽略。
基于此,通过自定义的扩展能力数据结构,***软件能够方便地获取到目标设备是否支持某种错误事件类型的注入以达到错误信息注入能力的查询,以及如何注入某种错误以达到注入使能的效果,进而提升上层软件的迭代复用度,减小错误信息注入的验证时间和人力成本。
本申请提供了一种验证方法,如图9所示,包括如上所述的错误信息注入能力的配置方法,所述验证方法包括步骤S11和步骤S12。
步骤S11:获取目标设备的扩展能力寄存器的配置信息,根据配置信息对目标设备执行错误信息注入操作。基于前述实施例,***软件通过查询不可纠正错误信息注入能力寄存器和可纠正错误信息注入能力寄存器的各第一设定值,可以获取目标设备所能支持的错误事件类型注入,并可根据实际情况,有选择地对目标设备进行一种或多种错误事件的注入。
步骤S12:根据目标设备响应于错误信息注入操作的处理结果验证目标设备对错误信息的处理能力。
可以理解,通过对目标设备主动执行某种或多种错误信息注入操作,以监测目标设备在错误发生时是否会正确应对,如给出错误提醒或者执行错误校正等响应,根据所述响应的结果可以验证目标设备对错误信息的处理能力,从而采取响应的措施来及时调整或修复目标设备的错误处理能力。
本申请提供了一种计算机设备,包括存储器和处理器,该存储器存储有计算机程序,该处理器执行计算机程序时实现如上所述各方法实施例中的步骤。
本申请还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上所述各方法实施例中的步骤。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory,ROM)、磁带、软盘、闪存或光存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic Random Access Memory,DRAM)等。
应该理解的是,虽然图1和图9的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,图1和图9中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
在本说明书的描述中,参考术语“有些实施例”、“其他实施例”、“理想实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特征包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性描述不一定指的是相同的实施例或示例。
上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (11)

1.一种错误信息注入能力的配置方法,其特征在于,所述方法包括:
确定用于提供错误信息注入能力格式的扩展能力数据结构;
根据所述扩展能力数据结构对目标设备的扩展能力寄存器进行配置,以使***软件根据所述扩展能力寄存器的配置信息对所述目标设备执行错误信息注入操作;
其中,所述目标设备包括高速串行计算机扩展总线标准设备。
2.根据权利要求1所述的错误信息注入能力的配置方法,其特征在于,所述扩展能力数据结构包括标头部分和需求写入部分;所述确定用于提供错误信息注入能力格式的扩展能力数据结构包括:
确定所述标头部分中的扩展能力标头和错误信息注入能力标头;
确定所述需求写入部分中的所述目标设备的错误信息注入能力策略;
其中,所述扩展能力标头用于指示所述目标设备的性质和版本信息,所述错误信息注入能力标头用于指示后续的所述需求写入部分将提供所述错误信息注入能力策略。
3.根据权利要求2所述的错误信息注入能力的配置方法,其特征在于,所述需求写入部分包括第一部分;所述确定所述需求写入部分中的所述目标设备的错误信息注入能力策略包括:
确定所述第一部分所需占据的多个第一比特位置,各所述第一比特位置被配置有对应的错误事件类型;
根据所述目标设备能够支持的所述错误事件类型的注入能力,在各所述第一比特位置对应写入第一设定值,以形成所述目标设备的错误信息注入能力的查询策略;
其中,所述查询策略用于提供所述***软件查询所述目标设备所支持的错误事件类型的注入能力。
4.根据权利要求3所述的错误信息注入能力的配置方法,其特征在于,所述根据所述目标设备能够支持的所述错误事件类型的注入能力,在各所述第一比特位置对应写入第一设定值包括:
若所述第一比特位置的第一设定值为1,则指示所述目标设备支持所述第一比特位置对应的错误事件类型的注入能力;
若所述第一比特位置的第一设定值为0,则指示所述目标设备不支持所述第一比特位置对应的错误事件类型的注入能力。
5.根据权利要求3所述的错误信息注入能力的配置方法,其特征在于,所述需求写入部分还包括第二部分,所述确定所述需求写入部分中的所述目标设备的错误信息注入能力策略,还包括:
确定所述第二部分所需占据的多个第二比特位置,多个所述第二比特位置与多个所述第一比特位置一一对应;
基于外部输入的目标执行信息对各所述第二比特位置的第二设定值进行置位,以形成所述目标设备的错误信息注入能力的执行策略,所述目标执行信息与各所述第一比特位置的第一设定值相关联,所述执行策略用于指示所述***软件执行错误信息注入操作。
6.根据权利要求5所述的错误信息注入能力的配置方法,其特征在于,所述错误事件类型包括多种不可纠正错误事件和/或多种可纠正错误事件。
7.根据权利要求2所述的错误信息注入能力的配置方法,其特征在于,所述错误信息注入能力标头包括功能标识字段和功能版本字段;所述确定所述标头部分中的错误信息注入能力标头包括:
对应于所述功能标识字段,确定所述扩展能力数据结构的功能标识号,所述功能标识号用于指示后续的存储空间将提供所述需求写入部分;
对应于所述功能版本字段,确定所述扩展能力数据结构的功能版本号,所述功能版本号用于指示所述***软件对所述需求写入部分进行解析处理。
8.根据权利要求2所述的错误信息注入能力的配置方法,其特征在于,所述扩展能力标头包括扩展标识字段和扩展版本字段,所述确定所述标头部分中的扩展能力标头包括:
对应于所述扩展标识字段,确定所述目标设备的扩展标识号,所述扩展标识号用于指示所述目标设备厂家的标识信息;
对应于所述扩展版本字段,确定所述目标设备的扩展版本号,所述扩展版本号用于指示所述目标设备厂家的扩展能力版本信息。
9.一种验证方法,其特征在于,包括:
如权利要求1至8任一项所述的错误信息注入能力的配置方法;
获取目标设备的扩展能力寄存器的配置信息,根据所述配置信息对目标设备执行错误信息注入操作;
根据所述目标设备响应于所述错误信息注入操作的处理结果验证所述目标设备对错误信息的处理能力。
10.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。
CN202310154396.4A 2023-02-22 2023-02-22 错误信息注入能力的配置方法、验证方法、设备和介质 Pending CN116185689A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310154396.4A CN116185689A (zh) 2023-02-22 2023-02-22 错误信息注入能力的配置方法、验证方法、设备和介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310154396.4A CN116185689A (zh) 2023-02-22 2023-02-22 错误信息注入能力的配置方法、验证方法、设备和介质

Publications (1)

Publication Number Publication Date
CN116185689A true CN116185689A (zh) 2023-05-30

Family

ID=86441962

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310154396.4A Pending CN116185689A (zh) 2023-02-22 2023-02-22 错误信息注入能力的配置方法、验证方法、设备和介质

Country Status (1)

Country Link
CN (1) CN116185689A (zh)

Similar Documents

Publication Publication Date Title
US6970948B2 (en) Configuring system units using on-board class information
CN109710317B (zh) ***启动方法、装置、电子设备及存储介质
US20180293123A1 (en) Detecting Memory Failures in the Runtime Environment
CN114003538B (zh) 一种智能网卡的识别方法及智能网卡
CN107273245B (zh) 运算装置与运作方法
CN107193560B (zh) 配置更新方法及装置
CN110765032A (zh) 基于***管理总线接口对i2c存储器进行读写的方法
CN109840232B (zh) 存储设备及存储设备的元件管理方法
CN111045710B (zh) 一种基于IPMI命令的SAS-Expander固件升级的方法、设备及介质
TWI685791B (zh) 產生bios變更紀錄的方法
CN109542808B (zh) 控制硬盘接入的方法和装置
CN116185689A (zh) 错误信息注入能力的配置方法、验证方法、设备和介质
CN111193818A (zh) 一种获取ip地址的方法、***、设备及介质
CN109298953B (zh) 一种共享内存数据读写的装置和方法
CN117077221A (zh) 一种硬盘丝印分配方法、装置、计算机设备及介质
CN107908418B (zh) 光纤通道节点卡的逻辑程序升级方法及光纤通道总线设备
US20030159102A1 (en) Method for testing a universal serial bus host controller
CN114496053A (zh) 数据异常检测方法、装置、设备及计算机可读存储介质
TWI417888B (zh) An embedded chip system, a method for burning a wafer, and a computer program product
TWI757606B (zh) 伺服器裝置及其基板管理控制器與可程式邏輯單元之間的通訊協定方法
TWI715294B (zh) 基於系統管理匯流排界面對i2c記憶體進行讀寫的方法
CN117271248B (zh) Io接口测试方法、装置及uvm验证环境
TWI841891B (zh) 嵌入式系統與韌體更新方法
CN114490217B (zh) 一种me和bios交互的故障测试方法、装置、设备及可读介质
CN116489014A (zh) 网口绑定方法、装置、通信设备及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination