WO2020078446A1

WO2020078446A1 - 运算方法、装置及相关产品

Info

Publication number: WO2020078446A1
Application number: PCT/CN2019/111852
Authority: WO
Inventors: 兰慧盈; 杜子东
Original assignee: 中科寒武纪科技股份有限公司
Priority date: 2018-10-19
Filing date: 2019-10-18
Publication date: 2020-04-23

Abstract

一种运算方法、装置及相关产品。其中的组合处理装置包括：机器学***台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

Description

运算方法、装置及相关产品

技术领域

本公开涉及信息处理技术领域，特别是涉及一种神经网络指令生成方法、装置及相关产品。

背景技术

随着科技的不断发展，神经网络算法的使用越来越广泛。其在图像识别、语音识别、自然语言处理等领域中都得到了良好的应用。但由于神经网络算法的复杂度越来越高，其模型的规模不断增大。基于图形处理器(Graphics Processing Unit，简称GPU)、中央处理器(Central Processing Unit，简称CPU)的大规模的神经网络模型，要花费大量的计算时间，且耗电量大。相关技术中，对神经网络模型的处理速度进行加快的方式存在无法跨平台处理、处理效率低、开发成本高、易出错等问题。

发明内容

基于此，有必要针对上述技术问题，提供一种神经网络指令生成方法、装置及相关产品，使其能够跨平台使用，提高处理效率，降低出错几率和开发成本。

根据本公开的第一方面，提供了一种神经网络指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的宏指令，确定执行所述宏指令的运行设备；

指令生成模块，用于根据所述宏指令和所述运行设备，生成运行指令。

根据本公开的第二方面，提供了一种机器学习运算装置，所述装置包括：

一个或多个上述第一方面所述的神经网络指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述神经网络指令生成装置时，所述多个所述神经网络指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述神经网络指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述神经网络指令生成装置共享同一控制***或拥有各自的控制***；多个所述神经网络指令生成装置共享内存或者拥有各自的内存；多个所述神经网络指令生成装置的互联方式是任意互联拓扑。

根据本公开的第三方面，提供了一种组合处理装置，所述装置包括：

上述第二方面所述的机器学习运算装置、通用互联接口和其他处理装置；

所述机器学习运算装置与所述其他处理装置进行交互，共同完成用户指定的计算操作。

根据本公开的第四方面，提供了一种机器学习芯片，所述机器学习芯片包括上述第二方面所述的机器学习络运算装置或上述第三方面所述的组合处理装置。

根据本公开的第五方面，提供了一种机器学习芯片封装结构，该机器学习芯片封装结构包括上述第四方面所述的机器学习芯片。

根据本公开的第六方面，提供了一种板卡，该板卡包括上述第五方面所述的机器学习芯片封装结构。

根据本公开的第七方面，提供了一种电子设备，所述电子设备包括上述第四方面所述的机器学习芯片或上述第六方面所述的板卡。

根据本公开的第八方面，提供了一种神经网络指令生成方法，所述方法包括：

根据接收到的宏指令，确定执行所述宏指令的运行设备；

根据所述宏指令和所述运行设备，生成运行指令。

在一些实施例中，所述电子设备包括数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、服务器、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备、交通工具、家用电器、和/或医疗设备。

在一些实施例中，所述交通工具包括飞机、轮船和/或车辆；所述家用电器包括电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机；所述医疗设备包括核磁共振仪、B超仪和/或心电图仪。

本公开实施例所提供的神经网络指令生成方法、装置及相关产品，该装置包括设备确定模块和指令生成模块，设备确定模块用于根据接收到的宏指令，确定执行宏指令的运行设备。指令生成模块用于根据宏指令和运行设备，生成运行指令。该方法、装置及相关产品可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

根据下面参考附图对示例性实施例的详细说明，本公开的其它特征及方面将变得清楚。

附图说明

包含在说明书中并且构成说明书的一部分的附图与说明书一起示出了本公开的示例性实施例、特征和方面，并且用于解释本公开的原理。

图1示出根据本公开实施例的指令生成、处理方法的处理器的示意图。

图2示出根据本公开一实施例的神经网络指令生成装置的框图。

图3示出根据本公开一实施例的神经网络指令生成装置的框图。

图4示出根据本公开一实施例的神经网络指令生成方法的流程图。

图5示出根据本公开一实施例的神经网络指令处理***的框图。

图6示出根据本公开一实施例的神经网络指令处理***的框图。

图7示出根据本公开一实施例的神经网络指令处理方法的流程图。

图8a、图8b示出根据本公开一实施例的神经网络指令生成装置、处理***的应用场景的示意图。

图9a、图9b示出根据本公开一实施例的组合处理装置的框图。

图10示出根据本公开一实施例的板卡的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

应当理解，本公开的权利要求、说明书及附图中的术语“第一”、“第二”、“第零”等是用于区别不同对象，而不是用于描述特定顺序。本公开的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在，但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。

还应当理解，在此本公开说明书中所使用的术语仅仅是出于描述特定实施例的目的，而并不意在限定本公开。如在本公开说明书和权利要求书中所使用的那样，除非上下文清楚地指明其它情况，否则单数形式的“一”、“一个”及“该”意在包括复数形式。还应当进一步理解，在本公开说明书和权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合，并且包括这些组合。

如在本说明书和权利要求书中所使用的那样，术语“如果”可以依据上下文被解释为“当...时”或“一旦”或“响应于确定”或“响应于检测到”。类似地，短语“如果确定”或“如果检测到[所描述条件或事件]”可以依据上下文被解释为意指“一旦确定”或“响应于确定”或“一旦检测到[所描述条件或事件]”或“响应于检测到[所描述条件或事件]”。

根据本公开实施例的指令生成、指令处理方法可应用于处理器中，该处理器可以是通用处理器，例如CPU(Central Processing Unit，中央处理器)，也可以是用于执行人工智能运算的人工智能处理器(IPU)。人工智能运算可包括机器学习运算，类脑运算等。其中，机器学习运算包括神经网络运算、k-means运算、支持向量机运算等。该人工智能处理器可例如包括GPU(Graphics Processing Unit，图形处理单元)、NPU(Neural-Network Processing Unit，神经网络处理单元)、DSP(Digital Signal Process，数字信号处理单元)、现场可编程门阵列(Field－Programmable Gate Array，FPGA)芯片中的一种或组合。本公开对处理器的具体类型不作限制。

在一种可能的实现方式中，本公开中所提及的处理器可包括多个处理单元，每个处理单元可以独立运行所分配到的各种任务，如：卷积运算任务、池化任务或全连接任务等。本公开对处理单元及处理单元所运行的任务不作限制。

图1示出根据本公开实施例的指令生成、处理方法的处理器的示意图。如图1所示，处理器100包括多个处理单元101以及存储单元102，多个处理单元101用于执行指令序列，存储单元102用于存储数据，可包括随机存储器(RAM，Random Access Memory)和寄存器堆。处理器100中的多个处理单元101既可共用部分存储空间，例如共用部分RAM存储空间和寄存器堆，又可同时拥有各自的存储空间。

图2示出根据本公开一实施例的神经网络指令生成装置的框图。如图2所示，该装置包括设备确定模块11和指令生成模块12。设备确定模块11用于根据接收到的宏指令，确定执行宏指令的运行设备。指令生成模块12用于根据宏指令和运行设备，生成运行指令。

在该实现方式中，宏指令是一种批量处理的称谓，宏指令可以是一种规则或模式，或称语法替换，在遇到宏指令时会自动进行这一规则或模式的替换。宏指令可以是对常用的用于对数据进行计算、控制和搬运等处理的待执行指令整合形成的。

在一种可能的实现方式中，宏指令可以包括以下至少一种：计算宏指令、控制宏指令和数据搬运宏指令。其中，计算宏指令可以包括神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令中的至少一种。控制宏指令可以包括无条件跳转宏指令和有条件跳转宏指令中的至少一种。数据搬运宏指令可以包括读宏指令和写宏指令中的至少一种。读宏指令可以包括读神经元宏指令、读突触宏指令和读标量宏指令中的至少一种。写宏指令可以包括写神经元宏指令、写突触宏指令和写标量宏指令中的至少一种。

在一种可能的实现方式中，宏指令可以包含以下选项中的至少一项：用于执行宏指令的指定设备的标识、操作类型、输入地址、输出地址、输入量、输出量、操作数和指令参数。运行指令可以包含以下选项中的至少一项：操作类型、输入地址、输出地址、操作数和指令参数。

其中，指定设备的标识可以是指定设备的物理地址、IP地址、名称、编号等标识。标识可以包括数字、字母、符号中的其中一种或任意组合。在宏指令的指定设备的标识的位置为空时，确定该宏指令无指定设备；或者，在宏指令中不包含“指定设备的标识”这个字段时，确定该宏指令无指定设备。操作类型可以是指该宏指令对数据所进行操作的类型，表征该宏指令的具体类型，如在某宏指令的操作类型为“XXX”时，可以根据“XXX”确定该宏指令对数据所进行的操作的具体类型。根据操作类型可以确定执行该宏指令所需的指令集合，如在某宏指令的操作类型为“XXX”时，其所需的指令集合为进行“XXX”所对应的处理所需的所有指令集。输入地址可以是数据的输入地址、读取地址等获得数据的地址，输出地址可以是被处理后的数据的输出地址、写入地址等存储数据的地址。输入量可以是数据的输入规模、输入长度等表征其数据量大小的信息。输出量可以是数据的输出规模、输出长度等表征其数据量的大小的信息。操作数可以包括寄存器的长度、寄存器的地址、寄存器的标识、立即数等。立即数为在立即寻址方式指令中给出的数。指令参数可以是指对应于该宏指令、与其执行相关的参数。例如，指令参数可以是第二个操作数的地址和长度等。指令参数可以是卷积核的大小、卷积核的步长和卷积核的填充等。

在该实现方式中，对于一个宏指令，其必须包括操作码和至少一个操作域，其中操作码即为操作类型，操作域包括指定设备的标识、输入地址、输出地址、输入量、输出量、操作数和指令参数。操作码可以是计算机程序中所规定的要执行操作的那一部分指令或字段(通常用代码表示)，是指令序列号，用来告知执行指令的装置具体需要执行哪一条指令。操作域可以是执行对应的指令所需的所有数据的来源，执行对应的指令所需的所有数据包括参数数据、待运算或待处理的数据、对应的运算方法，或者存储参数数据、待运算或待处理的数据、对应的运算方法的地址等等。

应当理解的是，本领域技术人员可以根据需要对宏指令的指令格式以及所包含的内容进行设置，本公开对此不作限制。

在本实施例中，设备确定模块11可以根据宏指令确定一个或多个运行设备。指令生成模块12可以生成一个或多个运行指令。在生成的运行指令为多个时，多个运行指令可以在同一个运行设备中被执行，也可以在不同的运行设备中被执行，本公开对此不作限制。

本公开实施例所提供的神经网络指令生成装置包括设备确定模块和指令生成模块，设备确定模块用于根据接收到的宏指令，确定执行宏指令的运行设备。指令生成模块用于根据宏指令和运行设备，生成运行指令。该装置可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

图3示出根据本公开一实施例的神经网络指令生成装置的框图。在一种可能的实现方式中，如图3所示，该装置还可以包括宏指令生成模块13。宏指令生成模块13用于接收待执行指令，根据确定的指定设备的标识和待执行指令生成宏指令。

在该实现方式中，指定设备可以是根据待执行指令的操作类型、输入量、输出量等确定的。所接收到的待执行指令可以是一条，也可以是多条。

待执行指令可以包括以下至少一种：待执行计算指令、待执行控制指令和待执行数据搬运指令。其中，待执行计算指令可以包括待执行神经网络计算指令、待执行向量逻辑计算指令、待执行矩阵向量计算指令、待执行标量计算指令和待执行标量逻辑计算指令中的至少一种。待执行控制指令可以包括待执行无条件跳转指令和待执行有条件跳转指令中的至少一种。待执行数据搬运指令可以包括待执行读指令和待执行写指令中的至少一种。待执行读指令可以包括待执行读神经元指令、待执行读突触指令和待执行读标量指令中的至少一种。待执行写指令可以包括待执行写神经元指令、待执行写突触指令和待执行写标量指令中的至少一种。

待执行指令可以包含以下选项中的至少一项：操作类型、输入地址、输出地址、输入量、输出量、操作数和指令参数。

在该实现方式中，在待执行指令为一个时，可以将确定的指定设备的标识添加到待执行指令中，生成宏指令。举例来说，某待执行指令m为“XXX……param)”。其中，XXX为操作类型，param为指令参数。可以根据该待执行指令m的操作类型“XXX”确定其指定设备m-1。然后，在待执行指令m中添加指定设备m-1的标识(例如，09)，生成对应该待执行指令m的宏指令M“XXX 09,……param”。在待执行指令为多个时，可以将确定的每个待执行指令所对应的指定设备的标识添加到待执行指令中，根据带有指定设备的标识的多个待执行指令，生成一个宏指令，或者生成对应的多个宏指令。

应当理解的是，本领域技术人员可以根据需要对待执行指令的指令格式以及所包含的内容进行设置，本公开对此不作限制。

在一种可能的实现方式中，如图3所示，设备确定模块11可以包括第一确定子模块111。第一确定子模块111用于在确定宏指令中包含指定设备的标识，且指定设备的资源满足执行宏指令的执行条件时，将指定设备确定为运行设备。其中，执行条件可以包括：指定设备中包含与宏指令相对应的指令集。

在该实现方式中，宏指令中可以包含执行宏指令的一个或多个指定设备的标识。在宏指令中包含指定设备的标识，且指定设备的资源满足执行条件时，第一确定子模块111可以直接将指定设备确定为运行设备，节省基于宏指令生成运行指令的生成时间，且可以保证所生成的运行指令能够被对应的运行设备所执行。

在一种可能的实现方式中，如图3所示，该装置还可以包括资源获取模块14。设备确定模块11还可以包括第二确定子模块112。资源获取模块14用于获取备选设备的资源信息。第二确定子模块112用于在确定宏指令中不包含指定设备的标识时，根据接收到的宏指令和备选设备的资源信息，从备选设备中确定出用于执行宏指令的运行设备。其中，资源信息可以包括备选设备所包含的指令集。备选设备所包含的指令集可以是对应于一种或多种宏指令的操作类型的指令集合。备选设备所包含的指令集越多，备选设备能够执行的宏指令的类型越多。

在该实现方式中，第二确定子模块112在确定宏指令中不包含指定设备的标识时，可以从备选设备中确定出能够执行宏指令的一个或多个运行设备。其中，所确定的运行设备的指令集中包括与宏指令相对应的指令集合。例如，接收到的宏指令为神经网络计算宏指令，可将包含对应于神经网络计算宏指令的指令集的备选设备确定为运行设备，以保证其可以运行生成的运行指令。

在一种可能的实现方式中，如图3所示，设备确定模块11还可以包括第三确定子模块113。第三确定子模块113在确定宏指令中包含指定设备的标识，且指定设备的资源不满足执行宏指令的执行条件时，根据宏指令和备选设备的资源信息，确定运行设备。

在该实现方式中，第三确定子模块113在确定宏指令中包含指定设备的标识，且指定设备的资源不满足执行条件时，可以认定该宏指令的指定设备不具备执行宏指令的能力。第三确定子模块113可以从备选设备中确定运行设备，可以将包含与宏指令相对应的指令集的备选设备确定为运行设备。

在一种可能的实现方式中，如图3所示，宏指令可以包含输入量和输出量中的至少一项，指令生成模块12还用于确定宏指令的数据量，根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令。其中，宏指令的数据量可以是根据输入量和输出量中的至少一项确定的，运行设备的资源信息还可以包括存储容量、剩余存储容量的至少一项。

其中，运行设备的存储容量可以是指运行设备的存储器可以容纳的二进制信息量。运行设备的剩余存储容量可以是指去除被占用的存储容量之后，运行设备当前所能用于指令运行的存储容量。运行设备的资源信息能够表征该运行设备的运行能力。存储容量越大、剩余存储容量越大，运行设备的运行能力越强。

在该实现方式中，指令生成模块12可以根据每个运行设备的资源信息、宏指令的数据量等，确定拆分宏指令的具体方式，以对宏指令进行拆分，生成与运行设备相对应的运行指令。

在一种可能的实现方式中，如图3所示，指令生成模块12可以包括第一指令生成子模块121。第一指令生成子模块121用于在确定运行设备为一个，且在运行设备的资源不满足执行宏指令的容量条件时，根据运行设备的运行数据量和数据量将宏指令拆分成多条运行指令，以使运行设备依次执行多条运行指令。其中，运行设备的运行数据量可以是根据运行设备的资源信息确定的，每条运行指令可以包含运行输入量和运行输出量中的至少一项，运行输入量和运行输出量可以是根据运行数据量确定的。

在该实现方式中，运行设备的运行数据量可以是根据运行设备的存储容量或剩余存储容量确定的。容量条件可以是运行设备的运行数据量大于或等于宏指令的数据量，换言之，运行设备的资源不满足执行宏指令的容量条件可以是指：运行设备的运行数据量小于宏指令的数据量。运行输入量和运行输出量需小于或等于运行数据量，以保证所生成的运行指令可以被运行设备执行。多个运行指令中不同运行指令的运行输入量(或运行输出量)可以相同，也可以不同，本公开对此不作限制。

在该实现方式中，第一指令生成子模块121在确定运行设备为一个，且在运行设备的资源满足执行宏指令的容量条件时，可以直接将宏指令转化为一个运行指令，还可以将宏指令拆分为多个运行指令，本公开对此不作限制。

在一种可能的实现方式中，如图3所示，指令生成模块12可以包括第二指令生成子模块122。第二指令生成子模块122用于在确定运行设备为多个时，根据每个运行设备的运行数据量和数据量对宏指令进行拆分，生成对应于每个运行设备的运行指令。其中，每个运行设备的运行数据量可以是根据每个运行设备的资源信息确定的，运行指令可以包含运行输入量和运行输出量中的至少一项，运行输入量和运行输出量是根据执行运行指令的运行设备的运行数据量确定的。

在该实现方式中，运行输入量和运行输出量需小于或等于运行数据量，以保证所生成的运行指令可以运行设备执行。第二指令生成子模块122可以根据每个运行设备的运行数据量，为每个运行设备生成一个或多个运行指令，以供对应的运行设备执行。

在上述实现方式中，运行指令中包含运行输入量运行输出量中的至少一项，除了可以限定运行指令的数据量，使其能够被对应的运行设备执行之外。还可以满足不同运行指令对运行输入量和/或运行输出量的特殊限定需求。

在一种可能的实现方式中，对于一些对运行输入量和/或运行输出量没有特殊限定需求的运行指令，其中可以不包含运行输入量和/或运行输出量，可以预先设置默认运行输入量和默认运行输出量，使得运行设备在确定接收到的运行指令中不存在运行输入量、运行输出量时，可以将默认运行输入量、默认运行输出量作为该运行指令的运行输入量、运行输出量。通过预设默认运行输入量和默认运行输出量的方式，可以简化运行指令的生成过程，节省运行指令的生成时间。

在一种可能的实现方式中，可以将预先设置针对不同类型的宏指令的默认输入量和默认输出量。在宏指令中不包含输入量和输出量时，可以将对应的预先设置的默认输入量和默认输出量作为宏指令的输入量和输出量。进而根据默认输入量和/或默认输出量确定宏指令的数据量，并根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令。在宏指令中不包含输入量和输出量时，所生成的运行指令可以不包含运行输入量和运行输出量，也可以包含运行输入量和运行输出量中的至少一项。在运行指令中不包含运行输入量和/或运行输出量时，运行设备可以根据预先设置的默认运行输入量和/或默认运行输出量执行运行指令。

在一种可能的实现方式中，指令生成模块12还可以根据宏指令以及预先设置的宏指令拆分规则，对宏指令进行拆分生成运行指令。宏指令拆分规则可以是根据常规的宏指令拆分方式(例如，根据宏指令的处理过程等进行拆分)，结合所有备选设备能够执行的指令的运行数据量阈值确定的。将宏指令拆分成运行输入量以及运行输出量均小于或等于运行数据量阈值的运行指令，以保证生成的运行指令可以在其对应的运行设备(运行设备为备选设备中的任意一个)中被执行。其中，可以比较所有备选设备的存储容量(或剩余存储容量)，将确定出的最小的存储容量(或剩余存储容量)确定为所有备选设备能够执行的指令的运行数据量阈值。

应当理解的是，本领域技术人员可以根据实际需要对运行指令的生成方式进行设置，本公开对此不作限制。

在本实施例中，指令生成模块根据宏指令所生成的运行指令可以是待执行指令，也可以是对待执行指令进行解析所获得的解析后的一个或多个指令，本公开对此不作限制。

在一种可能的实现方式中，如图3所示，该装置还可以包括队列构建模块15。队列构建模块15用于根据队列排序规则对运行指令进行排序，根据排序后的运行指令构建与运行设备相对应的指令队列。

在该实现方式中，可以为每个运行设备构建与之唯一对应的指令队列。可以按照指令队列中运行指令的排序，依次向指令队列唯一对应的运行设备发送运行指令；或者可以将指令队列发送至运行设备，以使运行设备按照指令队列中运行指令的排序依次执行其中的运行指令。通过上述方式，可保证运行设备按照指令队列执行运行指令，避免运行指令被错误、延误执行，避免运行指令被遗漏执行。

在该实现方式中，队列排序规则可以是根据执行运行指令的预计执行时长、运行指令的生成时间、与运行指令自身相关的运行输入量、运行输出量、操作类型等信息确定的，本公开对此不作限制。

在一种可能的实现方式中，如图3所示，该装置还可以包括指令分派模块16。指令分派模块16用于将运行指令发送至运行设备，以使运行设备执行运行指令。

在该实现方式中，在运行设备所执行的运行指令为一个时，可以直接将该运行指令发送至运行设备。在运行设备所执行的运行指令为多个时，可以将多个运行指令全部发送至运行设备，以使运行设备依次执行多个运行指令。还可以将多个运行指令依次发送给与之对应的运行设备，其中，每次在运行设备执行完成当前运行指令之后，向运行设备发送与之对应的下一个运行指令。本领域技术人员可以对向运行设备发送运行指令的方式进行设置，本公开对此不作限制。

在一种可能的实现方式中，如图3所示，指令分派模块16可以包括指令汇编子模块161、汇编翻译子模块162和指令发送子模块163。指令汇编子模块161用于根据所述运行指令生成汇编文件。汇编翻译子模块162用于将汇编文件翻译成二进制文件。指令发送子模块163用于将二进制文件发送至运行设备，以使运行设备根据二进制文件执行运行指令。

通过上述方式，可以降低运行指令的数据量，节省向运行设备发送运行指令的时间，提高宏指令的转换、执行速度。

在该实现方式中，在二进制文件被发送至运行设备之后，运行设备可以对接收到的二进制文件进行译码获得对应的运行指令，并执行所获得的运行指令，获得执行结果。

在一种可能的实现方式中，运行设备可以为CPU、GPU和嵌入式神经网络处理器(Neural-network Processing Unit，简称NPU)中的其中一种或任意组合。这样，提高了装置根据宏指令生成运行指令的速度。

在一种可能的实现方式中，该装置可以设置于CPU和/或NPU中。以实现通过CPU和/或NPU实现根据宏指令生成运行指令的过程，为装置的实现提供了更多的可能方式。

本公开提供一种运行设备，该运行设备用于执行上述神经网络指令生成装置所生成的运行指令。该运行设备包括控制模块和执行模块。控制模块用于获取数据、神经网络模型以及运行指令，还可以用于对运行指令进行解析，获得多个解析指令，并将多个解析指令和数据发送至执行模块。执行模块用于根据数据执行多个解析指令，得到执行结果。

在一种可能的实现方式中，运行设备还包括存储模块。该存储模块可以包括寄存器和缓存中的至少一种，缓存可以包括高速暂存缓存。缓存可以用于存储数据。寄存器可以用于存储数据中的标量数据。

在一种可能的实现方式中，控制模块可以包括指令存储子模块和指令处理子模块。指令存储子模块用于存储运行指令。指令处理子模块用于对运行指令进行解析，得到多个解析指令。

在一种可能的实现方式中，控制模块还可以包括存储队列子模块。存储队列子模块用于存储运行指令队列，该运行指令队列中包含运行设备所需执行的运行指令以及多个解析指令。在运行指令队列中所有指令按照执行的先后顺序依次排列。

在一种可能的实现方式中，执行模块还可以包括依赖关系处理子模块。依赖关系处理子模块用于在确定第一解析指令与第一解析指令之前的第零解析指令存在关联关系时，将第一解析指令缓存在指令存储子模块中，在第零解析指令执行完毕后，从指令存储子模块中提取第一解析指令发送至执行模块。

其中，第一解析指令与第一解析指令之前的第零解析指令存在关联关系可以包括：存储第一解析指令所需数据的第一存储地址区间与存储第零解析指令所需数据的第零存储地址区间具有重叠区域。反之，第一解析指令与第零解析指令之间没有关联关系可以是第一存储地址区间与第零存储地址区间没有重叠区域。

本公开提供一种神经网络指令处理***，该***包括上述神经网络指令生成装置和上述运行设备。

需要说明的是，尽管以上述实施例作为示例介绍了神经网络指令生成装置、运行设备、神经网络指令处理***如上，但本领域技术人员能够理解，本公开应不限于此。事实上，用户完全可根据个人喜好和/或实际应用场景灵活设定各模块，只要符合本公开的技术方案即可。

图4示出根据本公开一实施例的神经网络指令生成方法的流程图。如图4所示，该方法应用于上述神经网络指令生成装置，该方法包括步骤S41和步骤S42。在步骤S41中，根据接收到的宏指令，确定执行宏指令的运行设备。在步骤S42中，根据宏指令和运行设备，生成运行指令。

在一种可能的实现方式中，步骤S41可以包括：在确定宏指令中包含指定设备的标识，且指定设备的资源满足执行宏指令的执行条件时，将指定设备确定为运行设备。其中，执行条件可以包括：指定设备中包含与宏指令相对应的指令集。

在一种可能的实现方式中，该方法还可以包括：获取备选设备的资源信息。其中，步骤S41还可以包括：在确定宏指令中不包含指定设备的标识时，根据接收到的宏指令和备选设备的资源信息，从备选设备中确定出用于执行宏指令的运行设备。其中，资源信息可以包括备选设备所包含的指令集。

在一种可能的实现方式中，步骤S41还可以包括：在确定宏指令中包含指定设备的标识，且指定设备的资源不满足执行宏指令的执行条件时，根据宏指令和备选设备的资源信息，确定运行设备。

在一种可能的实现方式中，宏指令可以包含输入量和输出量中的至少一项。步骤S42可以包括：确定宏指令的数据量，根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令。其中，数据量可以是根据输入量和输出量中的至少一项确定的，运行设备的资源信息还可以包括存储容量、剩余存储容量的至少一项。

在一种可能的实现方式中，根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令，可以包括：在确定运行设备为一个，且运行设备的资源不满足执行宏指令的容量条件时，根据运行设备的运行数据和数据量将宏指令拆分成多条运行指令，以使运行设备依次执行多条运行指令。其中，运行设备的运行数据量可以是根据运行设备的资源信息确定的，每条运行指令可以包含运行输入量和运行输出量中的至少一项，运行输入量和运行输出量是根据运行数据量确定的。

在一种可能的实现方式中，根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令，可以包括：在确定运行设备为多个时，根据每个运行设备的运行数据量和数据量对宏指令进行拆分，生成对应于每个运行设备的运行指令。其中，每个运行设备的运行数据量可以是根据每个运行设备的资源信息确定的，运行指令可以包含运行输入量和运行输出量中的至少一项，运行输入量和运行输出量是根据执行运行指令的运行设备的运行数据量确定的。

在一种可能的实现方式中，该方法还可以包括：根据队列排序规则对运行指令进行排序，根据排序后的运行指令构建与运行设备相对应的指令队列。

在一种可能的实现方式中，该方法还可以包括：接收待执行指令，根据确定的指定设备的标识和待执行指令生成宏指令。

在一种可能的实现方式中，该方法还可以包括：将运行指令发送至运行设备，以使运行设备执行运行指令。

在一种可能的实现方式中，将运行指令发送至运行设备，以使运行设备执行运行指令，包括：根据运行指令生成汇编文件；将汇编文件翻译成二进制文件；将二进制文件发送至运行设备，以使运行设备根据二进制文件执行运行指令。

在一种可能的实现方式中，资源信息可以包括备选设备的存储容量、剩余存储容量、备选设备所包含的指令集中的至少一种。

在一种可能的实现方式中，运行设备可以为CPU、GPU和NPU中的其中一种或任意组合。

在一种可能的实现方式中，该方法可以应用于CPU和/或NPU中。

在一种可能的实现方式中，宏指令可以包括以下指令中的至少一种：计算宏指令、控制宏指令和数据搬运宏指令。

其中，计算宏指令可以包括神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令中的至少一种。控制宏指令可以包括无条件跳转宏指令和有条件跳转宏指令中的至少一种。数据搬运宏指令可以包括读宏指令和写宏指令中的至少一种。读宏指令可以包括读神经元宏指令、读突触宏指令和读标量宏指令中的至少一种。写宏指令可以包括写神经元宏指令、写突触宏指令和写标量宏指令中的至少一种。

本公开实施例所提供的神经网络指令生成方法，根据接收到的宏指令，确定执行宏指令的运行设备；根据宏指令和运行设备，生成运行指令。该方法可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

本公开还提供一种神经网络指令执行方法，该方法应用于上述运行设备，该方法包括：通过运行设备获取数据、神经网络模型以及运行指令，对运行指令进行解析，获得多个解析指令，并根据数据执行多个解析指令，得到执行结果。

在一种可能的实现方式中，该方法还可以包括：通过运行设备存储数据以及数据中的标量数据。其中，运行设备包括存储模块，存储模块包括寄存器、缓存中的一个或多个，缓存包括高速暂存缓存。缓存，用于存储数据。寄存器，用于存储数据中标量数据。

在一种可能的实现方式中，该方法还可以包括：

通过运行设备存储运行指令；

通过运行设备对运行指令进行解析，得到多个解析指令；

通过运行设备存储运行指令队列，运行指令队列包括运行指令和多个解析指令，运行指令队列运行指令和多个解析指令按照被执行的先后顺序依次排列。

在一种可能的实现方式中，该方法还可以包括：

通过运行设备在确定第一解析指令与第一解析指令之前的第零解析指令存在关联关系时，缓存第一解析指令，在第零解析指令执行完毕后，执行缓存的第一解析指令。

其中，第一解析指令与第一解析指令之前的第零解析指令存在关联关系包括：存储第一解析指令所需数据的第一存储地址区间与存储第零解析指令所需数据的第零存储地址区间具有重叠的区域。

本公开实施例所提供的神经网络指令执行方法，通过运行设备获取数据、神经网络模型以及运行指令，对运行指令进行解析，获得多个解析指令，并根据数据执行多个解析指令，得到执行结果。该方法可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

本公开还提供一种神经网络指令处理方法，该方法应用于神经网络指令处理***，该神经网络指令处理***包括上述神经网络指令生成装置和上述运行设备。该方法包括上述应用于神经网络指令生成装置的神经网络指令生成方法和应用于运行设备的神经网络指令执行方法。该方法可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

依据以下条款可更好地理解前述内容：

条款B1、一种神经网络指令生成装置，所述装置包括：

条款B2、根据条款B1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备包含与所述宏指令相对应的指令集。

条款B3、根据条款B2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述宏指令中不包含所述指定设备的标识时，根据接收到的宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款B4、根据条款B3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述宏指令包含所述指定设备的标识，且所述指定设备的资源不满足执行所述宏指令的执行条件时，根据所述宏指令和所述备选设备的资源信息，确定运行设备。

条款B5、根据条款B2-条款B4任一项所述的装置，所述宏指令包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述宏指令的数据量，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，

其中，所述数据量是根据所述输入量和所述输出量中的至少一项确定的，所述运行设备的资源信息还包括存储容量、剩余存储容量的至少一项。

条款B6、根据条款B5所述的装置，所述指令生成模块，包括：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的资源不满足执行所述宏指令的容量条件时，根据所述运行设备的运行数据量和所述数据量将所述宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

其中，所述运行设备的运行数据量是根据所述运行设备的资源信息确定的，每条运行指令包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据所述运行数据量确定的。

条款B7、根据条款B5所述的装置，所述指令生成模块，包括：

第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述宏指令进行拆分，生成对应于每个运行设备的运行指令，

其中，每个运行设备的运行数据量是根据每个运行设备的资源信息确定的，所述运行指令包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款B8、根据条款B1所述的装置，所述装置还包括：

队列构建模块，用于根据队列排序规则对所述运行指令进行排序，根据排序后的运行指令构建与所述运行设备相对应的指令队列。

条款B9、根据条款B2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行指令，根据确定的指定设备的标识和所述待执行指令生成所述宏指令。

条款B10、根据条款B1所述的装置，所述装置还包括：

指令分派模块，用于将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

指令发送子模块，用于将所述二进制文件发送至所述运行设备，以使所述运行设备根据所述二进制文件执行所述运行指令。

条款B11、根据条款B1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述装置设置于CPU和/或NPU中；

所述宏指令包括以下指令中的至少一种：计算宏指令、控制宏指令和数据搬运宏指令，

其中，所述计算宏指令包括神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令中的至少一种，

所述控制宏指令包括无条件跳转宏指令和有条件跳转宏指令中的至少一种，

数据搬运宏指令包括读宏指令和写宏指令中的至少一种，所述读宏指令包括读神经元宏指令、读突触宏指令和读标量宏指令中的至少一种，所述写宏指令包括写神经元宏指令、写突触宏指令和写标量宏指令中的至少一种；

所述宏指令包含以下选项中的至少一项：用于执行所述宏指令的指定设备的标识、操作类型、输入地址、输出地址、输入量、输出量、操作数和指令参数，

所述运行指令包含以下选项中的至少一项：所述操作类型、所述输入地址、所述输出地址、所述操作数和所述指令参数。

条款B12、一种机器学习运算装置，所述装置包括：

一个或多个如条款B1-条款B 11任一项所述的神经网络指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

条款B13、一种组合处理装置，所述装置包括：

如条款B12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款B14、根据条款B13所述的组合处理装置，还包括：存储装置，该存储装置分别与所述机器学习运算装置和所述其他处理装置连接，用于保存所述机器学习运算装置和所述其他处理装置的数据。

条款B15、一种机器学习芯片，所述机器学习芯片包括：

如条款B12所述的机器学习运算装置或如条款B13所述的组合处理装置。

条款B16、一种电子设备，所述电子设备包括：

如条款B15所述的机器学习芯片。

条款B17、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如条款B15所述的机器学习芯片；

其中，所述机器学习芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；

所述存储器件，用于存储数据；

所述接口装置，用于实现所述机器学习芯片与外部设备之间的数据传输；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款B18、根据条款B17所述的板卡，

所述存储器件包括：多组存储单元，每一组所述存储单元与所述机器学习芯片通过总线连接，所述存储单元为：DDR SDRAM；

所述机器学习芯片包括：DDR控制器，用于控制每个所述存储单元的数据传输与数据存储；

所述接口装置为：标准PCIE接口。

条款B19、一种神经网络指令生成方法，所述方法包括：

根据接收到的宏指令，确定执行所述宏指令的运行设备；

根据所述宏指令和所述运行设备，生成运行指令。

条款B20、根据条款B19所述的方法，根据接收到的宏指令，确定执行所述宏指令的运行设备，包括：

在确定所述宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述宏指令相对应的指令集。

条款B21、根据条款B20所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的宏指令，确定执行所述宏指令的运行设备，包括：

在确定所述宏指令中不包含所述指定设备的标识时，根据接收到的宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款B22、根据条款B21所述的方法，根据接收到的宏指令，确定执行所述宏指令的运行设备，包括：

在确定所述宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述宏指令的执行条件时，根据所述宏指令和所述备选设备的资源信息，确定运行设备。

条款B23、根据条款B20-条款B 22任一项所述的方法，所述宏指令包含输入量和输出量中的至少一项，

根据所述宏指令和所述运行设备，生成运行指令，包括：

确定所述宏指令的数据量，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，

条款B24、根据条款B23所述的方法，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为一个，且所述运行设备的资源不满足执行所述宏指令的容量条件时，根据所述运行设备的运行数据量和所述数据量将所述宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款B25、根据条款B23所述的方法，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款B26、根据条款B19所述的方法，所述方法还包括：

根据队列排序规则对所述运行指令进行排序，根据排序后的运行指令构建与所述运行设备相对应的指令队列。

条款B27、根据条款B20所述的方法，所述方法还包括：

接收待执行指令，根据确定的指定设备的标识和所述待执行指令生成所述宏指令。

条款B28、根据条款B19所述的方法，所述方法还包括：

将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，

其中，将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

将所述二进制文件发送至所述运行设备，以使所述运行设备根据所述二进制文件执行所述运行指令。

条款B29、根据条款B19所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

图5示出根据本公开一实施例的神经网络指令处理***的框图。如图5所示，该***包括指令生成设备100和运行设备200。

指令生成设备100包括设备确定模块11和指令生成模块12。设备确定模块11用于根据接收到的宏指令，确定执行宏指令的运行设备。指令生成模块12用于根据宏指令和运行设备，生成运行指令。

运行设备200包括控制模块21和执行模块22。控制模块21用于获取所需数据、神经网络模型以及运行指令，对运行指令进行解析，获得多个解析指令。执行模块22用于根据数据执行多个解析指令，得到执行结果。

在该实现方式中，宏指令是一种批量处理的称谓，宏指令可以是一种规则或模式，或称语法替换，宏指令的处理装置、***等在遇到宏指令时会自动进行这一规则或模式的替换。宏指令可以是对常用的用于对数据进行计算、控制和搬运等处理的待执行指令进行整合形成的。

其中，指定设备的标识可以是指定设备的物理地址、IP地址、名称、编号等标识。标识可以包括数字、字母、符号中的其中一种或任意组合。在宏指令的指定设备的标识的位置为空时，确定该宏指令无指定设备；或者，在宏指令中不包含“指定设备的标识”这个字段时，确定该宏指令无指定设备。操作类型可以是指该宏指令对数据所进行操作的类型，表征该宏指令的具体类型，如在某宏指令的操作类型为“XXX”时，可以根据“XXX”确定该宏指令对数据所进行的操作的具体类型。根据操作类型可以确定执行该宏指令所需的指令集合，如在某宏指令的操作类型为“XXX”时，其所需的指令集合为进行“XXX”所对应的处理所需的所有指令集。输入地址可以是数据的输入地址、读取地址等获得数据的地址，输出地址可以是被处理后的数据的输出地址、写入地址等存储数据的地址。输入量可以是数据的输入规模、输入长度等表征其数据量大小的信息。输出量可以是数据的输出规模、输出长度等表征其数据量的大小的信息。操作数可以包括寄存器的长度、寄存器的地址、寄存器的标识、立即数等中的一个或多个。立即数为在立即寻址方式指令中给出的数。指令参数可以是指对应于该宏指令、与其执行相关的参数。例如，指令参数可以是第二个操作数的地址和长度等。指令参数可以是卷积核的大小、卷积核的步长和卷积核的填充等。

本公开实施例所提供的神经网络指令处理***，该***包括指令生成设备和运行设备。指令生成设备包括设备确定模块用于根据接收到的宏指令，确定执行宏指令的运行设备；指令生成模块用于根据宏指令和运行设备，生成运行指令。运行设备包括控制模块用于获取所需数据、神经网络模型以及运行指令，对运行指令进行解析，获得多个解析指令；执行模块用于根据所述数据执行所述多个解析指令，得到执行结果。本公开实施例所提供的神经网络指令处理***，可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

图6示出根据本公开一实施例的神经网络指令处理***的框图。在一种可能的实现方式中，如图6所示，指令生成设备100还可以包括宏指令生成模块13。宏指令生成模块13用于接收待执行指令，根据确定的指定设备的标识和待执行指令生成宏指令。

在一种可能的实现方式中，如图6所示，设备确定模块11可以包括第一确定子模块111。第一确定子模块111用于在确定宏指令中包含指定设备的标识，且指定设备的资源满足执行宏指令的执行条件时，将指定设备确定为运行设备。其中，执行条件可以包括：指定设备中包含与宏指令相对应的指令集。

在一种可能的实现方式中，如图6所示，指令生成设备100还可以包括资源获取模块14。设备确定模块11还可以包括第二确定子模块112。资源获取模块14用于获取备选设备的资源信息。第二确定子模块112用于在确定宏指令中不包含指定设备的标识时，根据接收到的宏指令和备选设备的资源信息，从备选设备中确定出用于执行宏指令的运行设备。其中，资源信息可以包括备选设备所包含的指令集。备选设备所包含的指令集可以是对应于一种或多种宏指令的操作类型的指令集合。备选设备所包含的指令集越多，备选设备能够执行的宏指令的类型越多。

在该实现方式中，第二确定子模块112在确定宏指令中不包含指定设备的标识时，可以从备选设备中确定出能够执行宏指令的一个或多个运行设备。其中，所确定的运行设备的指令集中包括与宏指令相对应的指令集合。例如，接收到的宏指令为神经网络计算宏指令，可将包含对应于神经网络计算宏指令的指令集的备选设备确定为运行设备，以保证运行设备可以运行生成的运行指令。

在一种可能的实现方式中，如图6所示，设备确定模块11还可以包括第三确定子模块113。第三确定子模块113在确定宏指令中包含指定设备的标识，且指定设备的资源不满足执行宏指令的执行条件时，根据宏指令和备选设备的资源信息，确定运行设备。

在一种可能的实现方式中，如图6所示，宏指令可以包含输入量和输出量中的至少一项，指令生成模块12还用于确定宏指令的数据量，根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令。其中，宏指令的数据量可以是根据输入量和输出量中的至少一项确定的，运行设备的资源信息还可以包括存储容量、剩余存储容量的至少一项。

在一种可能的实现方式中，如图6所示，指令生成模块12可以包括第一指令生成子模块121。第一指令生成子模块121用于在确定运行设备为一个，且在运行设备的资源不满足执行宏指令的容量条件时，根据运行设备的运行数据量和数据量将宏指令拆分成多条运行指令，以使运行设备依次执行多条运行指令。其中，运行设备的运行数据量可以是根据运行设备的资源信息确定的，每条运行指令可以包含运行输入量和运行输出量中的至少一项，运行输入量和运行输出量可以是根据运行数据量确定的。

在一种可能的实现方式中，如图6所示，指令生成模块12可以包括第二指令生成子模块122。第二指令生成子模块122用于在确定运行设备为多个时，根据每个运行设备的运行数据量和数据量对宏指令进行拆分，生成对应于每个运行设备的运行指令。其中，每个运行设备的运行数据量可以是根据每个运行设备的资源信息确定的，运行指令可以包含运行输入量和运行输出量中的至少一项，运行输入量和运行输出量是根据执行运行指令的运行设备的运行数据量确定的。

在该实现方式中，运行输入量和运行输出量需小于或等于运行数据量，以保证所生成的运行指令可以被运行设备执行。第二指令生成子模块122可以根据每个运行设备的运行数据量，为每个运行设备生成一个或多个运行指令，以供对应的运行设备执行。

在上述实现方式中，运行指令中包含运行输入量、运行输出量中的至少一项。这样，除了可以限定运行指令的数据量，使其能够被对应的运行设备执行之外，还可以满足不同运行指令对运行输入量和/或运行输出量的特殊限定需求。

在一种可能的实现方式中，对于一些对运行输入量和/或运行输出量没有特殊限定需求的运行指令，该运行指令中可以不包含运行输入量和/或运行输出量，可以预先设置默认运行输入量和默认运行输出量，使得运行设备在确定接收到的运行指令中不存在运行输入量、运行输出量时，可以将默认运行输入量、默认运行输出量作为该运行指令的运行输入量、运行输出量。通过预设默认运行输入量和默认运行输出量的方式，可以简化运行指令的生成过程，节省运行指令的生成时间。

在一种可能的实现方式中，如图6所示，指令生成设备100还可以包括队列构建模块15。队列构建模块15用于根据队列排序规则对运行指令进行排序，根据排序后的运行指令构建与运行设备相对应的指令队列。

在一种可能的实现方式中，如图6所示，指令生成设备100还可以包括指令分派模块16。指令分派模块16用于将运行指令发送至运行设备，以使运行设备执行运行指令。

在一种可能的实现方式中，如图6所示，指令分派模块16可以包括指令汇编子模块161、汇编翻译子模块162和指令发送子模块163。指令汇编子模块161用于根据所述运行指令生成汇编文件。汇编翻译子模块162用于将汇编文件翻译成二进制文件。指令发送子模块163用于将二进制文件发送至运行设备，以使运行设备根据二进制文件执行运行指令。

在一种可能的实现方式中，运行设备可以为CPU、GPU和嵌入式神经网络处理器(Neural-network Processing Unit，简称NPU)中的其中一种或任意组合。这样，提高了指令生成设备根据宏指令生成运行指令的速度。

在一种可能的实现方式中，该指令生成设备100可以设置于CPU和/或NPU中。以实现通过CPU和/或NPU实现根据宏指令生成运行指令的过程，为指令生成设备的实现提供了更多的可能方式。

在一种可能的实现方式中，运行设备200还包括存储模块23。该存储模块23可以包括寄存器和缓存中的至少一种，缓存可以包括高速暂存缓存。缓存可以用于存储数据。寄存器可以用于存储数据中的标量数据。

在一种可能的实现方式中，控制模块21可以包括指令存储子模块211和指令处理子模块212。指令存储子模块211用于存储运行指令。指令处理子模块212用于对运行指令进行解析，得到多个解析指令。

在一种可能的实现方式中，控制模块21还可以包括存储队列子模块213。存储队列子模块213用于存储运行指令队列，该运行指令队列中包含运行设备所需执行的运行指令以及多个解析指令。在运行指令队列中所有指令按照执行的先后顺序依次排列。

在一种可能的实现方式中，执行模块22还可以包括依赖关系处理子模块221。依赖关系处理子模块221用于在确定第一解析指令与第一解析指令之前的第零解析指令存在关联关系时，将第一解析指令缓存在指令存储子模块中，在第零解析指令执行完毕后，从指令存储子模块中提取第一解析指令发送至执行模块。

需要说明的是，尽管本文以上述实施例作为示例对神经网络指令处理***进行了如上介绍，但本领域技术人员能够理解，本公开应不限于此。事实上，用户完全可根据个人喜好和/或实际应用场景灵活设定各模块，只要符合本公开的技术方案即可。

图7示出根据本公开一实施例的神经网络指令处理方法的流程图。如图7所示，该方法应用于上述包括指令生成设备和运行设备的神经网络指令处理***，该方法包括步骤S51和步骤S52。

步骤S51：通过指令生成设备根据接收到的宏指令，确定执行宏指令的运行设备，并根据宏指令和运行设备，生成运行指令。

步骤S52：通过运行设备获取数据、神经网络模型以及运行指令，对运行指令进行解析，获得多个解析指令，并根据数据执行多个解析指令，得到执行结果。

在一种可能的实现方式中，步骤S51可以包括：在确定宏指令中包含指定设备的标识，且指定设备的资源满足执行宏指令的执行条件时，将指定设备确定为运行设备。其中，执行条件可以包括：指定设备中包含与宏指令相对应的指令集。

在一种可能的实现方式中，该方法还可以包括：获取备选设备的资源信息。

其中，步骤S51还可以包括：在确定宏指令中不包含指定设备的标识时，根据接收到的宏指令和备选设备的资源信息，从备选设备中确定出用于执行宏指令的运行设备。其中，资源信息可以包括备选设备所包含的指令集。

在一种可能的实现方式中，步骤S51还可以包括：在确定宏指令中包含指定设备的标识，且指定设备的资源不满足执行宏指令的执行条件时，根据宏指令和备选设备的资源信息，确定运行设备。

在一种可能的实现方式中，宏指令可以包含输入量和输出量中的至少一项，步骤S51中根据宏指令和运行设备，生成运行指令，可以包括：确定宏指令的数据量，根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令。其中，数据量是根据输入量和输出量中的至少一项确定的，运行设备的资源信息还包括存储容量、剩余存储容量的至少一项。

在一种可能的实现方式中，根据宏指令的数据量、宏指令和运行设备的资源信息，生成运行指令，可以包括：在确定运行设备为一个，且运行设备的资源不满足执行宏指令的容量条件时，根据运行设备的运行数据量和数据量将宏指令拆分成多条运行指令，以使运行设备依次执行多条运行指令。其中，运行设备的运行数据量可以是根据运行设备的资源信息确定的，每条运行指令可以包含运行输入量和运行输出量中的至少一项，运行输入量和运行输出量是根据运行数据量确定的。

在一种可能的实现方式中，该方法还可以包括：通过指令生成设备根据队列排序规则对运行指令进行排序，根据排序后的运行指令构建与运行设备相对应的指令队列。

在一种可能的实现方式中，该方法还可以包括：通过指令生成设备接收待执行指令，根据确定的指定设备的标识和待执行指令生成宏指令。

在一种可能的实现方式中，该方法还可以包括：通过指令生成设备将运行指令发送至运行设备，以使运行设备执行运行指令。

在一种可能的实现方式中，通过指令生成设备将运行指令发送至运行设备，以使运行设备执行运行指令，可以包括：

根据运行指令生成汇编文件；

将汇编文件翻译成二进制文件；

将二进制文件发送至运行设备，以使运行设备根据二进制文件执行运行指令。

在一种可能的实现方式中，该方法还可以包括：通过运行设备存储数据以及数据中的标量数据。其中，运行设备包括存储模块，存储模块包括寄存器、缓存中的一个或多个，缓存包括高速暂存缓存，缓存，用于存储数据；寄存器，用于存储数据中标量数据。

在一种可能的实现方式中，该方法还可以包括：

通过运行设备存储运行指令；

通过运行设备对运行指令进行解析，得到多个解析指令；

通过运行设备存储运行指令队列，其中，运行指令队列包括运行指令和多个解析指令，在运行指令队列中，运行指令和多个解析指令按照被执行的先后顺序依次排列。

在一种可能的实现方式中，该方法还可以包括：

在一种可能的实现方式中，指令生成设备设置于CPU和/或NPU中。

本公开实施例所提供的神经网络指令处理方法，通过指令生成设备根据接收到的宏指令，确定执行宏指令的运行设备，并根据宏指令和运行设备，生成运行指令；通过运行设备获取数据、神经网络模型以及运行指令，对运行指令进行解析，获得多个解析指令，并根据数据执行多个解析指令，得到执行结果。该方法可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

依据以下条款可更好地理解前述内容：

条款A1、一种神经网络指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

控制模块，用于获取所需数据、神经网络模型以及所述运行指令，对所述运行指令进行解析，获得多个解析指令；

执行模块，用于根据所述数据执行所述多个解析指令，得到执行结果。

条款A2、根据条款A1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述宏指令中不包含所述指定设备的标识时，根据接收到的宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述宏指令的运行设备；

第三确定子模块，在确定所述宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述宏指令的执行条件时，根据所述宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款A3、根据条款A2所述的***，所述宏指令包含输入量和输出量中的至少一项，

条款A4、根据条款A3所述的***，所述指令生成模块，包括以下至少一个子模块：

其中，运行设备的运行数据量是根据运行设备的资源信息确定的，所述运行指令包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款A5、根据条款A1所述的***，所述指令生成设备还包括：

条款A6、根据条款A2所述的***，所述指令生成设备还包括：

条款A7、根据条款A1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款A8、根据条款A1所述的***，所述运行设备，还包括：

存储模块，所述存储模块包括寄存器、缓存中的一个或多个，所述缓存包括高速暂存缓存，

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款A9、根据条款A1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

指令处理子模块，用于对所述运行指令进行解析，得到所述多个解析指令；

存储队列子模块，用于存储运行指令队列，所述运行指令队列包括所述运行指令和所述多个解析指令，所述运行指令队列所述运行指令和所述多个解析指令按照被执行的先后顺序依次排列。

条款A10、根据条款A9所述的***，所述执行模块，包括：

依赖关系处理子模块，用于在确定第一解析指令与所述第一解析指令之前的第零解析指令存在关联关系时，将所述第一解析指令缓存在所述指令存储子模块中，在所述第零解析指令执行完毕后，从所述指令存储子模块中提取所述第一解析指令发送至所述执行模块，

其中，所述第一解析指令与所述第一解析指令之前的第零解析指令存在关联关系包括：

存储所述第一解析指令所需数据的第一存储地址区间与存储所述第零解析指令所需数据的第零存储地址区间具有重叠的区域。

条款A11、根据条款A1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述宏指令包括以下指令中的至少一种：计算宏指令、控制宏指令和数据搬运指令，

条款A12、一种机器学习运算装置，所述装置包括：

一个或多个如条款A1-条款A11任一项所述的神经网络指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述神经网络指令处理***时，所述多个所述神经网络指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述神经网络指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述神经网络指令处理***共享同一控制***或拥有各自的控制***；多个所述神经网络指令处理***共享内存或者拥有各自的内存；多个所述神经网络指令处理***的互联方式是任意互联拓扑。

条款A13、一种组合处理装置，所述组合处理装置包括：

如条款A12所述的机器学习运算装置、通用互联接口和其他处理装置；

所述机器学习运算装置与所述其他处理装置进行交互，共同完成用户指定的计算操作，

其中，所述组合处理装置还包括：存储装置，该存储装置分别与所述机器学习运算装置和所述其他处理装置连接，用于保存所述机器学习运算装置和所述其他处理装置的数据。

条款A14、一种机器学习芯片，所述机器学习芯片包括：

如条款A12所述的机器学习运算装置或如条款A13所述的组合处理装置。

条款A15、一种电子设备，所述电子设备包括：

如条款A14所述的机器学习芯片。

条款A16、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及如条款A14所述的机器学习芯片；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款A17、一种神经网络指令处理方法，所述方法应用于神经网络指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的宏指令，确定执行所述宏指令的运行设备，并根据所述宏指令和所述运行设备，生成运行指令；

通过所述运行设备获取数据、神经网络模型以及运行指令，对所述运行指令进行解析，获得多个解析指令，并根据所述数据执行所述多个解析指令，得到执行结果。

条款A18、根据条款A17所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的宏指令，确定执行所述宏指令的运行设备，包括以下至少一项：

在确定所述宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述宏指令中不包含所述指定设备的标识时，根据接收到的宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述宏指令的运行设备；

在确定所述宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述宏指令的执行条件时，根据所述宏指令和所述备选设备的资源信息，确定运行设备，

条款A19、根据条款A18所述的方法，所述宏指令包含输入量和输出量中的至少一项，

根据所述宏指令和所述运行设备，生成运行指令，包括：

条款A20、根据条款A19所述的方法，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，包括以下至少一项：

在确定所述运行设备为一个，且所述运行设备的资源不满足执行所述宏指令的容量条件时，根据所述运行设备的运行数据量和所述数据量将所述宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

条款A21、根据条款A17所述的方法，所述方法还包括：

通过所述指令生成设备根据队列排序规则对所述运行指令进行排序，根据排序后的运行指令构建与所述运行设备相对应的指令队列。

条款A22、根据条款A18所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行指令，根据确定的指定设备的标识和所述待执行指令生成所述宏指令。

条款A23、根据条款A17所述的方法，所述方法还包括：

通过所述指令生成设备将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，

其中，通过所述指令生成设备将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款A24、根据条款A17所述的方法，所述方法还包括：

通过所述运行设备存储所述数据以及所述数据中的标量数据，

其中，所述运行设备包括存储模块，所述存储模块包括寄存器、缓存的一个或多个，所述缓存包括高速暂存缓存，

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款A25、根据条款A17所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

通过所述运行设备对所述运行指令进行解析，得到所述多个解析指令；

通过所述运行设备存储运行指令队列，所述运行指令队列包括所述运行指令和所述多个解析指令，所述运行指令队列所述运行指令和所述多个解析指令按照被执行的先后顺序依次排列。

条款A26、根据条款A25所述的方法，所述方法还包括：

通过所述运行设备在确定第一解析指令与所述第一解析指令之前的第零解析指令存在关联关系时，缓存所述第一解析指令，在所述第零解析指令执行完毕后，执行缓存的所述第一解析指令，

条款A27、根据条款A17所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述宏指令包括以下指令中的至少一种：

计算宏指令、控制宏指令和数据搬运指令，

所述宏指令包括以下选项中的至少一项：

用于执行所述宏指令的指定设备的标识、操作类型、输入地址、输出地址、输入量、输出量、操作数和指令参数，

所述运行指令包括以下选项中的至少一项：所述操作类型、所述输入地址、所述输出地址、所述操作数和所述指令参数。

对于不同的指令上述装置、***和对应的方法，可以针对指令的不同进行不同的处理，为更清晰的描述针对不同指令上述装置、***和对应方法的工作过程和原理，可以结合以下条款进行理解。

对于计算指令，可以通过下述计算指令生成装置、方法，以及计算指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款C1、一种计算指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的计算宏指令，确定执行所述计算宏指令的运行设备；

指令生成模块，用于根据所述计算宏指令和所述运行设备，生成运行指令，

其中，所述计算宏指令是指用于进行数据计算的宏指令，所述数据计算包括机器学习计算、向量逻辑计算、矩阵向量计算、标量计算和标量逻辑计算中的至少一种，

所述计算宏指令包含操作类型、输入地址和输出地址，所述运行指令包含所述操作类型、运行输入地址和运行输出地址，所述运行输入地址和所述运行输出地址是分别根据所述输入地址、所述输出地址确定的。

条款C2、根据条款C1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括所述指定设备中包含与所述计算宏指令相对应的指令集。

条款C3、根据条款C2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述计算宏指令中不包含所述指定设备的标识时，根据接收到的计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款C4、根据条款C3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述计算宏指令的执行条件时，根据所述计算宏指令和所述备选设备的资源信息，确定运行设备。

条款C5、根据条款C2-条款C4任一项所述的装置，所述计算宏指令还包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述计算宏指令的数据量，根据所述计算宏指令的数据量、所述计算宏指令和所述运行设备的资源信息，生成运行指令，

条款C6、根据条款C5所述的装置，所述指令生成模块，包括：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述计算宏指令拆分成多条运行指令，以使所述运行设备依次执行所述多条运行指令，

其中，所述运行设备的运行数据量是根据所述运行设备的资源信息确定的，每条运行指令还包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据所述运行数据量确定的。

条款C7、根据条款C5所述的装置，所述指令生成模块，包括：

第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

其中，每个运行设备的运行数据量是根据每个运行设备的资源信息确定的，所述运行指令还包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款C8、根据条款C1所述的装置，所述装置还包括：

条款C9、根据条款C2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行计算指令，根据确定的指定设备的标识和所述待执行计算指令生成所述计算宏指令。

条款C10、根据条款C1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款C11、根据条款C1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述装置设置于CPU和/或NPU中；

所述计算宏指令包括以下指令中的至少一种：神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令中的至少一种；

所述计算宏指令还包含以下选项中的至少一项：用于执行所述计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数。

条款C12、一种机器学习运算装置，所述装置包括：

一个或多个如条款C1-条款C11任一项所述的计算指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述计算指令生成装置时，所述多个所述计算指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述计算指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述计算指令生成装置共享同一控制***或拥有各自的控制***；多个所述计算指令生成装置共享内存或者拥有各自的内存；多个所述计算指令生成装置的互联方式是任意互联拓扑。

条款C13、一种组合处理装置，所述装置包括：

如条款C12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款C14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款C12所述的机器学习运算装置或如条款C13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款C15、一种计算指令生成方法，所述方法包括：

根据接收到的计算宏指令，确定执行所述计算宏指令的运行设备；

根据所述计算宏指令和所述运行设备，生成运行指令，

条款C16、根据条款C15所述的方法，根据接收到的计算宏指令，确定执行所述计算宏指令的运行设备，包括：

在确定所述计算宏指令包括指定设备的标识，且所述指定设备的资源满足执行所述计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

条款C17、根据条款C16所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的计算宏指令，确定执行所述计算宏指令的运行设备，包括：

在确定所述计算宏指令中不包含所述指定设备的标识时，根据接收到的计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款C18、根据条款C17所述的方法，根据接收到的计算宏指令，确定执行所述计算宏指令的运行设备，包括：

在确定所述计算宏指令包括所述指定设备的标识，且所述指定设备的资源不满足执行所述计算宏指令的执行条件时，根据所述计算宏指令和所述备选设备的资源信息，确定运行设备。

条款C19、根据条款C16-条款C18任一项所述的方法，所述计算宏指令还包含输入量和输出量中的至少一项，

根据所述计算宏指令和所述运行设备，生成运行指令，包括：

确定所述计算宏指令的数据量，根据所述数据量、所述计算宏指令和所述运行设备的资源信息，生成运行指令，

条款C20、根据条款C19所述的方法，根据所述计算宏指令的数据量、所述计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款C21、根据条款C19所述的方法，根据所述计算宏指令的数据量、所述计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款C22、根据条款C15所述的方法，所述方法还包括：

条款C23、根据条款C16所述的方法，所述方法还包括：

接收待执行计算指令，根据确定的指定设备的标识和所述待执行计算指令生成所述计算宏指令。

条款C24、根据条款C15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款C25、根据条款C15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

所述计算宏指令包括以下指令中的至少一种：神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令中的至少一种，

条款D1、一种计算指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述计算宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

执行模块，用于根据所述数据执行所述多个解析指令，得到执行结果，

条款D2、根据条款D1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述计算宏指令中不包含所述指定设备的标识时，根据接收到的计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述计算宏指令的运行设备；

第三确定子模块，在确定所述计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述计算宏指令的执行条件时，根据所述计算宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述计算宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款D3、根据条款D2所述的***，所述计算宏指令还包含输入量和输出量中的至少一项，

条款D4、根据条款D3所述的***，所述指令生成模块，包括以下至少一个子模块：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

其中，运行设备的运行数据量是根据运行设备的资源信息确定的，所述运行指令还包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款D5、根据条款D1所述的***，所述指令生成设备还包括：

条款D6、根据条款D2所述的***，所述指令生成设备还包括：

条款D7、根据条款D1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款D8、根据条款D1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款D9、根据条款D1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款D10、根据条款D9所述的***，所述执行模块，包括：

条款D11、根据条款D1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述计算宏指令包括以下指令中的至少一种：神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令；

所述计算宏指令包含以下选项中的至少一项：用于执行所述计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数。

条款D12、一种机器学习运算装置，所述装置包括：

一个或多个如条款D1-条款D11任一项所述的计算指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述计算指令处理***时，所述多个所述计算指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述计算指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述计算指令处理***共享同一控制***或拥有各自的控制***；多个所述计算指令处理***共享内存或者拥有各自的内存；多个所述计算指令处理***的互联方式是任意互联拓扑。

条款D13、一种组合处理装置，所述组合处理装置包括：

如条款D12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款D14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款D12所述的机器学习运算装置或如条款D13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款D15、一种计算指令处理方法，所述方法应用于计算指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的计算宏指令，确定执行所述计算宏指令的运行设备，并根据所述计算宏指令和所述运行设备，生成运行指令；

通过所述运行设备获取数据、神经网络模型以及运行指令，对所述运行指令进行解析，获得多个解析指令，并根据所述数据执行所述多个解析指令，得到执行结果，

条款D16、根据条款D15所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的计算宏指令，确定执行所述计算宏指令的运行设备，包括以下至少一项：

在确定所述计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述计算宏指令中不包含所述指定设备的标识时，根据接收到的计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述计算宏指令的运行设备；

在确定所述计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述计算宏指令的执行条件时，根据所述计算宏指令和所述备选设备的资源信息，确定运行设备，

条款D17、根据条款D16所述的方法，所述计算宏指令还包含输入量和输出量中的至少一项，

确定所述计算宏指令的数据量，根据所述计算宏指令的数据量、所述计算宏指令和所述运行设备的资源信息，生成运行指令，

条款D18、根据条款D17所述的方法，根据所述计算宏指令的数据量、所述计算宏指令和所述运行设备的资源信息，生成运行指令，包括以下至少一项：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

条款D19、根据条款D15所述的方法，所述方法还包括：

条款D20、根据条款D16所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行计算指令，根据确定的指定设备的标识和所述待执行计算指令生成所述计算宏指令。

条款D21、根据条款D15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款D22、根据条款D15所述的方法，所述方法还包括：

其中，所述运行设备包括存储模块，所述存储模块包括寄存器、缓存中的一个或多个，所述缓存包括高速暂存缓存，

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款D23、根据条款D15所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款D24、根据条款D23所述的方法，所述方法还包括：

条款D25、根据条款D15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述计算宏指令还包括以下选项中的至少一项：用于执行所述计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数。

对于神经网络计算指令，可以通过下述计算指令生成装置、方法，以及神经网络计算指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款E1、一种神经网络计算指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的神经网络计算宏指令，确定执行所述神经网络计算宏指令的运行设备；

指令生成模块，用于根据所述神经网络计算宏指令和所述运行设备，生成运行指令，

其中，所述神经网络计算宏指令是指用于计算神经网络算法的宏指令，

所述神经网络计算宏指令包含操作类型、输入地址和输出地址，所述运行指令包含所述操作类型、运行输入地址和运行输出地址，所述运行输入地址和所述运行输出地址是分别根据所述输入地址、所述输出地址确定的。

条款E2、根据条款E1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述神经网络计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述神经网络计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述神经网络计算宏指令相对应的指令集。

条款E3、根据条款E2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述神经网络计算宏指令中不包含所述指定设备的标识时，根据接收到的神经网络计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述神经网络计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款E4、根据条款E3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述神经网络计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述神经网络计算宏指令的执行条件时，根据所述神经网络计算宏指令和所述备选设备的资源信息，确定运行设备。

条款E5、根据条款E2-条款E4任一项所述的装置，所述神经网络计算宏指令还包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述神经网络计算宏指令的数据量，根据所述神经网络计算宏指令的数据量、所述神经网络计算宏指令和所述运行设备的资源信息，生成运行指令，

条款E6、根据条款E5所述的装置，所述指令生成模块，包括：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述神经网络计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述神经网络计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款E7、根据条款E5所述的装置，所述指令生成模块，包括：

第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述神经网络计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款E8、根据条款E1所述的装置，所述装置还包括：

条款E9、根据条款E2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行神经网络计算指令，根据确定的指定设备的标识和所述待执行神经网络计算指令生成所述神经网络计算宏指令。

条款E10、根据条款E1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款E11、根据条款E1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合

所述装置设置于CPU和/或NPU中；

所述神经网络计算宏指令包括卷积计算宏指令、池化计算宏指令中的至少一种，

所述神经网络计算宏指令还包含以下选项中的至少一项：用于执行所述神经网络计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数，所述指令参数包括卷积核的大小、所述卷积核的步长和所述卷积核的填充中的至少一种。

条款E12、一种机器学习运算装置，所述装置包括：

一个或多个如条款E1-条款E11任一项所述的神经网络计算指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述神经网络计算指令生成装置时，所述多个所述神经网络计算指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述神经网络计算指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述神经网络计算指令生成装置共享同一控制***或拥有各自的控制***；多个所述神经网络计算指令生成装置共享内存或者拥有各自的内存；多个所述神经网络计算指令生成装置的互联方式是任意互联拓扑。

条款E13、一种组合处理装置，所述装置包括：

如条款E12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款E14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款E12所述的机器学习运算装置或如条款E13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款E15、一种神经网络计算指令生成方法，所述方法包括：

根据接收到的神经网络计算宏指令，确定执行所述神经网络计算宏指令的运行设备；

根据所述神经网络计算宏指令和所述运行设备，生成运行指令，

条款E16、根据条款E15所述的方法，根据接收到的神经网络计算宏指令，确定执行所述神经网络计算宏指令的运行设备，包括：

在确定所述神经网络计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述神经网络计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

条款E17、根据条款E16所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的神经网络计算宏指令，确定执行所述神经网络计算宏指令的运行设备，包括：

在确定所述神经网络计算宏指令中不包含所述指定设备的标识时，根据接收到的神经网络计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述神经网络计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款E18、根据条款E17所述的方法，根据接收到的神经网络计算宏指令，确定执行所述神经网络计算宏指令的运行设备，包括：

在确定所述神经网络计算宏指令包括所述指定设备的标识，且所述指定设备的资源不满足执行所述神经网络计算宏指令的执行条件时，根据所述神经网络计算宏指令和所述备选设备的资源信息，确定运行设备。

条款E19、根据条款E16-条款E18任一项所述的方法，所述神经网络计算宏指令还包含输入量和输出量中的至少一项，

根据所述神经网络计算宏指令和所述运行设备，生成运行指令，包括：

确定所述神经网络计算宏指令的数据量，根据所述神经网络计算宏指令的数据量、所述神经网络计算宏指令和所述运行设备的资源信息，生成运行指令，

条款E20、根据条款E19所述的方法，根据所述神经网络计算宏指令的数据量、所述神经网络计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述神经网络计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述神经网络计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款E21、根据条款E19所述的方法，根据所述神经网络计算宏指令的数据量、所述神经网络计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述神经网络计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款E22、根据条款E15所述的方法，所述方法还包括：

条款E23、根据条款E16所述的方法，所述方法还包括：

接收待执行神经网络计算指令，根据确定的指定设备的标识和所述待执行神经网络计算指令生成所述神经网络计算宏指令。

条款E24、根据条款E15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款E25、根据条款E15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款F1、一种神经网络计算指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述神经网络计算宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

条款F2、根据条款F1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述神经网络计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述神经网络计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述神经网络计算宏指令中不包含所述指定设备的标识时，根据接收到的神经网络计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述神经网络计算宏指令的运行设备；

第三确定子模块，在确定所述神经网络计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述神经网络计算宏指令的执行条件时，根据所述神经网络计算宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述神经网络计算宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款F3、根据条款F2所述的***，所述神经网络计算宏指令还包含输入量和输出量中的至少一项，

条款F4、根据条款F3所述的***，所述指令生成模块，包括以下至少一个子模块：

条款F5、根据条款F1所述的***，所述指令生成设备还包括：

条款F6、根据条款F2所述的***，所述指令生成设备还包括：

条款F7、根据条款F1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款F8、根据条款F1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款F9、根据条款F1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款F10、根据条款F9所述的***，所述执行模块，包括：

条款F11、根据条款F1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述神经网络计算宏指令包括卷积计算宏指令、池化计算宏指令中的至少一种；

所述神经网络计算宏指令包含以下选项中的至少一项：用于执行所述神经网络计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数，所述指令参数包括卷积核的大小、所述卷积核的步长和所述卷积核的填充中的至少一种。

条款F12、一种机器学习运算装置，所述装置包括：

一个或多个如条款F1-条款F11任一项所述的神经网络计算指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述神经网络计算指令处理***时，所述多个所述神经网络计算指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述神经网络计算指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述神经网络计算指令处理***共享同一控制***或拥有各自的控制***；多个所述神经网络计算指令处理***共享内存或者拥有各自的内存；多个所述神经网络计算指令处理***的互联方式是任意互联拓扑。

条款F13、一种组合处理装置，所述组合处理装置包括：

如条款F12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款F14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款F12所述的机器学习运算装置或如条款F13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款F15、一种神经网络计算指令处理方法，所述方法应用于神经网络计算指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的神经网络计算宏指令，确定执行所述神经网络计算宏指令的运行设备，并根据所述神经网络计算宏指令和所述运行设备，生成运行指令；

条款F16、根据条款F15所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的神经网络计算宏指令，确定执行所述神经网络计算宏指令的运行设备，包括以下至少一项：

在确定所述神经网络计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述神经网络计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述神经网络计算宏指令中不包含所述指定设备的标识时，根据接收到的神经网络计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述神经网络计算宏指令的运行设备；

在确定所述神经网络计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述神经网络计算宏指令的执行条件时，根据所述神经网络计算宏指令和所述备选设备的资源信息，确定运行设备，

条款F17、根据条款F16所述的方法，所述神经网络计算宏指令还包含输入量和输出量中的至少一项，

条款F18、根据条款F17所述的方法，根据所述神经网络计算宏指令的数据量、所述神经网络计算宏指令和所述运行设备的资源信息，生成运行指令，包括以下至少一项：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述神经网络计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述神经网络计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

条款F19、根据条款F15所述的方法，所述方法还包括：

条款F20、根据条款F16所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行神经网络计算指令，根据确定的指定设备的标识和所述待执行神经网络计算指令生成所述神经网络计算宏指令。

条款F21、根据条款F15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款F22、根据条款F15所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款F23、根据条款F15所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款F24、根据条款F23所述的方法，所述方法还包括：

条款F25、根据条款F15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述神经网络计算宏指令还包括以下选项中的至少一项：用于执行所述神经网络计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数，所述指令参数包括卷积核的大小、所述卷积核的步长和所述卷积核的填充中的至少一种。

对于向量逻辑计算指令，可以通过下述向量逻辑计算指令生成装置、方法，以及向量逻辑计算指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款G1、一种向量逻辑计算指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的向量逻辑计算宏指令，确定执行所述向量逻辑计算宏指令的运行设备；

指令生成模块，用于根据所述向量逻辑计算宏指令和所述运行设备，生成运行指令，

其中，所述向量逻辑计算宏指令是指用于对向量进行逻辑运算的宏指令，

所述向量逻辑计算宏指令包含操作类型、输入地址和输出地址，所述运行指令包含所述操作类型、运行输入地址和运行输出地址，所述运行输入地址和所述运行输出地址是分别根据所述输入地址、所述输出地址确定的。

条款G2、根据条款G1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述向量逻辑计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述向量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述向量逻辑计算宏指令相对应的指令集。

条款G3、根据条款G2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述向量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的向量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述向量逻辑计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款G4、根据条款G3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述向量逻辑计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述向量逻辑计算宏指令的执行条件时，根据所述向量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备。

条款G5、根据条款G2-条款G4任一项所述的装置，所述向量逻辑计算宏指令还包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述向量逻辑计算宏指令的数据量，根据所述数据量、所述向量逻辑计算宏指令和所述运行设备的资源信息，生成运行指令，

条款G6、根据条款G5所述的装置，所述指令生成模块，包括：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述向量逻辑计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述向量逻辑计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款G7、根据条款G5所述的装置，所述指令生成模块，包括：

第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述向量逻辑计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款G8、根据条款G1所述的装置，所述装置还包括：

条款G9、根据条款G2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行向量逻辑计算指令，根据确定的指定设备的标识和所述待执行向量逻辑计算指令生成所述向量逻辑计算宏指令。

条款G10、根据条款G1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款G11、根据条款G1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合

所述装置设置于CPU和/或NPU中；

所述向量逻辑计算宏指令包括以下指令中的至少一种：向量与计算宏指令、向量或计算宏指令、向量非计算宏指令、向量比较计算宏指令；

所述向量逻辑计算宏指令还包含以下选项中的至少一项：用于执行所述向量逻辑计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数，所述指令参数包括第二个操作数的地址、长度中的至少一种。

条款G12、一种机器学习运算装置，所述装置包括：

一个或多个如条款G1-条款G11任一项所述的向量逻辑计算指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述向量逻辑计算指令生成装置时，所述多个所述向量逻辑计算指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述向量逻辑计算指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述向量逻辑计算指令生成装置共享同一控制***或拥有各自的控制***；多个所述向量逻辑计算指令生成装置共享内存或者拥有各自的内存；多个所述向量逻辑计算指令生成装置的互联方式是任意互联拓扑。

条款G13、一种组合处理装置，所述装置包括：

如条款G12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款G14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款G12所述的机器学习运算装置或如条款G13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款G15、一种向量逻辑计算指令生成方法，所述方法包括：

根据接收到的向量逻辑计算宏指令，确定执行所述向量逻辑计算宏指令的运行设备；

根据所述向量逻辑计算宏指令和所述运行设备，生成运行指令，

条款G16、根据条款G15所述的方法，根据接收到的向量逻辑计算宏指令，确定执行所述向量逻辑计算宏指令的运行设备，包括：

在确定所述向量逻辑计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述向量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括所述指定设备中包含与所述向量逻辑计算宏指令相对应的指令集。

条款G17、根据条款G16所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的向量逻辑计算宏指令，确定执行所述向量逻辑计算宏指令的运行设备，包括：

在确定所述向量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的向量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述向量逻辑计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款G18、根据条款G17所述的方法，根据接收到的向量逻辑计算宏指令，确定执行所述向量逻辑计算宏指令的运行设备，包括：

在确定所述向量逻辑计算宏指令包括所述指定设备的标识，且所述指定设备的资源不满足执行所述向量逻辑计算宏指令的执行条件时，根据所述向量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备。

条款G19、根据条款G16-条款G18任一项所述的方法，所述向量逻辑计算宏指令还包含输入量和输出量中的至少一项，

根据所述向量逻辑计算宏指令和所述运行设备，生成运行指令，包括：

确定所述向量逻辑计算宏指令的数据量，根据所述数据量、所述向量逻辑计算宏指令和所述运行设备的资源信息，生成运行指令，

条款G20、根据条款G19所述的方法，根据所述向量逻辑计算宏指令的数据量、所述向量逻辑计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述向量逻辑计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述向量逻辑计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款G21、根据条款G19所述的方法，根据所述向量逻辑计算宏指令的数据量、所述向量逻辑计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述向量逻辑计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款G22、根据条款G15所述的方法，所述方法还包括：

条款G23、根据条款G16所述的方法，所述方法还包括：

接收待执行向量逻辑计算指令，根据确定的指定设备的标识和所述待执行向量逻辑计算指令生成所述向量逻辑计算宏指令。

条款G24、根据条款G15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款G25、根据条款G15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款H1、一种向量逻辑计算指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述向量逻辑计算宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

条款H2、根据条款H1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述向量逻辑计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述向量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述向量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的向量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述向量逻辑计算宏指令的运行设备；

第三确定子模块，在确定所述向量逻辑计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述向量逻辑计算宏指令的执行条件时，根据所述向量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述向量逻辑计算宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款H3、根据条款H2所述的***，所述向量逻辑计算宏指令还包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述向量逻辑计算宏指令的数据量，根据所述向量逻辑计算宏指令的数据量、所述向量逻辑计算宏指令和所述运行设备的资源信息，生成运行指令，

条款H4、根据条款H3所述的***，所述指令生成模块，包括以下至少一个子模块：

条款H5、根据条款H1所述的***，所述指令生成设备还包括：

条款H6、根据条款H2所述的***，所述指令生成设备还包括：

条款H7、根据条款H1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款H8、根据条款H1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款H9、根据条款H1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款H10、根据条款H9所述的***，所述执行模块，包括：

条款H11、根据条款H1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

条款H12、一种机器学习运算装置，所述装置包括：

一个或多个如条款H1-条款H 11任一项所述的向量逻辑计算指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述向量逻辑计算指令处理***时，所述多个所述向量逻辑计算指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述向量逻辑计算指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述向量逻辑计算指令处理***共享同一控制***或拥有各自的控制***；多个所述向量逻辑计算指令处理***共享内存或者拥有各自的内存；多个所述向量逻辑计算指令处理***的互联方式是任意互联拓扑。

条款H13、一种组合处理装置，所述组合处理装置包括：

如条款H12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款H14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款H12所述的机器学习运算装置或如条款H13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款H15、一种向量逻辑计算指令处理方法，所述方法应用于向量逻辑计算指令处理***，所述 ***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的向量逻辑计算宏指令，确定执行所述向量逻辑计算宏指令的运行设备，并根据所述向量逻辑计算宏指令和所述运行设备，生成运行指令；

条款H16、根据条款H15所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的向量逻辑计算宏指令，确定执行所述向量逻辑计算宏指令的运行设备，包括以下至少一项：

在确定所述向量逻辑计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述向量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述向量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的向量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述向量逻辑计算宏指令的运行设备；

在确定所述向量逻辑计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述向量逻辑计算宏指令的执行条件时，根据所述向量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备，

条款H17、根据条款H16所述的方法，所述向量逻辑计算宏指令还包含输入量和输出量中的至少一项，

确定所述向量逻辑计算宏指令的数据量，根据所述向量逻辑计算宏指令的数据量、所述向量逻辑计算宏指令和所述运行设备的资源信息，生成运行指令，

条款H18、根据条款H17所述的方法，根据所述向量逻辑计算宏指令的数据量、所述向量逻辑计算宏指令和所述运行设备的资源信息，生成运行指令，包括以下至少一项：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述向量逻辑计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述向量逻辑计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

条款H19、根据条款H15所述的方法，所述方法还包括：

条款H20、根据条款H16所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行向量逻辑计算指令，根据确定的指定设备的标识和所述待执行向量逻辑计算指令生成所述向量逻辑计算宏指令。

条款H21、根据条款H15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款H22、根据条款H15所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款H23、根据条款H15所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款H24、根据条款H23所述的方法，所述方法还包括：

条款H25、根据条款H15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述向量逻辑计算宏指令还包括以下选项中的至少一项：用于执行所述向量逻辑计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数。

对于矩阵向量计算指令，可以通过下述矩阵向量计算指令生成装置、方法，以及矩阵向量计算指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款I1、一种矩阵向量计算指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的矩阵向量计算宏指令，确定执行所述矩阵向量计算宏指令的运行设备；

指令生成模块，用于根据所述矩阵向量计算宏指令和所述运行设备，生成运行指令，

其中，所述矩阵向量计算宏指令是指用于对矩阵和向量进行计算的宏指令，

所述矩阵向量计算宏指令包含操作类型、输入地址和输出地址，所述运行指令包含所述操作类型、运行输入地址和运行输出地址，所述运行输入地址和所述运行输出地址是分别根据所述输入地址、所述输出地址确定的。

条款I2、根据条款I1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述矩阵向量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述矩阵向量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述矩阵向量计算宏指令相对应的指令集。

条款I3、根据条款I2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述矩阵向量计算宏指令中不包含所述指定设备的标识时，根据接收到的矩阵向量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述矩阵向量计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款I4、根据条款I3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述矩阵向量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述矩阵向量计算宏指令的执行条件时，根据所述矩阵向量计算宏指令和所述备选设备的资源信息，确定运行设备。

条款I5、根据条款I2-条款I4任一项所述的装置，所述矩阵向量计算宏指令还包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述矩阵向量计算宏指令的数据量，根据所述数据量、所述矩阵向量计算宏指令和所述运行设备的资源信息，生成运行指令，

条款I6、根据条款I5所述的装置，所述指令生成模块，包括：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述矩阵向量计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述矩阵向量计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款I7、根据条款I5所述的装置，所述指令生成模块，包括：

第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述矩阵向量计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款I8、根据条款I1所述的装置，所述装置还包括：

条款I9、根据条款I2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行矩阵向量计算指令，根据确定的指定设备的标识和所述待执行矩阵向量计算指令生成所述矩阵向量计算宏指令。

条款I10、根据条款I1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款I11、根据条款I1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合

所述装置设置于CPU和/或NPU中；

所述矩阵向量计算宏指令包括以下指令中的至少一种：矩阵乘向量计算宏指令、向量乘矩阵计算宏指令、张量计算宏指令、矩阵相加计算宏指令、矩阵相减计算宏指令；

所述矩阵向量计算宏指令还包含以下选项中的至少一项：用于执行所述矩阵向量计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数，所述指令参数包括第二个操作数的地址、长度中的至少一种。

条款I12、一种机器学习运算装置，所述装置包括：

一个或多个如条款I1-条款I11任一项所述的矩阵向量计算指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述矩阵向量计算指令生成装置时，所述多个所述矩阵向量计算指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述矩阵向量计算指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述矩阵向量计算指令生成装置共享同一控制***或拥有各自的控制***；多个所述矩阵向量计算指令生成装置共享内存或者拥有各自的内存；多个所述矩阵向量计算指令生成装置的互联方式是任意互联拓扑。

条款I13、一种组合处理装置，所述装置包括：

如条款I12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款I14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款I12所述的机器学习运算装置或如条款I13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款I15、一种矩阵向量计算指令生成方法，所述方法包括：

根据接收到的矩阵向量计算宏指令，确定执行所述矩阵向量计算宏指令的运行设备；

根据所述矩阵向量计算宏指令和所述运行设备，生成运行指令，

条款I16、根据条款I15所述的方法，根据接收到的矩阵向量计算宏指令，确定执行所述矩阵向量计算宏指令的运行设备，包括：

在确定所述矩阵向量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述矩阵向量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

条款I17、根据条款I16所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的矩阵向量计算宏指令，确定执行所述矩阵向量计算宏指令的运行设备，包括：

在确定所述矩阵向量计算宏指令中不包含所述指定设备的标识时，根据接收到的矩阵向量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述矩阵向量计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款I18、根据条款I17所述的方法，根据接收到的矩阵向量计算宏指令，确定执行所述矩阵向量计算宏指令的运行设备，包括：

在确定所述矩阵向量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述矩阵向量计算宏指令的执行条件时，根据所述矩阵向量计算宏指令和所述备选设备的资源信息，确定运行设备。

条款I19、根据条款I16-条款I18任一项所述的方法，所述矩阵向量计算宏指令还包含输入量和输出量中的至少一项，

根据所述矩阵向量计算宏指令和所述运行设备，生成运行指令，包括：

确定所述矩阵向量计算宏指令的数据量，根据所述数据量、所述矩阵向量计算宏指令和所述运行设备的资源信息，生成运行指令，

条款I20、根据条款I19所述的方法，根据所述矩阵向量计算宏指令的数据量、所述矩阵向量计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述矩阵向量计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述矩阵向量计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款I21、根据条款I19所述的方法，根据所述矩阵向量计算宏指令的数据量、所述矩阵向量计算宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述矩阵向量计算宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款I22、根据条款I15所述的方法，所述方法还包括：

条款I23、根据条款I16所述的方法，所述方法还包括：

接收待执行矩阵向量计算指令，根据确定的指定设备的标识和所述待执行矩阵向量计算指令生成所述矩阵向量计算宏指令。

条款I24、根据条款I15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款I25、根据条款I15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款J1、一种矩阵向量计算指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述矩阵向量计算宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

条款J2、根据条款J1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述矩阵向量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述矩阵向量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述矩阵向量计算宏指令中不包含所述指定设备的标识时，根据接收到的矩阵向量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述矩阵向量计算宏指令的运行设备；

第三确定子模块，在确定所述矩阵向量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述矩阵向量计算宏指令的执行条件时，根据所述矩阵向量计算宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述矩阵向量计算宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款J3、根据条款J2所述的***，所述矩阵向量计算宏指令还包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述矩阵向量计算宏指令的数据量，根据所述矩阵向量计算宏指令的数据量、所述矩阵向量计算宏指令和所述运行设备的资源信息，生成运行指令，

条款J4、根据条款J3所述的***，所述指令生成模块，包括以下至少一个子模块：

条款J5、根据条款J1所述的***，所述指令生成设备还包括：

条款J6、根据条款J2所述的***，所述指令生成设备还包括：

条款J7、根据条款J1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款J8、根据条款J1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款J9、根据条款J1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款J10、根据条款J9所述的***，所述执行模块，包括：

条款J11、根据条款J1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

条款J12、一种机器学习运算装置，所述装置包括：

一个或多个如条款J1-条款J11任一项所述的矩阵向量计算指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述矩阵向量计算指令处理***时，所述多个所述矩阵向量计算指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述矩阵向量计算指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述矩阵向量计算指令处理***共享同一控制***或拥有各自的控制***；多个所述矩阵向量计算指令处理***共享内存或者拥有各自的内存；多个所述矩阵向量计算指令处理***的互联方式是任意互联拓扑。

条款J13、一种组合处理装置，所述组合处理装置包括：

如条款J12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款J14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款J12所述的机器学习运算装置或如条款J13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款J15、一种矩阵向量计算指令处理方法，所述方法应用于矩阵向量计算指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的矩阵向量计算宏指令，确定执行所述矩阵向量计算宏指令的运行设备，并根据所述矩阵向量计算宏指令和所述运行设备，生成运行指令；

条款J16、根据条款J15所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的矩阵向量计算宏指令，确定执行所述矩阵向量计算宏指令的运行设备，包括以下至少一项：

在确定所述矩阵向量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述矩阵向量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述矩阵向量计算宏指令中不包含所述指定设备的标识时，根据接收到的矩阵向量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述矩阵向量计算宏指令的运行设备；

在确定所述矩阵向量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述矩阵向量计算宏指令的执行条件时，根据所述矩阵向量计算宏指令和所述备选设备的资源信息，确定运行设备，

条款J17、根据条款J16所述的方法，所述矩阵向量计算宏指令还包含输入量和输出量中的至少一项，

确定所述矩阵向量计算宏指令的数据量，根据所述矩阵向量计算宏指令的数据量、所述矩阵向量计算宏指令和所述运行设备的资源信息，生成运行指令，

条款J18、根据条款J17所述的方法，根据所述矩阵向量计算宏指令的数据量、所述矩阵向量计算宏指令和所述运行设备的资源信息，生成运行指令，包括以下至少一项：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述矩阵向量计算宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述矩阵向量计算宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

条款J19、根据条款J15所述的方法，所述方法还包括：

条款J20、根据条款J16所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行矩阵向量计算指令，根据确定的指定设备的标识和所述待执行矩阵向量计算指令生成所述矩阵向量计算宏指令。

条款J21、根据条款J15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款J22、根据条款J15所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款J23、根据条款J15所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款J24、根据条款J23所述的方法，所述方法还包括：

条款J25、根据条款J15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

所述矩阵向量计算宏指令还包括以下选项中的至少一项：用于执行所述矩阵向量计算宏指令的指定设备的标识、输入量、输出量、操作数和指令参数，所述指令参数包括第二个操作数的地址、长度中的至少一种。

对于标量计算指令，可以通过下述标量计算指令生成装置、方法，以及标量计算指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款K1、一种标量计算指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的标量计算宏指令，确定执行所述标量计算宏指令的运行设备；

指令生成模块，用于根据所述标量计算宏指令和所述运行设备，生成运行指令，

其中，所述标量计算宏指令是指用于对标量进行算术运算的宏指令，

所述标量计算宏指令包含操作类型、第一操作数、第二操作数和输出地址，所述运行指令包含所述操作类型、第一运行操作数、第二运行操作数和运行输出地址，所述第一运行操作数、所述第二运行操作数和所述运行输出地址是分别根据所述第一操作数、所述第二操作数和所述输出地址确定的。

条款K2、根据条款K1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述标量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述标量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述标量计算宏指令相对应的指令集。

条款K3、根据条款K2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述标量计算宏指令中不包含所述指定设备的标识时，根据接收到的标量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款K4、根据条款K3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述标量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述标量计算宏指令的执行条件时，根据所述标量计算宏指令和所述备选设备的资源信息，确定运行设备。

条款K5、根据条款K1所述的装置，所述装置还包括：

条款K6、根据条款K2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行标量计算指令，根据确定的指定设备的标识和所述待执行标量计算指令生成所述标量计算宏指令。

条款K7、根据条款K1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款K8、根据条款K1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合

所述装置设置于CPU和/或NPU中；

所述标量计算宏指令包括以下指令中的至少一种：标量相加计算宏指令、标量相减计算宏指令、标量相乘计算宏指令和标量相除计算宏指令。

条款K9、一种机器学习运算装置，所述装置包括：

一个或多个如条款K1-条款K8任一项所述的标量计算指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述标量计算指令生成装置时，所述多个所述标量计算指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述标量计算指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述标量计算指令生成装置共享同一控制***或拥有各自的控制***；多个所述标量计算指令生成装置共享内存或者拥有各自的内存；多个所述标量计算指令生成装置的互联方式是任意互联拓扑。

条款K10、一种组合处理装置，所述装置包括：

如条款K9所述的机器学习运算装置、通用互联接口和其他处理装置；

条款K11、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款K9所述的机器学习运算装置或如条款K10所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款K12、一种标量计算指令生成方法，所述方法包括：

根据接收到的标量计算宏指令，确定执行所述标量计算宏指令的运行设备；

根据所述标量计算宏指令和所述运行设备，生成运行指令，

所述标量计算宏指令包含操作类型、第一操作数、第二操作数和输出地址，

所述运行指令包含所述操作类型、第一运行操作数、第二运行操作数和运行输出地址，所述第一运行操作数、所述第二运行操作数和所述运行输出地址是分别根据所述第一操作数、所述第二操作数和所述输出地址确定的。

条款K13、根据条款K12所述的方法，根据接收到的标量计算宏指令，确定执行所述标量计算宏指令的运行设备，包括：

在确定所述标量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述标量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

条款K14、根据条款K13所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的标量计算宏指令，确定执行所述标量计算宏指令的运行设备，包括：

在确定所述标量计算宏指令中不包含所述指定设备的标识时，根据接收到的标量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款K15、根据条款K14所述的方法，根据接收到的标量计算宏指令，确定执行所述标量计算宏指令的运行设备，包括：

在确定所述标量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述标量计算宏指令的执行条件时，根据所述标量计算宏指令和所述备选设备的资源信息，确定运行设备。

条款K16、根据条款K12所述的方法，所述方法还包括：

条款K17、根据条款K13所述的方法，所述方法还包括：

接收待执行标量计算指令，根据确定的指定设备的标识和所述待执行标量计算指令生成所述标量计算宏指令。

条款K18、根据条款K12所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款K19、根据条款K12所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款L1、一种标量计算指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述标量计算宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

条款L2、根据条款L1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述标量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述标量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述标量计算宏指令中不包含所述指定设备的标识时，根据接收到的标量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量计算宏指令的运行设备；

第三确定子模块，在确定所述标量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述标量计算宏指令的执行条件时，根据所述标量计算宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述标量计算宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款L3、根据条款L1所述的***，所述指令生成设备还包括：

条款L4、根据条款L2所述的***，所述指令生成设备还包括：

条款L5、根据条款L1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款L6、根据条款L1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款L7、根据条款L1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款L8、根据条款L7所述的***，所述执行模块，包括：

条款L9、根据条款L1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

条款L10、一种机器学习运算装置，所述装置包括：

一个或多个如条款L1-条款L9任一项所述的标量计算指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述标量计算指令处理***时，所述多个所述标量计算指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述标量计算指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述标量计算指令处理***共享同一控制***或拥有各自的控制***；多个所述标量计算指令处理***共享内存或者拥有各自的内存；多个所述标量计算指令处理***的互联方式是任意互联拓扑。

条款L11、一种组合处理装置，所述组合处理装置包括：

如条款L110所述的机器学习运算装置、通用互联接口和其他处理装置；

条款L12、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款L10所述的机器学习运算装置或如条款L13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款L13、一种标量计算指令处理方法，所述方法应用于标量计算指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的标量计算宏指令，确定执行所述标量计算宏指令的运行设备，并根据所述标量计算宏指令和所述运行设备，生成运行指令；

条款L14、根据条款L13所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的标量计算宏指令，确定执行所述标量计算宏指令的运行设备，包括以下至少一项：

在确定所述标量计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述标量计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述标量计算宏指令中不包含所述指定设备的标识时，根据接收到的标量计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量计算宏指令的运行设备；

在确定所述标量计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述标量计算宏指令的执行条件时，根据所述标量计算宏指令和所述备选设备的资源信息，确定运行设备，

条款L15、根据条款L13所述的方法，所述方法还包括：

条款L16、根据条款L14所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行标量计算指令，根据确定的指定设备的标识和所述待执行标量计算指令生成所述标量计算宏指令。

条款L17、根据条款L13所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款L18、根据条款L13所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款L19、根据条款L13所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款L20、根据条款L19所述的方法，所述方法还包括：

条款L21、根据条款L13所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

对于标量逻辑计算指令，可以通过下述标量逻辑计算指令生成装置、方法，以及标量逻辑计算指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款M1、一种标量逻辑计算指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的标量逻辑计算宏指令，确定执行所述标量逻辑计算宏指令的运行设备；

指令生成模块，用于根据所述标量逻辑计算宏指令和所述运行设备，生成运行指令，

其中，所述标量逻辑计算宏指令是指用于对标量进行逻辑运算的宏指令，

所述标量逻辑计算宏指令包含操作类型、第一操作数、第二操作数和输出地址，

条款M2、根据条款M1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述标量逻辑计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述标量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述标量逻辑计算宏指令相对应的指令集。

条款M3、根据条款M2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述标量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的标量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量逻辑计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款M4、根据条款M3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述标量逻辑计算宏指令中包含包括所述指定设备的标识，且所述指定设备的资源不满足执行所述标量逻辑计算宏指令的执行条件时，根据所述标量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备。

条款M5、根据条款M1所述的装置，所述装置还包括：

条款M6、根据条款M2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行标量逻辑计算指令，根据确定的指定设备的标识和所述待执行标量逻辑计算指令生成所述标量逻辑计算宏指令。

条款M7、根据条款M1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款M8、根据条款M1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合

所述装置设置于CPU和/或NPU中；

所述标量逻辑计算宏指令包括以下指令中的至少一种：标量与计算宏指令、标量或计算宏指令、标量非计算宏指令、标量比较计算宏指令。

条款M9、一种机器学习运算装置，所述装置包括：

一个或多个如条款M1-条款M8任一项所述的标量逻辑计算指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述标量逻辑计算指令生成装置时，所述多个所述标量逻辑计算指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述标量逻辑计算指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述标量逻辑计算指令生成装置共享同一控制***或拥有各自的控制***；多个所述标量逻辑计算指令生成装置共享内存或者拥有各自的内存；多个所述标量逻辑计算指令生成装置的互联方式是任意互联拓扑。

条款M10、一种组合处理装置，所述装置包括：

如条款M9所述的机器学习运算装置、通用互联接口和其他处理装置；

其中，所述的组合处理装置还包括：存储装置，该存储装置分别与所述机器学习运算装置和所述其他处理装置连接，用于保存所述机器学习运算装置和所述其他处理装置的数据。

条款M11、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款M9所述的机器学习运算装置或如条款M10所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款M12、一种标量逻辑计算指令生成方法，所述方法包括：

根据接收到的标量逻辑计算宏指令，确定执行所述标量逻辑计算宏指令的运行设备；

根据所述标量逻辑计算宏指令和所述运行设备，生成运行指令，

其中，所述标量逻辑计算宏指令是指用于对标量进行逻辑运算的宏指令，所述标量逻辑计算宏指令包括操作类型、第一操作数、第二操作数和输出地址，

所述运行指令包括所述操作类型、第一运行操作数、第二运行操作数和运行输出地址，所述第一运行操作数、所述第二运行操作数和所述运行输出地址是分别根据所述第一操作数、所述第二操作数和所述输出地址确定的。

条款M13、根据条款M12所述的方法，根据接收到的标量逻辑计算宏指令，确定执行所述标量逻辑计算宏指令的运行设备，包括：

在确定所述标量逻辑计算宏指令中包含包括指定设备的标识，且所述指定设备的资源满足执行所述标量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备，

条款M14、根据条款M13所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的标量逻辑计算宏指令，确定执行所述标量逻辑计算宏指令的运行设备，包括：

在确定所述标量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的标量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量逻辑计算宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款M15、根据条款M14所述的方法，根据接收到的标量逻辑计算宏指令，确定执行所述标量逻辑计算宏指令的运行设备，包括：

在确定所述标量逻辑计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述标量逻辑计算宏指令的执行条件时，根据所述标量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备。

条款M16、根据条款M12所述的方法，所述方法还包括：

条款M17、根据条款M13所述的方法，所述方法还包括：

接收待执行标量逻辑计算指令，根据确定的指定设备的标识和所述待执行标量逻辑计算指令生成所述标量逻辑计算宏指令。

条款M18、根据条款M12所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款M19、根据条款M12所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款N1、一种标量逻辑计算指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述标量逻辑计算宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

条款N2、根据条款N1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述标量逻辑计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述标量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述标量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的标量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量逻辑计算宏指令的运行设备；

第三确定子模块，在确定所述标量逻辑计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述标量逻辑计算宏指令的执行条件时，根据所述标量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述标量逻辑计算宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款N3、根据条款N1所述的***，所述指令生成设备还包括：

条款N4、根据条款N2所述的***，所述指令生成设备还包括：

条款N5、根据条款N1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款N6、根据条款N1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款N7、根据条款N1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款N8、根据条款N7所述的***，所述执行模块，包括：

条款N9、根据条款N1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

条款N10、一种机器学习运算装置，所述装置包括：

一个或多个如条款N1-条款N9任一项所述的标量逻辑计算指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述标量逻辑计算指令处理***时，所述多个所述标量逻辑计算指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述标量逻辑计算指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述标量逻辑计算指令处理***共享同一控制***或拥有各自的控制***；多个所述标量逻辑计算指令处理***共享内存或者拥有各自的内存；多个所述标量逻辑计算指令处理***的互联方式是任意互联拓扑。

条款N11、一种组合处理装置，所述组合处理装置包括：

如条款N110所述的机器学习运算装置、通用互联接口和其他处理装置；

条款N12、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款N10所述的机器学习运算装置或如条款N13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款N13、一种标量逻辑计算指令处理方法，所述方法应用于标量逻辑计算指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的标量逻辑计算宏指令，确定执行所述标量逻辑计算宏指令的运行设备，并根据所述标量逻辑计算宏指令和所述运行设备，生成运行指令；

其中，所述标量逻辑计算宏指令是指用于对标量进行算术运算的宏指令，

条款N14、根据条款N13所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的标量逻辑计算宏指令，确定执行所述标量逻辑计算宏指令的运行设备，包括以下至少一项：

在确定所述标量逻辑计算宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述标量逻辑计算宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述标量逻辑计算宏指令中不包含所述指定设备的标识时，根据接收到的标量逻辑计算宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述标量逻辑计算宏指令的运行设备；

在确定所述标量逻辑计算宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述标量逻辑计算宏指令的执行条件时，根据所述标量逻辑计算宏指令和所述备选设备的资源信息，确定运行设备，

条款N15、根据条款N13所述的方法，所述方法还包括：

条款N16、根据条款N14所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行标量逻辑计算指令，根据确定的指定设备的标识和所述待执行标量逻辑计算指令生成所述标量逻辑计算宏指令。

条款N17、根据条款N13所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款N18、根据条款N13所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款N19、根据条款N13所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款N20、根据条款N19所述的方法，所述方法还包括：

条款N21、根据条款N13所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

对于控制指令，可以通过下述控制指令生成装置、方法，以及控制指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款O1、一种控制指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的控制宏指令，确定执行所述控制宏指令的运行设备；

指令生成模块，用于根据所述控制宏指令和所述运行设备，生成运行指令，

其中，所述控制宏指令是指用于控制指令流跳转至目标跳转位置的宏指令，

所述控制宏指令包含操作类型和目标跳转位置，所述运行指令包含所述操作类型和运行目标跳转位置，所述运行目标跳转位置是根据所述目标跳转位置确定的。

条款O2、根据条款O1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述控制宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述控制宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述控制宏指令的操作类型相对应的指令集。

条款O3、根据条款O2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述控制宏指令中不包含所述指定设备的标识时，根据接收到的控制宏指令的操作类型和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述控制宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款O4、根据条款O3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述控制宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述控制宏指令的执行条件时，根据所述控制宏指令和所述备选设备的资源信息，确定运行设备。

条款O5、根据条款O1所述的装置，所述装置还包括：

条款O6、根据条款O2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行控制指令，根据确定的指定设备的标识和所述待执行控制指令生成所述控制宏指令。

条款O7、根据条款O1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款O8、根据条款O1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合

所述装置设置于CPU和/或NPU中；

所述控制宏指令包括无条件跳转宏指令和有条件跳转宏指令中的至少一种，所述有条件跳转宏指令包含跳转条件。

条款O9、一种机器学习运算装置，所述装置包括：

一个或多个如条款O1-条款O8任一项所述的控制指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述控制指令生成装置时，所述多个所述控制指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述控制指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述控制指令生成装置共享同一控制***或拥有各自的控制***；多个所述控制指令生成装置共享内存或者拥有各自的内存；多个所述控制指令生成装置的互联方式是任意互联拓扑。

条款O10、一种组合处理装置，所述装置包括：

如条款O9所述的机器学习运算装置、通用互联接口和其他处理装置；

条款O11、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款O9所述的机器学习运算装置或如条款O10所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款O12、一种控制指令生成方法，所述方法包括：

根据接收到的控制宏指令，确定执行所述控制宏指令的运行设备；

根据所述控制宏指令和所述运行设备，生成运行指令，

条款O13、根据条款O12所述的方法，根据接收到的控制宏指令，确定执行所述控制宏指令的运行设备，包括：

在确定所述控制宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述控制宏指令的执行条件时，将所述指定设备确定为所述运行设备，

条款O14、根据条款O13所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的控制宏指令，确定执行所述控制宏指令的运行设备，包括：

在确定所述控制宏指令中不包含所述指定设备的标识时，根据接收到的控制宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述控制宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款O15、根据条款O14所述的方法，根据接收到的控制宏指令，确定执行所述控制宏指令的运行设备，包括：

在确定所述控制宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述控制宏指令的执行条件时，根据所述控制宏指令和所述备选设备的资源信息，确定运行设备。

条款O16、根据条款O12所述的方法，所述方法还包括：

条款O17、根据条款O13所述的方法，所述方法还包括：

接收待执行控制指令，根据确定的指定设备的标识和所述待执行控制指令生成所述控制宏指令。

条款O18、根据条款O12所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款O19、根据条款O12所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款P1、一种控制指令处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述控制宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

条款P2、根据条款P1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述控制宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述控制宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述控制宏指令中不包含所述指定设备的标识时，根据接收到的控制宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述控制宏指令的运行设备；

第三确定子模块，在确定所述控制宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述控制宏指令的执行条件时，根据所述控制宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述控制宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款P3、根据条款P1所述的***，所述指令生成设备还包括：

条款P4、根据条款P2所述的***，所述指令生成设备还包括：

条款P5、根据条款P1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款P6、根据条款P1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款P7、根据条款P1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款P8、根据条款P7所述的***，所述执行模块，包括：

条款P9、根据条款P1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

条款P10、一种机器学习运算装置，所述装置包括：

一个或多个如条款P1-条款P9任一项所述的控制指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述控制指令处理***时，所述多个所述控制指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述控制指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述控制指令处理***共享同一控制***或拥有各自的控制***；多个所述控制指令处理***共享内存或者拥有各自的内存；多个所述控制指令处理***的互联方式是任意互联拓扑。

条款P11、一种组合处理装置，所述组合处理装置包括：

如条款P110所述的机器学习运算装置、通用互联接口和其他处理装置；

条款P12、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款P10所述的机器学习运算装置或如条款P13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款P13、一种控制指令处理方法，所述方法应用于控制指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的控制宏指令，确定执行所述控制宏指令的运行设备，并根据所述控制宏指令和所述运行设备，生成运行指令；

条款P14、根据条款P13所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的控制宏指令，确定执行所述控制宏指令的运行设备，包括以下至少一项：

在确定所述控制宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述控制宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述控制宏指令中不包含所述指定设备的标识时，根据接收到的控制宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述控制宏指令的运行设备；

在确定所述控制宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述控制宏指令的执行条件时，根据所述控制宏指令和所述备选设备的资源信息，确定运行设备，

条款P15、根据条款P13所述的方法，所述方法还包括：

条款P16、根据条款P14所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行控制指令，根据确定的指定设备的标识和所述待执行控制指令生成所述控制宏指令。

条款P17、根据条款P13所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款P18、根据条款P13所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款P19、根据条款P13所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款P20、根据条款P19所述的方法，所述方法还包括：

条款P21、根据条款P13所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

对于数据读入指令，可以通过下述数据读入指令生成装置、方法，以及数据读入指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款Q1、一种数据读入指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的读宏指令，确定执行所述读宏指令的运行设备；

指令生成模块，用于根据所述读宏指令和所述运行设备，生成运行指令，

其中，所述读宏指令是指用于进行数据读入的宏指令，

所述读宏指令包含操作类型、数据读入地址、数据加密方式地址，所述运行指令中包含所述操作类型、运行数据读入地址和运行数据加密方式地址，所述运行数据读入地址和运行数据加密方式地址分别是根据所述数据读入地址和所述数据加密方式地址确定的。

条款Q2、根据条款Q1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述读宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述读宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述读宏指令的操作类型相对应的指令集。

条款Q3、根据条款Q2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述读宏指令中不包含所述指定设备的标识时，根据接收到的读宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述读宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款Q4、根据条款Q3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述读宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述读宏指令的执行条件时，根据所述读宏指令和所述备选设备的资源信息，确定运行设备。

条款Q5、根据条款Q2-条款Q4任一项所述的装置，所述读宏指令还包含读入量，

所述指令生成模块，还用于确定所述读宏指令的数据量，根据所述数据量、所述读宏指令和所述运行设备的资源信息，生成运行指令，

其中，所述数据量是根据所述读入量确定的，所述运行设备的资源信息还包括存储容量、剩余存储容量的至少一项。

条款Q6、根据条款Q5所述的装置，所述指令生成模块，包括：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述读宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述读宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

其中，所述运行设备的运行数据量是根据所述运行设备的资源信息确定的，每条运行指令还包含运行读入量，所述运行读入量是根据所述运行数据量确定的。

条款Q7、根据条款Q5所述的装置，所述指令生成模块，包括：

第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述读宏指令进行拆分，生成对应于每个运行设备的运行指令，

其中，每个运行设备的运行数据量是根据每个运行设备的资源信息确定的，所述运行指令还包含运行读入量，所述运行读入量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款Q8、根据条款Q1所述的装置，所述装置还包括：

条款Q9、根据条款Q2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行读指令，根据确定的指定设备的标识和所述待执行读指令生成所述读宏指令。

条款Q10、根据条款Q1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款Q11、根据条款Q1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述装置设置于CPU和/或NPU中；

所述读宏指令包括读神经元宏指令、读突触宏指令和读标量宏指令中的至少一种。

条款Q12、一种机器学习运算装置，所述装置包括：

一个或多个如条款Q1-条款Q11任一项所述的数据读入指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述数据读入指令生成装置时，所述多个所述数据读入指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述数据读入指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述数据读入指令生成装置共享同一控制***或拥有各自的控制***；多个所述数据读入指令生成装置共享内存或者拥有各自的内存；多个所述数据读入指令生成装置的互联方式是任意互联拓扑。

条款Q13、一种组合处理装置，所述装置包括：

如条款Q12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款Q14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款Q12所述的机器学习运算装置或如条款Q13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款Q15、一种数据读入指令生成方法，所述方法包括：

根据接收到的读宏指令，确定执行所述读宏指令的运行设备；

根据所述读宏指令和所述运行设备，生成运行指令，

其中，所述读宏指令是指用于进行数据读入的宏指令，

条款Q16、根据条款Q15所述的方法，根据接收到的读宏指令，确定执行所述读宏指令的运行设备，包括：

在确定所述读宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述读宏指令的执行条件时，将所述指定设备确定为所述运行设备，

条款Q17、根据条款Q16所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的读宏指令，确定执行所述读宏指令的运行设备，包括：

在确定所述读宏指令中不包含所述指定设备的标识时，根据接收到的读宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述读宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款Q18、根据条款Q17所述的方法，根据接收到的读宏指令，确定执行所述读宏指令的运行设备，包括：

在确定所述读宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述读宏指令的执行条件时，根据所述读宏指令和所述备选设备的资源信息，确定运行设备。

条款Q19、根据条款Q16-条款Q18任一项所述的方法，所述读宏指令还包含读入量，

根据所述读宏指令和所述运行设备，生成运行指令，包括：

确定所述读宏指令的数据量，根据所述数据量、所述读宏指令和所述运行设备的资源信息，生成运行指令，

条款Q20、根据条款Q19所述的方法，根据所述读宏指令的数据量、所述读宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述读宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述读宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款Q21、根据条款Q19所述的方法，根据所述读宏指令的数据量、所述读宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述读宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款Q22、根据条款Q15所述的方法，所述方法还包括：

条款Q23、根据条款Q16所述的方法，所述方法还包括：

接收待执行读指令，根据确定的指定设备的标识和所述待执行读指令生成所述读宏指令。

条款Q24、根据条款Q15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款Q25、根据条款Q15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款R1、一种数据读入处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述读宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

其中，所述读宏指令是指用于进行数据读入的宏指令，

条款R2、根据条款R1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述读宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述读宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述读宏指令中不包含所述指定设备的标识时，根据接收到的读宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述读宏指令的运行设备；

第三确定子模块，在确定所述读宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述读宏指令的执行条件时，根据所述读宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述读宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款R3、根据条款R2所述的***，所述读宏指令还包含读入量，

条款R4、根据条款R3所述的***，所述指令生成模块，包括以下至少一个子模块：

其中，运行设备的运行数据量是根据运行设备的资源信息确定的，所述运行指令还包含运行读入量，所述运行读入量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款R5、根据条款R1所述的***，所述指令生成设备还包括：

条款R6、根据条款R2所述的***，所述指令生成设备还包括：

条款R7、根据条款R1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款R8、根据条款R1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款R9、根据条款R1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款R10、根据条款R9所述的***，所述执行模块，包括：

条款R11、根据条款R1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

条款R12、一种机器学习运算装置，所述装置包括：

一个或多个如条款R1-条款R11任一项所述的数据读入指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述数据读入指令处理***时，所述多个所述数据读入指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述数据读入指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述数据读入指令处理***共享同一控制***或拥有各自的控制***；多个所述数据读入指令处理***共享内存或者拥有各自的内存；多个所述数据读入指令处理***的互联方式是任意互联拓扑。

条款R13、一种组合处理装置，所述组合处理装置包括：

如条款R12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款R14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款R12所述的机器学习运算装置或如条款R13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款R15、一种数据读入指令处理方法，所述方法应用于数据读入指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的读宏指令，确定执行所述读宏指令的运行设备，并根据所述读宏指令和所述运行设备，生成运行指令；

其中，所述读宏指令是指用于进行数据读入的宏指令，

条款R16、根据条款R15所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的读宏指令，确定执行所述读宏指令的运行设备，包括以下至少一项：

在确定所述读宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述读宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述读宏指令中不包含所述指定设备的标识时，根据接收到的读宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述读宏指令的运行设备；

在确定所述读宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述读宏指令的执行条件时，根据所述读宏指令和所述备选设备的资源信息，确定运行设备，

条款R17、根据条款R16所述的方法，所述读宏指令还包含读入量，

根据所述读宏指令和所述运行设备，生成运行指令，包括：

确定所述读宏指令的数据量，根据所述读宏指令的数据量、所述读宏指令和所述运行设备的资源信息，生成运行指令，

条款R18、根据条款R17所述的方法，根据所述读宏指令的数据量、所述读宏指令和所述运行设备的资源信息，生成运行指令，包括以下至少一项：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述读宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述读宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

条款R19、根据条款R15所述的方法，所述方法还包括：

条款R20、根据条款R16所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行读指令，根据确定的指定设备的标识和所述待执行读指令生成所述读宏指令。

条款R21、根据条款R15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款R22、根据条款R15所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款R23、根据条款R15所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款R24、根据条款R23所述的方法，所述方法还包括：

条款R25、根据条款R15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

对于数据写入指令，可以通过下述数据写入指令生成装置、方法，以及数据写入指令处理***、方法等相关产品进行处理，依据以下条款可更好地理解前述内容：

条款S1、一种数据写入指令生成装置，所述装置包括：

设备确定模块，用于根据接收到的写宏指令，确定执行所述写宏指令的运行设备；

指令生成模块，用于根据所述写宏指令和所述运行设备，生成运行指令，

其中，所述写宏指令是指用于进行数据写入的宏指令，

所述写宏指令包含操作类型、数据写入地址、数据加密方式地址，所述运行指令中包含所述操作类型、运行数据写入地址和运行数据加密方式地址，所述运行数据写入地址和运行数据加密方式地址分别是根据所述数据写入地址和所述数据加密方式地址确定的。

条款S2、根据条款S1所述的装置，所述设备确定模块，包括：

第一确定子模块，用于在确定所述写宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述写宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述写宏指令的操作类型相对应的指令集。

条款S3、根据条款S2所述的装置，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，还包括：

第二确定子模块，用于在确定所述写宏指令中不包含所述指定设备的标识时，根据接收到的写宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述写宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款S4、根据条款S3所述的装置，所述设备确定模块，还包括：

第三确定子模块，在确定所述写宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述写宏指令的执行条件时，根据所述写宏指令和所述备选设备的资源信息，确定运行设备。

条款S5、根据条款S2-条款S4任一项所述的装置，所述写宏指令还包含写入量，

所述指令生成模块，还用于确定所述写宏指令的数据量，根据所述数据量、所述写宏指令和所述运行设备的资源信息，生成运行指令，

其中，所述数据量是根据所述写入量确定的，所述运行设备的资源信息还包括存储容量、剩余存储容量的至少一项。

条款S6、根据条款S5所述的装置，所述指令生成模块，包括：

第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述写宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述写宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

其中，所述运行设备的运行数据量是根据所述运行设备的资源信息确定的，每条运行指令还包含运行写入量，所述运行写入量是根据所述运行数据量确定的。

条款S7、根据条款S5所述的装置，所述指令生成模块，包括：

第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述写宏指令进行拆分，生成对应于每个运行设备的运行指令，

其中，每个运行设备的运行数据量是根据每个运行设备的资源信息确定的，所述运行指令还包含运行写入量，所述运行写入量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款S8、根据条款S1所述的装置，所述装置还包括：

条款S9、根据条款S2所述的装置，所述装置还包括：

宏指令生成模块，用于接收待执行写指令，根据确定的指定设备的标识和所述待执行写指令生成所述写宏指令。

条款S10、根据条款S1所述的装置，所述装置还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款S11、根据条款S1所述的装置，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述装置设置于CPU和/或NPU中；

所述写宏指令包括写神经元宏指令、写突触宏指令和写标量宏指令中的至少一种。

条款S12、一种机器学习运算装置，所述装置包括：

一个或多个如条款S1-条款S11任一项所述的数据写入指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述数据写入指令生成装置时，所述多个所述数据写入指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述数据写入指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述数据写入指令生成装置共享同一控制***或拥有各自的控制***；多个所述数据写入指令生成装置共享内存或者拥有各自的内存；多个所述数据写入指令生成装置的互联方式是任意互联拓扑。

条款S13、一种组合处理装置，所述装置包括：

如条款S12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款S14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款S12所述的机器学习运算装置或如条款S13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款S15、一种数据写入指令生成方法，所述方法包括：

根据接收到的写宏指令，确定执行所述写宏指令的运行设备；

根据所述写宏指令和所述运行设备，生成运行指令，

其中，所述写宏指令是指用于进行数据写入的宏指令，

条款S16、根据条款S15所述的方法，根据接收到的写宏指令，确定执行所述写宏指令的运行设备，包括：

在确定所述写宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述写宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括所述指定设备中包含与所述写宏指令的操作类型相对应的指令集。

条款S17、根据条款S16所述的方法，所述方法还包括：

获取备选设备的资源信息，

其中，根据接收到的写宏指令，确定执行所述写宏指令的运行设备，包括：

在确定所述写宏指令中不包含所述指定设备的标识时，根据接收到的写宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述写宏指令的运行设备，

其中，所述资源信息包括所述备选设备所包含的指令集。

条款S18、根据条款S17所述的方法，根据接收到的写宏指令，确定执行所述写宏指令的运行设备，包括：

在确定所述写宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述写宏指令的执行条件时，根据所述写宏指令和所述备选设备的资源信息，确定运行设备。

条款S19、根据条款S16-条款S18任一项所述的方法，所述写宏指令还包含写入量，

根据所述写宏指令和所述运行设备，生成运行指令，包括：

确定所述写宏指令的数据量，根据所述数据量、所述写宏指令和所述运行设备的资源信息，生成运行指令，

条款S20、根据条款S19所述的方法，根据所述写宏指令的数据量、所述写宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述写宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述写宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，

条款S21、根据条款S19所述的方法，根据所述写宏指令的数据量、所述写宏指令和所述运行设备的资源信息，生成运行指令，包括：

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述写宏指令进行拆分，生成对应于每个运行设备的运行指令，

条款S22、根据条款S15所述的方法，所述方法还包括：

条款S23、根据条款S16所述的方法，所述方法还包括：

接收待执行写指令，根据确定的指定设备的标识和所述待执行写指令生成所述写宏指令。

条款S24、根据条款S15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款S25、根据条款S15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU中；

条款T1、一种数据写入处理***，所述***包括指令生成设备和运行设备，

所述指令生成设备，包括：

指令生成模块，用于根据所述写宏指令和所述运行设备，生成运行指令；

所述运行设备，包括：

其中，所述写宏指令是指用于进行数据写入的宏指令，

条款T2、根据条款T1所述的***，所述指令生成设备还包括：

资源获取模块，用于获取备选设备的资源信息，

所述设备确定模块，包括以下至少一个子模块：

第一确定子模块，用于在确定所述写宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述写宏指令的执行条件时，将所述指定设备确定为所述运行设备；

第二确定子模块，用于在确定所述写宏指令中不包含所述指定设备的标识时，根据接收到的写宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述写宏指令的运行设备；

第三确定子模块，在确定所述写宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述写宏指令的执行条件时，根据所述写宏指令和所述备选设备的资源信息，确定运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述写宏指令相对应的指令集，所述资源信息包括所述备选设备所包含的指令集。

条款T3、根据条款T2所述的***，所述写宏指令还包含写入量，

条款T4、根据条款T3所述的***，所述指令生成模块，包括以下至少一个子模块：

其中，运行设备的运行数据量是根据运行设备的资源信息确定的，所述运行指令还包含运行写入量，所述运行写入量是根据执行所述运行指令的运行设备的运行数据量确定的。

条款T5、根据条款T1所述的***，所述指令生成设备还包括：

条款T6、根据条款T2所述的***，所述指令生成设备还包括：

条款T7、根据条款T1所述的***，所述指令生成设备还包括：

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

条款T8、根据条款T1所述的***，所述运行设备，还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款T9、根据条款T1所述的***，所述控制模块，包括：

指令存储子模块，用于存储所述运行指令；

条款T10、根据条款T9所述的***，所述执行模块，包括：

条款T11、根据条款T1所述的***，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

条款T12、一种机器学习运算装置，所述装置包括：

一个或多个如条款T1-条款T11任一项所述的数据写入指令处理***，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述数据写入指令处理***时，所述多个所述数据写入指令处理***间可以通过特定的结构进行连接并传输数据；

其中，多个所述数据写入指令处理***通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述数据写入指令处理***共享同一控制***或拥有各自的控制***；多个所述数据写入指令处理***共享内存或者拥有各自的内存；多个所述数据写入指令处理***的互联方式是任意互联拓扑。

条款T13、一种组合处理装置，所述组合处理装置包括：

如条款T12所述的机器学习运算装置、通用互联接口和其他处理装置；

条款T14、一种板卡，所述板卡包括：存储器件、接口装置和控制器件以及机器学习芯片，所述机器学习芯片包括条款T12所述的机器学习运算装置或如条款T13所述的组合处理装置；

所述存储器件，用于存储数据；

所述控制器件，用于对所述机器学习芯片的状态进行监控。

条款T15、一种数据写入指令处理方法，所述方法应用于数据写入指令处理***，所述***包括指令生成设备和运行设备，所述方法包括：

通过所述指令生成设备根据接收到的写宏指令，确定执行所述写宏指令的运行设备，并根据所述写宏指令和所述运行设备，生成运行指令；

其中，所述写宏指令是指用于进行数据写入的宏指令，

条款T16、根据条款T15所述的方法，所述方法还包括：

通过所述指令生成设备获取备选设备的资源信息，

其中，通过所述指令生成设备根据接收到的写宏指令，确定执行所述写宏指令的运行设备，包括以下至少一项：

在确定所述写宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述写宏指令的执行条件时，将所述指定设备确定为所述运行设备；

在确定所述写宏指令中不包含所述指定设备的标识时，根据接收到的写宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述写宏指令的运行设备；

在确定所述写宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述写宏指令的执行条件时，根据所述写宏指令和所述备选设备的资源信息，确定运行设备，

条款T17、根据条款T16所述的方法，所述写宏指令还包含写入量，

根据所述写宏指令和所述运行设备，生成运行指令，包括：

确定所述写宏指令的数据量，根据所述写宏指令的数据量、所述写宏指令和所述运行设备的资源信息，生成运行指令，

条款T18、根据条款T17所述的方法，根据所述写宏指令的数据量、所述写宏指令和所述运行设备的资源信息，生成运行指令，包括以下至少一项：

在确定所述运行设备为一个，且所述运行设备的运行数据量小于所述写宏指令的数据量时，根据所述运行设备的运行数据量和所述数据量将所述写宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

条款T19、根据条款T15所述的方法，所述方法还包括：

条款T20、根据条款T16所述的方法，所述方法还包括：

通过所述指令生成设备接收待执行写指令，根据确定的指定设备的标识和所述待执行写指令生成所述写宏指令。

条款T21、根据条款T15所述的方法，所述方法还包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

条款T22、根据条款T15所述的方法，所述方法还包括：

所述缓存，用于存储所述数据；

所述寄存器，用于存储所述数据中标量数据。

条款T23、根据条款T15所述的方法，所述方法还包括：

通过所述运行设备存储所述运行指令；

条款T24、根据条款T23所述的方法，所述方法还包括：

条款T25、根据条款T15所述的方法，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述指令生成设备设置于CPU和/或NPU中；

在一种可能的实现方式中，计算宏指令是指用于进行数据计算的宏指令，数据计算可以包括机器学习计算、神经网络计算、向量逻辑计算、矩阵向量计算、标量计算和标量逻辑计算中的至少一种。

神经网络计算宏指令可以是指用于对神经网络算法进行计算的宏指令。例如，对卷积运算(convolutional computation)、池化运算(Pooling)等神经网络算法进行计算的卷积计算宏指令、池化计算宏指令等。不同类型的神经网络计算宏指令对应于不同的操作类型。例如，卷积计算宏指令所对应的操作类型可以为CONV。

向量逻辑计算宏指令可以是指用于对向量进行逻辑运算的宏指令。例如，对向量进行“与”、“比较”、“或”等逻辑计算的宏指令。不同类型的向量逻辑计算宏指令对应于不同的操作类型。例如，向量与计算宏指令所对应的操作类型可以为VAND、向量或计算宏指令所对应的操作类型可以为VOR。

矩阵向量计算宏指令可以是指用于对矩阵和向量进行计算的宏指令。例如，对矩阵和向量进行矩阵乘向量计算、向量乘矩阵计算、张量计算、矩阵相加计算、矩阵相减计算等计算的宏指令。不同类型的矩阵向量计算宏指令对应于不同的操作类型，例如，矩阵相加计算宏指令所对应的操作类型为MADD，矩阵乘向量计算宏指令所对应的操作类型为MMV。

标量计算宏指令可以是指用于对标量进行算术运算的宏指令。例如，对标量进行标量相加、标量相减、标量相乘、标量相除等计算的宏指令。不同类型的标量计算宏指令对应于不同的操作类型。例如，标量相减宏指令所对应的操作类型为SSUB、标量相加宏指令所对应的操作类型为SADD。

标量逻辑计算宏指令可以是用于对标量进行逻辑运算的宏指令。例如，对标量进行“与”、“比较”、“或”、“非”等逻辑运算的宏指令。不同类型的标量逻辑计算宏指令对应于不同的操作类型，例如，标量与计算宏指令所对应的操作类型可以为SAND、标量或计算宏指令所对应的操作类型可以为SOR。

在一种可能的实现方式中，控制宏指令是指用于控制指令流跳转至目标跳转位置的宏指令。无条件跳转宏指令可以是用于对指令流进行控制，使其无条件的跳转至指定位置的宏指令。有条件跳转宏指令可以是用于对指令流进行控制，使有条件跳转宏指令在其需要满足的条件为真时，跳转至指定位置的宏指令。

在一种可能的实现方式中，数据搬运宏指令是指用于对数据进行读入、写入等搬运处理的宏指令。读宏指令可以是指将数据从内存中读入到存储数据的位置的宏指令，可以是指用于进行数据读入的宏指令。根据数据类型的不同，读宏指令可以包括用于读入神经元数据的读神经元宏指令、用于读入突触数据的读突触宏指令和用于读入标量数据的读标量宏指令。写宏指令可以是指将数据从其存储位置写入到内存中的宏指令，可以是指用于进行数据写入的宏指令。根据数据类型的不同，写宏指令可以包括用于写入神经元数据的写神经元宏指令、用于写入突触数据的写突触宏指令和用于写入标量数据的写标量宏指令。其中，神经元数据即为神经网络算法中的输入神经元、输出神经元，突触数据即为神经网络算法中的权值。

在一种可能的实现方式中，对宏指令的指令格式、待执行指令的指令格式及运行设备执行运行指令的过程进行描述，以下是为具体示例。

宏指令的指令格式可以为如下格式示例。

神经网络计算宏指令的指令格式可以是：

Type device_id,input_addr,output_addr,input_h,input_w,input_c,output_h,output_w,output_c,[param1,param2,…]

其中，Type为操作类型，device_id为指定设备的标识，input_addr为输入地址，output_addr为输出地址，input_h、input_w、input_c为输入的神经元规模(即输入量)，output_h、output_w、output_c为输出的神经元规模(即输出量)，param1、param2为指令参数。

对于神经网络计算宏指令，其必须包含操作类型、输入地址和输出地址，且根据神经网络计算宏指令所生成的运行指令也须包含操作类型、运行输入地址和运行输出地址，运行输入地址和运行输出地址是分别根据输入地址、输出地址确定的。

以卷积计算宏指令为例，其指令格式为：CONV device_id,input_addr,output_addr,input_h,input_w,input_c,output_h,output_w,output_c,kernel,stride,pad。调用时卷积计算宏指令可以为如下示例：

@CONV#0,#4,#500,#5,#5,#32,#3,#3,#16,#3,#1,#0

其中，该卷积计算宏指令的操作类型为CONV。指定设备为设备0。数据的输入地址为地址4。数据的输出地址为地址500。数据的输入量为5x5x32。数据的输出量为3x3x16。卷积核的大小为3，卷积核的步长为1，卷积核的填充为0。

若根据上述卷积计算宏指令示例生成的运行指令为“@CONV#4,#500,#5,#5,#32,#3,#3,#16,#3,#1,#0”为例。运行设备在接收到该运行指令之后，其执行过程为：从地址4处获取到输入量为5x5x32的数据。按照该运行指令中卷积核的大小(3)、步长为(1)和填充(0)对输入量为5x5x32的数据进行卷积运算，得到数据量为3x3x16的执行结果时，将该执行结果存储至输出地址500。

向量逻辑计算宏指令的指令格式可以是：

Type device_id,input_addr,output_addr,input_size,output_size,[param1,param2,…]

其中，Type为操作类型，device_id为指定设备的标识，input_addr为输入地址，output_addr为输出地址，input_size为输入向量的大小(即输入量)，output_size为输出向量的大小(即输出量)，param1、param2为指令参数。指令参数可以是第二个操作数的地址和长度。

对于向量逻辑计算宏指令，其必须包含操作类型、输入地址和输出地址，且根据向量逻辑计算宏指令所生成的运行指令也须包含操作类型、运行输入地址和运行输出地址，运行输入地址和运行输出地址是分别根据输入地址、输出地址确定的。

以根据某个向量逻辑计算宏指令所生成的运行指令为“@VAND#501,#7,#33,#4”为例。运行设备在接收到该运行指令后，其执行过程为：从输入地址501处获取到大小为33的输入向量，对该输入向量进行“与”逻辑运算，获得大小为4的输出向量，并将该大小为4的输出向量作为执行结果存储至输出地址7处。

矩阵向量计算宏指令的指令格式可以是：

其中，Type为操作类型，idevice_id为指定设备的标识，input_addr为输入地址，output_addr为输出地址，input_size为输入向量的大小(即输入量)，output_size为输出向量的大小(即输出量)，param1、param2为指令参数。指令参数可以是第二个操作数的地址和长度。

对于矩阵向量计算宏指令，其必须包含操作类型、输入地址和输出地址，且根据矩阵向量计算宏指令所生成的运行指令也须包含操作类型、运行输入地址和运行输出地址，运行输入地址和运行输出地址是分别根据输入地址、输出地址确定的。

以根据某个矩阵向量计算宏指令生成的运行指令为“@MADD#502,#8,#34,#5”为例。运行设备在接收到该运行指令后，其执行过程为：从输入地址502处获得大小为34的输入矩阵向量。对该输入矩阵向量进行矩阵相加计算，获得大小为5的输出矩阵向量。将该大小为5的输出矩阵向量作为执行结果存储至存储地址8处。

标量计算宏指令的指令格式可以是：

Type device_id,op1,op2,ans

其中，Type为操作类型，device_id为指定设备的标识，op1、op2为两个操作数。Ans为标量计算宏指令计算结果的存放地址或者用于存放计算结果的寄存器的标识。其中，所获取的标量的大小、对获取的标量进行计算所输出的标量的大小可以预先设定。

对于标量计算宏指令，其必须包含操作类型、第一操作数、第二操作数和输出地址。且根据标量计算宏指令所生成的运行指令也须包含操作类型、第一运行操作数、第二运行操作数和运行输出地址。其中，第一运行操作数、第二运行操作数和运行输出地址是分别根据第一操作数、第二操作数和输出地址确定的。

以根据某个标量计算宏指令生成的运行指令为“@SADD#503,#504,#3”为例。运行设备在接收到该运行指令后，其执行过程为：从寄存器的地址503中获取第一标量以及从寄存器的地址504中获取第二标量，将第一标量和第二标量相加，并将相加计算所获得的结果作为执行结果存储至寄存器的存储地址3处。

标量逻辑计算宏指令的指令格式可以是：

Type device_id,op1,op2,ans

其中，Type为操作类型，device_id为指定设备的标识，op1、op2为两个操作数。Ans为标量逻辑计算宏指令计算结果的存放地址或者用于存放计算结果的寄存器的标识。其中，所获取的标量的大小、对获取的标量进行计算所输出的标量的大小可以预先设定。

对于标量逻辑计算宏指令，其必须包含操作类型、第一操作数、第二操作数和输出地址。且根据标量逻辑计算宏指令所生成的运行指令也须包含操作类型、第一运行操作数、第二运行操作数和运行输出地址。其中，第一运行操作数、第二运行操作数和运行输出地址是分别根据第一操作数、第二操作数和输出地址确定的。

以根据某个标量逻辑计算宏指令生成的运行指令为“@SAND#703,#704,#8”为例。运行设备在接收到该运行指令后，其执行过程为：从寄存器的地址703中获取第一标量以及从寄存器的地址704中获取第二标量，对第一标量和第二标量进行“与”逻辑运算，并将所获得的结果作为执行结果存储至寄存器的存储地址8处。

无条件跳转宏指令的指令格式可以是：

Jump device_id,src

其中，Jump为无条件跳转宏指令所对应的操作类型，device_id为指定设备的标识，src为指令流所需跳转到的目标跳转位置。目标跳转位置可以是寄存器的长度、寄存器的地址、寄存器的标识、立即数等。

对于无条件跳转宏指令，其必须包含操作类型和目标跳转位置，且根据无条件跳转宏指令所生成的运行指令也须包含操作类型和运行目标跳转位置。其中，运行目标跳转位置是根据目标跳转位置确定的。

以根据某个无条件跳转宏指令所生成的运行指令为“@Jump#505”为例。运行设备在接收到该运行指令后，其执行过程为：将当前指令流跳转至地址505处继续执行。

有条件跳转宏指令的指令格式可以是：

CB device_id,src,condition

其中，CB为有条件跳转宏指令所对应的操作类型，device_id为指定设备的标识，src为指令流所需跳转到的目标跳转位置，condition为跳转的条件。例如，condition可以为“寄存器的值为零是否为真”，在寄存器的值为零时，可以跳转至目标跳转位置。目标跳转位置可以是寄存器的长度、寄存器的地址、寄存器的标识、立即数等。

对于有条件跳转宏指令，其必须包含操作类型和目标跳转位置，且根据有条件跳转宏指令所生成的运行指令也须包含操作类型和运行目标跳转位置。其中，运行目标跳转位置是根据目标跳转位置确定的。

以根据某个有条件跳转宏指令所生成的运行指令为“@CB#506#h”为例。运行设备在接收到该运行指令后，其执行过程为：判断其跳转条件“h”是否为真，在“h”为真时，将当前指令流跳转至地址506处继续执行。

读神经元宏指令的指令格式可以是：

NLOAD device_id,src_addr,des_addr,size

其中，NLOAD为读神经元宏指令所对应的操作类型，device_id为指定设备的标识，src_addr为读取神经元数据的数据读入地址，des_addr为存储读取神经元数据所需的加密方式的数据加密方式地址，size为神经元数据的读入量。

以根据某个读神经元宏指令所生成的运行指令为“@NLOAD#505#506#9”为例。运行设备在接收到该运行指令后，其执行过程为：从地址506处获取到神经元数据的加密方式，根据该加密方式从地址505处读取读入量为9的神经元数据。

读突触宏指令的指令格式可以是：

WLOAD device_id,src_addr,des_addr,size

其中，WLOAD为读突触宏指令所对应的操作类型，device_id为指定设备的标识，src_addr为读取突触数据的数据读入地址，des_addr为存储读取突触数据所需的加密方式的数据加密方式地址，size为突触数据的读入量。

以根据某个读突触宏指令所生成的运行指令为“@WLOAD#507#508#10”为例。运行设备在接收到该运行指令后，其执行过程为：从地址508处获取到读入突触数据的加密方式，根据该加密方式从地址507处读取读入量为10的突触数据。

读标量宏指令的指令格式可以是：

SLOAD device_id,src,des

其中，SLOAD为读标量宏指令所对应的操作类型，device_id为指定设备的标识，src为读取标量的数据读入地址，des为存储读取标量数据所需的加密方式的数据加密方式地址。

以根据某个读标量宏指令所生成的运行指令为“@SLOAD#601#602”为例。运行设备在接收到该运行指令后，其执行过程为：从地址602处获取到标量数据的加密方式，根据该加密方式从地址601处读取其存储的标量数据。

其中，读神经元宏指令、读突触宏指令和读标量宏指令中所包含的数据读入地址以及数据加密方式地址，可以是寄存器的地址、编号、名称等标识。对于读神经元宏指令、读突触宏指令和读标量宏指令，其必须包含操作类型、数据读入地址、数据加密方式地址，运行指令中也须包含操作类型、运行数据读入地址和运行数据加密方式地址。其中，运行数据读入地址和运行数据加密方式地址分别是根据数据读入地址和数据加密方式地址确定的。

写神经元宏指令的指令格式可以是：

NSTORE device_id,src_addr,des_addr,size

其中，NSTORE为写神经元宏指令所对应的操作类型，device_id为指定设备的标识，src_addr为写入神经元数据的数据写入地址，des_addr为存储写入神经元数据所需的加密方式的数据加密方式地址，size为数据的写入量。

以根据某个写神经元宏指令所生成的运行指令为“@NSTORE#603#604#14”为例。运行设备在接收到该运行指令后，其执行过程为：从地址604处获取到神经元数据的加密方式，根据该加密方式将待写入的神经元数据写入地址14处。

写突触宏指令的指令格式可以是：

WSTORE device_id,src_addr,des_addr,size

其中，WSTORE为写突触宏指令所对应的操作类型，device_id为指定设备的标识，src_addr为写入突触数据的数据写入地址，des_addr为存储写入突触数据所需的加密方式的数据加密方式地址，size为数据的写入量。

以根据某个写突触宏指令所生成的运行指令为“@WSTORE#605#606#15”为例。运行设备在接收到该运行指令后，其执行过程为：从地址606处获取到突触数据的加密方式，根据该加密方式将待写入的突触数据写入地址14处。

写标量宏指令的指令格式可以是：

SSTORE device_id,src,des

其中，SSTORE为读标量宏指令所对应的操作类型，device_id为指定设备的标识，src为写入标量数据的数据写入地址，des为存储写入标量数据所需的加密方式的数据加密方式地址。

以根据某个写标量宏指令所生成的运行指令为“@SSTORE#607#608”为例。运行设备在接收到该运行指令后，其执行过程为：从地址608处获取到标量数据的加密方式，根据该加密方式将待写入的标量数据写入地址14处。

其中，写神经元宏指令、写突触宏指令和写标量宏指令中所包含的数据写入地址和数据加密方式地址可以是寄存器的地址、编号、名称等标识。对于写神经元宏指令、写突触宏指令和写标量宏指令，其必须包含操作类型、数据写入地址、数据加密方式地址，运行指令中也须包含操作类型、运行数据写入地址和运行数据加密方式地址。其中，运行数据写入地址和运行数据加密方式地址分别是根据数据写入地址和数据加密方式地址确定的。

待执行指令的指令格式可以为如下格式示例。

待执行神经网络计算指令的指令格式可以是：

Type input_addr,output_addr,input_h,input_w,input_c,output_h,output_w,output_c,[param1,param2,…]

其中，Type为操作类型，input_addr为输入地址，output_addr为输出地址，input_h、input_w、input_c为输入的神经元规模(即输入量)，output_h、output_w、output_c为输出的神经元规模(即输出量)，param1、param2为指令参数。

以待执行卷积指令为例，其指令格式为CONV input_addr,output_addr,input_h,input_w,input_c,output_h,output_w,output_c,kernel,stride,pad。调用时待执行卷积指令可以为：

@CONV#6,#500,#5,#5,#32,#3,#3,#16,#3,#1,#0

其中，该待执行卷积指令的操作类型为卷积神经网络计算。数据的输入地址为地址6。数据的输出地址为地址500。数据的输入量为5x5x32。数据的输出量为3x3x16。卷积核的大小为3，卷积核的步长为1，卷积核的填充为0。

待执行向量逻辑计算指令的指令格式可以是：

Type input_addr,output_addr,input_size,output_size,[param1,param2,…]

其中，Type为操作类型，input_addr为输入地址，output_addr为输出地址，input_size为输入向量的大小(即输入量)，output_size为输出向量的大小(即输出量)，param1、param2为指令参数。指令参数可以是第二个操作数的地址和长度。

待执行矩阵向量计算指令的指令格式可以是：

Type input_addr,output_addr,input_size,output_size,[param1,param2,…]

待执行标量计算指令的指令格式可以是：

Type op1,op2,ans

其中，Type为操作类型，op1、op2为两个操作数。Ans为待执行标量计算指令计算结果的存放地址或者用于存放计算结果的寄存器的标识。

待执行标量逻辑计算指令的指令格式可以是：

Type op1,op2,ans

其中，Type为操作类型，op1、op2为两个操作数。Ans为待执行标量逻辑计算指令计算结果的存放地址或者用于存放计算结果的寄存器的标识。

待执行无条件跳转指令的指令格式可以是：

Jump src

其中，Jump为待执行无条件跳转指令所对应的操作类型，src为指令流所需跳转到的目标跳转位置。

待执行有条件跳转指令的指令格式可以是：

CB src,condition

其中，CB为待执行有条件跳转指令所对应的操作类型，src为指令流所需跳转到的目标跳转位置，condition为跳转的条件。例如，condition可以为“寄存器的值为零是否为真”，在寄存器的值为零时，可以跳转至目标跳转位置。

待执行读神经元指令的指令格式可以是：

NLOAD src_addr,des_addr,size

其中，NLOAD为待执行读神经元指令所对应的操作类型，src_addr为读取神经元数据数据的数据读入地址，des_addr为存储读取神经元数据所需的加密方式的数据加密方式地址，size为神经元数据的读入量。

待执行读突触指令的指令格式可以是：

WLOAD src_addr,des_addr,size

其中，WLOAD为待执行读突触指令所对应的操作类型，src_addr为读取突触数据的数据读入地址，des_addr为存储读取突触数据所需的加密方式的数据加密方式地址，size为突触数据的读入量。

待执行读标量指令的指令格式可以是：

SLOAD src,des

其中，SLOAD为待执行读标量指令所对应的操作类型，src为读取标量数据的数据读入地址，des为存储读取标量数据所需的加密方式的数据加密方式地址。

待执行写神经元指令的指令格式可以是：

NSTORE src_addr,des_addr,size

其中，NSTORE为待执行写神经元指令所对应的操作类型，src_addr为写入神经元数据的数据写入地址，des_addr为存储写入神经元数据所需的加密方式的数据加密方式地址，size为神经元数据的写入量。

待执行写突触指令的指令格式可以是：

WSTORE src_addr,des_addr,size

其中，WSTORE为待执行写突触指令所对应的操作类型，src_addr为写入突触数据的数据写入地址，des_addr为存储写入突触数据所需的加密方式的数据加密方式地址，size为突触数据的写入量。

待执行写标量原指令的指令格式可以是：

SSTORE src,des

其中，SSTORE为待执行读标量指令所对应的操作类型，src为写入标量数据的数据写入地址，des为存储写入标量数据所需的加密方式的数据加密方式地址。

应当理解的是，本文中宏指令中的“@”、“#”仅用于分隔宏指令中所记载的参数，是为了便于技术人员理解，在实际使用过程中，“@”、“#”并不是宏指令中所需包含的内容。

应用示例

图8a、图8b示出根据本公开一实施例的神经网络指令生成装置、处理***的应用场景的示意图。如图8a、图8b所示，用于执行宏指令的备选设备可以为多个，备选设备可以为CPU-1、CPU-2、…、CPU-n，NPU-1、NPU-2、…、NPU-n和GPU-1、GPU-2、…、GPU-n。

示例1

以下结合“神经网络指令生成装置根据宏指令生成运行指令的工作过程”作为一个示例性应用场景，给出根据本公开实施例的应用示例，以便于理解神经网络指令生成装置的流程。本领域技术人员应理解，以下应用示例仅仅是出于便于理解本公开实施例的目的，不应视为对本公开实施例的限制。

神经网络指令生成装置根据某宏指令生成运行指令的工作过程及原理如下。

资源获取模块14

获取备选设备的资源信息，该资源信息包括备选设备的剩余存储容量、存储容量和备选设备所包含的指令集。资源获取模块14将获取到的备选设备的资源信息发送至设备确定模块11和指令生成模块12。

设备确定模块11(包括第一确定子模块111、第二确定子模块112和第三确定子模块113)

在接收到宏指令时，根据接收到的宏指令，确定执行宏指令的运行设备。例如，接收到如下宏指令。其中，宏指令可以是来自不同的平台的。

宏指令1：@XXX#01……

宏指令2：@SSS#02……

宏指令3：@DDD#04……

宏指令4：@NNN……

第一确定子模块111在确定在宏指令中包含指定设备的标识，且确定该指定设备中包含与宏指令相对应的指令集时，第一确定子模块111可以将该指定设备确定为执行宏指令的运行设备，并将确定的运行设备的标识发送至指令生成模块12。例如，第一确定子模块111可以将标识01所对应的指定设备如CPU-2(CPU-2中包含与宏指令1相对应的指令集)确定为用于执行宏指令1的运行设备。可以将标识02所对应的指定设备如CPU-1(CPU-1中包含与宏指令2相对应的指令集)确定为用于执行宏指令2的运行设备。

第三确定子模块113在确定在宏指令中包含指定设备的标识，且确定该指定设备中不包含与宏指令相对应的指令集时，第三确定子模块113可以将包含与宏指令相对应的指令集的备选设备确定为运行设备，并将确定的运行设备的标识发送至指令生成模块12。例如，第三确定子模块113在确定标识04所对应的指定设备中不包含与宏指令3相对应的指令集时，可以将包含与宏指令3的操作类型DDD相对应的指令集的备选设备如NPU-n、NPU-2，确定为用于执行宏指令3的运行设备。

第二确定子模块112在确定宏指令中不存在指定设备的标识(指定设备的标识所对应的位置为空，或者在宏指令中不包含“指定设备的标识”这个字段)时，第二确定子模块112可以根据该宏指令和备选设备的资源信息，从备选设备中确定出运行设备(具体确定过程详见上文第二确定子模块112的相关描述)，并将确定出的运行设备的标识发送至指令生成模块12。例如，由于宏指令4中不存在指定设备的标识，第二确定子模块112可以根据宏指令4的操作类型NNN和备选设备的资源信息(所包含的指令集)，从备选设备中确定出用于执行宏指令4的运行设备，例如，GPU-n(GPU-n中包含与操作类型NNN相对应的指令集)。

指令生成模块12(包括第一指令生成模块121和第二指令生成模块122)

第一指令生成模块121在运行设备为一个，且运行设备的资源不满足执行宏指令的容量条件时，根据运行设备的运行数据量和数据量将宏指令拆分成多条运行指令，并将多条运行指令发送至队列构建模块15。例如，根据宏指令2的数据量和运行设备CPU-1的运行数据量生成多条运行指令2-1、2-2、…、2-n。根据宏指令4的数据量和运行设备GPU-n的运行数据量生成多条运行指令4-1、4-2、…、4-n。

第一指令生成模块121在确定运行设备为一个，且运行设备的资源满足执行宏指令的容量条件时，可以根据宏指令生成一条运行指令，并将其发送至队列构建模块15。例如，根据宏指令1的数据量和运行设备CPU-2的运行数据量生成一条运行指令1-1。

第二指令生成模块122在确定运行设备为多个时，根据每个运行设备的运行数据量和宏指令的数据量对宏指令进行拆分，生成对应于每个运行设备的运行指令，并将其发送至队列构建模块15。例如，根据宏指令3的数据量和运行设备NPU-n的运行数据量、运行设备NPU-2的运行数据量，为运行设备NPU-n生成多条运行指令3-1、3-2、…、3-n，为运行设备NPU-2生成多条运行指令3’-1、3’-2、…、3’-n。

队列构建模块15

在接收到运行指令时，根据队列排序规则对每个运行设备所需执行的所有运行指令进行排序，根据排序后的运行指令为每个运行设备构建与之唯一对应的指令队列，并将指令队列发送至指令分派模块16。具体地，

对于被运行设备CPU-2执行的一条运行指令1-1。所构建的对应于运行设备CPU-2的指令队列CPU-2”仅包括运行指令1-1。

对于被运行设备CPU-1执行的多条运行指令2-1、2-2、…、2-n。根据队列排序规则对多条运行指令2-1、2-2、…、2-n进行排序，根据排序后的多条运行指令2-1、2-2、…、2-n构建与运行设备CPU-1相对应的指令队列CPU-1”。

对于被运行设备NPU-n执行的多条运行指令3-1、3-2、…、3-n。根据队列排序规则对多条运行指令3-1、3-2、…、3-n进行排序，根据排序后的多条运行指令3-n、…、3-2、3-1构建与运行设备NPU-n相对应的指令队列NPU-n”。

对于被运行设备NPU-2执行的多条运行指令3’-1、3’-2、…、3’-n。根据队列排序规则对多条运行指令3’-1、3’-2、…、3’-n进行排序，根据排序后的多条运行指令3’-n、…、3’-2、3’-1构建与运行设备NPU-2相对应的指令队列NPU-2”。

对于被运行设备GPU-n执行的多条运行指令4-1、4-2、…、4-n。根据队列排序规则对多条运行指令4-1、4-2、…、4-n进行排序，根据排序后的多条运行指令4-1、4-2、…、4-n构建与运行设备GPU-n相对应的指令队列GPU-n”。

指令分派模块16

在接收到指令队列之后，将每个指令队列中的运行指令，依次发送至对应的运行设备中，以使运行设备执行运行指令。例如，将指令队列CPU-2”中包括的运行指令1-1发送至其对应的运行设备CPU-2。将指令队列CPU-1”中的多条运行指令2-1、2-2、…、2-n，依次发送至其对应的运行设备CPU-1。将指令队列NPU-n”中的多条运行指令3-n、…、3-2、3-1，依次发送至其对应的运行设备NPU-n。将指令队列NPU-2”中的多条运行指令3’-n、…、3’-2、3’-1，依次发送至其对应的运行设备NPU-2。将队列GPU-n”中的多条运行指令4-1、4-2、…、4-n，依次发送至其对应的运行设备GPU-n。

其中，上述运行设备CPU-2、运行设备CPU-1、运行设备NPU-n和运行设备NPU-2在接收到指令队列之后，按照指令队列中运行指令的排列顺序，依次执行运行指令。以运行设备CPU-2为例，描述其执行所接收到的运行指令的具体过程。运行设备CPU-2包括控制模块、执行模块和存储模块。其中，控制模块包括指令存储子模块、指令处理子模块和存储队列子模块，执行模块包括依赖关系处理子模块，详见上文关于运行设备的相关描述。

假定根据宏指令1所生成的运行指令1-1为“@XXX……”。运行设备CPU-2在接收到运行指令1-1之后，执行运行指令1-1的过程如下：

运行设备CPU-2的控制模块获取数据、神经网络模型以及运行指令1-1。其中，指令存储子模块用于存储运行指令1-1。指令处理子模块用于对运行指令1-1进行解析，获得多个解析指令如解析指令0、解析指令1和解析指令2，并将多个解析指令发送至存储队列子模块和执行模块。存储队列子模块用于存储运行指令队列，运行指令队列中包含运行设备CPU-2所需执行的解析指令0、解析指令1和解析指令2以及其他运行指令，在运行指令队列中所有指令按照执行的先后顺序依次排列。例如，获得的多个解析指令的执行的先后顺序为解析指令0、解析指令1和解析指令2，且解析指令1与解析指令0之间存在关联关系。

运行设备CPU-2的执行模块接收到多个解析指令后，依赖关系处理子模块判断多个解析指令之间是否存在关联关系。依赖关系处理子模块确定出解析指令1与解析指令0存在关联关系，则将解析指令1缓存至指令存储子模块中，并在确定解析指令0执行完毕之后，从缓存中提取出解析指令1发送至执行模块，以供执行模块执行。

执行模块接收并执行解析指令0、解析指令1和解析指令2，以完成运行指令1-1的运行。

以上各模块的工作过程可参考上文的相关描述。

这样，该装置可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

示例2

神经网络指令处理***可以包括上述备选设备和指令生成设备。如图8a、图8b所示，用于执行宏指令的备选设备可以为多个，备选设备可以为CPU-1、CPU-2、…、CPU-n，NPU-1、NPU-2、…、NPU-n和GPU-1、GPU-2、…、GPU-n，备选设备被选定用于执行对应的运行指令即为运行设备。神经网络指令处理***根据某宏指令生成并执行运行指令的工作过程及原理如下。

资源获取模块14

宏指令1：@XXX#01……

宏指令2：@SSS#02……

宏指令3：@DDD#04……

宏指令4：@NNN……

队列构建模块15

指令分派模块16

其中，上述运行设备CPU-2、运行设备CPU-1、运行设备NPU-n和运行设备NPU-2在接收到指令队列之后，按照指令队列中运行指令的排列顺序，依次执行运行指令。以运行设备CPU-2为例，描述其执行所接收到的运行指令的具体过程。运行设备CPU-2包括控制模块21、执行模块22和存储模块23。其中，控制模块21包括指令存储子模块211、指令处理子模块212和存储队列子模块213，执行模块22包括依赖关系处理子模块221，详见上文关于运行设备的相关描述。

运行设备CPU-2的控制模块21获取数据、神经网络模型以及运行指令1-1。其中，指令存储子模块211用于存储运行指令1-1。指令处理子模块212用于对运行指令1-1进行解析，获得多个解析指令如解析指令0、解析指令1和解析指令2，并将多个解析指令发送至存储队列子模块213和执行模块22。存储队列子模块213用于存储运行指令队列，运行指令队列中包含运行设备CPU-2所需执行的解析指令0、解析指令1和解析指令2以及其他运行指令，在运行指令队列中所有指令按照执行的先后顺序依次排列。例如，获得的多个解析指令的执行的先后顺序为解析指令0、解析指令1和解析指令2，且解析指令1与解析指令0之间存在关联关系。

运行设备CPU-2的执行模块22接收到多个解析指令后，其中的依赖关系处理子模块221判断多个解析指令之间是否存在关联关系。依赖关系处理子模块221确定出解析指令1与解析指令0存在关联关系，则将解析指令1缓存至指令存储子模块211中，并在确定解析指令0执行完毕之后，从缓存中提取出解析指令1发送至执行模块22，以供执行模块22执行。

执行模块22接收并执行解析指令0、解析指令1和解析指令2，以完成运行指令1-1的运行。

以上各模块的工作过程可参考上文的相关描述。

这样，该***可跨平台使用，适用性好，指令转换的速度快、处理效率高、出错几率低，且开发的人力、物力成本低。

本公开提供一种机器学习运算装置，该机器学习运算装置可以包括一个或多个上述神经网络指令生成装置(或者包括一个或多个上述神经网络指令处理***)，用于从其他处理装置中获取待运算数据和控制信息，执行指定的机器学习运算。该机器学习运算装置可以从其他机器学习运算装置或非机器学习运算装置中获得宏指令或待执行指令，并将执行结果通过I/O接口传递给***设备(也可称其他处理装置)。***设备譬如摄像头，显示器，鼠标，键盘，网卡，wifi接口，服务器。当包含一个以上神经网络指令生成装置(或者神经网络指令处理***)时，神经网络指令生成装置(或者神经网络指令处理***)间可以通过特定的结构进行链接并传输数据，譬如，通过快速外部设备互连总线(也即PCIE总线)进行互联并传输数据，以支持更大规模的神经网络的运算。此时，可以共享同一控制***，也可以有各自独立的控制***；可以共享内存，也可以每个加速器有各自的内存。此外，其互联方式可以是任意互联拓扑。

该机器学习运算装置具有较高的兼容性，可通过PCIE接口与各种类型的服务器相连接。

图9a示出根据本公开一实施例的组合处理装置的框图。如图9a所示，该组合处理装置包括上述机器学习运算装置、通用互联接口和其他处理装置。机器学习运算装置与其他处理装置进行交互，共同完成用户指定的操作。

其他处理装置，包括中央处理器CPU、图形处理器GPU、神经网络处理器等通用/专用处理器中的一种或以上的处理器类型。其他处理装置所包括的处理器数量不做限制。其他处理装置作为机器学习运算装置与外部数据和控制的接口，包括数据搬运，完成对本机器学习运算装置的开启、停止等基本控制；其他处理装置也可以和机器学习运算装置协作共同完成运算任务。

通用互联接口，用于在机器学习运算装置与其他处理装置间传输数据和控制指令。该机器学习运算装置从其他处理装置中获取所需的输入数据，写入机器学习运算装置片上的存储装置；可以从其他处理装置中获取控制指令，写入机器学习运算装置片上的控制缓存；也可以读取机器学习运算装置的存储模块中的数据并传输给其他处理装置。

图9b示出根据本公开一实施例的组合处理装置的框图。在一种可能的实现方式中，如图9b所示，该组合处理装置还可以包括存储装置，存储装置分别与机器学习运算装置和所述其他处理装置连接。存储装置用于保存在机器学习运算装置和所述其他处理装置的数据，尤其适用于所需要运算的数据在本机器学习运算装置或其他处理装置的内部存储中无法全部保存的数据。

该组合处理装置可以作为手机、机器人、无人机、视频监控设备等设备的SOC片上***，有效降低控制部分的核心面积，提高处理速度，降低整体功耗。此情况时，该组合处理装置的通用互联接口与设备的某些部件相连接。某些部件譬如摄像头，显示器，鼠标，键盘，网卡，wifi接口。

本公开提供一种机器学习芯片，该芯片包括上述机器学习运算装置或组合处理装置。

本公开提供一种机器学习芯片封装结构，该机器学习芯片封装结构包括上述机器学习芯片。

本公开提供一种板卡，图10示出根据本公开一实施例的板卡的结构示意图。如图10所示，该板卡包括上述机器学习芯片封装结构或者上述机器学习芯片。板卡除了包括机器学习芯片389以外，还可以包括其他的配套部件，该配套部件包括但不限于：存储器件390、接口装置391和控制器件392。

存储器件390与机器学习芯片389(或者机器学习芯片封装结构内的机器学习芯片)通过总线连接，用于存储数据。存储器件390可以包括多组存储单元393。每一组存储单元393与机器学习芯片389通过总线连接。可以理解，每一组存储单元393可以是DDR SDRAM(英文：Double Data Rate SDRAM，双倍速率同步动态随机存储器)。

DDR不需要提高时钟频率就能加倍提高SDRAM的速度。DDR允许在时钟脉冲的上升沿和下降沿读出数据。DDR的速度是标准SDRAM的两倍。

在一个实施例中，存储器件390可以包括4组存储单元393。每一组存储单元393可以包括多个DDR4颗粒(芯片)。在一个实施例中，机器学习芯片389内部可以包括4个72位DDR4控制器，上述72位DDR4控制器中64bit用于传输数据，8bit用于ECC校验。可以理解，当每一组存储单元393中采用DDR4-3200颗粒时，数据传输的理论带宽可达到25600MB/s。

在一个实施例中，每一组存储单元393包括多个并联设置的双倍速率同步动态随机存储器。DDR在一个时钟周期内可以传输两次数据。在机器学习芯片389中设置控制DDR的控制器，用于对每个存储单元393的数据传输与数据存储的控制。

接口装置391与机器学习芯片389(或者机器学习芯片封装结构内的机器学习芯片)电连接。接口装置391用于实现机器学习芯片389与外部设备(例如服务器或计算机)之间的数据传输。例如在一个实施例中，接口装置391可以为标准PCIE接口。比如，待处理的数据由服务器通过标准PCIE接口传递至机器学习芯片289，实现数据转移。优选的，当采用PCIE 3.0X 16接口传输时，理论带宽可达到16000MB/s。在另一个实施例中，接口装置391还可以是其他的接口，本公开并不限制上述其他的接口的具体表现形式，接口装置能够实现转接功能即可。另外，机器学习芯片的计算结果仍由接口装置传送回外部设备(例如服务器)。

控制器件392与机器学习芯片389电连接。控制器件392用于对机器学习芯片389的状态进行监控。具体的，机器学习芯片389与控制器件392可以通过SPI接口电连接。控制器件392可以包括单片机(Micro Controller Unit，MCU)。如机器学习芯片389可以包括多个处理芯片、多个处理核或多个处理电路，可以带动多个负载。因此，机器学习芯片389可以处于多负载和轻负载等不同的工作状态。通过控制器件可以实现对机器学习芯片中多个处理芯片、多个处理和/或多个处理电路的工作状态的调控。

本公开提供一种电子设备，该电子设备包括上述机器学习芯片或板卡。

电子设备可以包括数据处理装置、机器人、电脑、打印机、扫描仪、平板电脑、智能终端、手机、行车记录仪、导航仪、传感器、摄像头、服务器、云端服务器、相机、摄像机、投影仪、手表、耳机、移动存储、可穿戴设备、交通工具、家用电器、和/或医疗设备。

交通工具可以包括飞机、轮船和/或车辆。家用电器可以包括电视、空调、微波炉、冰箱、电饭煲、加湿器、洗衣机、电灯、燃气灶、油烟机。医疗设备可以包括核磁共振仪、B超仪和/或心电图仪。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本公开并不受所描述的动作顺序的限制，因为依据本公开，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本公开所必须的。

进一步需要说明的是，虽然图4、图7的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，图4、图7中的至少一部分步骤可以包括多个子步骤或者多个阶段，这些子步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些子步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

应该理解，上述的装置实施例仅是示意性的，本公开的装置还可通过其它的方式实现。例如，上述实施例中所述单元/模块的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式。例如，多个单元、模块或组件可以结合，或者可以集成到另一个***，或一些特征可以忽略或不执行。

另外，若无特别说明，在本公开各个实施例中的各功能单元/模块可以集成在一个单元/模块中，也可以是各个单元/模块单独物理存在，也可以两个或两个以上单元/模块集成在一起。上述集成的单元/模块既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元/模块如果以硬件的形式实现时，该硬件可以是数字电路，模拟电路等等。硬件结构的物理实现包括但不局限于晶体管，忆阻器等等。若无特别说明，所述人工智能处理器可以是任何适当的硬件处理器，比如CPU、GPU、FPGA、DSP和ASIC等等。若无特别说明，所述存储单元可以是任何适当的磁存储介质或者磁光存储介质，比如，阻变式存储器RRAM(Resistive Random Access Memory)、动态随机存取存储器DRAM(Dynamic Random Access Memory)、静态随机存取存储器SRAM(Static Random-Access Memory)、增强动态随机存取存储器EDRAM(Enhanced Dynamic Random Access Memory)、高带宽内存HBM(High-Bandwidth Memory)、混合存储立方HMC(Hybrid Memory Cube)等等。

所述集成的单元/模块如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本公开实施例还提出一种计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令被处理器执行时实现上述方法。计算机可读存储介质可以是非易失性计算机可读存储介质。

本公开实施例还提出一种电子设备，包括：处理器；用于存储处理器可执行指令的存储器；其中，所述处理器被配置为调用所述存储器存储的指令，以执行上述方法。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。上述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上对本公开实施例进行了详细介绍，本文中应用了具体个例对本公开的原理及实施方式进行了阐述，以上实施例的说明仅用于帮助理解本公开的方法及其核心思想。同时，本领域技术人员依据本公开的思想，基于本公开的具体实施方式及应用范围上做出的改变或变形之处，都属于本公开保护的范围。综上所述，本说明书内容不应理解为对本公开的限制。

Claims

一种神经网络指令生成装置，其特征在于，所述装置包括：

设备确定模块，用于根据接收到的宏指令，确定执行所述宏指令的运行设备；

指令生成模块，用于根据所述宏指令和所述运行设备，生成运行指令。
根据权利要求1所述的装置，其特征在于，所述设备确定模块，包括：

第一确定子模块，用于在确定所述宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备包含与所述宏指令相对应的指令集。
根据权利要求2所述的装置，其特征在于，所述装置还包括：

资源获取模块，用于获取备选设备的资源信息，所述资源信息包括所述备选设备所包含的指令集，

所述设备确定模块，还包括第二确定子模块和/或第三确定子模块，

所述第二确定子模块，用于在确定所述宏指令中不包含所述指定设备的标识时，根据接收到的宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述宏指令的运行设备，

所述第三确定子模块，在确定所述宏指令包含所述指定设备的标识，且所述指定设备的资源不满足执行所述宏指令的执行条件时，根据所述宏指令和所述备选设备的资源信息，确定运行设备。
根据权利要求2或3所述的装置，其特征在于，所述宏指令包含输入量和输出量中的至少一项，

所述指令生成模块，还用于确定所述宏指令的数据量，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，

其中，所述数据量是根据所述输入量和所述输出量中的至少一项确定的，所述运行设备的资源信息还包括存储容量、剩余存储容量的至少一项。
根据权利要求4所述的装置，其特征在于，所述指令生成模块包括第一指令生成子模块和/或第二指令生成子模块，

所述第一指令生成子模块，用于在确定所述运行设备为一个，且所述运行设备的资源不满足执行所述宏指令的容量条件时，根据所述运行设备的运行数据量和所述数据量将所述宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令；

所述第二指令生成子模块，用于在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述宏指令进行拆分，生成对应于每个运行设备的运行指令，

其中，每个运行设备的运行数据量是根据每个运行设备的资源信息确定的，所述运行指令包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据执行所述运行指令的运行设备的运行数据量确定的。
根据权利要求1所述的装置，其特征在于，所述装置还包括队列构建模块、宏指令生成模块和指令分派模块中的至少一个模块，

所述队列构建模块，用于根据队列排序规则对所述运行指令进行排序，根据排序后的运行指令构建与所述运行设备相对应的指令队列；

所述宏指令生成模块，用于接收待执行指令，根据确定的指定设备的标识和所述待执行指令生成所述宏指令；

所述指令分派模块，用于将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，

其中，所述指令分派模块，包括：

指令汇编子模块，用于根据所述运行指令生成汇编文件；

汇编翻译子模块，用于将所述汇编文件翻译成二进制文件；

指令发送子模块，用于将所述二进制文件发送至所述运行设备，以使所述运行设备根据所述二进制文件执行所述运行指令。
根据权利要求1所述的装置，其特征在于，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述装置设置于CPU和/或NPU中；

所述宏指令包括以下指令中的至少一种：计算宏指令、控制宏指令和数据搬运宏指令，

其中，所述计算宏指令包括神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令中的至少一种，

所述控制宏指令包括无条件跳转宏指令和有条件跳转宏指令中的至少一种，

数据搬运宏指令包括读宏指令和写宏指令中的至少一种，所述读宏指令包括读神经元宏指令、读突触宏指令和读标量宏指令中的至少一种，所述写宏指令包括写神经元宏指令、写突触宏指令和写标量宏指令中的至少一种；

所述宏指令包含以下选项中的至少一项：用于执行所述宏指令的指定设备的标识、操作类型、输入地址、输出地址、输入量、输出量、操作数和指令参数，

所述运行指令包含以下选项中的至少一项：所述操作类型、所述输入地址、所述输出地址、所述操作数和所述指令参数。
一种机器学习运算装置，其特征在于，所述装置包括：

一个或多个如权利要求1-6任一项所述的神经网络指令生成装置，用于从其他处理装置中获取待运算数据和控制信息，并执行指定的机器学习运算，将执行结果通过I/O接口传递给其他处理装置；

当所述机器学习运算装置包含多个所述神经网络指令生成装置时，所述多个所述神经网络指令生成装置间可以通过特定的结构进行连接并传输数据；

其中，多个所述神经网络指令生成装置通过快速外部设备互连总线进行互联并传输数据，以支持更大规模的机器学习的运算；多个所述神经网络指令生成装置共享同一控制***或拥有各自的控制***；多个所述神经网络指令生成装置共享内存或者拥有各自的内存；多个所述神经网络指令生成装置的互联方式是任意互联拓扑。
一种组合处理装置，其特征在于，所述装置包括：

如权利要求8所述的机器学习运算装置、通用互联接口和其他处理装置；

所述机器学习运算装置与所述其他处理装置进行交互，共同完成用户指定的计算操作，

其中，所述装置还包括：存储装置，该存储装置分别与所述机器学习运算装置和所述其他处理装置连接，用于保存所述机器学习运算装置和所述其他处理装置的数据。
一种机器学习芯片，其特征在于，所述机器学习芯片包括：

如权利要求8所述的机器学习运算装置或如权利要求9所述的组合处理装置。
一种电子设备，其特征在于，所述电子设备包括：

如权利要求10所述的机器学习芯片。
一种板卡，其特征在于，所述板卡包括：存储器件、接口装置和控制器件以及如权利要求10所述的机器学习芯片；

其中，所述机器学习芯片与所述存储器件、所述控制器件以及所述接口装置分别连接；

所述存储器件，用于存储数据；

所述接口装置，用于实现所述机器学习芯片与外部设备之间的数据传输；

所述控制器件，用于对所述机器学习芯片的状态进行监控。
一种神经网络指令生成方法，其特征在于，所述方法包括：

根据接收到的宏指令，确定执行所述宏指令的运行设备；

根据所述宏指令和所述运行设备，生成运行指令。
根据权利要求13所述的方法，其特征在于，根据接收到的宏指令，确定执行所述宏指令的运行设备，包括：

在确定所述宏指令中包含指定设备的标识，且所述指定设备的资源满足执行所述宏指令的执行条件时，将所述指定设备确定为所述运行设备，

其中，所述执行条件包括：所述指定设备中包含与所述宏指令相对应的指令集。
根据权利要求14所述的方法，其特征在于，所述方法还包括：

获取备选设备的资源信息，所述资源信息包括所述备选设备所包含的指令集，

其中，根据接收到的宏指令，确定执行所述宏指令的运行设备，包括以下任一项处理：

在确定所述宏指令中不包含所述指定设备的标识时，根据接收到的宏指令和所述备选设备的资源信息，从所述备选设备中确定出用于执行所述宏指令的运行设备，或者

在确定所述宏指令中包含所述指定设备的标识，且所述指定设备的资源不满足执行所述宏指令的执行条件时，根据所述宏指令和所述备选设备的资源信息，确定运行设备。
根据权利要求14或15所述的方法，其特征在于，所述宏指令包含输入量和输出量中的至少一项，

根据所述宏指令和所述运行设备，生成运行指令，包括：

确定所述宏指令的数据量，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，

其中，所述数据量是根据所述输入量和所述输出量中的至少一项确定的，所述运行设备的资源信息还包括存储容量、剩余存储容量的至少一项。
根据权利要求16所述的方法，其特征在于，根据所述宏指令的数据量、所述宏指令和所述运行设备的资源信息，生成运行指令，包括以下任一项处理：

在确定所述运行设备为一个，且所述运行设备的资源不满足执行所述宏指令的容量条件时，根据所述运行设备的运行数据量和所述数据量将所述宏指令拆分成多条运行指令，以使所述运行设备依次执行多条运行指令，或者

在确定所述运行设备为多个时，根据每个运行设备的运行数据量和所述数据量对所述宏指令进行拆分，生成对应于每个运行设备的运行指令，

其中，每个运行设备的运行数据量是根据每个运行设备的资源信息确定的，所述运行指令包含运行输入量和运行输出量中的至少一项，所述运行输入量和所述运行输出量是根据执行所述运行指令的运行设备的运行数据量确定的。
根据权利要求13所述的方法，其特征在于，所述方法还包括以下至少一项处理：

根据队列排序规则对所述运行指令进行排序，根据排序后的运行指令构建与所述运行设备相对应的指令队列；

接收待执行指令，根据确定的指定设备的标识和所述待执行指令生成所述宏指令；

将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，

其中，将所述运行指令发送至所述运行设备，以使所述运行设备执行所述运行指令，包括：

根据所述运行指令生成汇编文件；

将所述汇编文件翻译成二进制文件；

将所述二进制文件发送至所述运行设备，以使所述运行设备根据所述二进制文件执行所述运行指令。
根据权利要求13所述的方法，其特征在于，

所述运行设备为CPU、GPU和NPU中的其中一种或任意组合；

所述方法应用于CPU和/或NPU；

所述宏指令包括以下指令中的至少一种：计算宏指令、控制宏指令和数据搬运宏指令，

其中，所述计算宏指令包括神经网络计算宏指令、向量逻辑计算宏指令、矩阵向量计算宏指令、标量计算宏指令和标量逻辑计算宏指令中的至少一种，

所述控制宏指令包括无条件跳转宏指令和有条件跳转宏指令中的至少一种，

数据搬运宏指令包括读宏指令和写宏指令中的至少一种，所述读宏指令包括读神经元宏指令、读突触宏指令和读标量宏指令中的至少一种，所述写宏指令包括写神经元宏指令、写突触宏指令和写标量宏指令中的至少一种；

所述宏指令包含以下选项中的至少一项：用于执行所述宏指令的指定设备的标识、操作类型、输入地址、输出地址、输入量、输出量、操作数和指令参数，

所述运行指令包含以下选项中的至少一项：所述操作类型、所述输入地址、所述输出地址、所述操作数和所述指令参数。