CN115601231B

CN115601231B - 图像处理方法、装置、硬件加速器、芯片以及设备

Info

Publication number: CN115601231B
Application number: CN202211462549.3A
Authority: CN
Inventors: 杨大卫; 许晨; 袁之航; 吴强
Original assignee: Nanjing Houmo Intelligent Technology Co ltd
Current assignee: Nanjing Houmo Intelligent Technology Co ltd
Priority date: 2022-11-22
Filing date: 2022-11-22
Publication date: 2023-03-10
Anticipated expiration: 2042-11-22
Also published as: CN115601231A

Abstract

公开了一种图像处理方法、装置、硬件加速器、芯片以及设备，其中的方法包括：获取待处理的输入图像和变换矩阵；基于缩放系数S，将变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，S为2的n次方；基于第一矩阵，确定输出图像中的各像素点对应的第一坐标；基于缩放系数S，将第一坐标的坐标值缩小至S分之一，得到第二坐标，第二坐标表示像素点在输入图像中对应的坐标；从第一坐标的二进制坐标值中提取出后n位数字，得到插值参数；基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的第一像素值；将第一像素值缩小至L分之一，作为像素点在输出图像中的目标像素值，得到输出图像，L为2的n+1次方。

Description

图像处理方法、装置、硬件加速器、芯片以及设备

技术领域

本公开涉及半导体集成电路应用技术领域，尤其涉及一种图像处理方法、装置、硬件加速器、芯片以及电子设备。

背景技术

在人工智能领域中，为了降低神经网络识别图像的代价、提高识别的精度，在将图像输入神经网络之前，通常需要对图像进行预处理，图像预处理的结果直接影响神经网络提取的图像特征，少量误差都会降低神经网络前向推理的效果。而仿射变换是最常用的预处理算法之一。

相关技术中，神经网络硬件加速器通常采用浮点运算或部分整型运算来实现图像的仿射变换，导致仿射变换的计算效率较低，会成为整个神经网络执行的瓶颈，且硬件开销较大。

发明内容

为了解决上述技术问题，提出了本公开。本公开的实施例提供了一种图像处理方法、装置、硬件加速器、芯片以及设备。

根据本公开实施例的一个方面，提供了一种图像处理方法，该方法包括：获取待处理的输入图像和变换矩阵；基于预先确定的缩放系数S，将变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，其中S为2的n次方，n为大于0的整数；基于第一矩阵，确定输出图像中的各像素点对应的第一坐标；基于缩放系数S，将第一坐标的坐标值缩小至S分之一，得到第二坐标，第二坐标表示像素点在输入图像中对应的坐标；从第一坐标的二进制坐标值中提取出后n位数字，得到插值参数；基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的第一像素值；将第一像素值缩小至L分之一，作为像素点在输出图像中的目标像素值，得到输出图像，其中，L为2的n+1次方。

在一些实施例中，基于第一矩阵，确定输出图像中的各像素点对应的第一坐标，包括：确定像素点在输出图像中的第三坐标；将第三坐标左乘第一矩阵，得到归一化的第四坐标；对第四坐标进行反归一化处理，得到第一坐标。

在一些实施例中，得到第一坐标之后，该方法还包括：基于输入图像的尺寸，确定坐标值的取值范围；若第一坐标的坐标值不在取值范围之内，删除第一坐标。

在一些实施例中，通过双线性插值确定像素点的第一像素值之前，方法还包括：对输入图像进行补零处理。

在一些实施例中，基于预先确定的缩放系数S，将变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，包括：基于缩放系数S，生成缩放向量；将逆矩阵左乘缩放向量，以将逆矩阵的第一行和第二行的数值放大S倍，得到第二矩阵；对第二矩阵中的数值进行取整操作，得到第一矩阵。

在一些实施例中，将第一像素值缩小至L分之一，作为像素点在输出图像中的目标像素值，包括：基于缩放系数S，确定取整参数；将第一像素值与取整参数之和缩小至L分之一，得到目标像素值。

在一些实施例中，基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的第一像素值，包括：基于第二坐标，从输入图像中确定出四个用于双线性插值的参考像素值；基于插值参数，确定双线性插值的四个插值系数；基于参考像素值与插值系数，确定第一像素值。

根据本公开实施例的又一个方面，提供了一种图像处理装置，包括：数据获取单元，被配置成获取待处理的输入图像和变换矩阵；矩阵放大单元，被配置成基于预先确定的缩放系数S，将变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，其中，S为2的n次方，n为大于0的整数；第一计算单元，被配置成基于第一矩阵，确定输出图像中的各像素点对应的第一坐标；第二计算单元，被配置成基于缩放系数S，将第一坐标的坐标值缩小至S分之一，得到第二坐标，第二坐标表示像素点在输入图像中对应的坐标；参数提取单元，被配置成从第一坐标的二进制坐标值中提取出后n位数字，得到插值参数；插值处理单元，被配置成基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的第一像素值；图像生成单元，被配置成将第一像素值缩小至L分之一，作为像素点在输出图像中的目标像素值，得到输出图像，其中L为2的n+1次方。

根据本公开实施例的又一个方面，提供了一种全整型硬件加速器，内嵌有上述实施例中的图像处理装置。

根据本公开实施例的又一个方面，提供了一种图像处理芯片，包括全整型硬件加速器，全整型硬件加速器用于执行上述任一实施例中的图像处理方法。

根据本公开实施例的再一方面，提供了一种电子设备，包括存储器，用于存储计算机程序；处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，实现上述任一实施例中的方法。

基于本公开上述实施例提供的一种图像处理方法和装置，利用预先确定的缩放系数S，先确定出输出图像中的像素点对应的放大S倍后的第一坐标，并从第一坐标中提取出插值参数，再将第一坐标缩小后得到像素点在输入图像中对应的第二坐标；之后，基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的放大S倍之后的第一像素值，再通过对第一像素值进行缩小处理，得到像素点的目标像素值，可以通过全整型运算实现对输入图像的仿射变换处理，一方面通过双线性插值可以确保输出图像的质量，避免出现锯齿状边缘的问题；另一方面，避免了浮点型运算或查表操作，可以降低图像处理的开销，提高图像处理的效率和质量。

下面通过附图和实施例，对本公开的技术方案做进一步的详细描述。

附图说明

通过结合附图对本公开实施例进行更详细的描述，本公开的上述以及其他目的、特征以及优势将变得更加明显。附图用来提供对本公开实施例的进一步的理解，并且构成说明书的一部分，与本公开实施例一起用于解释本公开，并不构成对本公开的限制。在附图中，相同的参考标号通常代表相同部件或步骤；

图1是本公开的图像处理方法所适用的一个场景示意图；

图2为本公开的图像处理方法的一个实施例的流程图；

图3为本公开的图像处理方法的一个实施例中确定第一坐标的流程图；

图4为本公开的图像处理方法的一个实施例中确定第一矩阵的流程图；

图5为本公开的图像处理方法的一个实施例中双线性插值的流程图；

图6为本公开的图像处理方法的又一个实施例的流程图；

图7为本公开的图像处理装置的一个实施例的结构示意图；

图8是本公开一示例性实施例提供的电子设备的结构图。

具体实施方式

下面将参考附图详细地描述根据本公开的示例实施例。显然，所描述的实施例仅仅是本公开的一部分实施例，而不是本公开的全部实施例，应理解，本公开不受这里描述的示例实施例的限制。

应注意到：除非另外具体说明，否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。

本领域技术人员可以理解，本公开实施例中的“第一”、“第二”等术语仅用于区别不同步骤、设备或模块等，既不代表任何特定技术含义，也不表示它们之间的必然逻辑顺序。

还应理解，在本公开实施例中，“多个”可以指两个或两个以上，“至少一个”可以指一个、两个或两个以上。

还应理解，对于本公开实施例中提及的任一部件、数据或结构，在没有明确限定或者在前后文给出相反启示的情况下，一般可以理解为一个或多个。

另外，本公开中术语“和/或”，仅是一种描述关联对象的关联关系，表示可以存在三种关系，如A和/或B，可以表示：单独存在A，同时存在A和B，单独存在B这三种情况。另外，本公开中字符“/”，一般表示前后关联对象是一种“或”的关系。

还应理解，本公开对各个实施例的描述着重强调各个实施例之间的不同之处，其相同或相似之处可以相互参考，为了简洁，不再一一赘述。

同时，应当明白，为了便于描述，附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。

以下对至少一个示例性实施例的描述实际上仅仅是说明性的，决不作为对本公开及其应用或使用的任何限制。

对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论，但在适当情况下，所述技术、方法和设备应当被视为说明书的一部分。

应注意到：相似的标号和字母在下面的附图中表示类似项，因此，一旦某一项在一个附图中被定义，则在随后的附图中不需要对其进行进一步讨论。

本公开的实施例可以应用于终端设备、计算机***、服务器等电子设备，其可与众多其它通用或者专用计算***环境或配置一起操作。适于与终端设备、计算机***或者服务器等电子设备一起使用的众所周知的终端设备、计算***、环境和/或配置的例子包括但不限于：个人计算机***、服务器计算机***、瘦客户机、厚客户机、手持或膝上设备、基于微处理器的***、机顶盒、可编程消费电子产品、网络个人电脑、小型计算机***、大型计算机***和包括上述任何***的分布式云计算技术环境等等。

终端设备、计算机***、服务器等电子设备可以在由计算机***执行的计算机***可执行指令（诸如程序模块）的一般语境下描述。通常，程序模块可以包括例程、程序、目标程序、组件、逻辑、数据结构等等，它们执行特定的任务或者实现特定的抽象数据类型。计算机***/服务器可以在分布式云计算环境中实施。在分布式云计算环境中，任务可以是由通过通信网络链接的远程处理设备执行的。在分布式云计算环境中，程序模块可以位于包括存储设备的本地或远程计算***存储介质上。

目前，对图像进行仿射变换的处理方法主要包括以下两种：第一种是支持浮点运算的仿射变换算子，在其处理过程中，输出图像的像素点在输入图像中对应的坐标为浮点型数值，根据该坐标计算得到双线性插值的4个浮点型系数，之后，利用该坐标和4个浮点型系数进行双线性插值，得到的运算结果仍然为浮点型，最后，通过对运算结果取整，得到输出图像中的像素点的像素值。

第二种是OpenCV支持部分整型运算的仿射变换算子，在其处理过程中，需要根据输入图像和变换矩阵创建两个列表，一个列表用于存储双线性插值的四个系数，另一个列表用于存放输出图像中的像素点在输入图像中对应的坐标的整数位。在该过程中，双线性插值是通过整型运算实现的，双线性插值之前的运算过程则是浮点型运算。

在实现本公开的过程中，发明人发现，由于浮点型运算在硬件加速器上的运算效率较低，第一种图像处理方法会大幅延长图像处理的运算时间，导致效率较低，成为整个神经网络执行的瓶颈；第二种图像处理方法虽然采用了部分整型运算，但是其处理过程中需要构建列表存储相关数据，既增加了存储空间的开销，又增加了处理过程中的读取次数，导致硬件开销较大、运算效率较低，并且，通过查表得到的双线性插值的插值系数的准确度较低，影响图像处理的质量。

可见，相关技术中的图像处理方法至少存在硬件开销大、运算效率低、图像处理的质量较低的问题。

下面结合图1进行示例性说明，图1示出了本公开的图像处理方法的一个场景示意图。在图1所示的场景中，芯片100可以是神经网络加速器，其上设置有全整型硬件加速器110和神经网络计算单元120，全整型硬件加速器110中的逻辑电路可以实现本公开的图像处理方法，神经网络计算单元120中的逻辑电路则可以对输入数据进行识别、预测等处理，并输出处理结果。为了提高神经网络的准确度，将输入图像130输入神经网络计算单元120之前，由全整型硬件加速器110对输入图像130进行预处理。预处理类型可以根据需求设定，例如可以包括图像平移、旋转、缩放、反射等仿射变换，不同的预处理类型对应不同的变换矩阵140。全整型硬件加速器110可以从片外存储获取输入图像130和变换矩阵140，然后结合预存的缩放系数S确定出第一矩阵、第一坐标、第二坐标、插值参数，并通过双线性插值确定输出图像150中的像素点的目标像素值，以生成变换后的输出图像150。之后，全整型硬件加速器110可以将输出图像150发送至神经网络计算单元120，由神经网络计算单元120中预存的神经网络模型对输出图像150进行识别、预测等处理，最终输出处理结果。

图2为本公开的图像处理方法一个实施例的流程图。如图2所示，该流程包括以下步骤。

步骤210、获取待处理的输入图像和变换矩阵。

在本实施例中，输入图像可以是需要输入神经网络模型进行处理的图像，例如可以是特征图。变换矩阵则可以表征图像处理的类型，例如可以利用变换矩阵对输入图像进行旋转、平移、缩放等仿射变换处理。

通常，可以根据实际需求确定对待处理的输入图像的处理类型，例如可以是旋转、平移、缩放、同一性处理等等，然后根据处理类型确定对应的变换矩阵，并将变换矩阵和待处理的输入图像输入全整型硬件加速器。由全整型硬件加速器执行本实施例的图像处理方法，确定输出图像的像素点与输入图像中的源像素点之间的对应关系，并根据对应关系确定输出图像中的像素点的像素值，从而实现对输入图像的仿射变换。

步骤220、基于预先确定的缩放系数S，将变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵。

其中，S为2的n次方，n为大于0的整数。

在本实施例中，缩放系数S可以预先根据芯片的运算性能和运算精度设定，也可以根据经验设定。例如可以是4、8、16等。

在一个可选的示例中，可以通过二进制的移位处理实现对数值的放大。例如，只需将逆矩阵的第一行和第二行的二进制数值分别左移n位，即可得到放大后的第一矩阵，有助于提高运算效率。

步骤230、基于第一矩阵，确定输出图像中的各像素点对应的第一坐标。

在本实施例中，执行主体可以将像素点在输出图像中的坐标左乘第一矩阵，即可得到第一坐标。

步骤240、基于缩放系数S，将第一坐标的坐标值缩小至S分之一，得到第二坐标。

其中，第二坐标表示像素点在输入图像中对应的坐标。

在本实施例中，由于第一矩阵的前两行数值为放大S倍后的数值，因此，第一坐标中的坐标值为放大S倍后的数值，只需将第一坐标的坐标值缩小S分之一，即可得到像素点在输入图像中对应的坐标，即第二坐标。

作为示例，可以通过二进制的移位操作实现第一坐标的缩小处理。例如，S为16时，只需将第一坐标的坐标值分别右移4位，即可得到第二坐标。

步骤250、从第一坐标的二进制坐标值中提取出后n位数字，得到插值参数。

在本实施例中，插值参数用于确定双线性插值的插值系数。由于第一坐标的数值被放大了S倍（即二进制数值左移了n位），则第一坐标的二进制坐标值中的后n位数字为放大前的小数部分，执行主体可以直接从第一坐标的二进制坐标值中提取后n位数字，作为插值参数。

作为示例，第一坐标的二进制横坐标为11001101，二进制纵坐标为11111010，n为3，则插值参数为101和010。

步骤260、基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的第一像素值。

在本实施例中，执行主体可以根据步骤250得到的插值参数，计算出双线性插值的4个插值系数，根据第二坐标在输入图像中提取第二坐标邻域内的像素值，然后将插值系数与像素值的乘积和确定为像素点的第一像素值。

步骤270、将第一像素值缩小至L分之一，作为像素点在输出图像中的目标像素值，得到输出图像。

其中，L为2的n+1次方。

在本实施例中，由于插值参数放大了S倍，由此得到的插值系数和第一像素值均被放大了2S倍，即L倍。执行主体可以将第一像素值缩小至L分之一，得到像素点在输出图像中的目标像素值，由此得到的输出图像是对输入图像进行仿射变换后得到的图像。

在一个可选的示例中，可以将输出图像作为神经网络的输入数据，由神经网络对输出图像进行特征提取、特征映射等处理，并输出处理结果，从而实现基于图像的目标分类、目标检测、姿态估计、目标追踪等任务。

本实施例提供的图像处理方法，利用预先确定的缩放系数S，先确定出输出图像中的像素点对应的放大S倍后的第一坐标，并从第一坐标中提取出插值参数，再将第一坐标缩小后得到像素点在输入图像中对应的第二坐标；之后，基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的放大S倍之后的第一像素值，再通过对第一像素值进行缩小处理，得到像素点的目标像素值，可以通过全整型运算实现对输入图像的仿射变换处理，一方面通过双线性插值可以确保输出图像的质量，避免出现锯齿状边缘的问题；另一方面，避免了浮点型运算或查表操作，可以降低图像处理的开销，提高图像处理的效率和质量。

在本实施例的一些可选的实施方式中，上述步骤270可以通过如下方式实现：基于缩放系数S，确定取整参数；将第一像素值与取整参数之和缩小至L分之一，得到目标像素值。

在本实施例中，取整参数用于对目标像素值进行取整操作。

作为示例，取整参数可以是S的一半，即2的n-1次方。确定第一像素值与取整参数的和右移n+1位之后，可以得到整数型的目标像素值。

在本实施方式中，将第一像素值加上取整参数之后再进行缩小处理，可以得到精度更高的整数型目标像素值。

接着参考图3，图3示出了本公开的图像处理方法的一个实施例中确定第一坐标的流程图，如图3所示，该流程包括以下步骤。

步骤310、确定像素点在输出图像中的第三坐标。

步骤320、将第三坐标左乘第一矩阵，得到归一化的第四坐标。

步骤330、对第四坐标进行反归一化处理，得到第一坐标。

作为示例，假设第一矩阵为M，像素点的第三坐标为

，其对应的列向量

可以表示为

，则归一化的第四坐标对应的列向量

=

=

，对列向量

进行反归一化处理，可以得到列向量

，则第一坐标为

。

在本实施例中，可以基于第一矩阵和像素点在输出图像中的第三坐标，通过乘法运算和反归一化处理确定像素点的第一坐标，有助于提高运算效率。

在本实施例的一些可选的实施方式中，图3所示的流程还可以进一步包括如下步骤：基于输入图像的尺寸，确定坐标值的取值范围；若第一坐标的坐标值不在取值范围之内，删除第一坐标。

在本实施例中，由于第一矩阵为放大后的矩阵，由此确定出的第一坐标的坐标值可能超出输入图像的尺寸，形成噪声数据，进而对后续的图像处理步骤造成不利影响。

为了避免这种情况，可以根据输入图像的尺寸确定坐标值的取值范围，并将超出取值范围的第一坐标删除，以免引入噪声数据。坐标值的取值范围可以包括横坐标的取值区间和纵坐标的取值区间。例如，可以将输入图像的尺寸与预设数值的和作为坐标值的取值范围。

作为示例，假设输入图像的尺寸为

，则横坐标的取值范围可以是[-1，h+1]，纵坐标的取值范围可以是[-1，w +1]。若第一坐标的横坐标在区间[-1，h+1]之外，和/或，纵坐标在区间[-1，w +1]之外，则将该第一坐标删除。

下面参考图4，图4示出了本公开的图像处理方法的一个实施例中确定第一矩阵的流程图，如图4所示，该流程包括以下步骤。

步骤410、基于缩放系数S，生成缩放向量。

在本实施例中，缩放向量可以表示为[S，S，1]。

可选的，根据S为2的n次方，S可以通过二进制数值的移位操作来表征，则缩放向量在程序代码中还可以表示为[（1<<n），（1<<n），1]，（1<<n）表示左移n位。

步骤420、将逆矩阵左乘缩放向量，以将逆矩阵的第一行和第二行的数值放大S倍，得到第二矩阵。

步骤430、对第二矩阵中的数值进行取整操作，得到第一矩阵。

在一个具体的示例中，假设逆矩阵为T，缩放向量为向量l，则第一矩阵可以表示为round（T*l），round()为取整函数。

在本实施例中，通过对放大后的矩阵进行取整，可以得到整数型的第一矩阵，有助于提高运算效率和精度。

接着参考图5，图5示出了本公开的图像处理方法的一个实施例中双线性插值的流程图，如图5所示，该流程包括以下步骤。

步骤510、基于第二坐标，从输入图像中确定出四个用于双线性插值的参考像素值。

步骤520、基于插值参数，确定双线性插值的四个插值系数。

步骤530、基于参考像素值与插值系数，确定第一像素值。

在一个具体的示例中，输入图像为

，其尺寸为h×w，第二坐标为

，第二坐标在输入图像中的像素值为

，插值参数为

和

，通过上述步骤510至步骤530，第一像素值为[o _y，o _x]可以表示为：

式中，

均为输入图像中位于第二坐标的邻域内的像素值，

为插值系数，其中其中，

。

在本实施例中，可以将第二坐标中的小数部分放大成整数型的插值参数，并以此进行双线性插值得到放大后的第一像素值，可以避免双线性插值的处理过程中引入浮点型运算，有助于提高双线性插值的运算效率和精度。

接着参考图6，图6示出了本公开的图像处理方法的又一个实施例的流程图，如图6所示，该流程包括以下步骤。

步骤610、获取待处理的输入图像和变换矩阵；

步骤620、基于预先确定的缩放系数S，将变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵。

在一个可选的示例中，可以采用图4所示的流程确定第一矩阵。

步骤630、基于第一矩阵，确定输出图像中的各像素点对应的第一坐标。

可选的，可以采用图3所示的流程确定第一坐标。

步骤640、基于输入图像的尺寸，确定坐标值的取值范围。

步骤650、若第一坐标的坐标值不在取值范围之内，删除第一坐标。

步骤660、基于缩放系数S，将第一坐标的坐标值缩小至S分之一，得到第二坐标。

步骤670、从第一坐标的坐标值中提取出后n位数字，得到插值参数。

步骤680、对输入图像进行补零处理。

作为示例，可以沿一个或两个方向对输入图像进行补零处理，以扩大输入图像的尺寸。

实践中，对于输出图像边缘位置的像素点，双线性插值时可能会存在输入图像中的参考像素缺失的情况。为了避免这种情况，本实施例在双线性插值之前，可以对输入图像进行补零处理，有助于进一步提高双线性插值的精度。

结合图5中的示例进行举例说明，未补零处理时，输入图像

的尺寸为h×w，当

时，

，超出了输入图像的尺寸，此时点

和点

为输入图像之外的点，即无效像素点。补零处理之后，输入图像的尺寸为(h+2)×(w+2)，此时可用

表示补零后的输入图像，这样一来，补零后的输入图像可以包括点

和点

，且其像素值均为0。

步骤690、基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的第一像素值。

可选的，可以采用图5所示的流程进行双线性插值，以确定第一像素值。

步骤691、将第一像素值缩小至L分之一，作为像素点在输出图像中的目标像素值，得到输出图像。

可选的，可以通过上述步骤270的可选实施方式确定整数型的目标像素值。

图6所示的实施例体现了对输入图像进行补零操作的步骤，可以进一步提高双线性插值的精度，有助于进一步提高输出图像的图像质量。

此外，本公开的实施例还提供了一种图像处理芯片，包括全整型硬件加速器，全整型硬件加速器用于执行上述任一实施例中的图像处理方法。

本实施提供的图像处理芯片，可以采用全整型运算实现图像的仿射变换处理，可以降低图像处理带来的硬件开销，提高运算效率。

图7为本公开的图像处理装置的一个实施例的结构示意图。该实施例的装置可用于实现本公开相应的方法实施例。如图7所示的装置包括：数据获取单元710，被配置成获取待处理的输入图像和变换矩阵；矩阵放大单元720，被配置成基于预先确定的缩放系数S，将变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，其中，S为2的n次方，n为大于0的整数；第一计算单元730，被配置成基于第一矩阵，确定输出图像中的各像素点对应的第一坐标；第二计算单元740，被配置成基于缩放系数S，将第一坐标的坐标值缩小至S分之一，得到第二坐标，第二坐标表示像素点在输入图像中对应的坐标；参数提取单元750，被配置成从第一坐标的二进制坐标值中提取出后n位数字，得到插值参数；插值处理单元760，被配置成基于第二坐标、输入图像和插值参数，通过双线性插值确定像素点的第一像素值；图像生成单元770，被配置成将第一像素值缩小至L分之一，作为像素点在输出图像中的目标像素值，得到输出图像，其中L为2的n+1次方。

其中一个实施方式中，第一计算单元730被进一步配置成：确定像素点在输出图像中的第三坐标；将第三坐标左乘第一矩阵，得到归一化的第四坐标；对第四坐标进行反归一化处理，得到第一坐标。

其中一个实施方式中，该装置还包括坐标过滤单元，被配置成：基于输入图像的尺寸，确定坐标值的取值范围；若第一坐标的坐标值不在取值范围之内，删除第一坐标。

其中一个实施方式中，该装置还包括补零单元，被配置成：对输入图像进行补零处理。

其中一个实施方式中，矩阵放大单元720被进一步配置成：基于缩放系数S，生成缩放向量；将逆矩阵左乘缩放向量，以将逆矩阵的第一行和第二行的数值放大S倍，得到第二矩阵；对第二矩阵中的数值进行取整操作，得到第一矩阵。

其中一个实施方式中，图像生成单元770，被配置成：基于缩放系数S，确定取整参数；将第一像素值与取整参数之和缩小至L分之一，得到目标像素值。

其中一个实施方式中，插值处理单元760，被配置成包括：基于第二坐标，从输入图像中确定出四个用于双线性插值的参考像素值；基于插值参数，确定双线性插值的四个插值系数；基于参考像素值与插值系数，确定第一像素值。

此外，本公开实施例还提供了一种全整型硬件加速器，内嵌有上述任一实施例中的图像处理装置，以实现上述任一实施例中的图像处理方法。

下面参考图8来描述根据本公开实施例的电子设备。图8示出了根据本公开实施例的电子设备的框图。如图8所示，电子设备800包括一个或多个处理器810和存储器820。

处理器810可以是中央处理单元（CPU）或者具有图像处理能力和/或指令执行能力的其他形式的处理单元，并且可以控制电子设备800中的其他组件以执行期望的功能。

存储器820可以包括一个或多个计算机程序产品，所述计算机程序产品可以包括各种形式的计算机可读存储介质，例如易失性存储器和/或非易失性存储器。所述易失性存储器，例如，可以包括：随机存取存储器（RAM）和/或高速缓冲存储器（cache）等。所述非易失性存储器，例如，可以包括：只读存储器（ROM）、硬盘以及闪存等。在所述计算机可读存储介质上可以存储一个或多个计算机程序指令，处理器810可以运行所述程序指令，以实现上文所述的本公开的各个实施例的图像处理方法以及/或者其他期望的功能。在所述计算机可读存储介质中还可以存储诸如输入信号、信号分量、噪声分量等各种内容。

在一个示例中，电子设备800还可以包括：输入装置830以及输出装置840等，这些组件通过总线***和/或其他形式的连接机构（未示出）互连。此外，该输入设备830还可以包括例如键盘、鼠标等等。该输出装置840可以向外部输出各种信息。该输出设备840可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然，为了简化，图8中仅示出了该电子设备800中与本公开有关的组件中的一些，省略了诸如总线、输入/输出接口等等的组件。除此之外，根据具体应用情况，电子设备800还可以包括任何其他适当的组件。

除了上述方法和设备以外，本公开的实施例还可以是计算机程序产品，其包括计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的图像处理方法中的步骤。

所述计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本公开实施例操作的程序代码，所述程序设计语言包括面向对象的程序设计语言，诸如Java、C++等，还包括常规的过程式程序设计语言，诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外，本公开的实施例还可以是计算机可读存储介质，其上存储有计算机程序指令，所述计算机程序指令在被处理器运行时使得所述处理器执行本说明书上述“示例性方法”部分中描述的根据本公开各种实施例的图像处理方法中的步骤。

所述计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。可读存储介质的更具体的例子（非穷举的列举）可以包括：具有一个或者多个导线的电连接、便携式盘、硬盘、随机存取存储器（RAM）、只读存储器（ROM）、可擦式可编程只读存储器（EPROM或闪存）、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本公开的基本原理，但是，需要指出的是，在本公开中提及的优点、优势、效果等仅是示例而非限制，不能认为这些优点、优势以及效果等是本公开的各个实施例必须具备的。另外，上述公开的具体细节仅是为了示例的作用和便于理解的作用，而非限制，上述细节并不限制本公开为必须采用上述具体的细节来实现。

本说明书中各个实施例均采用递进的方式描述，每个实施例重点说明的都是与其它实施例的不同之处，各个实施例之间相同或相似的部分相互参见即可。对于***实施例而言，由于其与方法实施例基本对应，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

本公开中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的，可以按任意方式连接、布置、配置这些器件、装置、设备以及***。诸如“包括”、“包含、“具有”等等的词语是开放性词汇，指“包括但不限于”，且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”，且可与其互换使用，除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”，且可与其互换使用。

可能以许多方式来实现本公开的方法和装置。例如，可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法和装置。用于所述方法的步骤的上述顺序仅是为了进行说明，本公开的方法的步骤不限于以上具体描述的顺序，除非以其它方式特别说明。此外，在一些实施例中，还可将本公开实施为记录在记录介质中的程序，这些程序包括用于实现根据本公开的方法的机器可读指令。因而，本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。

还需要指出的是，在本公开的装置、设备和方法中，各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本公开的等效方案。

提供所公开的方面的以上描述，以使本领域的任何技术人员能够做出或者使用本公开。对这些方面的各种修改等对于本领域技术人员而言，是非常显而易见的，并且在此定义的一般原理可以应用于其他方面，而不脱离本公开的范围。因此，本公开不意图被限制到在此示出的方面，而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外，此描述不意图将本公开的实施例限制到在此公开的形式中。尽管以上已经讨论了多个示例方面以及实施例，但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims

1.一种图像处理方法，其特征在于，包括：

获取待处理的输入图像和变换矩阵，所述变换矩阵用于对所述输入图像进行仿射变换处理；

基于预先确定的缩放系数S，将所述变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，其中，S为2的n次方，n为大于0的整数；

基于所述第一矩阵，确定输出图像中的各像素点对应的第一坐标；

基于所述缩放系数S，将所述第一坐标的坐标值缩小至S分之一，得到第二坐标，所述第二坐标表示所述像素点在所述输入图像中对应的坐标；

从所述第一坐标的二进制坐标值中提取出后n位数字，得到插值参数；

基于所述第二坐标、所述输入图像和所述插值参数，通过双线性插值确定所述像素点的第一像素值；

将所述第一像素值缩小至L分之一，作为所述像素点在所述输出图像中的目标像素值，得到所述输出图像，其中，L为2的n+1次方。

2.根据权利要求1所述的方法，其特征在于，所述基于所述第一矩阵，确定输出图像中的各像素点对应的第一坐标，包括：

确定所述像素点在所述输出图像中的第三坐标；

将所述第三坐标左乘所述第一矩阵，得到归一化的第四坐标；

对所述第四坐标进行反归一化处理，得到所述第一坐标。

3.根据权利要求2所述的方法，其特征在于，所述得到所述第一坐标之后，所述方法还包括：

基于所述输入图像的尺寸，确定坐标值的取值范围；

若所述第一坐标的坐标值不在所述取值范围之内，删除所述第一坐标。

4.根据权利要求1所述的方法，其特征在于，所述通过双线性插值确定所述像素点的第一像素值之前，所述方法还包括：

对所述输入图像进行补零处理。

5.根据权利要求1所述的方法，其特征在于，所述基于预先确定的缩放系数S，将所述变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，包括：

基于所述缩放系数S，生成缩放向量；

将所述逆矩阵左乘所述缩放向量，以将所述逆矩阵的第一行和第二行的数值放大S倍，得到第二矩阵；

对所述第二矩阵中的数值进行取整操作，得到所述第一矩阵。

6.根据权利要求1所述的方法，其特征在于，所述将所述第一像素值缩小至L分之一，作为所述像素点在所述输出图像中的目标像素值，包括：

基于所述缩放系数S，确定取整参数；

将所述第一像素值与所述取整参数之和缩小至L分之一，得到所述目标像素值。

7.根据权利要求1至6任一所述的方法，其特征在于，所述基于所述第二坐标、所述输入图像和所述插值参数，通过双线性插值确定所述像素点的第一像素值，包括：

基于所述第二坐标，从所述输入图像中确定出四个用于双线性插值的参考像素值；

基于所述插值参数，确定双线性插值的四个插值系数；

基于所述参考像素值与所述插值系数，确定所述第一像素值。

8.一种图像处理装置，其特征在于，包括：

数据获取单元，被配置成获取待处理的输入图像和变换矩阵，所述变换矩阵用于对所述输入图像进行仿射变换处理；

矩阵放大单元，被配置成基于预先确定的缩放系数S，将所述变换矩阵的逆矩阵的第一行和第二行的数值放大S倍，得到第一矩阵，S为2的n次方，n为大于0的整数；

第一计算单元，被配置成基于所述第一矩阵，确定输出图像中的各像素点对应的第一坐标；

第二计算单元，被配置成基于所述缩放系数S，将所述第一坐标的坐标值缩小至S分之一，得到第二坐标，所述第二坐标表示所述像素点在所述输入图像中对应的坐标；

参数提取单元，被配置成从所述第一坐标的二进制坐标值中提取出后n位数字，得到插值参数；

插值处理单元，被配置成基于所述第二坐标、所述输入图像和所述插值参数，通过双线性插值确定所述像素点的第一像素值；

图像生成单元，被配置成将所述第一像素值缩小至L分之一，作为所述像素点在所述输出图像中的目标像素值，得到所述输出图像，其中，L为2的n+1次方。

9.一种全整型硬件加速器，其特征在于，内嵌有权利要求8所述的图像处理装置。

10.一种图像处理芯片，其特征在于，包括权利要求9所述的全整型硬件加速器，所述全整型硬件加速器用于执行权利要求1至7任一所述的图像处理方法。

11.一种电子设备，其特征在于，包括：

存储器，用于存储计算机程序；

处理器，用于执行所述存储器中存储的计算机程序，且所述计算机程序被执行时，实现上述权利要求1-7任一所述的方法。