CN112927163A

CN112927163A - 图像数据增强方法、装置、电子设备及存储介质

Info

Publication number: CN112927163A
Application number: CN202110300112.9A
Authority: CN
Inventors: 夏春秋
Original assignee: Shenzhen Vision Technology Co Ltd
Current assignee: Shenzhen Vision Technology Co Ltd
Priority date: 2021-03-22
Filing date: 2021-03-22
Publication date: 2021-06-08

Abstract

本发明涉及一种图像数据增强方法、装置、电子设备及存储介质，其中，方法包括：S1、获取原始图像，对所述原始图像进行标注框标注，得到经过标注的图像；S2、对所述经过标注的图像进行旋转处理，得到经过旋转的图像；S3、对所述经过旋转的图像经过缩小处理和/或放大处理，其中，所述缩小处理包括：以相邻的两个采样点为分割线，将所述经过旋转的图像分成多个子块图像，所述多个子块图像的像素取相应子块图像像素总和的平均值，放大处理包括：构造Bi Cub i c函数，对待插值的像素点附近的邻域点，进行插值计算；S4、获得经过缩小处理和/或放大处理的标注数据。可大大提升数据的多样性，在不增加人力标注成本的基础上，可快速增加训练样本数量的效果。

Description

图像数据增强方法、装置、电子设备及存储介质

技术领域

本发明涉及图像数据处理技术领域，更具体地说，涉及一种图像数据增强方法、装置、电子设备及存储介质。

背景技术

目前在目标检测算法中，采用矩形框做图像标注往往不能够以最小的外接框框住目标物体，从而产生了较多的冗余区域。在图像中存在较密集的目标检测场景中，采用矩形框便会造成较多的重叠框，不利于准确判定目标物的位置和类别。同时在对目标物***置精度有较高要求的场景中，比如卫星航拍图，卫星建筑物图等，这就需要对用到四边形框来进行对目标物体进行精准标注。而四边形标注的方式，工作量较大，需要大量的人力投入。

发明内容

本发明要解决的技术问题在于采用矩形框往往不能够以最小的外接框框住目标物体，从而产生了较多的冗余区域，针对现有技术的上述的缺陷，本发明一方面提供了一种图像数据增强方法，包括：

S1、获取原始图像，对所述原始图像进行标注框标注，得到经过标注的图像；

S2、对所述经过标注的图像进行旋转处理，得到经过旋转的图像；

S3、对所述经过旋转的图像经过缩小处理和/或放大处理，其中，所述缩小处理包括：

以相邻的两个采样点为分割线，将所述经过旋转的图像分成多个子块图像，所述多个子块图像的像素取相应子块图像像素总和的平均值，

所述放大处理包括：

构造BiCubic函数，对待插值的像素点附近的邻域点，进行插值计算；

S4、获得经过缩小处理和/或放大处理的标注数据。

优选地，所述对所述经过标注的图像进行旋转处理包括：

设置旋转中心和旋转角度θ，对所述原始图像进行旋转。

优选地，所述设置旋转中心和旋转角度θ，对所述原始图像进行旋转包括：

将坐标原点由所述原始图像的左上角变换到所述旋转中心；

以所述旋转中心为原点，将所述原始图像旋转角度θ；

旋转结束后，将坐标原点变换到旋转后图像的左上角。

优选地，设所述原始图像上一点P(x，y)，P(x',y')为P(x，y)经过旋转转换后在笛卡尔坐标系的坐标，旋转中心为(-center_x,center_y)，则有公式：

对所述原始图像的坐标进行变换，如下公式P(x”,y”)为旋转变换后的笛卡尔坐标，有公式：

对公式2经过逆变换后，有公式3：

假设旋转后的宽和高为newWidth,newHeight，right为旋转后x轴的最大值，left为旋转后x轴的最小值，top为旋转后y轴的最小值，down为旋转后y轴的最大值。则可得到下面的关系：

旋转完成后将坐标系转换为以图像的左上角为坐标原点的图像坐标(x”',y”')，可由下面变换关系得到：

对公式5经逆变换后，得到公式6：

其中，(x_out,y_out)为旋转后的坐标：

对公式7经过逆运算后，可得到旋转后的坐标公式8：

优选地，所述旋转角度θ为顺时针方向。

优选地，所述以相邻的两个采样点为分割线，将所述经过旋转的图像分成多个子块图像进一步包括：

设置宽度和长度采样间隔，假设所述原始图像的尺寸大小宽和长为W*H，宽度和长度的缩小因子分别为k1和k2，那么宽度和长度采样间隔分别为W/k1,W/k2；

将所述经过旋转的图像分成多个子块图像。

优选地，所述插值计算为立方卷积插值计算。

相应地，本发明还提供了一种数据增强装置，包括：

原始图像获取模块，用于获取原始图像，对所述原始图像进行标注框标注，得到经过标注的图像；

旋转增强处理模块，用于对所述经过标注的图像进行旋转处理，得到经过旋转的图像；

缩小处理和/或放大处理模块，用于对所述经过旋转的图像经过缩小处理和/或放大处理，其中，所述缩小处理包括：

所述放大处理包括：

标注数据获取模块，用于获得经过缩小处理和/或放大处理的标注数据。

另一方面，本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时，实现上述图像数据增强方法的步骤。

另一方面，本发明还提供一种存储介质，所述存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述图像数据增强方法的步骤。

实施本发明的图像数据增强方法，具有以下有益效果：

采用本发明的图像旋转、放大或者缩小的两种增强方法，可以实现训练数据量6～20倍的增加；在实现数据量增加的同时，大大提升数据的多样性，例如多角度数据，拍摄远近数据，目标缩放数据等；只需要对一张原图进行标注，其他增强数据的标注在增强过程中自动生成；所以可以实现在不增加人力标注成本的基础上，可快速增加训练样本数量的效果，提升已标注训练数据的数量和种类。

附图说明

通过阅读下文优选的具体实施方式中的详细描述，本发明各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。说明书附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。显而易见地，下面描述的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

下面将结合附图及实施例对本发明作进一步说明，附图中：

图1是本发明一种图像数据增强方法流程图；

图2是将图1中采用的原始图像进行图像坐标系向笛卡尔坐标系转换的示意图；

图3是图1中采用的将6*4的原始图像切割成4*3的结构示意图；

图4是图1中采用的BiCubic基函数示意图；

图5为图1中采用的为待插值的像素点(x,y)取其附近的4x4邻域点结构示意图；

图6是本发明一种图像数据增强方法另一实施例中采用的一原始图像大小结构示意图；

图7是将图6中的原始图像旋转后得到的图像；

图8为一原始图像结构示意图；

图9是图8经过4x3压缩后得到的划分区域块；

图10为对图9区域块中的像素值取平均值后的示意图；

图11为本发明一种图像数据增强装置结构示意图；

图12为根据本发明实施例提供的电子设备的实体结构示意图。

具体实施方式

下面结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述。显然，所描述的实施例仅仅是本申请的一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下，所获得的所有其他实施例，都属于本申请保护的范围。

本申请实施例提供的图像数据增强方法可应用于各种服务器端、终端。该服务器端、终端设备包括但不限于个人计算机、服务器计算机、手持式或膝上型设备、移动设备(如手机、移动电话、平板电脑、PDA、媒体播放器等)、消费型电子设备、车载计算机、智能手表、电视机，以及其他具有显示屏幕的终端设备等等。

四边形框的目标检测数据集面临标注复杂，工作量是矩形框的四倍等困难。目前可供使用的公开数据集较少，涉及到航拍，卫星遥感图像等这类专业型数据就更加缺乏。航拍和卫星遥感照片经过俯拍修正处理后，可达到垂直俯拍的效果。

基于其垂直拍摄成像的特点，本发明提出一种针对于俯拍视图的图像做旋转变化，缩放变化数据增强的方法。

实施例一

请参阅图1，为本发明一种图像数据增强方法流程图。如图1所示，在本发明第一实施例提供的图像数据增强方法中，至少包括步骤：

获取原始图像的途径很多，比如卫星航拍图，卫星建筑物图这些远视图，也可以是拍摄的近距离图，还可以是录制的卫星航拍、卫星建筑物视频等。对录制的视频如卫星航拍视频、卫星建筑物视频等，可以进行取视频帧作为原始图像。采用矩形框框住原始图像中的目标物体。在图像中存在较密集的目标检测场景中，由于采用矩形框便会造成较多的重叠框，不利于准确判定目标物的位置和类别。这就需要对用到四边形框来进行对目标物体进行精准标注。标注的方法可以是机器标注，也可以采用人工标注。机器标注比较节省时间，但是可能会误标注或者漏标注；人工标注费时费力，准确性略高；两者可以互为补充。

四边形标注框的旋转以及旋转后新位置坐标的计算

原图像的像素坐标要经过三次的坐标变换:

1、将坐标原点由图像的左上角变换到旋转中心；

2、以旋转中心为原点，图像旋转角度θ；

3、旋转结束后，将坐标原点变换到旋转后图像的左上角；

以图像围绕任意点(center_x,center_y)为旋转中心为例，旋转角度值为θ。图像坐标系的原点在左上角，在计算的时候首先将图像坐标系转换为笛卡尔坐标系，如图2所示，将左上角的原点移到图像中心，并且Y轴需要翻转。图2是将图1中采用的原始图像进行图像坐标系向笛卡尔坐标系转换的示意图。

(x',y')是笛卡尔坐标系的坐标，(x,y)是图像坐标系的坐标，将所有像素坐标(x,y)变换为笛卡尔坐标为：

坐标系变换到以旋转中心为原点后，接下来就要对图像的坐标进行变换，如下公式(x”,y”)为旋转变换后的笛卡尔坐标：

经逆变换后，得到公式3：

由于在旋转的时候是以旋转中心为坐标原点的，旋转结束后还需要将坐标原点移到图像左上角。

旋转完成后要将坐标系转换为以图像的左上角为坐标原点的图像坐标(x”',y”')，可由下面变换关系得到：

逆变换

可以得到下面的旋转公式：(x_out,y_out)旋转后的坐标，(x,y)原坐标，

(center_x,center_y)旋转中心,θ旋转的角度(逆时针)。

其逆运算可得到最终结果：

所述放大处理包括：

基于局部均值的图像缩小算法是在等间隔采样的缩小的基础上对其进行了改进。为解决原始图像中未被选中的像素信息会在缩小后的图像中丢失的问题，在求缩小图像的像素时，不再简单的取在原图像中的采样点像素，而是以相邻的两个采样点为分割，将原图像分成一个个的子块。缩小图像的像素取相应子块像素的均值，可将原图中所有的像素信息全部融合入缩小后的图像中，使得缩小后图像具备更好的平滑度和更丰富的信息。设原图的尺寸大小为W*H，宽度和长度的缩小因子分别为k1和k2，那么采样间隔为：W/k1,W/k2。也就是说在原图的水平方向每隔W/k1，在垂直方向每隔W/k2取一个像素。长和宽的缩小因子k1和k2相等时，图像时等比例缩小，不等时是不等比例缩小，缩小图像的长和宽的比例会发生变化。如图3所示，图3是图1中采用的将6*4的原始图像切割成4*3的结构示意图。以宽高分别为6x4，k1＝2/3，k2＝3/4为例，图3说明了其取值计算过程。

最终得到结果：

举例说明：

插值方法采用基于立方卷积插值的图像放大算法。立方卷积插值是一种复杂的插值方式。其工作原理是：假设源图像A大小为m*n，缩放K倍后的目标图像B的大小为M*N，即K＝M/m。A的每一个像素点是已知的，B是未知的，我们想要求出目标图像B中每一像素点(X,Y)的值，必须先找出像素(X,Y)在源图像A中对应的像素(x,y)，再根据源图像A距离像素(x,y)最近的16个像素点作为计算目标图像B(X,Y)处像素值的参数，利用BiCubic基函数求出16个像素点的权重，图B像素(x,y)的值就等于16个像素点的加权叠加。该算法利用待采样点周围16个点的灰度值作三次插值，不仅考虑到4个直接相邻点的灰度影响，而且考虑到各邻点间灰度值变化率的影响。三次运算可以得到更接近高分辨率图像的放大效果，可得到较细致的影像，但也导致了运算量的急剧增加。这种算法需要选取插值基函数来拟合数据，其最常用的插值基函数(BiCubic基函数)如图4所示，图4是图1中采用的BiCubic基函数示意图。

构造BiCubic函数：(其中a＝-0.5)

其中，a指超参，影响函数曲线的变化曲率；x代表入参，此处指像素值；W(x)代表BiCubic函数输出；对待插值的像素点(x,y)，取其附近的4x4邻域点(x_i,y_i)如图5所示,图5为图1中采用的为待插值的像素点(x,y)取其附近的4x4邻域点结构示意图。按如下公式进行插值计算：

S4、获得经过缩小处理和/或放大处理的标注数据。

数据缩放增强后，对应标注数据的生成。不管是图像的缩小还是放大，图像的缩放是属于整体的缩放，只不过在缩放过程中插值和消值的方式不同。图像的原始尺寸为w_o×h_o，原图中目标位置标注坐标为(x_io,y_io)，缩放增强后的图像尺寸为w_e×h_e,增强后的标注数据生成规则如下公式11：

采用本发明的图像旋转、放大或者缩小的两种增强方法，可以实现训练数据量6～20倍的增加；在实现数据量增加的同时，大大提升数据的多样性，例如多角度数据，拍摄远近数据，目标缩放数据等；只需要对一张原图进行标注，其他增强数据的标注在增强过程中自动生成；所以可以实现在不增加人力标注成本的基础上，可快速增加训练样本数量的效果。

实施例二

图6是本发明一种图像数据增强方法另一实施例中采用的一原始图像大小结构示意图。如图假设获取了一张原始图像，宽高如图6所示，其中已经标注好的目标物的右上角图像坐标值为(550,150)。

将原始图像送入到图像旋转增强算法，旋转角度θ为60°，旋转中心设置为图像的中心点(center_x,center_y)＝(320,160)。为了保证图像旋转之后的图像信息不丢失，将旋转后的坐标原点坐标设置为left设置为0，则top根据计算可得top＝sinθ×w＝554。将原始图像的所有像素值坐标(x，y)代入以下公式8，可计算得出所有像素值旋转后的新坐标，如图7所示。图7是将图6中的原始图像旋转后得到的图像。

下面采用基于局部均值的图像缩小算法进行说明。假设含有一张原始图像，如图8所示，图8为一原始图像结构示意图，图像尺寸为6x4：21,255,240,230,111,0；75,66,247,64,78,58,；64,47,230,63,99,34；63,48,26,10,78,21。

设定图形缩小后的尺寸大小为4x3，原始数据送入到局部均值图像缩小算法，得到如图9所示的划分区域块。图9是图8经过4x3压缩后得到的划分区域块。

最后将区域块中的像素值取平均，得到最终4x3的缩小尺寸图像，如图10所示，图10为对图9区域块中的像素值取平均值后的示意图。

基于立方卷积插值的图像放大算法举例说明：假设含有一张原图，其局部像素值分布如图5所示。现需要对该图像进行放大，以图中P所在位置的行列坐标进行立方卷积插值，其过程如下。(x_i,y_i)指在以P点为中心的4x4邻域点的横纵坐标值。对应图5中的4x4的像素矩阵。待插值的P点出坐标(x,y)＝(4.5,5.6)。代入以下立方卷积插值公式10，最终可求得P点处的像素值取整为23。

实施例三

图11为本发明一种图像数据增强装置结构示意图。如图11所示，一种图像数据增强装置，包括：

原始图像获取模块10，用于获取原始图像，对所述原始图像进行标注框标注，得到经过标注的图像；

旋转增强处理模块20，用于对所述经过标注的图像进行旋转处理，得到经过旋转的图像；

缩小处理和/或放大处理模块30，用于对所述经过旋转的图像经过缩小处理和/或放大处理，其中，所述缩小处理包括：

所述放大处理包括：

标注数据获取模块40，用于获得经过缩小处理和/或放大处理的标注数据。

本实施例一种图像数据增强装置，执行如实施例一或者实施例二的图像数据增强方法，图像数据增强方法请参考实施例一和实施例二，在此不再赘述。

实施例四

图12为根据本发明实施例提供的电子设备的实体结构示意图。基于上述实施例的内容，如图12所示，该电子设备可以包括：处理器(processor)301、存储器(memory)302和总线303；其中，处理器301和存储器302通过总线303完成相互间的通信；处理器301用于调用存储在存储器302中并可在处理器301上运行的计算机程序指令，以执行上述各方法实施例所提供的图像数据增强方法，例如包括：

所述放大处理包括：

S4、获得经过缩小处理和/或放大处理的标注数据。

此外，上述的存储器302中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明实施例的技术方案实质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例数据增强的方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘，只读存储器(ROM，Read-Only Memory)、随机存储存储器(RAM，Random Access Memory)、磁碟或者光盘等各种存储程序代码的介质。

采用本实施例，采用本发明的图像旋转、放大或者缩小的两种增强方法，可以实现训练数据量6～20倍的增加；在实现数据量增加的同时，大大提升数据的多样性，例如多角度数据，拍摄远近数据，目标缩放数据等；只需要对一张原图进行标注，其他增强数据的标注在增强过程中自动生成；所以可以实现在不增加人力标注成本的基础上，可快速增加训练样本数量的效果，提升已标注训练数据的数量和种类。

实施例五

本发明另一实施例公开一种计算机程序产品，计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序，计算机程序包括程序指令，当程序指令被计算机执行时，计算机能够执行上述各实施例所提供的图像数据增强方法，例如包括步骤：

所述放大处理包括：

S4、获得经过缩小处理和/或放大处理的标注数据。

实施例六

本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的图像数据增强方法，例如包括步骤：

所述放大处理包括：

S4、获得经过缩小处理和/或放大处理的标注数据。

本发明是根据特定实施例进行描述的，但本领域的技术人员应明白在不脱离本发明范围时，可进行各种变化和等同替换。此外，为适应本发明技术的特定场合，可对本发明进行诸多修改而不脱离其保护范围。因此，本发明并不限于在此公开的特定实施例，而包括所有落入到权利要求保护范围的实施例。