CN107169489A

CN107169489A - 倾斜图像校正的方法和装置

Info

Publication number: CN107169489A
Application number: CN201710316618.2A
Authority: CN
Inventors: 李春华
Original assignee: Beijing Jingdong Financial Technology Holding Co Ltd
Current assignee: JD Digital Technology Holdings Co Ltd; Jingdong Technology Holding Co Ltd
Priority date: 2017-05-08
Filing date: 2017-05-08
Publication date: 2017-09-15
Anticipated expiration: 2037-05-08
Also published as: CN107169489B

Abstract

本发明实施例提供一种倾斜图像校正的方法和装置，能够以较小的运算量准确地对倾斜图像进行校正，并能够判断校正后的图像是否倒置，进而对倒置的图像进行调整。本发明实施例的倾斜图像校正的方法包括：切分图像中的字符；从切分的字符中确定至少一个特征字符串；通过所述至少一个特征字符串校正图像。

Description

倾斜图像校正的方法和装置

技术领域

本发明涉及计算机领域，尤其涉及一种倾斜图像校正的方法和装置。

背景技术

如今，证件信息提取已经广泛应用于各种场景中。证件信息提取通常的流程是：先通过扫描证件或拍照得到证件图像，再利用技术手段识别图像中的关键信息。但是，在拍照或扫描过程中，由于各种原因，证件图像可能会产生一定的倾斜，这对后期证件信息的提取会产生较大影响，容易导致证件信息提取不全、错误，甚至无法提取到证件信息，因此有必要对倾斜的图像进行校正。

现有技术中倾斜图像校正的流程一般如下：

S01.利用图像采集设备获取证件图像。

S02.对证件图像进行灰度处理。

S03.对灰度图像进行边缘检测。

S04.利用Hough变换进行图像边框直线检测，计算图像倾斜角度。

S05.利用所述倾斜角度旋转图像以实现校正。上述具体流程如图1所示。

在实现本发明的过程中，发明人发现现有技术至少存在以下问题：

1.现有技术中采用Hough变换来计算倾斜角度，由于Hough变换需要对所有像素点进行重复计算，需要较大的计算量和较长的运算时间，这使得图像校正效率较低。

2.现有技术是通过检测图像的轮廓而进行旋转的，对于产生180度偏转的图像，不能判断其正反。

3.在受到噪点影响，背景与图像信息不分明的时候，现有技术很难将轮廓提取出来，导致无法实现校正。

4.现有技术采用Hough变换检测直线时，由于图片背景各异，通常会检测出较多的干扰线，从而无法确定图像边框直线。

发明内容

有鉴于此，本发明实施例提供一种倾斜图像校正的方法和装置，能够以较小的运算量准确地对倾斜图像进行校正，并能够判断校正后的图像是否倒置，进而对倒置的图像进行调整。

为实现上述目的，根据本发明的一个方面，提供了一种倾斜图像校正的方法。

本发明实施例的倾斜图像校正的方法包括：切分图像中的字符；从切分的字符中确定至少一个特征字符串；通过所述至少一个特征字符串校正图像。

可选地，所述至少一个特征字符串为直线型字符串。

可选地，切分图像中的字符包括：检测图像中的字符，根据检测的字符的端点建立容纳所述字符的字符框。

可选地，从切分的字符中确定特征字符串包括：从图像的字符框中确定起始字符框；选取处于所述起始字符框邻域内、且满足预设判别条件的待判别字符框，作为特征字符框；将得到的特征字符框依次作为起始字符框，确定在所述起始字符框邻域内、且满足预设判别条件的待判别字符框为特征字符框，直到没有新的特征字符框生成；将得到的所有特征字符框组成特征字符串。

可选地，预设判别条件为：待判别字符框与起始字符框的横向距离小于第一距离阈值，且待判别字符框与起始字符框的纵向中心距离小于第二距离阈值；或者待判别字符框与起始字符框的纵向距离小于第三距离阈值，且待判别字符框与起始字符框的横向中心距离小于第四距离阈值。

可选地，所述方法进一步包括：计算任一特征字符串的每一起伏角，将任一起伏角小于预设角度阈值的特征字符串去除；其中，所述起伏角为：特征字符串中一个字符框的中心点与相邻字符框的中心点的连线的夹角。

可选地，如果从切分的字符中确定一个特征字符串，则通过所述一个特征字符串校正图像包括：以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角；根据所述倾角旋转图像以实现校正。

可选地，如果从切分的字符中确定多个特征字符串，则通过所述多个特征字符串校正图像包括：针对任一特征字符串，以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角；如果所述多个特征字符串的倾角都在预设角度范围、或都不在预设角度范围，则计算所述多个特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正。

可选地，所述方法进一步包括：在所述多个特征字符串中，如果部分特征字符串的倾角在预设角度范围，则统计倾角在预设角度范围的特征字符串的数量、与倾角不在预设角度范围的特征字符串的数量，将数量较小的相应特征字符串去除；针对剩余的特征字符串，计算各特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正。

可选地，所述方法进一步包括：校正图像后，根据所述特征字符串在校正后的图像中的位置判断所述校正后的图像是否倒置：若是，将该图像旋转180°。

为实现上述目的，根据本发明的另一方面，提供了一种倾斜图像校正的装置。

本发明实施例的倾斜图像校正的装置包括：切分模块，可用于切分图像中的字符；字符串提取模块，可用于从切分的字符中确定至少一个特征字符串；校正模块，可用于通过所述至少一个特征字符串校正图像。

可选地，切分模块包括：检测模块，可用于检测图像中的字符；字符框建立模块，可用于根据检测的字符的端点建立容纳所述字符的字符框。

可选地，字符串提取模块包括：起始字符框确定模块，可用于从图像的字符框中确定起始字符框；特征字符框选取模块，可用于选取处于所述起始字符框邻域内、且满足预设判别条件的待判别字符框，作为特征字符框；特征字符串生成模块，可用于将得到的特征字符框依次作为起始字符框，确定在所述起始字符框邻域内、且满足预设判别条件的待判别字符框为特征字符框，直到没有新的特征字符框生成；将得到的所有特征字符框组成特征字符串。

可选地，校正模块包括：倾角计算模块，可用于针对任一特征字符串，以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角；第一校正模块，可用于当确定的特征字符串为多个时，如果判断多个特征字符串的倾角都在预设角度范围、或都不在预设角度范围，则计算所述多个特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正；第二校正模块，可用于当确定的特征字符串为多个时，如果判断多个特征字符串中的部分特征字符串的倾角在预设角度范围，则统计倾角在预设角度范围的特征字符串的数量、与倾角不在预设角度范围的特征字符串的数量，将数量较小的相应特征字符串去除；并针对剩余的特征字符串，计算各特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正；第三校正模块，可用于当确定的特征字符串为一个时，根据该特征字符串的倾角旋转图像以实现校正。

可选地，所述装置进一步包括：倒置调整模块，可用于根据所述特征字符串在校正后的图像中的位置判断所述校正后的图像是否倒置：若是，将该图像旋转180°

为实现上述目的，根据本发明的再一方面，提供了一种电子设备。

本发明的一种电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明所提供的倾斜图像校正的方法。

为实现上述目的，根据本发明的再一方面，提供了一种计算机可读存储介质。

本发明的一种计算机可读存储介质，其上存储有计算机程序，所述程序被处理器执行时实现本发明所提供的倾斜图像校正的方法。

根据本发明的技术方案，上述发明中的一个实施例具有如下优点或有益效果：通过为切分的字符设置字符框，利用字符框的相邻位置关系确定特征字符串，根据特征字符串确定倾斜角度以旋转图像，从而以较小的运算量实现了倾斜图像的准确校正，大幅提高了倾斜图像的校正效率，并为图像中字符的后续识别提供基础，解决了现有技术校正运算量大、校正效率低的问题；由于提取图像的字符特征来进行校正，不需要提取图像轮廓，从而解决了现有技术干扰线较多、高噪声背景下无法提取轮廓的问题；通过判断特征字符串在校正后的图像中的位置来检测图像是否倒置，进而对倒置图像进行调整，从而克服了现有技术无法对倒置图像进行处理的缺陷。

上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。

附图说明

附图用于更好地理解本发明，不构成对本发明的不当限定。其中：

图1是现有技术中倾斜图像校正的流程示意图；

图2是根据本发明实施例的倾斜图像校正的方法的主要步骤示意图；

图3是根据本发明实施例的倾斜图像校正的方法的字符框建立示意图；

图4是根据本发明实施例的倾斜图像校正的方法的网格构建示意图；

图5是根据本发明实施例的倾斜图像校正的方法的特征字符串生成示意图；

图6是根据本发明实施例的倾斜图像校正的方法的起伏角生成示意图；

图7是根据本发明实施例的倾斜图像校正的装置的主要部分的示意图；

图8是用来实现本发明实施例的倾斜图像校正的方法的电子设备的结构示意图。

具体实施方式

以下结合附图对本发明的示范性实施例做出说明，其中包括本发明实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本发明的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

本发明的实施例的技术方案通过为切分的字符设置字符框，利用字符框的相邻位置关系确定特征字符串，根据特征字符串确定倾斜角度以旋转图像，从而以较小的运算量实现了倾斜图像的准确校正，大幅提高了倾斜图像的校正效率，并为图像中字符的后续识别提供基础，解决了现有技术校正运算量大、校正效率低的问题；通过提取图像的字符特征来进行校正，不需要提取图像轮廓，从而解决了现有技术干扰线较多、高噪声背景下无法提取轮廓的问题；通过判断特征字符串在校正后的图像中的位置来检测图像是否倒置，进而对倒置图像进行调整，从而克服了现有技术无法对倒置图像进行处理的缺陷。

图2是根据本发明实施例的倾斜图像校正的方法的主要步骤的示意图。

如图2所示，本发明实施例的倾斜图像校正的方法主要包括如下步骤：

步骤S1：切分图像中的字符。本步骤的目的在于：提取图像中的字符，并利用字符框对字符进行切分。

在本发明实施例中，在步骤S1之前，以图像的中心为原点，以目标方向为X轴方向，建立平面直角坐标系。上述目标方向可以是期望的校正后的图像中的特征线所指的方向，特征线具体为图像中具有定向作用的直线，例如：对于身份证图像来说，其矩形轮廓下边所在的直线或穿过“公民身份号码xxxxxxxxxx”中字符中心的直线都可以作为特征线。在本发明实施例中，当旋转图像使图像中的特征线处于目标方向时，说明图像处于已校正状态。

较佳地，在本发明实施例中，步骤S1可以包括：检测图像中的字符，根据检测的字符的端点建立容纳字符的字符框。字符的端点指的是字符的横坐标最大、最小的两个像素点、以及字符的纵坐标最大、最小的两个像素点，基于四个端点在X、Y方向构建矩形字符框即可包括该字符的全部像素点，即容纳该字符。

具体应用中，可以利用MSER(Maximally Stable Extremal Regions，最大稳定极值区域)算法来实现字符的切分，MSER算法可通过OpenCv(Open Source Computer VisionLibrary，开源计算机视觉算法库)的CvExtractMSER函数实现。在MSER算法处理图像之前，首先需要对图像进行灰度处理。MSER算法的具体步骤如下：

1.利用不同灰度阈值对图像进行二值化处理。

2.对于每个阈值得到的二值化图像，获取相应的黑色区域与白色区域。

3.在预设的灰度阈值内提取保持形状稳定的区域，即为最大稳定极值区域。

4.提取同一区域内所有像素点横纵坐标的最小和最大值x1、x2、y1、y2，组合得到四个坐标点(x1,y1)，(x1,y2)，(x2,y1)，(x2,y2)。

5.以步骤4中的四个坐标点为矩形的四个角，同一区域内的所有像素点均在这四个点围成的矩形字符框内。

图3是根据本发明实施例的倾斜图像校正的方法的字符框建立示意图，上述步骤4、5具体可参见图3。

步骤S2：从切分的字符中确定至少一个特征字符串。本步骤的目的在于：基于切分的字符及字符框，提取特征字符串用于确定图像的倾斜角度。

在本发明实施例中，特征字符串由多个字符组成，而每个字符均与字符框对应，因此也可以认为特征字符串由与上述字符对应的字符框组成。具体应用中，特征字符串为直线型字符串，即由相邻的、沿直线排列的多个字符组成的字符串，呈直线排列可以为：字符串中各字符框中心点的排列符合预设的直线排列规则，直线排列规则可以根据实际需要灵活设置。

需要说明的是，在本发明的实施例中，是通过从倾斜图像中提取出特征字符串并计算特征字符串的倾角，同时参照这一内容的字符串在此类图像中的固有位置，来获取倾斜图像的倾斜角度的。因此，本发明可以对具有上述特征字符串的图像如身份证、驾驶证、车牌号等进行校正。例如：对于身份证图像进行校正时，可提取身份证最下方的字符串“公民身份号码xxxxxxxx”作为特征字符串，计算其倾角角度。由于该字符串与身份证的特征线同向，因此可将身份证图像旋转上述倾角角度实现校正。

在本发明实施例中，步骤S2可根据下列步骤执行：

步骤S21：从图像的字符框中确定起始字符框。

较佳地，在确定起始字符框之前，可以建立网格图并对每一字符框的位置进行标记。

图4是根据本发明实施例的倾斜图像校正的方法的网格构建示意图。

如图4所示，倾斜图像由“鲁MBD726”与“车辆”两部分组成。首先可以根据预设距离建立网格，例如以所有字符框长度平均值的1.5倍作为网格的长度、以所有字符框宽度平均值的1.5倍作为网格宽度来建立网格。

建立网格之后，可以对每一字符框进行编号，并标记每一字符框在网格中的位置。其中：每一字符框在网格中的位置指的是每一字符框的中心点在网格中的位置。

例如：可将字符“鲁”、“M”、“B”、“D”、“7”、“2”、“6”、“车”、“辆”依次编号为0-8，并结合其在网格中的位置生成如下数组a[n]＝{(4，3，0)，(4，4，0)，(4，4，0)，(4，4，0)，(4，5，0)，(3，5，0)，(3，6，0)，(3，6，0)，(3，6，0)}。其中，n取值0-8，数组中每一项的前两个数字表示字符框中心点在网格中第几行、第几列，第三个数字表示字符框的处理状态，o为未处理，1为已处理。

在上述步骤中，通过建立网格进行字符框标记，能够快速限定需要判断的区域范围，只需要判断某一字符框在区域范围内是否有符合规则的相邻字符框即可，从而避免了在全盘范围内对所有其它字符框进行判断的过程，由此显著地提升了校正效率。

在本发明实施例中，可选取图像内的任一字符框作为起始字符框，例如：选取图4中的“鲁”作为起始字符框以提取特征字符串。

步骤S22：选取处于起始字符框邻域内且满足预设判别条件的待判别字符框，作为特征字符框。其中：邻域指的是起始字符框的相邻区域，实际应用中，可以根据需求设置领域范围。例如：可以将以起始字符框中心点为圆心，以预设长度为半径的圆内区域作为领域。在图4中，如果“鲁”为起始字符框，可以以其所处的网格、相邻的网格即九宫格(4,3)、(3,2)、(3,3)、(3,4)、(4,2)、(4,4)、(5,2)、(5,3)、(5,4)为其邻域。一般地，待判别字符框为未处理的字符框，特征字符框为已处理的字符框。

在本发明实施例中，预设预设判别条件可以是下列两个条件中的任一：

条件1：待判别字符框与起始字符框的横向距离小于第一距离阈值，同时待判别字符框与起始字符框的纵向中心距离小于第二距离阈值。横向距离指的是两个字符框最为接近的竖边的距离，纵向中心距离指的是两个字符框中心点的纵向距离，第一距离阈值与第二距离阈值可根据具体环境确定，例如：第一距离阈值、第二距离阈值都可以设置为两个字符框最短竖边的长度的25％。

条件2：待判别字符框与起始字符框的纵向距离小于第三距离阈值，同时待判别字符框与起始字符框的横向中心距离小于第四距离阈值。

纵向距离指的是两个字符框最为接近的横边的距离，横向中心距离指的是两个字符框中心点的横向距离，第三距离阈值与第四距离阈值可根据具体环境确定，例如：第三距离阈值、第四距离阈值都可以设置为两个字符框最短横边的长度的25％。

在图4中，如果以“鲁”字符框作为起始字符框，则判断其九宫格内的“鲁”、“M”、“B”、“D”是否满足预设判别条件，如果判断“M”满足判别条件，“B”、“D”不满足判别条件，则将“鲁”、“M”字符框标记为“已处理”，作为特征字符框。

步骤S23：将得到的特征字符框依次作为起始字符框，确定在所述起始字符框邻域内且满足预设判别条件的待判别字符框为特征字符框，直到没有新的特征字符框生成；将得到的所有特征字符框组成特征字符串。

具体地，在步骤S23中，将特征字符框作为起始字符框，不断执行步骤S22、S23；当没有新的特征字符框生成时，由得到的所有特征字符框组成特征字符串。本步骤的目的在于：确定所有满足判别条件的相邻字符框，组成特征字符串。

在图4中，“M”字符框已是特征字符框，则将其作为起始字符框，判断其九宫格内的待判别字符框“B”、“D”、“7”、“2”是否满足预设判别条件。如果“B”满足，其余三者不满足，则将“B”作为特征字符框，并将“B”作为起始字符框执行步骤S22、S23。这样，直到确定从“鲁”字符框得到的所有特征字符框，这些特征字符框组成特征字符串“鲁MBD726”。

步骤S24：如果图像中还存在待判别字符框，则将任一待判别字符框确定为起始字符框，依次执行步骤S22、S23、S24；由此获取图像中所有的特征字符串。

较佳地，在本发明实施例中，可以按照字符框的编号顺序确定起始字符框，已执行过步骤S24的待判别字符框不再重复执行。

例如：图4中，在确定特征字符串“鲁MBD726”之后，判断“车”“辆”未处理，则以“车”或“辆”为起始字符框，重复步骤S21-S23，确定特征字符串“车辆”。

图5是根据本发明实施例的倾斜图像校正的方法的特征字符串生成示意图，如图5所示，图像中的两个特征字符串“鲁MBD726”、“车辆”被确定。

通过步骤S2，本发明实施例的倾斜图像校正的方法能够提取倾斜图像中的特征字符串用于图像的校正。

步骤S3：通过特征字符串校正图像。本步骤的目的在于通过特征字符串获得图像的倾斜角度，根据倾斜角度旋转图像从而实现图像的校正。

在本发明实施例中，步骤S3可按照以下步骤执行：

步骤S31：计算任一特征字符串的每一起伏角，将任意一个起伏角小于预设角度阈值的特征字符串去除。其中，起伏角具体为：特征字符串中一个字符框的中心点与相邻字符框的中心点的连线的夹角。

图6是根据本发明实施例的倾斜图像校正的方法的起伏角生成示意图。

如图6所示，起伏角可通过以下方法得到：根据特征字符串中字符框中心点横坐标或纵坐标由小到大的顺序，依次用直线连接字符框中心点，连线间小于180°的夹角即为起伏角。预设角度阈值可以根据应用环境进行设置，例如可以设置为150°。一般地，对于横向排列的特征字符串，可以利用横坐标由小到大的顺序构造直线形成起伏角，对于纵向排列的特征字符串，可以利用纵坐标由小到大的顺序构造直线形成起伏角。横向排列与纵向排列的含义将在后文中具体介绍。

本步骤的目的在于：通过判断特征字符串的起伏角，将起伏较大、影响校正效果的特征字符串去除，以提高图像校正质量。

步骤S32：针对任一特征字符串，以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角。本步骤的目的在于计算每一特征字符串的倾角，综合特征字符串的倾角即可获得图像的倾斜角度。上述倾角具体为直线斜率对应的角度，即从X轴正方向起始，沿逆时针方向旋转至该直线形成的角度。端点字符框指的是特征字符串中中心点坐标是各字符框中心点坐标中最值的两个字符框。

步骤S33：如果确定的特征字符串为1个，则根据所述特征字符串的倾角旋转图像以实现校正。

在本发明实施例中，可以结合倾角与目标方向来计算图像的倾斜角度。由于在本发明实施例中，目标方向为X轴方向，则倾角角度即为图像的倾斜角度，于是将图像旋转倾角角度即可实现校正。

步骤S34：当确定的特征字符串为多个时，如果判断特征字符串的倾角都在预设角度范围、或都不在预设角度范围，则计算各特征字符串的倾角的平均值，根据倾角的平均值旋转图像以实现校正。

其中，预设角度范围可以根据实际需求进行设置，例如设置为(-45°，45°)。在步骤S34中，如果判断特征字符串是否全部在预设角度范围、或者全部都不在预设角度范围，则认为各特征字符串的排列方式类似，则计算各特征字符串的倾角的平均值来进行校正。

在本发明实施例中，可以结合倾角的平均值与目标方向，计算图像的倾斜角度。由于在本发明实施例中，目标方向为X轴方向，则倾角的平均值即为图像的倾斜角度，于是将图像旋转倾角的平均值即可实现校正。

步骤S35：当确定的特征字符串为多个时，如果判断所述多个特征字符串中的部分特征字符串的倾角在预设角度范围，则统计倾角在预设角度范围的特征字符串的数量、与倾角不在预设角度范围的特征字符串的数量，将数量较小的相应特征字符串去除。

实际应用中，除了可提取出与图像中真实字符相对应的特征字符串外，从图像中还可提取出由噪点组成的特征字符串。这些由噪点组成的特征字符串与对应于真实字符的字符串方向差异较大，而数量较小。步骤S35即可应对上述情况。在步骤S35中，首先判断特征字符串是否处于预设角度范围，从而将特征字符串分成两组；之后比较两组包含的特征字符串数量，将数量较小的一组确定为噪点组成的字符串，将其去除。

步骤S36：针对剩余的特征字符串，计算各特征字符串的倾角的平均值，根据该平均值旋转图像以实现校正。在步骤S36中，针对去除噪点后的特征字符串，计算其倾角的平均值以校正图像。

在本发明实施例中，步骤S3还可按照以下步骤执行：

步骤S37：连接特征字符串中横坐标最小和最大的字符框中心点，计算中心点连接线在平面直角坐标系中的直线表达式y＝ax+b。判断a的取值是否在-1到1之间：若是，则确定该特征字符串为横向排列；否则，则确定该特征字符串为纵向排列。

步骤S38：对于横向排列的特征字符串，根据其中字符框中心点横坐标由小到大的顺序依次用直线连接字符框中心点，形成起伏角；对于纵向排列的特征字符串，根据其中字符框中心点纵坐标由小到大的顺序依次用直线连接字符框中心点，形成起伏角。将任一起伏角小于预设角度阈值的特征字符串去除。

步骤S39：判断剩余的特征字符串是否都为横向排列或纵向排列：若是，计算特征字符串的倾角的平均值以校正图像；否则，去除横向排列的特征字符串与纵向排列的特征字符串两组中数量较小的一组，计算剩余的特征字符串的倾角的平均值以校正图像。其中，特征字符串的倾角为该特征字符串的端点字符框的中心点连线的夹角。对于横向排列的特征字符串：其两个端点字符框为中心点横坐标最大与最小的字符框；对于纵向排列的特征字符串：其两个端点字符框为中心点纵坐标最大与最小的字符框。

较佳地，在校正图像后，本发明实施例的倾斜图像校正的方法能够判断图像是否倒置。如果倒置，将其旋转180°实现图像的倒置校正。具体地，在本发明实施例中，倒置判断的过程如下：

1.确定校正线对应的字符串在现实中的图像中的位置。例如：校正线对应的“公民身份号码xxxxxxxx”在身份证的下方。

2.确定该字符串在待判断图像中的位置。

3.进行倒置判断：如果上述二位置相同，则没有倒置；否则即为倒置。例如：如果待判断图像中的上述字符串在图像上方，则判断图像为倒置；如果在下方，则判断为没有倒置。

接下来，如果图像没有倒置，对其不做处理。如果图像倒置，将其绕图像中心旋转180°得到最终的图像。

根据本发明实施例的倾斜图像校正的方法可以看出，因为采用了为切分的字符设置字符框，利用字符框的相邻位置关系确定特征字符串，根据特征字符串确定倾斜角度的技术手段，所以能够以较小的运算量实现倾斜图像的准确校正，能够大幅提高倾斜图像的校正效率，并为图像中字符的后续识别提供基础，能够解决现有技术校正运算量大、校正效率低的问题；由于提取图像的字符特征来进行校正，不需要提取图像轮廓，所以解决了现有技术干扰线较多、高噪声背景下无法提取轮廓的问题；通过判断特征字符串在校正后的图像中的位置来检测图像是否倒置，进而对倒置图像进行调整，从而克服了现有技术无法对倒置图像进行处理的缺陷。

图7是根据本发明实施例的倾斜图像校正的装置的主要部分的示意图。

如图7所示，本发明实施例的倾斜图像校正的装置70主要可包括：切分模块701、字符串提取模块702、校正模块703。其中：

切分模块701可用于切分图像中的字符。

字符串提取模块702可用于从切分的字符中确定至少一个特征字符串。

校正模块703可用于通过所述至少一个特征字符串校正图像。

较佳地，切分模块701可包括检测模块与字符框建立模块。其中：

检测模块可用于检测图像中的字符。

字符框建立模块可用于根据检测的字符的端点建立容纳所述字符的字符框。

作为一个可选方案，字符串提取模块702可包括起始字符框确定模块、特征字符框选取模块及特征字符串生成模块。其中：

起始字符框确定模块可用于从图像的字符框中确定起始字符框。

特征字符框选取模块可用于选取处于所述起始字符框邻域内且满足预设判别条件的待判别字符框，作为特征字符框。

特征字符串生成模块可用于将得到的特征字符框依次作为起始字符框，确定在所述起始字符框邻域内、且满足预设判别条件的待判别字符框为特征字符框，直到没有新的特征字符框生成；将得到的所有特征字符框组成特征字符串。

在本发明实施例中，校正模块703可包括：倾角计算模块、第一校正模块、第二校正模块以及第三校正模块。其中：

倾角计算模块可用于针对任一特征字符串，以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角。

第一校正模块可用于当确定的特征字符串为多个时，如果判断多个特征字符串的倾角都在预设角度范围、或都不在预设角度范围，则计算各特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正。

第二校正模块可用于当确定的特征字符串为多个时，如果判断多个特征字符串中的部分特征字符串的倾角在预设角度范围，则统计倾角在预设角度范围的特征字符串的数量、与倾角不在预设角度范围的特征字符串的数量，将数量较小的相应特征字符串去除；并针对剩余的特征字符串，计算各特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正。

第三校正模块，用于当确定的特征字符串为一个时，根据该特征字符串的倾角旋转图像以实现校正。

此外，本发明实施例的倾斜图像校正的装置70进一步包括倒置调整模块，可用于根据所述特征字符串在校正后的图像中的位置判断所述校正后的图像是否倒置：若是，将该图像旋转180°。

需要说明的是，本发明实施例的倾斜图像校正的装置70作为软件，可安装在计算机、移动终端等设备中。

从以上描述可以看出，因为采用了为切分的字符设置字符框，利用字符框的相邻位置关系确定特征字符串，根据特征字符串确定倾斜角度的技术手段，所以能够以较小的运算量实现倾斜图像的准确校正，能够大幅提高倾斜图像的校正效率，并为图像中字符的后续识别提供基础，能够解决现有技术校正运算量大、校正效率低的问题；由于提取图像的字符特征来进行校正，不需要提取图像轮廓，所以解决了现有技术干扰线较多、高噪声背景下无法提取轮廓的问题；通过判断特征字符串在校正后的图像中的位置来检测图像是否倒置，进而对倒置图像进行调整，从而克服了现有技术无法对倒置图像进行处理的缺陷。

根据本发明公开的实施例，本发明还提供了一种电子设备。

本发明实施例的电子设备包括：一个或多个处理器；存储装置，用于存储一个或多个程序，当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现本发明所提供的倾斜图像校正的方法。

下面参考图8，其示出了适于用来实现本发明实施例的电子设备的计算机***800的结构示意图。图8示出的电子设备仅仅是一个示例，不应对本发明实施例的功能和使用范围带来任何限制。

如图8所示，计算机***800包括中央处理单元(CPU)801，其可以根据存储在只读存储器(ROM)802中的程序或者从存储部分808加载到随机访问存储器(RAM)803中的程序而执行各种适当的动作和处理。在RAM803中，还存储有计算机***800操作所需的各种程序和数据。CPU801、ROM 802以及RAM 803通过总线804彼此相连。输入/输出(I/O)接口805也连接至总线804。

以下部件连接至I/O接口805：包括键盘、鼠标等的输入部分806；包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分807；包括硬盘等的存储部分808；以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分809。通信部分809经由诸如因特网的网络执行通信处理。驱动器810也根据需要连接至I/O接口805。可拆卸介质811，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器810上，以便从其上读出的计算机程序根据需要被安装入存储部分808。

特别地，根据本发明公开的实施例，上文的主要步骤图描述的过程可以被实现为计算机软件程序。例如，本发明实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在上述实施例中，该计算机程序可以通过通信部分809从网络上被下载和安装，和/或从可拆卸介质811被安装。在该计算机程序被中央处理单元801执行时，执行本发明的***中限定的上述功能。

需要说明的是，本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的***、装置或器件，或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于：具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中，计算机可读存储介质可以是任何包含或存储程序的有形介质，该程序可以被指令执行***、装置或者器件使用或者与其结合使用。在本发明中，计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号，其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式，包括但不限于电磁信号、光信号或上述任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质，该计算机可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输，包括但不限于：无线、电线、光缆、RF等等，或者上述的任意合适的组合。

附图中的流程图和框图，图示了按照本发明各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上，流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分，上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意，在有些作为替换的实现中，方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如，两个接连地表示的方框实际上可以基本并行地执行，它们有时也可以按相反的顺序执行，这根据所涉及的功能而定。也要注意的是，框图或流程图中的每个方框、以及框图或流程图中的方框的组合，可以用执行规定的功能或操作的专用的基于硬件的***来实现，或者可以用专用硬件与计算机指令的组合来实现。

描述于本发明实施例中所涉及到的单元可以通过软件的方式实现，也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中，例如，可以描述为：一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中，这些单元的名称在某种情况下并不构成对该单元本身的限定，例如，发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。

作为另一方面，本发明还提供了一种计算机可读介质，该计算机可读介质可以是上述实施例中描述的设备中所包含的；也可以是单独存在，而未装配入该设备中的。上述计算机可读介质承载有一个或者多个程序，当上述一个或者多个程序被该设备执行时，使得该设备执行的步骤包括：切分图像中的字符；从切分的字符中确定至少一个特征字符串；通过所述至少一个特征字符串校正图像。

根据本发明实施例的技术方案，通过为切分的字符设置字符框，利用字符框的相邻位置关系确定特征字符串，根据特征字符串确定倾斜角度以旋转图像，从而以较小的运算量实现了倾斜图像的准确校正，大幅提高了倾斜图像的校正效率，并为图像中字符的后续识别提供基础，解决了现有技术校正运算量大、校正效率低的问题；由于提取图像的字符特征来进行校正，不需要提取图像轮廓，从而解决了现有技术干扰线较多、高噪声背景下无法提取轮廓的问题；通过判断特征字符串在校正后的图像中的位置来检测图像是否倒置，进而对倒置图像进行调整，从而克服了现有技术无法对倒置图像进行处理的缺陷。

上述具体实施方式，并不构成对本发明保护范围的限制。本领域技术人员应该明白的是，取决于设计要求和其他因素，可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明保护范围之内。

Claims

1.一种倾斜图像校正的方法，其特征在于，包括：

切分图像中的字符；

从切分的字符中确定至少一个特征字符串；

通过所述至少一个特征字符串校正图像。

2.根据权利要求1所述的方法，其特征在于，所述至少一个特征字符串为直线型字符串。

3.根据权利要求1所述的方法，其特征在于，

切分图像中的字符包括：检测图像中的字符，根据检测的字符的端点建立容纳所述字符的字符框。

4.根据权利要求3所述的方法，其特征在于，从切分的字符中确定特征字符串包括：

从图像的字符框中确定起始字符框；

选取处于所述起始字符框邻域内、且满足预设判别条件的待判别字符框，作为特征字符框；

将得到的特征字符框依次作为起始字符框，确定在所述起始字符框邻域内、且满足预设判别条件的待判别字符框为特征字符框，直到没有新的特征字符框生成；将得到的所有特征字符框组成特征字符串。

5.根据权利要求4所述的方法，其特征在于，预设判别条件为：

待判别字符框与起始字符框的横向距离小于第一距离阈值，且待判别字符框与起始字符框的纵向中心距离小于第二距离阈值；或者

待判别字符框与起始字符框的纵向距离小于第三距离阈值，且待判别字符框与起始字符框的横向中心距离小于第四距离阈值。

6.根据权利要求4所述的方法，其特征在于，所述方法进一步包括：

计算任一特征字符串的每一起伏角，将任一起伏角小于预设角度阈值的特征字符串去除；其中，所述起伏角为：特征字符串中一个字符框的中心点与相邻字符框的中心点的连线的夹角。

7.根据权利要求4所述的方法，其特征在于，如果从切分的字符中确定一个特征字符串，则通过所述一个特征字符串校正图像包括：

以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角；

根据所述倾角旋转图像以实现校正。

8.根据权利要求4所述的方法，其特征在于，如果从切分的字符中确定多个特征字符串，则通过所述多个特征字符串校正图像包括：

针对任一特征字符串，以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角；

如果所述多个特征字符串的倾角都在预设角度范围、或都不在预设角度范围，则计算所述多个特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正。

9.根据权利要求8所述的方法，其特征在于，所述方法进一步包括：

在所述多个特征字符串中，如果部分特征字符串的倾角在预设角度范围，则统计倾角在预设角度范围的特征字符串的数量、与倾角不在预设角度范围的特征字符串的数量，将数量较小的相应特征字符串去除；

针对剩余的特征字符串，计算各特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正。

10.根据权利要求1-9任一所述的方法，其特征在于，所述方法进一步包括：

校正图像后，根据所述特征字符串在校正后的图像中的位置判断所述校正后的图像是否倒置：若是，将该图像旋转180°。

11.一种倾斜图像校正的装置，其特征在于，包括：

切分模块，用于切分图像中的字符；

字符串提取模块，用于从切分的字符中确定至少一个特征字符串；

校正模块，用于通过所述至少一个特征字符串校正图像。

12.根据权利要求11所述的装置，其特征在于，切分模块包括：

检测模块，用于检测图像中的字符；

字符框建立模块，用于根据检测的字符的端点建立容纳所述字符的字符框。

13.根据权利要求12所述的装置，其特征在于，字符串提取模块包括：

起始字符框确定模块，用于从图像的字符框中确定起始字符框；

特征字符框选取模块，用于选取处于所述起始字符框邻域内、且满足预设判别条件的待判别字符框，作为特征字符框；

特征字符串生成模块，用于将得到的特征字符框依次作为起始字符框，确定在所述起始字符框邻域内、且满足预设判别条件的待判别字符框为特征字符框，直到没有新的特征字符框生成；将得到的所有特征字符框组成特征字符串。

14.根据权利要求13所述的装置，其特征在于，校正模块包括：

倾角计算模块，用于针对任一特征字符串，以直线连接该特征字符串的端点字符框的中心点，计算该直线的倾角作为该特征字符串的倾角；

第一校正模块，用于当确定的特征字符串为多个时，如果判断多个特征字符串的倾角都在预设角度范围、或都不在预设角度范围，则计算所述多个特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正；

第二校正模块，用于当确定的特征字符串为多个时，如果判断多个特征字符串中的部分特征字符串的倾角在预设角度范围，则统计倾角在预设角度范围的特征字符串的数量、与倾角不在预设角度范围的特征字符串的数量，将数量较小的相应特征字符串去除；并针对剩余的特征字符串，计算各特征字符串的倾角的平均值，根据所述平均值旋转图像以实现校正；

15.根据权利要求11-14任一所述的装置，其特征在于，所述装置进一步包括：

倒置调整模块，用于根据所述特征字符串在校正后的图像中的位置判断所述校正后的图像是否倒置：若是，将该图像旋转180°。

16.一种电子设备，其特征在于，包括：

一个或多个处理器；

存储装置，用于存储一个或多个程序，

当所述一个或多个程序被所述一个或多个处理器执行，使得所述一个或多个处理器实现如权利要求1-10中任一所述的方法。

17.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述程序被处理器执行时实现如权利要求1-10中任一所述的方法。