CN107292307B

CN107292307B - 一种倒置汉字验证码自动识别方法及***

Info

Publication number: CN107292307B
Application number: CN201710599718.0A
Authority: CN
Inventors: 路松峰; 罗立志; 王同洋
Original assignee: Huazhong University of Science and Technology
Current assignee: Huazhong University of Science and Technology
Priority date: 2017-07-21
Filing date: 2017-07-21
Publication date: 2019-12-17
Anticipated expiration: 2037-07-21
Also published as: CN107292307A

Abstract

本发明公开了一种倒置汉字验证码自动识别方法及***，所述方法包括：对待识别验证码图像进行处理得到目标验证码图像，由目标验证码图像中每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像；生成与目标验证码图像对应的标签信息，标签信息采用二进制表示，0表示单字符图像中的字符正常，1表示单字符图像中的字符倒置；将标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型，由倒置汉字自动识别模型将神经元的output个数设置为与标签信息的长度一致；使用交叉熵之和作为已训练的倒置汉字自动识别模型的损失函数，对损失函数进行训练，直至损失函数收敛，输出识别结果。可实现对倒置汉字验证码的自动识别。

Description

一种倒置汉字验证码自动识别方法及***

技术领域

本发明属于自动识别技术领域，更具体地，涉及一种倒置汉字验证码自动识别方法及***。

背景技术

随着互联网的高速发展，网络在给人们的生活带来极大便利的同时，其安全问题也日益突出。网络验证码作为一项广泛使用的验证手段，对网络安全起到了重要的作用。

目前，对于字符型验证码的识别主要就是对于文字的识别，主要流程如下：准备原始图片素材；图片预处理，字符切割，图片尺寸归一化；图片字符标记；字符图片特征提取；生成特征和标记对应的训练数据集；训练特征标记数据生成识别模型；使用识别模型预测新的未知图片集。

然而，传统的验证码识别技术是对验证码中出现的字符进行识别，比如数字，字母等。而没有关于如何对倒置中文字符的识别。

发明内容

针对现有技术的以上缺陷或改进需求，本发明的目的在于提供了一种倒置汉字验证码自动识别方法及***，由此解决传统的验证码识别技术不能识别倒置中文字符的技术问题。

为实现上述目的，按照本发明的一个方面，提供了一种倒置汉字验证码自动识别方法，包括：

对待识别验证码图像进行处理得到目标验证码图像，获取所述目标验证码图像中每个字符的左右边界，根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像；

生成与所述目标验证码图像对应的标签信息，其中，所述标签信息采用二进制表示，0表示单字符图像中的字符正常，1表示单字符图像中的字符倒置；

将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型，由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致，其中，每个output均为一个二分类分类器；

使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数，对所述损失函数进行训练，直至所述损失函数收敛，输出识别结果，其中，所述交叉熵的个数与output个数相同。

优选地，所述已训练的倒置汉字自动识别模型的训练方法为：

对测试样本图像中的各样本图像分别进行处理，获取处理后的各样本图像中每个字符的左右边界，由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像；

分别生成与各样本图像对应的标签信息，其中，每张样本图像的标签信息采用二进制表示，0表示对应样本图像中的单字符图像中的字符正常，1表示对应样本图像中的单字符图像中的字符倒置；

依次将每张样本图像的标签信息的长度作为参数传递给训练模型，由所述训练模型根据输入的标签信息的长度设置神经元的output个数，其中，每个output均为一个二分类分类器；

使用交叉熵之和作为所述训练模型的损失函数，对所述训练模型进行训练，直至所述训练模型的输出正确率满足预设正确率要求，保存所述训练模型。

优选地，所述训练模型为2维卷积神经网络模型，所述2维卷积神经网络模型采用多层卷积层加上多层池化层，最后加上一个全连接层。

优选地，所述2维卷积神经网络模型的参数为，输入为验证码图像中的字符个数，卷积核数量为M，对每个输入提取M维特征，卷积核的大小为N*N，channel值为L，边界处理方式padding值为SAME，池化函数采用平均池化avg_pool，使用C*C池化，即将C*C的色块降为边界处理方式padding值为SAME。

优选地，M取值为32，N取值为5，L取值为1，C取值为2。

按照本发明的另一方面，提供了一种倒置汉字验证码自动识别***，包括：

字符分割模块，用于对待识别验证码图像进行处理得到目标验证码图像，获取所述目标验证码图像中每个字符的左右边界，根据所述每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像；

标签信息生成模块，用于生成与所述目标验证码图像对应的标签信息，其中，所述标签信息采用二进制表示，0表示单字符图像中的字符正常，1表示单字符图像中的字符倒置；

输入模块，用于将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型，由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致，其中，每个output均为一个二分类分类器；

识别模块，用于使用交叉熵之和作为所述已训练的倒置汉字自动识别模型的损失函数，对所述损失函数进行训练，直至所述损失函数收敛，输出识别结果，其中，所述交叉熵的个数与output个数相同。

优选地，所述字符分割模块，还用于对测试样本图像中的各样本图像分别进行处理，获取处理后的各样本图像中每个字符的左右边界，由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像；

所述标签信息生成模块，还用于分别生成与各样本图像对应的标签信息，其中，每张样本图像的标签信息采用二进制表示，0表示对应样本图像中的单字符图像中的字符正常，1表示对应样本图像中的单字符图像中的字符倒置；

所述输入模块，还用于依次将每张样本图像的标签信息的长度作为参数传递给训练模型，由所述训练模型根据输入的标签信息的长度设置神经元的output个数，其中，每个output均为一个二分类分类器；

模型训练模块，用于使用交叉熵之和作为所述训练模型的损失函数，对所述训练模型进行训练，直至所述训练模型的输出正确率满足预设正确率要求，保存所述训练模型。

优选地，M取值为32，N取值为5，L取值为1，C取值为2。

总体而言，通过本发明所构思的以上技术方案与现有技术相比，能够取得下列有益效果：通过对验证码图像进行分割得到各单字符图像，然后用二进制序列区分倒置与正常的字符，可以准确的区分倒置与正常字符；通过将生成的含有验证码图像中字符特性的标签信息的长度作为已训练的倒置汉字自动识别模型的输入，可以实现对倒置汉字验证码的自动识别；通过分割后的测试样本图像对构建的训练模型进行训练得到倒置汉字自动识别模型，可以自动识别出汉字验证码中的倒字，减少人工的操作，实现自动化过程。

附图说明

图1是本发明实施例公开的一种倒置汉字验证码自动识别方法的流程示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。此外，下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。

如图1所示为本发明实施例公开的一种倒置汉字验证码自动识别方法的流程示意图，在图1所示的方法中，包括以下步骤：

S1、对待识别验证码图像进行处理得到目标验证码图像，获取目标验证码图像中每个字符的左右边界，根据每个字符的左右边界对所述目标验证码图像进行分割得到各单字符图像；

作为一种可选的实施方式，在步骤S1中，对待识别验证码图像进行处理可以采用以下方式：

将待识别验证码图像进行预处理，主要包括对图像进行灰度化、二值化、抑噪等技术。

1、图像的灰度化

RGB***中一个颜色值由3个分量组成，这样的图像称为彩色图像，RGB***称为颜色空间模型。常见的颜色空间模型还有HSI、CMYK等。如果一幅图像的颜色空间是一维的(一个颜色值只有一个颜色分量)，则这幅图像就是一副灰度图。在位图图像中，一般以R＝G＝B来显示灰度图像。

常用的灰度化方法有以下三种：

g(x,y)＝0.11×R(x,y)+0.59×G(x,y)+0.3×B(x,y) (2.2)

g(x,y)＝min(R(x,y),G(x,y),B(x,y)) (2.3)

其中，公式(2.1)的方法来源于I色彩空间中I分量的计算公式，公式(2.2)来源于NTSC色彩空间中Y分量的计算公式。公式(2.3)是基于采用保留最小亮度(黑色)的方法。

RGB彩色图像可以看成是由3副单色的灰度图像构成的，可以直接取RGB通道中的任一个通道得到灰度化图像，如g(x,y)＝B(x,y)，前提是图像中目标像素的亮度信息主要分布在B通道上，否则灰度化结果将是亮度信息的大量丢失。灰度图像又叫亮度图像，由归一化的取值表示亮度，最大取值表示白色，最小取值表示黑色。

以P(x,y)表示图像中一个点，x、y分别是图像的横坐标和纵坐标，R(x,y)表示R通道的颜色分量，G(x,y)表示G通道的颜色分量，B(x,y)表示B通道的颜色分量。点P(x,y)的亮度值用L(x,y)表示。彩色图像的亮度没有严格的定义和计算公式，一般用公式(2.1)来计算，我们记作L1(x,y)。同样的用公式(2.2)计算的亮度值记作L2(x,y)，用公式(2.3)计算的亮度值记作L3(x,y)。可以证明：

L3(x,y)≤L1(x,y) (2.4)

L3(x,y)≤L2(x,y) (2.5)

公式(2.1)取RGB通道的平均值，得到的图像相对比较柔和，同时也缩小了目标和背景的平均亮度差，不利于后续的阀值处理。公式(2.2)考虑了人眼对绿色的适应度最强，蓝色次之，红色最差。在处理绿色调和蓝色调的验证码图像时，公式(2.2)的效果令人满意，但在处理红色调的图像时，因为公式中红色的权值很小，灰度化后目标像素和背景像素的亮度差值被严重缩小，效果还不如公式(2.1)。公式(2.3)基于一个前提，那就是有限保留目标像素的亮度信息，利于后续的阀值分割。

2、图像的二值化

一般24位RGB图像的灰度图是8位256个灰度级的，如果把这个灰度级减少到1位2个灰度级，就得到一副二值图，二值图像中的数据全部是0或1。

作为一种可选的实施方式，在对待识别验证码图像进行处理得到目标验证码图像，还需要对目标验证码图像进行分割，其中，字符分割包括从验证码图像中分割出字符区域和把字符区域划分成单个字符两个部分。如果采用统计特征匹配以及神经网络法识别，必须要先分割出单个的字符。简单的分割方法包括等距分割、积分投影分割、交叉点分割、求连通区等。经过字符切割成为一组待检测的字符系列图片。根据图片中字符个数输出相同个数的0,1序列(其中0代表是汉字是正常，1代表汉字是倒置)。分割图片处理步骤，先扫描出每个字符的左右边界，即找出每个字符最左最右的点，根据边界进行裁剪。

S2、生成与目标验证码图像对应的标签信息，其中，标签信息采用二进制表示，0表示单字符图像中的字符正常，1表示单字符图像中的字符倒置；

S3、将标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型，由已训练的倒置汉字自动识别模型将神经元的output个数设置为与标签信息的长度一致，其中，每个output均为一个二分类分类器；

S4、使用交叉熵之和作为已训练的倒置汉字自动识别模型的损失函数，对损失函数进行训练，直至损失函数收敛，输出识别结果，其中，交叉熵的个数与output个数相同。

其中，识别结果类似于010100(二进制个数等于字符个数，其中1表示该汉字倒置)。

其中，已训练的倒置汉字自动识别模型的训练方法为：

依次将每张样本图像的标签信息的长度作为参数传递给训练模型，由训练模型根据输入的标签信息的长度设置神经元的output个数，其中，每个output均为一个二分类分类器；

其中，采用此方式进行参数化以后可以适应不同数量字符的情况，达到更好的通用性。

使用交叉熵之和作为训练模型的损失函数，对训练模型进行训练，直至训练模型的输出正确率满足预设正确率要求，保存训练模型。

优选地，可以采用基于TensorFlow和TF-Slim工具包，对训练模型进行训练，优化器可以选择Adam，最后计算正确率，保存模型，预设正确率要求可以根据需要进行确定。

其中，训练模型为2维卷积神经网络模型，2维卷积神经网络模型采用多层卷积层加上多层池化层，最后加上一个全连接层，输出都是0,1序列(0，1的总个数和验证码图像中单个字符个数相同)，优选地，可以使用TensorFlow提供的2维卷积神经网络模型。

其中，2维卷积神经网络模型的参数为，输入为验证码图像中的字符个数，卷积核数量为M，对每个输入提取M维特征，卷积核的大小为N*N，channel值为L，边界处理方式padding值为SAME，池化函数采用平均池化avg_pool，使用C*C池化，即将C*C的色块降为边界处理方式padding值为SAME。优选地，M取值为32，N取值为5，L取值为1，C取值为2。

本领域的技术人员容易理解，以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种倒置汉字验证码自动识别方法，其特征在于，包括：

将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型，由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致，其中，每个output均为一个二分类分类器；所述倒置汉字自动识别模型为2维卷积神经网络模型，所述2维卷积神经网络模型采用多层卷积层加上多层池化层，最后加上一个全连接层；

2.根据权利要求1所述的方法，其特征在于，所述已训练的倒置汉字自动识别模型的训练方法为：

3.根据权利要求2所述的方法，其特征在于，所述2维卷积神经网络模型的参数为，输入为验证码图像中的字符个数，卷积核数量为M，对每个输入提取M维特征，卷积核的大小为N*N，channel值为L，边界处理方式padding值为SAME，池化函数采用平均池化avg_pool，使用C*C池化，将C*C的色块降为边界处理方式padding值为SAME。

4.根据权利要求3所述的方法，其特征在于，M取值为32，N取值为5，L取值为1，C取值为2。

5.一种倒置汉字验证码自动识别***，其特征在于，包括：

输入模块，用于将所述标签信息的长度作为参数传递给已训练的倒置汉字自动识别模型，由所述已训练的倒置汉字自动识别模型将神经元的output个数设置为与所述标签信息的长度一致，其中，每个output均为一个二分类分类器；所述倒置汉字自动识别模型为2维卷积神经网络模型，所述2维卷积神经网络模型采用多层卷积层加上多层池化层，最后加上一个全连接层；

6.根据权利要求5所述的***，其特征在于，所述字符分割模块，还用于对测试样本图像中的各样本图像分别进行处理，获取处理后的各样本图像中每个字符的左右边界，由各样本图像中每个字符的左右边界对各样本图像进行分割得到各样本图像对应的单字符图像；

7.根据权利要求6所述的***，其特征在于，所述2维卷积神经网络模型的参数为，输入为验证码图像中的字符个数，卷积核数量为M，对每个输入提取M维特征，卷积核的大小为N*N，channel值为L，边界处理方式padding值为SAME，池化函数采用平均池化avg_pool，使用C*C池化，即将C*C的色块降为边界处理方式padding值为SAME。

8.根据权利要求7所述的***，其特征在于，M取值为32，N取值为5，L取值为1，C取值为2。