CN109977980A - 一种验证码识别方法及装置 - Google Patents

一种验证码识别方法及装置 Download PDF

Info

Publication number
CN109977980A
CN109977980A CN201711466525.4A CN201711466525A CN109977980A CN 109977980 A CN109977980 A CN 109977980A CN 201711466525 A CN201711466525 A CN 201711466525A CN 109977980 A CN109977980 A CN 109977980A
Authority
CN
China
Prior art keywords
convolutional neural
neural networks
identifying code
training
networks model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711466525.4A
Other languages
English (en)
Inventor
苏斌
王永宝
范宜强
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Aisino Corp
Original Assignee
Aisino Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Aisino Corp filed Critical Aisino Corp
Priority to CN201711466525.4A priority Critical patent/CN109977980A/zh
Publication of CN109977980A publication Critical patent/CN109977980A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)

Abstract

本发明实施例提供一种验证码识别方法及装置,用于解决终端设备在识别破解验证码时存在识别效率较低的技术问题。该方法包括:将具有标记的样本图像输入卷积神经网络模型,对卷积神经网络模型进行训练,其中,所述卷积神经网络模型中包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层,且训练后的卷积神经网络模型中卷积的权重数量小于等于标准卷积神经网络模型中卷积的权重数量,提取的图像的特征信息的特征值处于预设范围内;将待识别的验证码图像输入训练后的卷积神经网络模型,获得待识别的验证码图像的识别结果,识别结果用于指示验证码图像中包括的至少一个验证码字符。

Description

一种验证码识别方法及装置
技术领域
本发明涉及计算机技术领域,特别涉及一种验证码识别方法及装置。
背景技术
验证码(CAPTCHA)是“Completely Automated Public Turing test to tellComputers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序,目前带有大小写字母和数字的验证码广泛用于各大网站,用来防止机器自动批量注册和反复登录与灌水,字母和数字本身扭曲并带有很多噪声和横线。
验证码概念随着互联网技术的快速发展和应用,网络在给人们提供丰富资源和极大便利的同时,伴随而来的就是互联网***的安全性问题。验证码的出现,正是加强web***安全的产物。
现有技术中针对验证码识别破解的方式包括:
第一种:基于图像处理方式,通过预处理(二值化,CFS,连通域),检测(找出文字所在的主要区域),前处理(对图片内容做一些旋转,扭曲,分割等),最后再通过模式识别或机器学习算法来训练,输出成分类器的置信度来判断可能属于哪个字母或数字。
当该方式的技术难点主要在于验证码图片的分割方面,对于识别的匹配,OCR技术已经很成熟了,完全可用于验证码图片的识别,但是复杂的验证码图片大多粘连,分割处理比较麻烦。
第二种:基于深度学习的方式,即通过经典的图片识别网络模型来识别分类验证码图片中的内容。但由于经典的图片识别网络结构过大,需要计算资源较多,且需要大量的标注样本,收敛速度很慢,难以在有限时间内应用。
由此可见,现有技术中终端设备在识别破解验证码时存在识别效率较低的技术问题。
发明内容
本发明实施例提供一种验证码识别方法及装置,用于解决现有技术中的终端设备在识别破解验证码时存在识别效率较低的技术问题。
第一方面,本发明实施例提供一种验证码识别方法,包括以下步骤:
将具有标记的样本图像输入卷积神经网络模型,对所述卷积神经网络模型进行训练;所述卷积神经网络模型中包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层,且训练后的卷积神经网络模型中卷积的权重数量小于等于标准卷积神经网络模型中卷积的权重数量,提取的图像的特征信息的特征值处于预设范围内;
将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,所述识别结果用于指示所述验证码图像中包括的至少一个验证码字符。
可选的,将具有标记的样本图像输入卷积神经网络模型,对所述卷积神经网络模型进行训练,包括:
按照训练规定样本数量将具有标记的样本图像分批输入卷积神经网络模型进行训练;
确定训练次数达到预设次数,计算每批次样本图像的平均损失率和正确率,所述正确率用于表征预测值与标注值相匹配的概率,所述损失率用于表征样本识别失败的数量;
确定所述正确率高于设定值,记录所述卷积神经网络模型当前的训练参数。
可选的,在确定所述正确率高于设定值,记录所述卷积神经网络模型当前的训练参数之后,将待识别的验证码图像输入训练后的所述卷积神经网络模型之前,所述方法还包括:
将测试样本集输入训练后的所述卷积神经网络模型,确定每个测试样本的测试结果;
将每个测试结果与相应的测试样本的标注进行匹配,确定所述匹配度大于等于预设匹配度。
可选的,所述将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,包括:
将所述待识别的验证码图像输入训练后的所述卷积神经网络模型,提取所述待识别的验证码图像的至少两个特征信息;
对所述至少两个特征信息的特征值进行规范化处理,使得所述规范化处理后的至少两个特征信息的特征值处于预设范围内;
根据处理后的至少两个特征信息确定所述待识别的验证码图像的识别结果。
可选的,根据处理后的至少两个特征信息确定所述待识别的验证码图像的识别结果,包括:
根据需要提取的验证码图像中的字符数量对处理后的至少两个特征信息进行多任务分类,获取所述验证码图像的识别结果。
第二方面,本发明实施例提供一种验证码识别装置,包括:
字符集数据模块,用于设置输入的验证码图像的字符数量,并对将输入的验证码图片进行预处理,所述预处理包括尺寸调整和灰度转换,且预处理后的验证码图片具有预设的像素尺寸;
训练模块,用于按照训练规定样本数量将具有标注的样本图像分批输入卷积神经网络模型,对所述卷积神经网络模型进行训练;其中,训练后的所述卷积神经网络模型能够识别具有特定特征的验证码,所述卷积神经网络模型包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层;
识别模块,用于将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,所述识别结果用于指示所述验证码图像中包括的至少一个验证码字符。
可选的,所述字符集数据模块还用于:
根据样本图像中的字符数量设置所述卷积神经网络模型需要识别的字符数量,并对将待识别的验证码图片进行预处理,所述预处理包括尺寸调整和灰度转换,且预处理后的验证码图片具有预设的像素尺寸。
可选的,所述验证码识别装置还包括:
测试模块,与所述训练模块相连,用于在确定所述训练模块针对所述卷积神经网络模型的训练次数达到预设次数时,通过具有标识的样本图像对所述卷积神经网络模型进行测试,且在确定测试结果的正确率高于设定值时,记录所述卷积神经网络模型当前的训练参数和模型;其中,所述正确率用于表征样本图像的预测值与标注的值相匹配的概率。
可选的,所述识别模块包括:
特征提取模块,用于将所述待识别的验证码图像输入训练后的所述卷积神经网络模型,提取所述待识别的验证码图像的至少两个特征信息;
规范化层,用于对所述至少两个特征信息的特征值进行规范化处理,使得所述规范化处理后的至少两个特征信息的特征值处于预设范围内;
确定模块,用于根据处理后的至少两个特征信息确定所述待识别的验证码图像的识别结果。
可选的,所述确定模块用于:
根据需要提取的验证码图像中的字符数量对处理后的至少两个特征信息进行多任务分类,获取所述验证码图像的识别结果。
第三方面,本发明实施例提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如第一方面所述方法。
第四方面,本发明实施例提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,当所述指令在计算机上运行时,使得计算机执行如第一方面所述的方法。
本发明实施例中,通过将具有标记的样本图像输入卷积神经网络模型,对卷积神经网络模型进行训练,使得训练后的卷积神经网络模型能够识别具有特定特征的验证码,由于该卷积神经网络模型包括规范化层,且卷积神经网络模型中卷积的权重数量小于等于标准的常规模型中卷积的权重数量,且通过规范化层对卷积后的特征信息进行了规范化,使得模型提取的特征信息的特征值处于预设范围内,有效减少卷积层的数量和权重的数量,从而大大加快模型训练的收敛时间,提高识别准确率。
附图说明
图1为本发明实施例中提供的卷积神经网络模型的架构图;
图2为本发明实施例中验证码识别方法的流程图;
图3为本发明实施例中验证码识别装置的结构图;
图4为本发明实施例中计算机装置的结构图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
本文中描述的技术方案可用于具有验证码识别功能的验证码识别装置,该验证码识别装置可以设置在终端或服务器等其它电子设备中。
首先,结合附图介绍本发明实施例中所采用的卷积神经网络模型。
图1为本发明实施例中卷积神经网络模型的架构示意图。该卷积神经网络模型相较于现有的卷积神经网络模型来说,在卷积层之间增加了规范化层,该规范化层用于对卷积后的特征信息的特征值进行规范化处理。同时,本发明实施例中的卷积神经网络模型还在网络输出层增加了多任务分类器,图1中一并示出,即多任务分类器层。
具体来说,本发明实施例中的卷积神经网络模型通过加入规范化层可以减小参数量和卷积层的数量,从而减少卷积核的尺寸和网络深度,加快网络模型的训练收敛速度。同时,在网络模型的输出层,根据想要提取的图片中的字符数量来进行多任务分类器层,增加了验证码识别的通用性。
本发明实施例中,在使用上述卷积神经网络模型进行验证码图像识别前,需要通过一定数量的样本图像对其进行训练。
在进行训练准备时,首先可将需要识别的验证码图像中的字符数量进行定义。例如可以通过自定义的转向量方式,对相同数量的字符进行向量编码的转换,以便训练时更好的进行特征提取,使得字符之间的相似度提高,它由2个双向模块构成,即字符转成向量,再由向量转成字符。
其中,转向量处理即指将每个字符转换成数值向量方式,比如one-hot编码(独热编程)或其它编码方式,以便于体现字符之间的相似度。例如,如果字母A与字母B之间的相对距离要比字母A与字母C之间的相对距离大,则从编码后的向量值可以体现出来。
进而,需要对输入的验证码图像大小进行调整和灰度转换,将输入模型的验证码图像调整到规定的像素尺寸。由于卷积神经网络模型在进行字符识别时,一般不考虑图片的色彩信息,因此,还可将多通道的RGB色彩图像转成灰度图。
然后,将具有标识的样本图像进行划分,具体可以划分为训练样本集、验证样本集以及测试样本集共3个部分,并规定好训练样本集,验证样本集的批量测试集的大小。其中,训练样本集用于模型的监督学习训练,通过反向传播,调整参数来学习;验证样本集可以用于模型在学习过程中,进行阶段性检测,用于微调模型的超参数,使模型性能达到最优;测试样本集可以用于模型达到一定准确率后,检验其基于更一般数据的准确率。
训练样本集、验证样本集以及测试样本集的分配比例可以是8:1:1。也就是说3种样本集均是具有标识的样本图样,在划分时,可随机打乱所有样本图像,划分结果可以是:训练样本集占80%,验证样本集和测试样本集各占10%。
然后,设备可以读取各个样本集并输入模型,以便模型识别出其中标注错误的样本图像,并做相应处理,例如丢弃处理。
此外,还需要对卷积神经网络模型的架构进行相应的设置,设定权重和偏移参数的初始值。设置的卷积神经网络模型对验证码图像的处理过程可以如下:
1)使用较大尺寸的卷积核,针对验证码图片中较大范围的特征进行提取;
2)选取合适尺寸的最大化池化层进行特征精简;
3)使用较小尺寸的卷集核,扩大卷积核的数量;
4)进行最大化池化来进行特征细节特征提取与精简,以提取出更多的小特征信息,并降低单通道图片神经元的个数,从而减少所需训练的权重和偏移;
5)批规范化处理,以将神经元权重和偏移规范化在一定分布范围内,有效减少反向传播时,可能存在的梯度弥散。
6)连续进行2层的卷积,同时继续扩大卷积核的数量,进一步降低单通道图片神经元的个数,并提取更细节的特征;
7)紧接着一个完全展开方式的全连接层,在此之后接入按一定概率丢弃神经元的防过拟合单元;
8)接入一定数量的字符分类器,此分类器可根据字符数量的变化进行调整输出,即可定义多个任务的分类。
由于加入了规范化,初始的学***均的损失率和正确率。在进行一定次数的训练步骤后,例如100次,会进行一次验证步骤,验证步骤时,并计算损失率和正确率,当正确率高于设定值时,保持整个模型的训练参数和模型,并退出。测试模块,获取之前训练好的模型参数和架构,使用准备好的测试样本集进行预测,并将测试结果与标注的结果进行比对,得出样本批次验证的最终的测试正确率。在实际测试过程中,模型每次仅对单个样本图像进行操作。
在实际应用中,如图1所示的卷积神经网络模型的架构中,从左往右看,该卷积神经网络模型通过卷积层和池化层交替对输入的图像的特征信息进行提取后,进而通过批规范化模块对特征信息的特征值进行批规范化处理,使得特征信息的特征值处于预设范围内,该预设范围可以是[0.5,1]。通过规范化处理可将神经元权重和偏移规范化在一定分布范围内,从而有效减少反向传播时,可能存在的梯度弥散。例如池化后的特征信息的特征值的范围可能为[0.5,3.5],进行规范化处理后,特征值所处的范围可以是[0.5,1]。
如图2所示,本发明实施例还提供一种验证码识别方法,应用于验证码识别装置,该验证码识别装置中包含有卷积神经网络模型,该卷积神经网络模型具有如图1所示的结构。该方法可以描述如下:
S11:将具有标记的样本图像输入卷积神经网络模型,对卷积神经网络模型进行训练;其中,卷积神经网络模型中包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层,且训练后的卷积神经网络模型中卷积的权重数量小于等于标准卷积神经网络模型中卷积的权重数量,提取的图像的特征信息的特征值处于预设范围内。
具体来说,标准卷积神经网络模型可以是指现有的常规的卷积神经网络模型,即没有设置规范化层和多任务分类器层的网络模型。样本图像可以是预先准备的标注的验证码图像,样本图像的标注可以指示样本图像中的验证码相关的信息,例如具体的验证码字符和/或字符数量等。卷积神经网络模型中的规范化层可以用于对卷积后的特征图数据进行规范化处理,此外,卷积神经网络模型在输出层还可以包括分类器,本文将其简称为“多任务分类器层”,在分类器层可根据字符数量的变化调整输出。
本发明实施例中,验证码识别装置可基于样本图像对卷积神经网络模型进行训练时,其过程可以如下:
首先,验证码识别装置对样本图像进行预处理,该预处理包括尺寸调整和灰度转换等,预处理后的验证码图片具有预设的像素尺寸。
进而,验证码识别装置按照训练规定的样本数量将具有标记的样本图像分批输入卷积神经网络模型进行训练,例如每批次包括80个样本图像。其训练过程请参见前述对卷积神经网络模型的架构的介绍内容,此处不再赘述。
进而,如果确定训练次数达到预设次数,则验证码识别装置计算每批次样本图像的平均损失率和正确率,该正确率可以用于表征预测值与标注值相匹配的概率,该损失率用于表征样本识别失败的数量。
如果确定正确率高于设定值,则验证码识别装置可记录卷积神经网络模型当前的训练参数和模型,此时可退出训练。
在实际应用中,在对卷积神经网络模型进行训练后,在投入使用前还可以对其进行测试。此时,可将测试样本集输入训练后的卷积神经网络模型,确定每个测试样本的测试结果,进而将每个测试结果与相应的测试样本的标注进行匹配。
如果确定匹配度大于等于预设匹配度,例如80%,则表明训练后的卷积神经网络模型具有较高的准确性,可用于后续的验证码图像识别。当然,如果匹配度低于预设匹配度,则可继续通过样本图像对模型进行训练,以获得较为优选的训练参数。
由于本发明实施例中的卷积神经网络模型包括规范化和多任务分类,卷积神经网络模型通过加入规范化可减小参数量和卷积层的数量,从而减少卷积核的尺寸和网络深度,加快网络模型的训练收敛速度。同时,在网络模型的输出层,可以根据想要提取的图片中的字符数量来进行多任务分类,增加了验证码识别的通用性,故降低了训练卷积神经网络模型时所需要的样本的数量,例如在本发明实施例中的卷积神经网络模型结构下,仅需10000个标注的样本图样即可实现80%以上的识别准确率,对验证码图像识别的准确率较高。
S12:将待识别的验证码图像输入训练后的卷积神经网络模型,获得待识别的验证码图像的识别结果,识别结果用于指示验证码图像中包括的至少一个验证码字符。
在确定训练参数和模型后,验证码识别装置便可通过训练后的卷积神经网络模型对验证码图像进行识别。在将待识别的验证码图像输入训练后的所述卷积神经网络模型时,验证码识别装置可先对待识别的验证码图像进行预处理,以将输入模型的验证码图片调整到规定的像素尺寸,同时还可将待识别的验证码图像转换为灰度图。
进而通过卷积层和池化层提取待识别的验证码图像的特征信息。例如,结合图1中的卷积神经网络模型,首先可使用较大尺寸的卷积核,针对验证码图片中较大范围的特征进行提取,之后选取合适尺寸的最大化池化层进一步进行特征精简。紧接着减小卷集核的尺寸,扩大卷集核的数量,进一步进行最大化池化来进行特征细节特征提取与精简,以提取出更多的细小特征信息,并降低单通道图片神经元的个数,从而减少所需训练的权重和偏移,同时提高特征信息的精准度。
然后,验证码识别装置对至少两个特征信息的特征值进行规范化处理,使得规范化处理后的至少两个特征信息的特征值处于预设范围内,例如规范化后的特征信息的特征值处于[0.5,1]的范围内。通过规范化,可将神经元权重和偏移规范化在一定分布范围内,有效减少反向传播时可能存在的梯度弥散。
进一步,验证码识别装置可以通过连续进行2层的卷积层,同时继续扩大卷积核的数量,进一步降低单通道图片神经元的个数,并提取更细节的特征。紧接着,通过一个完全展开方式的全连接层,在全连接层之后还可接入按一定概率丢弃神经元的防过拟合单元。最后接入一定数量的字符分类器,此分类器可根据字符数量的变化进行调整输出,即可定义多个任务的分类,从而获得待识别的验证码图像的识别结果,例如识别出的验证码,例如4个字母字符等。
本发明实施例中,通过将具有标记的样本图像输入卷积神经网络模型,对卷积神经网络模型进行训练,使得训练后的卷积神经网络模型能够识别具有特定特征的验证码,由于该卷积神经网络模型包括规范化层和分类器层,且卷积神经网络模型中卷积的权重数量小于等于常规的不包含规范化层的卷积神经网络模型的权重数量,提取的特征值处于预设范围内,使得模型可以识别更多字符的验证码,同时由于规范化层对卷积后的特征图数据进行了规范化,有效减少卷积层的数量和权重的数量,从而大大加快模型训练的收敛时间,提高识别准确率。
如图3所述,本发明实施例还提供一种验证码识别装置,该装置可以用于实现图2所示的方法,该装置可以包括:字符集数据模块21、训练模块22和识别模块23。
字符集数据模块21可以用于设置输入的验证码图像中的字符数量,并对将输入的验证码图片进行预处理,所述预处理包括尺寸调整和灰度转换,且预处理后的验证码图片具有预设的像素尺寸。
训练模块22可以用于按照训练规定样本数量将具有标注的样本图像分批输入卷积神经网络模型,对所述卷积神经网络模型进行训练;其中,训练后的所述卷积神经网络模型能够识别具有特定特征的验证码,所述卷积神经网络模型包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层。
识别模块23可以用于将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,所述识别结果用于指示所述验证码图像中包括的至少一个验证码字符。
可选的,所述字符集数据模块21还用于:根据样本图像中的字符数量设置所述卷积神经网络模型需要识别的字符数量,并对将待识别的验证码图片进行预处理,所述预处理包括尺寸调整和灰度转换,且预处理后的验证码图片具有预设的像素尺寸。
可选的,所述验证码识别装置还包括:与所述训练模块相连的测试模块,用于在确定所述训练模块针对所述卷积神经网络模型的训练次数达到预设次数时,通过具有标识的样本图像对所述卷积神经网络模型进行测试,且在确定测试结果的正确率高于设定值时,记录所述卷积神经网络模型当前的训练参数和模型;其中,所述正确率用于表征样本图像的预测值与标注的值相匹配的概率。
可选的,所述识别模块23包括:
特征提取模块,用于将所述待识别的验证码图像输入训练后的所述卷积神经网络模型,提取所述待识别的验证码图像的至少两个特征信息;
规范化模块,用于对所述至少两个特征信息的特征值进行规范化处理,使得所述规范化处理后的至少两个特征信息的特征值处于预设范围内;
确定模块,用于根据处理后的至少两个特征信息确定所述待识别的验证码图像的识别结果。
可选的,所述确定模块用于:
根据需要提取的验证码图像中的字符数量对处理后的至少两个特征信息进行多任务分类,获取所述验证码图像的识别结果。
如图4所示,本发明实施例中还提供一种计算机装置该计算机装置包括处理器31和存储器32,其中,处理器31用于执行存储器32中存储的计算机程序时实现本发明实施例一中提供的处理数字证书更新请求的方法的步骤。
可选的,处理器31具体可以是中央处理器、特定应用集成电路(ApplicationSpecific Integrated Circuit,ASIC),可以是一个或多个用于控制程序执行的集成电路,可以是使用现场可编程门阵列(Field Programmable Gate Array,FPGA)开发的硬件电路,可以是基带处理器。
可选的,处理器31可以包括至少一个处理核。
可选的,电子设备还包括存储器32,存储器32可以包括只读存储器(Read OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)和磁盘存储器。存储器32用于存储处理器31运行时所需的数据。存储器32的数量为一个或多个。
在本发明另一实施例中,还提供一种计算机可读存储介质,该计算机可读存储介质存储有计算机指令,当计算机指令在计算机上运行时可以实现如本发明实施一例提供的处理数字证书更新请求的方法的步骤。
在本发明实施例中,应该理解到,所揭露处理数字证书更新请求的方法及服务器,可以通过其它的方式实现。例如,以上所描述的设备实施例仅仅是示意性的,例如,单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,设备或单元的间接耦合或通信连接,可以是电性或其它的形式。
在本发明实施例中的各功能单元可以集成在一个处理单元中,或者各个单元也可以均是独立的物理模块。
集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实施例的技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备,例如可以是个人计算机,服务器,或者网络设备等,或处理器(Processor)执行本发明各个实施例的方法的全部或部分步骤。而前述的存储介质包括:通用串行总线闪存盘(Universal Serial Bus flash drive,USB)、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上实施例仅用于对本发明的技术方案进行了详细介绍,但以上实施例的说明只是用于帮助理解本发明实施例的方法,不应理解为对本发明实施例的限制。本技术领域的技术人员可轻易想到的变化或替换,都应涵盖在本发明实施例的保护范围之内。

Claims (12)

1.一种验证码识别方法,应用于验证码识别装置,其特征在于,包括:
将具有标记的样本图像输入卷积神经网络模型,对所述卷积神经网络模型进行训练;其中,所述卷积神经网络模型中包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层,且训练后的卷积神经网络模型中卷积的权重数量小于等于标准卷积神经网络模型中卷积的权重数量,提取的图像的特征信息的特征值处于预设范围内;
将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,所述识别结果用于指示所述验证码图像中包括的至少一个验证码字符。
2.如权利要求1所述的方法,其特征在于,将具有标记的样本图像输入卷积神经网络模型,对所述卷积神经网络模型进行训练,包括:
按照训练规定样本数量将具有标记的样本图像分批输入卷积神经网络模型进行训练;
确定训练次数达到预设次数,计算每批次样本图像的平均损失率和正确率,所述正确率用于表征预测值与标注值相匹配的概率,所述损失率用于表征样本识别失败的数量;
确定所述正确率高于设定值,记录所述卷积神经网络模型当前的训练参数。
3.如权利要求2所述的方法,其特征在于,在确定所述正确率高于设定值,记录所述卷积神经网络模型当前的训练参数之后,将待识别的验证码图像输入训练后的所述卷积神经网络模型之前,所述方法还包括:
将测试样本集输入训练后的所述卷积神经网络模型,确定每个测试样本的测试结果;
将每个测试结果与相应的测试样本的标注进行匹配,确定所述匹配度大于等于预设匹配度。
4.如权利要求1所述的方法,其特征在于,所述将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,包括:
将所述待识别的验证码图像输入训练后的所述卷积神经网络模型,提取所述待识别的验证码图像的至少两个特征信息;
对所述至少两个特征信息的特征值进行规范化处理,使得所述规范化处理后的至少两个特征信息的特征值处于预设范围内;
根据处理后的至少两个特征信息确定所述待识别的验证码图像的识别结果。
5.如权利要求4所述的方法,其特征在于,根据处理后的至少两个特征信息确定所述待识别的验证码图像的识别结果,包括:
根据需要提取的验证码图像中的字符数量对处理后的至少两个特征信息进行多任务分类,获取所述验证码图像的识别结果。
6.一种验证码识别装置,其特征在于,包括:
字符集数据模块,用于设置输入的验证码图像的字符数量,并对将输入的验证码图片进行预处理,所述预处理包括尺寸调整和灰度转换,且预处理后的验证码图片具有预设的像素尺寸;
训练模块,用于按照训练规定样本数量将具有标注的样本图像分批输入卷积神经网络模型,对所述卷积神经网络模型进行训练;其中,训练后的所述卷积神经网络模型能够识别具有特定特征的验证码,所述卷积神经网络模型包含用于对卷积后的特征信息的特征值进行规范化处理的规范化层;
识别模块,用于将待识别的验证码图像输入训练后的所述卷积神经网络模型,获得所述待识别的验证码图像的识别结果,所述识别结果用于指示所述验证码图像中包括的至少一个验证码字符。
7.如权利要求6所述的装置,其特征在于,所述字符集数据模块还用于:
根据样本图像中的字符数量设置所述卷积神经网络模型需要识别的字符数量,并对将待识别的验证码图片进行预处理,所述预处理包括尺寸调整和灰度转换,且预处理后的验证码图片具有预设的像素尺寸。
8.如权利要求7所述的装置,其特征在于,所述验证码识别装置还包括:
测试模块,与所述训练模块相连,用于在确定所述训练模块针对所述卷积神经网络模型的训练次数达到预设次数时,通过具有标识的样本图像对所述卷积神经网络模型进行测试,且在确定测试结果的正确率高于设定值时,记录所述卷积神经网络模型当前的训练参数和模型;其中,所述正确率用于表征样本图像的预测值与标注的值相匹配的概率。
9.如权利要求8所述的装置,其特征在于,所述识别模块包括:
特征提取模块,用于将所述待识别的验证码图像输入训练后的所述卷积神经网络模型,提取所述待识别的验证码图像的至少两个特征信息;
规范化层,用于对所述至少两个特征信息的特征值进行规范化处理,使得所述规范化处理后的至少两个特征信息的特征值处于预设范围内;
确定模块,用于根据处理后的至少两个特征信息确定所述待识别的验证码图像的识别结果。
10.如权利要求9所述的装置,其特征在于,所述确定模块用于:
根据需要提取的验证码图像中的字符数量对处理后的至少两个特征信息进行多任务分类,获取所述验证码图像的识别结果。
11.一种计算机装置,其特征在于,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1-5中任一权项所述方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1-5中任一权项所述的方法。
CN201711466525.4A 2017-12-28 2017-12-28 一种验证码识别方法及装置 Pending CN109977980A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711466525.4A CN109977980A (zh) 2017-12-28 2017-12-28 一种验证码识别方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711466525.4A CN109977980A (zh) 2017-12-28 2017-12-28 一种验证码识别方法及装置

Publications (1)

Publication Number Publication Date
CN109977980A true CN109977980A (zh) 2019-07-05

Family

ID=67075297

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711466525.4A Pending CN109977980A (zh) 2017-12-28 2017-12-28 一种验证码识别方法及装置

Country Status (1)

Country Link
CN (1) CN109977980A (zh)

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555462A (zh) * 2019-08-02 2019-12-10 深圳索信达数据技术有限公司 基于卷积神经网络的无固定多字符验证码识别方法
CN110956177A (zh) * 2019-11-22 2020-04-03 成都市映潮科技股份有限公司 一种混合型验证码的识别方法及***
CN111027568A (zh) * 2019-10-30 2020-04-17 中国科学院自动化研究所南京人工智能芯片创新研究院 一种迭代的神经网络批量规范化***
CN111143213A (zh) * 2019-12-24 2020-05-12 北京数衍科技有限公司 软件自动化测试方法和装置及电子设备
CN111259366A (zh) * 2020-01-22 2020-06-09 支付宝(杭州)信息技术有限公司 一种基于自监督学习的验证码识别器的训练方法和装置
CN111275039A (zh) * 2020-01-17 2020-06-12 深圳信息职业技术学院 水尺字符定位方法、装置、计算设备及存储介质
CN111368824A (zh) * 2020-02-24 2020-07-03 河海大学常州校区 一种仪表识别方法、移动设备及存储介质
CN111611988A (zh) * 2020-05-22 2020-09-01 上海携程商务有限公司 图片验证码识别方法及装置、电子设备和计算机可读介质
CN111652220A (zh) * 2020-06-04 2020-09-11 上海鸢安智能科技有限公司 基于点阵图像的金属部件身份识别方法、***、存储介质、终端
CN111783064A (zh) * 2020-06-30 2020-10-16 平安国际智慧城市科技股份有限公司 图形验证码生成方法、装置、计算机设备及存储介质
CN112016591A (zh) * 2020-08-04 2020-12-01 杰创智能科技股份有限公司 一种图像识别模型的训练方法及图像识别方法
CN112989312A (zh) * 2020-11-30 2021-06-18 北京金堤科技有限公司 验证码的识别方法、装置、电子设备和存储介质
WO2022156552A1 (zh) * 2021-01-19 2022-07-28 北京嘀嘀无限科技发展有限公司 验证码图像加密方法、设备、存储介质和计算机程序产品
CN117132989A (zh) * 2023-10-23 2023-11-28 山东大学 基于卷积神经网络的字符验证码识别方法、***及设备

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184226A (zh) * 2015-08-11 2015-12-23 北京新晨阳光科技有限公司 数字识别方法和装置及神经网络训练方法和装置
CN106570477A (zh) * 2016-10-28 2017-04-19 中国科学院自动化研究所 基于深度学习的车型识别模型构建方法及车型识别方法
CN107153817A (zh) * 2017-04-29 2017-09-12 深圳市深网视界科技有限公司 行人重识别数据标注方法和装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105184226A (zh) * 2015-08-11 2015-12-23 北京新晨阳光科技有限公司 数字识别方法和装置及神经网络训练方法和装置
CN106570477A (zh) * 2016-10-28 2017-04-19 中国科学院自动化研究所 基于深度学习的车型识别模型构建方法及车型识别方法
CN107153817A (zh) * 2017-04-29 2017-09-12 深圳市深网视界科技有限公司 行人重识别数据标注方法和装置

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110555462A (zh) * 2019-08-02 2019-12-10 深圳索信达数据技术有限公司 基于卷积神经网络的无固定多字符验证码识别方法
CN111027568A (zh) * 2019-10-30 2020-04-17 中国科学院自动化研究所南京人工智能芯片创新研究院 一种迭代的神经网络批量规范化***
CN110956177A (zh) * 2019-11-22 2020-04-03 成都市映潮科技股份有限公司 一种混合型验证码的识别方法及***
CN111143213A (zh) * 2019-12-24 2020-05-12 北京数衍科技有限公司 软件自动化测试方法和装置及电子设备
CN111275039A (zh) * 2020-01-17 2020-06-12 深圳信息职业技术学院 水尺字符定位方法、装置、计算设备及存储介质
CN111275039B (zh) * 2020-01-17 2023-05-16 深圳信息职业技术学院 水尺字符定位方法、装置、计算设备及存储介质
CN111259366A (zh) * 2020-01-22 2020-06-09 支付宝(杭州)信息技术有限公司 一种基于自监督学习的验证码识别器的训练方法和装置
CN111368824B (zh) * 2020-02-24 2022-09-23 河海大学常州校区 一种仪表识别方法、移动设备及存储介质
CN111368824A (zh) * 2020-02-24 2020-07-03 河海大学常州校区 一种仪表识别方法、移动设备及存储介质
CN111611988A (zh) * 2020-05-22 2020-09-01 上海携程商务有限公司 图片验证码识别方法及装置、电子设备和计算机可读介质
CN111652220A (zh) * 2020-06-04 2020-09-11 上海鸢安智能科技有限公司 基于点阵图像的金属部件身份识别方法、***、存储介质、终端
CN111783064A (zh) * 2020-06-30 2020-10-16 平安国际智慧城市科技股份有限公司 图形验证码生成方法、装置、计算机设备及存储介质
CN112016591A (zh) * 2020-08-04 2020-12-01 杰创智能科技股份有限公司 一种图像识别模型的训练方法及图像识别方法
CN112989312A (zh) * 2020-11-30 2021-06-18 北京金堤科技有限公司 验证码的识别方法、装置、电子设备和存储介质
CN112989312B (zh) * 2020-11-30 2024-04-30 北京金堤科技有限公司 验证码的识别方法、装置、电子设备和存储介质
WO2022156552A1 (zh) * 2021-01-19 2022-07-28 北京嘀嘀无限科技发展有限公司 验证码图像加密方法、设备、存储介质和计算机程序产品
CN117132989A (zh) * 2023-10-23 2023-11-28 山东大学 基于卷积神经网络的字符验证码识别方法、***及设备
CN117132989B (zh) * 2023-10-23 2024-01-26 山东大学 基于卷积神经网络的字符验证码识别方法、***及设备

Similar Documents

Publication Publication Date Title
CN109977980A (zh) 一种验证码识别方法及装置
CN109829430B (zh) 基于异构层次化注意机制的跨模态行人再识别方法及***
CN105303179A (zh) 指纹识别方法、装置
CN110717554B (zh) 图像识别方法、电子设备及存储介质
CN108985232A (zh) 人脸图像比对方法、装置、计算机设备及存储介质
EP3588381A1 (en) Method and apparatus for training classification model, method and apparatus for classifying
CN106663203B (zh) 活体指纹识别方法及装置
CN108922560A (zh) 一种基于混合深度神经网络模型的城市噪声识别方法
CN108776774A (zh) 一种基于复杂度感知分类算法的面部表情识别方法
CN111783505A (zh) 伪造人脸的识别方法、装置和计算机可读存储介质
US11062120B2 (en) High speed reference point independent database filtering for fingerprint identification
CN109766277A (zh) 一种基于迁移学习与dnn的软件故障诊断方法
CN110909807A (zh) 基于深度学习的网络验证码识别方法、装置及计算机设备
CN109271915B (zh) 防伪检测方法和装置、电子设备、存储介质
CN107358209A (zh) 人脸检测模型的训练方法、装置及人脸检测方法、装置
CN105117708A (zh) 人脸表情识别的方法和装置
CN107798351A (zh) 一种基于深度学习神经网络的身份识别方法和***
CN111062424A (zh) 小样本食品图像识别模型训练方法及食品图像识别方法
CN110134961A (zh) 文本的处理方法、装置和存储介质
CN109165639A (zh) 一种指静脉识别方法、装置及设备
CN109189965A (zh) 图像文字检索方法及***
CN103679160A (zh) 一种人脸识别方法和装置
CN106897700B (zh) 一种单样本人脸识别方法及***
CN109034012A (zh) 基于动态图像和视频子序列的第一人称视角手势识别方法
CN108932533A (zh) 识别模型构建方法及装置、字符识别方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190705