CN111582259A - 机读码识别方法、装置、电子设备和存储介质 - Google Patents
机读码识别方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN111582259A CN111582259A CN202010280486.4A CN202010280486A CN111582259A CN 111582259 A CN111582259 A CN 111582259A CN 202010280486 A CN202010280486 A CN 202010280486A CN 111582259 A CN111582259 A CN 111582259A
- Authority
- CN
- China
- Prior art keywords
- machine
- readable code
- character
- image
- position information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 101
- 238000003860 storage Methods 0.000 title claims abstract description 37
- 238000001514 detection method Methods 0.000 claims abstract description 53
- 239000011159 matrix material Substances 0.000 claims description 173
- 238000012545 processing Methods 0.000 claims description 17
- 238000012937 correction Methods 0.000 claims description 7
- 238000012795 verification Methods 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 29
- 238000010586 diagram Methods 0.000 description 22
- 230000006870 function Effects 0.000 description 18
- 238000011176 pooling Methods 0.000 description 12
- 238000004590 computer program Methods 0.000 description 9
- 230000000694 effects Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 9
- 238000005452 bending Methods 0.000 description 6
- 230000003287 optical effect Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 5
- 239000000203 mixture Substances 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 238000013145 classification model Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 229920001296 polysiloxane Polymers 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
- Character Input (AREA)
Abstract
本说明书一个实施例提了一种机读码识别方法、装置、电子设备和存储介质,其中方法包括:获取机读码图像。所述机读码图像中包括待识别字符内容的多个机读码字符。通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息。计算所述机读码字符的位置信息的置信度。根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息。基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
Description
技术领域
本文件涉及计算机技术领域,尤其涉及一种机读码识别方法、装置、电子设备和存储介质。
背景技术
在很多场景下都需要对机读码的字符内容进行识别。机读码又称为MRZ(MachineReadable Zone)码。机读码可以设置在各种证件上面,证件包括但不限于护照、港澳通行证、身份证等。由于机读码通常设置在纸质证件上,因此在识别机读码的字符内容时,可能会受到纸张弯曲变形的影响导致机读码字符内容识别不准确。另外,若预先对打印有机读码的纸张进行拍摄,基于拍摄得到的图像识别机读码的字符内容,则有可能受到拍摄时曝光过高、曝光过低、拍摄模糊等因素的影响导致机读码字符内容识别不准确。因此,有必要提供一种技术方案,以提高机读码字符内容识别的准确性。
发明内容
本说明书一个实施例的目的是提供一种机读码识别方法、装置、电子设备和存储介质,以提高机读码字符内容识别的准确性。
为解决上述技术问题,本说明书一个实施例是这样实现的:
本说明书一个实施例提供了一种机读码识别方法,包括:获取机读码图像。所述机读码图像中包括待识别字符内容的多个机读码字符。通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息。计算所述机读码字符的位置信息的置信度。根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息。基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
本说明书一个实施例提供了一种机读码识别方法,包括:获取机读码图像。所述机读码图像中包括待识别字符内容的多个机读码字符。通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息。基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
本说明书一个实施例提供了一种机读码识别方法,包括:获取机读码图像。所述机读码图像中包括待识别字符内容的多个机读码字符。通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息。计算所述机读码字符的位置信息的置信度。若根据所述置信度,确定各个所述机读码字符中存在待修正位置信息的目标机读码字符,则修正所述目标机读码字符的位置信息,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。否则,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
本说明书一个实施例提供了一种机读码识别装置,包括:第一获取单元,获取机读码图像。所述机读码图像中包括待识别字符内容的多个机读码字符。第一检测单元,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息。修正单元,计算所述机读码字符的位置信息的置信度,根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息。第一识别单元,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
本说明书一个实施例提供了一种机读码识别装置,包括:第二获取单元,获取机读码图像。所述机读码图像中包括待识别字符内容的多个机读码字符。第二检测单元,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息。第二识别单元,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
本说明书一个实施例提供了一种机读码识别装置,包括:第三获取单元,获取机读码图像。所述机读码图像中包括待识别字符内容的多个机读码字符。第三检测单元,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息。计算单元,计算所述机读码字符的位置信息的置信度。第三识别单元,若根据所述置信度,确定各个所述机读码字符中存在待修正位置信息的目标机读码字符,则修正所述目标机读码字符的位置信息,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。否则,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
本说明书一个实施例提供了一种机读码识别设备,包括:处理器以及被安排成存储计算机可执行指令的存储器。所述计算机可执行指令在被执行时使所述处理器实现上述所述的机读码识别方法的步骤。
本说明书一个实施例提供了一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现上述所述的机读码识别方法的步骤。
附图说明
为了更清楚地说明本说明书一个或多个实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书一实施例提供的机读码识别的场景示意图;
图2为本说明书一实施例提供的机读码识别方法的流程示意图;
图3为本说明书一实施例提供的单字符位置识别模型的结构示意图;
图4a为本说明书一实施例提供的修正目标机读码字符的位置信息的示意图;
图4b为本说明书另一实施例提供的修正目标机读码字符的位置信息的示意图;
图5为本说明书另一实施例提供的机读码识别方法的流程示意图;
图6为本说明书另一实施例提供的机读码识别方法的流程示意图;
图7为本说明书另一实施例提供的机读码识别方法的流程示意图;
图8为本说明书一实施例提供的机读码识别装置的模块组成示意图;
图9为本说明书另一实施例提供的机读码识别装置的模块组成示意图;
图10为本说明书另一实施例提供的机读码识别装置的模块组成示意图;
图11为本说明书一实施例提供的机读码识别设备的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本说明书一个或多个实施例中的技术方案,下面将结合本说明书一个或多个实施例中的附图,对本说明书一个或多个实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书一个或多个实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本文件的保护范围。
本说明书一个实施例的目的是提供一种机读码识别方法、装置、电子设备和存储介质,以提高机读码字符内容识别的准确性。
图1为本说明书一实施例提供的机读码识别的场景示意图,如图1所示,该场景包括用户终端和机读码识别设备。其中用户终端包括但不限于如图1中所示的平板电脑101、手机102、台式电脑103、笔记本电脑104,机读码识别设备包括但不限于如图1中所示的服务器200。该场景中,用户终端可以对证件进行拍摄,并将拍摄得到的图像发送至机读码识别设备。机读码识别设备可以执行本说明书一个或多个实施例中提供的机读码识别方法,从而识别证件上的机读码的字符内容,提高机读码字符内容识别的准确性。当然,在其他实施例中,也可以由用户终端执行本说明书一个或多个实施例中提供的机读码识别方法,从而识别机读码的字符内容,这里不做限定。
图2为本说明书一实施例提供的机读码识别方法的流程示意图,该流程以机读码识别设备为执行主体进行说明,如图2所示,该流程包括以下步骤:
步骤S202,获取机读码图像,该机读码图像中包括待识别字符内容的多个机读码字符;
步骤S204,通过单字符位置检测的方式,检测该机读码图像中机读码字符的位置信息;
步骤S206,计算机读码字符的位置信息的置信度,根据该置信度,在各个机读码字符中确定待修正位置信息的目标机读码字符,并修正目标机读码字符的位置信息;
步骤S208,基于修正后的机读码字符的位置信息,识别机读码字符的字符内容。
可见,通过本实施例,能够在获取到机读码图像后,通过单字符位置检测的方式,检测该机读码图像中机读码字符的位置信息,并基于机读码字符的位置信息,识别机读码字符的字符内容。由于本实施例中没有直接检测机读码所在的区域的位置信息,而是检测机读码字符的位置信息,因此避免了纸张弯曲变形对检测机读码所在的区域的位置信息的影响,提高了机读码字符的位置信息的检测准确性,进而提高了机读码字符内容识别的准确性。
上述步骤S202中,获取机读码图像,该机读码图像中包括待识别字符内容的多个机读码字符。该步骤具体包括:
(a1)获取用户的证件图像,在用户的证件图像中确定机读码字符所在的机读码区域;
(a2)在用户的证件图像中提取机读码区域处的图像,并将机读码区域处的图像的尺寸转换成预定尺寸,将该预定尺寸的图像作为机读码图像。
具体地,机读码识别设备接收用户终端拍摄并发送的用户的证件图像,比如接收用户终端拍摄并发送的用户的护照图像。机读码识别设备可以采用通用的方法在用户的证件图像中确定各个机读码字符所在的机读码区域,以护照为例,该机读码区域通常为矩形区域,该矩形区域中包括护照上的2行机读码字符,每行机读码字符的数量为44个。
在识别得到各个机读码字符所在的机读码区域之后,机读码识别设备还从用户的证件图像中提取机读码区域处的图像,该动作可以理解为从用户的证件图像中将机读码区域处的图像裁剪下来,从而得到机读码区域处的图像。机读码识别设备还将机读码区域处的图像的尺寸转换成预定尺寸,并将该预定尺寸的图像作为机读码图像。
在一个具体的实施例中,机读码识别设备在接收用户终端拍摄并发送的用户的证件图像之后,利用sift或角点检测方法对证件图像进行对齐,并利用显著性检测方法在对齐后的证件图像中检测出大致的机读码区域,进而在用户的证件图像中提取机读码区域处的图像,并将机读码区域处的图像的尺寸转换成预定尺寸,将该预定尺寸的图像作为机读码图像。
上述获取机读码图像的过程可以通过模型执行,也可以基于预定的图像获取流程执行,这里不做限定。
在获取到机读码图像后,机读码识别设备执行上述步骤S204,通过单字符位置检测的方式,检测该机读码图像中机读码字符的位置信息。该步骤具体包括:
(b1)获取机读码图像的图像矩阵,对机读码图像的图像矩阵进行卷积运算,得到机读码图像对应的位置特征矩阵;位置特征矩阵中的元素值表示卷积运算后的图像中像素点的位置特征值;
(b2)对位置特征矩阵进行处理,得到机读码图像对应的位置信息矩阵;位置信息矩阵的矩阵结构与机读码图像中机读码字符的排列结构相对应;位置信息矩阵中的元素值表示机读码字符的位置信息。
具体地,获取机读码图像的图像矩阵,该图像矩阵是机读码图像在计算机***中的数据表现形式,该图像矩阵中的行表示像素行,列表示像素列,该机读码图像中的元素值表示对应行和对应列的对应像素点的像素值。上述动作(b1)获取机读码图像的图像矩阵,对机读码图像的图像矩阵进行卷积运算,得到机读码图像对应的位置特征矩阵。这一过程中,可以对机读码图像的图像矩阵进行多次卷积运算,运算后得到机读码图像对应的位置特征矩阵,该矩阵的行表示卷积运算后的机读码图像的行像素,列表示卷积运算后的机读码图像的列像素,该矩阵中的元素值表示卷积运算后的机读码图像中各个像素点的位置特征值。位置特征值是表示对应像素点的位置特征的值,是通过对机读码图像进行多次卷积运算提取到的特征值。
上述动作(b1)中,对机读码图像的图像矩阵进行卷积运算,得到机读码图像对应的位置特征矩阵,具体为:
(b11)通过预先训练的卷积核,对机读码图像的图像矩阵交替进行第一预定次数的第一类卷积运算和第二预定次数的第二类卷积运算;第一类卷积运算后得到的矩阵大小大于运算前的矩阵大小,第一类卷积运算后得到的矩阵通道数大于运算前的矩阵通道数;第二类卷积运算后得到的矩阵大小小于运算前的矩阵大小,第二类卷积运算后得到的矩阵通道数等于运算前的矩阵通道数;
(b12)将交替卷积运算后得到的矩阵确定为机读码图像对应的位置特征矩阵。
具体地,预先训练有多个卷积核,其中,每次第一类卷积运算均对应一个卷积核,每次第二类卷积运算均对应一个卷积核。通过这些预先训练的卷积核,对机读码图像的图像矩阵交替进行第一预定次数的第一类卷积运算和第二预定次数的第二类卷积运算,比如,对机读码图像的图像矩阵进行一次第一类卷积运算,再进行一次第二类卷积运算,再进行一次第一类卷积运算,再进行一次第二类卷积运算。每次第一类卷积运算后得到的矩阵大小大于运算前的矩阵大小,每次第一类卷积运算后得到的矩阵通道数大于运算前的矩阵通道数。每次第二类卷积运算后得到的矩阵大小小于运算前的矩阵大小,每次第二类卷积运算后得到的矩阵通道数等于运算前的矩阵通道数。
经过交替卷积运算后,得到的矩阵与机读码图像的图像矩阵的大小不同,该交替卷积运算后得到的矩阵即为机读码图像对应的位置特征矩阵。
上述动作(b2)中,对位置特征矩阵进行处理,比如,对位置特征矩阵进行卷积运算,得到机读码图像对应的位置信息矩阵。该位置信息矩阵的矩阵结构与机读码图像中各个机读码字符的排列结构相对应,具体地,比如在机读码图像中,各个机读码字符的排列结构是呈两行排列,每行44个字符,则位置信息矩阵的矩阵结构即为2行44列的结构。该位置信息矩阵中的元素值表示各个机读码字符的位置信息。由于该位置信息矩阵的矩阵结构与机读码图像中各个机读码字符的排列结构相对应,因此该矩阵中的元素值即表示相对应的机读码字符的位置信息。机读码字符的位置信息可以通过坐标(x,y)的形式表示。也可以将每个机读码字符看做一个矩形框,则每个机读码字符的位置信息通过该矩形框的四个顶点的顶点坐标表示,每个顶点的顶点坐标以坐标(x,y)的形式表示。
在一个具体的示例中,提供有单字符位置识别模型来通过单字符位置检测的方式,检测机读码图像中每个机读码字符的位置信息。图3为本说明书一实施例提供的单字符位置识别模型的结构示意图,如图3所示,该模型包括计算位置特征矩阵部分和计算位置信息矩阵部分,其中,计算位置特征矩阵部分包括第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层和第四卷积层,每个卷积层和每个池化层都有预先训练好的卷积核。计算位置信息矩阵部分包括第五卷积层,第五卷积层也有预先训练好的卷积核。
机读码图像的图像矩阵输入到上述的单字符位置识别模型后,首先通过第一卷积层进行卷积运算,卷积运算后图像尺寸和通道数均变大,然后经过第一池化层进行池化处理,池化处理后图像尺寸变小,通道数不变。然后依次经过第二卷积层、第二池化层、第三卷积层、第三池化层和第四卷积层进行处理,每次卷积后,图像尺寸和通道数均变大,每次池化后,图像尺寸变小通道数不变。经过第四卷积层输出得到的矩阵即为上述的位置特征矩阵。在计算位置特征矩阵的过程中,每次卷积处理的目的是通过卷积运算丰富机读码图像中的位置特征,每次池化处理的目的是通过池化的方式在保证位置特征量不变的基础上缩小机读码图像的图像尺寸,避免持续丰富图像特征导致的图像尺寸过大的问题。
将第四卷积层输出得到的矩阵输入至第五卷积层,通过第五卷积层进行卷积运算,即得到机读码图像对应的位置信息矩阵。如前所述,位置信息矩阵的矩阵结构与机读码图像中各个机读码字符的排列结构相一致,位置信息矩阵中的元素值表示各个机读码字符的位置信息。比如在机读码图像中,各个机读码字符的排列结构是呈两行排列,每行44个字符,则位置信息矩阵的矩阵结构即为2行44列的结构。该位置信息矩阵中的元素值表示各个机读码字符的位置信息。通过设置第五卷积层,使得机读码图像对应的位置信息矩阵的矩阵结构与机读码图像中各个机读码字符的排列结构相一致,能够保证准确计算到每个机读码字符的位置信息,避免字符位置漏检的问题,提高计算机读码字符的位置信息的准确性。
需要说明的是,图3中的模型结构仅为一种示意性举例,单字符位置识别模型还可以通过其他结构实现。下面举例一种单字符识别模型的训练方法。首先,建立模型结构,比如,建立如图3中所示的模型结构,该模型结构中,各个卷积核为待训练的卷积核。然后,获取样本图像,样本图像为标记有各个机读码字符的位置信息的机读码图像。接着,将样本图像输入至模型中,以训练模型中的各个卷积核,在各个卷积核训练完成后,即确定单字符识别模型训练完成。
在一种示例实施例中,单字符识别模型中在计算位置特征矩阵之前,还包括图像获取层,该图像获取层可以执行上述(a1)和(a2)的方法,以获取机读码图像。
可见,本实施例中,通过单字符位置检测的方式,能够同步学习到每个机读码字符的位置信息,实现机读码字符的位置信息的端对端的学习。端对端的学习指的是从每个机读码字符中直接学习到每个机读码字符的位置信息,中间不需要学习机读码所在的区域的位置信息的过程。由于没有直接检测机读码所在的区域的位置信息,而是检测每个机读码字符的位置信息,因此避免了纸张弯曲变形对检测机读码所在的区域的位置信息的影响,提高了机读码字符的位置信息的检测准确性,进而提高了机读码字符内容识别的准确性。
在通过单字符位置检测的方式,检测机读码图像中每个机读码字符的位置信息之后,还执行步骤S206,计算每个机读码字符的位置信息的置信度。计算机读码字符的位置信息的置信度具体包括:
(c1)在机读码图像中,根据机读码字符的位置信息,确定机读码字符的图像区域;
(c2)预测机读码字符的图像区域内存在机读码字符的概率值,将该概率值作为该位置信息的置信度。
具体地,首先在机读码图像中,分别根据每个机读码字符的位置信息,确定每个机读码字符的图像区域,比如,将每个机读码字符看做一个矩形框,则每个机读码字符的位置信息通过该矩形框的四个顶点的顶点坐标表示,每个顶点的顶点坐标以坐标(x,y)的形式表示。从而,在机读码图像中,分别根据每个机读码字符的位置信息,确定每个机读码字符的图像区域。
然后,分别预测每个机读码字符的图像区域内存在机读码字符的概率值,这里可以通过二分类模型预测每个机读码字符的图像区域内存在机读码字符的概率值。或者,通过其他已有的方法预测每个机读码字符的图像区域内存在机读码字符的概率值,本实施例不做限定。最后,将每个机读码字符的图像区域内存在机读码字符的概率值,作为对应的位置信息的置信度。比如,通过二分类模型预测某个机读码字符的图像区域内存在机读码字符的概率值为0.86,则该机读码字符的位置信息的置信度也为0.86。
在一种示例实施例中,若某个机读码字符由于曝光过高导致该字符变成一个亮点,则通过上述过程,识别得到的该机读码字符的位置信息的准确率将下降,从而计算得到的该机读码字符的位置信息的置信度也将较低。
在计算得到每个机读码字符的位置信息的置信度之后,上述步骤S206中,根据该置信度,在各个机读码字符中确定待修正位置信息的目标机读码字符,比如,将置信度低于预设阈值的机读码字符确定为待修正位置信息的目标机读码字符。然后,修正目标机读码字符的位置信息。该修正过程具体包括:
(d1)根据目标机读码字符的位置信息,确定在机读码图像中与目标机读码字符相邻的相邻机读码字符;
(d2)根据相邻机读码字符的位置信息,修正目标机读码字符的位置信息。
首先,通过动作(d1),根据每个机读码字符的位置信息和目标机读码字符的位置信息,在机读码图像中确定与目标机读码字符相邻的相邻机读码字符。然后,通过动作(d2),根据相邻机读码字符的位置信息,修正目标机读码字符的位置信息。
在一种示例实施例中,将每个机读码字符看做一个矩形框,则每个机读码字符的位置信息通过该矩形框的四个顶点的顶点坐标表示,每个顶点的顶点坐标以坐标(x,y)的形式表示。则每个机读码字符的位置信息包括四个矩形顶点的坐标值。该示例实施例中,与目标机读码字符相邻的相邻机读码字符包括第一机读码字符和第二机读码字符,则上述动作(d2)根据相邻机读码字符的位置信息,修正目标机读码字符的位置信息,具体包括:
(d21)若第一机读码字符、第二机读码字符和目标机读码字符位于同一基准线上,则将第一机读码和第二机读码的相互对应的矩形顶点的坐标值的平均值,作为目标机读码的相对应的矩形顶点的坐标值;
(d22)若第一机读码字符和目标机读码字符所在的基准线垂直于第二机读码字符和目标机读码字符所在的基准线,则从第一机读码的四个矩形顶点的坐标值中提取宽度方向上的两个坐标值,作为目标机读码在宽度方向上的两个坐标值,从第二机读码的四个矩形顶点的坐标值中提取高度方向上的两个坐标值,作为目标机读码在高度方向上的两个坐标值,根据目标机读码在宽度方向上的两个坐标值和目标机读码在高度方向上的两个坐标值,确定目标机读码的四个矩形顶点的坐标值。
图4a为本说明书一实施例提供的修正目标机读码字符的位置信息的示意图,如图4a所示,该实施例中,第一机读码字符A、第二机读码字符B和目标机读码字符C位于同一基准线上,第一机读码字符A的位置信息包括矩形顶点A1、A2、A3和A4的坐标值,第二机读码字符B的位置信息包括矩形顶点B1、B2、B3和B4的坐标值,目标机读码字符C的位置信息包括矩形顶点C1、C2、C3和C4的坐标值。其中,A1、B1、C1三个顶点均为左上角顶点,A2、B2、C2三个顶点均为左下角顶点,A3、B3、C3三个顶点均为右上角顶点,A4、B4、C4三个顶点均为右下角顶点。则本实施例中,按照上述动作(d21),将第一机读码和第二机读码的相互对应的矩形顶点的坐标值的平均值,作为目标机读码的相对应的矩形顶点的坐标值,也即,将顶点A1和顶点B1的坐标值的平均值,作为顶点C1的坐标值,比如,顶点A1的坐标值为(a,b),顶点B1的坐标值为(c,b),顶点C1的坐标值为((a+c)/2,(b+b)/2)。其他顶点同理。
图4b为本说明书另一实施例提供的修正目标机读码字符的位置信息的示意图,如图4b所示,该实施例中,第一机读码字符A和目标机读码字符C所在的基准线垂直于第二机读码字符B和目标机读码字符C所在的基准线。第一机读码字符A的位置信息包括矩形顶点A1、A2、A3和A4的坐标值,分别为(a1,b1)、(a1,c1)、(d1,b1)、(d1,c1)。第一机读码字符B的位置信息包括矩形顶点B1、B2、B3和B4的坐标值,分别为(a2,b2)、(a2,c2)、(d2,b2)、(d2,c2)。则本实施例中,在这种情况下,从第一机读码的四个矩形顶点的坐标值中提取宽度方向上的两个坐标值a1和d1,作为目标机读码在宽度方向上的两个坐标值。从第二机读码的四个矩形顶点的坐标值中提取高度方向上的两个坐标值b2和c2,作为目标机读码在高度方向上的两个坐标值。根据目标机读码在宽度方向上的两个坐标值和目标机读码在高度方向上的两个坐标值,确定目标机读码的四个矩形顶点的坐标值,分别为:(a1,b2)、(a1,c2)、(d1,b2)、(d1,c2)。
当然,在其他实施例中,第一机读码字符和目标机读码字符所在的基准线不一定严格垂直于第二机读码字符和目标机读码字符所在的基准线,则这种情况下,可以从第一机读码的四个矩形顶点的坐标值中提取宽度方向上的两个坐标值,根据第一机读码字符和目标机读码字符所在的基准线的倾斜角度,基于这两个坐标值确定目标机读码在宽度方向上的两个坐标值。同理,从第二机读码的四个矩形顶点的坐标值中提取高度方向上的两个坐标值,根据第二机读码字符和目标机读码字符所在的基准线的倾斜角度,基于这两个坐标值确定目标机读码在高度方向上的两个坐标值。进而确定目标机读码的四个矩形顶点的坐标值。
当然,在其他实施例中,当目标机读码字符仅与一个机读码字符相邻时,可以也可以不修正该目标机读码字符的位置信息。或者,将相邻机读字符的坐标值中的高度方向上的坐标值或者宽度方向上的坐标值减去一定值,作为修正后的目标机读码的四个矩形顶点的坐标值。
可见,通过本实施例,能够根据目标机读码的相邻机读码字符的位置信息,修正目标机读码字符的位置信息,从而得到每个机读码字符的准确的位置信息。
在修正目标机读码字符的位置信息之后,还执行步骤S208,基于修正后的各个机读码字符的位置信息,识别各个机读码字符的字符内容。该步骤可以通过已有的分类模型实现,或者,通过已有的基于位置的字符内容识别方法实现,本说明书实施例不做限定。
图5为本说明书另一实施例提供的机读码识别方法的流程示意图,该流程以机读码识别设备为执行主体进行说明,如图5所示,该流程在图2的基础上,还包括以下步骤:
步骤S210,在识别机读码字符的字符内容之后,从识别得到的字符内容中提取被校验字符的字符内容和校验字符的字符内容;
步骤S212,利用校验字符的字符内容校验被校验字符的字符内容,以验证机读码字符的字符内容是否识别正确。
具体地,在一种实施例中,各个机读码字符包括被校验字符和用于校验被校验字符的校验字符,比如,机读码字符一共20位,其中前19位是被校验字符,最后一位是对前19位进行加密运算得到的结果,为校验字符,校验字符也可以称为校验位。
则本实施例中,在识别各个机读码字符的字符内容之后,从识别得到的字符内容中提取被校验字符的字符内容和校验字符的字符内容,并利用校验字符的字符内容校验被校验字符的字符内容,若校验通过,则说明机读码字符的字符内容识别正确,若校验不通过,则说明机读码字符的字符内容识别有误。
综上,通过本实施例中的机读码识别方法,没有直接检测机读码所在的区域的位置信息,而是检测每个机读码字符的位置信息,因此避免了纸张弯曲变形对检测机读码所在的区域的位置信息的影响,提高了机读码字符的位置信息的检测准确性,进而提高了机读码字符内容识别的准确性,在纸张弯曲变形情况下也能够准确检测机读码字符的位置信息,从而准确识别机读码字符的字符内容。
并且,通过本实施例中修正目标机读码字符的位置信息的方式,能够避免拍摄机读码时曝光过度、曝光过低或拍摄模糊的情况对位置信息检测准确性的影响,提高机读码字符内容识别的准确性。
并且,通过单字符位置检测的方式,能够同步学习到每个机读码字符的位置信息,实现机读码字符的位置信息的端对端的学习。端对端的学习指的是从每个机读码字符中直接学习到每个机读码字符的位置信息,中间不需要学习机读码所在的区域的位置信息的过程。
并且,本实施例中在检测机读码字符的位置信息时,使得机读码图像对应的位置信息矩阵的矩阵结构与机读码图像中各个机读码字符的排列结构相一致,能够保证准确计算到每个机读码字符的位置信息,避免字符位置漏检的问题,提高计算机读码字符的位置信息的准确性。
图6为本说明书另一实施例提供的机读码识别方法的流程示意图,该流程以机读码识别设备为执行主体进行说明,如图6所示,该流程包括以下步骤:
步骤S602,获取机读码图像;机读码图像中包括待识别字符内容的多个机读码字符;
步骤S604,通过单字符位置检测的方式,检测机读码图像中机读码字符的位置信息;
步骤S606,基于检测到的机读码字符的位置信息,识别机读码字符的字符内容。
该实施例与图2所示实施例的区别在于,不确定待修正位置信息的目标机读码字符,直接基于检测到的各个机读码字符的位置信息,识别各个机读码字符的字符内容。该实施例的具体过程参考前面的描述,这里不再赘述。
由于本实施例中没有直接检测机读码所在的区域的位置信息,而是检测每个机读码字符的位置信息,因此避免了纸张弯曲变形对检测机读码所在的区域的位置信息的影响,提高了机读码字符的位置信息的检测准确性,进而提高了机读码字符内容识别的准确性。
图7为本说明书另一实施例提供的机读码识别方法的流程示意图,该流程以机读码识别设备为执行主体进行说明,如图7所示,该流程包括以下步骤:
步骤S702,获取机读码图像;机读码图像中包括待识别字符内容的多个机读码字符;
步骤S704,通过单字符位置检测的方式,检测机读码图像中机读码字符的位置信息;
步骤S706,计算机读码字符的位置信息的置信度;
步骤S708,若根据该置信度,确定各个机读码字符中存在待修正位置信息的目标机读码字符,则修正目标机读码字符的位置信息,基于修正后的机读码字符的位置信息,识别机读码字符的字符内容,否则,基于检测到的机读码字符的位置信息,识别机读码字符的字符内容。
该实施例与图6所示实施例的区别在于,根据位置信息的置信度,判断是否存在待修正位置信息的目标机读码字符,若存在,则修正目标机读码字符的位置信息,基于修正后的各个机读码字符的位置信息,识别各个机读码字符的字符内容,若不存在,则直接基于检测到的各个机读码字符的位置信息,识别各个机读码字符的字符内容。该实施例的具体过程参考前面的描述,这里不再赘述。
由于本实施例中没有直接检测机读码所在的区域的位置信息,而是检测每个机读码字符的位置信息,因此避免了纸张弯曲变形对检测机读码所在的区域的位置信息的影响,提高了机读码字符的位置信息的检测准确性,进而提高了机读码字符内容识别的准确性。
图8为本说明书一实施例提供的机读码识别装置的模块组成示意图,如图8所示,该装置包括:
第一获取单元81,获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
第一检测单元82,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
修正单元83,计算所述机读码字符的位置信息的置信度,根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息;
第一识别单元84,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
可选地,第一获取单元81:获取用户的证件图像,在所述证件图像中确定所述机读码字符所在的机读码区域;在所述证件图像中提取所述机读码区域处的图像,并将所述机读码区域处的图像的尺寸转换成预定尺寸,将所述预定尺寸的图像作为所述机读码图像。
可选地,第一检测单元82:获取所述机读码图像的图像矩阵,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵;所述位置特征矩阵中的元素值表示卷积运算后的图像中像素点的位置特征值;对所述位置特征矩阵进行处理,得到所述机读码图像对应的位置信息矩阵;所述位置信息矩阵的矩阵结构与所述机读码图像中所述机读码字符的排列结构相对应;所述位置信息矩阵中的元素值表示所述机读码字符的位置信息。
可选地,第一检测单元82:通过预先训练的卷积核,对所述机读码图像的图像矩阵交替进行第一预定次数的第一类卷积运算和第二预定次数的第二类卷积运算;所述第一类卷积运算后得到的矩阵大小大于运算前的矩阵大小,所述第一类卷积运算后得到的矩阵通道数大于运算前的矩阵通道数;所述第二类卷积运算后得到的矩阵大小小于运算前的矩阵大小,所述第二类卷积运算后得到的矩阵通道数等于运算前的矩阵通道数;将交替卷积运算后得到的矩阵确定为所述机读码图像对应的位置特征矩阵。
可选地,修正单元83:在所述机读码图像中,根据所述机读码字符的位置信息,确定每个所述机读码字符的图像区域;预测所述机读码字符的图像区域内存在机读码字符的概率值,将所述概率值作为对应的所述位置信息的置信度。
可选地,修正单元83:根据所述目标机读码字符的位置信息,确定在所述机读码图像中与所述目标机读码字符相邻的相邻机读码字符;根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息。
可选地,所述机读码字符的位置信息包括四个矩形顶点的坐标值;所述相邻机读码字符包括第一机读码字符和第二机读码字符;修正单元83:若所述第一机读码字符、所述第二机读码字符和所述目标机读码字符位于同一基准线上,则将所述第一机读码和所述第二机读码的相互对应的矩形顶点的坐标值的平均值,作为所述目标机读码的相对应的矩形顶点的坐标值;若所述第一机读码字符和所述目标机读码字符所在的基准线垂直于所述第二机读码字符和所述目标机读码字符所在的基准线,则从所述第一机读码的四个矩形顶点的坐标值中提取宽度方向上的两个坐标值,作为所述目标机读码在宽度方向上的两个坐标值,从所述第二机读码的四个矩形顶点的坐标值中提取高度方向上的两个坐标值,作为所述目标机读码在高度方向上的两个坐标值,根据所述目标机读码在宽度方向上的两个坐标值和所述目标机读码在高度方向上的两个坐标值,确定所述目标机读码的四个矩形顶点的坐标值。
可选地,所述机读码字符包括被校验字符和用于校验所述被校验字符的校验字符;所述装置还包括校验单元:在识别所述机读码字符的字符内容之后,从识别得到的字符内容中提取所述被校验字符的字符内容和所述校验字符的字符内容;利用所述校验字符的字符内容校验所述被校验字符的字符内容,以验证所述机读码字符的字符内容是否识别正确。
需要说明的是,本实施例中的机读码识别装置能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
图9为本说明书另一实施例提供的机读码识别装置的模块组成示意图,如图9所示,该装置包括:
第二获取单元91,获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
第二检测单元92,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
第二识别单元93,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
需要说明的是,本实施例中的机读码识别装置能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
图10为本说明书另一实施例提供的机读码识别装置的模块组成示意图,如图10所示,该装置包括:
第三获取单元1001,获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
第三检测单元1002,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算单元1003,计算所述机读码字符的位置信息的置信度;
第三识别单元1004,若根据所述置信度,确定各个所述机读码字符中存在待修正位置信息的目标机读码字符,则修正所述目标机读码字符的位置信息,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容,否则,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
需要说明的是,本实施例中的机读码识别装置能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
进一步地,本说明书另一实施例还提供了一种机读码识别设备,图11为本说明书一实施例提供的机读码识别设备的结构示意图,如图11所示,机读码识别设备可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上的处理器1101和存储器1102,存储器1102中可以存储有一个或一个以上存储应用程序或数据。其中,存储器1102可以是短暂存储或持久存储。存储在存储器1102的应用程序可以包括一个或一个以上模块(图示未示出),每个模块可以包括对机读码识别设备中的一系列计算机可执行指令。更进一步地,处理器1101可以设置为与存储器1102通信,在机读码识别设备上执行存储器1102中的一系列计算机可执行指令。机读码识别设备还可以包括一个或一个以上电源1103,一个或一个以上有线或无线网络接口1104,一个或一个以上输入输出接口1105,一个或一个以上键盘1106等。
在一个具体的实施例中,机读码识别设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对机读码识别设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算所述机读码字符的位置信息的置信度,根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息;
基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
可选地,计算机可执行指令在被执行时,获取机读码图像,包括:获取用户的证件图像,在所述证件图像中确定所述机读码字符所在的机读码区域;在所述证件图像中提取所述机读码区域处的图像,并将所述机读码区域处的图像的尺寸转换成预定尺寸,将所述预定尺寸的图像作为所述机读码图像。
可选地,计算机可执行指令在被执行时,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息,包括:获取所述机读码图像的图像矩阵,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵;所述位置特征矩阵中的元素值表示卷积运算后的图像中像素点的位置特征值;对所述位置特征矩阵进行处理,得到所述机读码图像对应的位置信息矩阵;所述位置信息矩阵的矩阵结构与所述机读码图像中所述机读码字符的排列结构相对应;所述位置信息矩阵中的元素值表示所述机读码字符的位置信息。
可选地,计算机可执行指令在被执行时,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵,包括:通过预先训练的卷积核,对所述机读码图像的图像矩阵交替进行第一预定次数的第一类卷积运算和第二预定次数的第二类卷积运算;所述第一类卷积运算后得到的矩阵大小大于运算前的矩阵大小,所述第一类卷积运算后得到的矩阵通道数大于运算前的矩阵通道数;所述第二类卷积运算后得到的矩阵大小小于运算前的矩阵大小,所述第二类卷积运算后得到的矩阵通道数等于运算前的矩阵通道数;将交替卷积运算后得到的矩阵确定为所述机读码图像对应的位置特征矩阵。
可选地,计算机可执行指令在被执行时,计算所述机读码字符的位置信息的置信度,包括:在所述机读码图像中,根据所述机读码字符的位置信息,确定所述机读码字符的图像区域;预测所述机读码字符的图像区域内存在机读码字符的概率值,将所述概率值作为所述位置信息的置信度。
可选地,计算机可执行指令在被执行时,修正所述目标机读码字符的位置信息,包括:根据所述目标机读码字符的位置信息,确定在所述机读码图像中与所述目标机读码字符相邻的相邻机读码字符;根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息。
可选地,计算机可执行指令在被执行时,所述机读码字符的位置信息包括四个矩形顶点的坐标值;所述相邻机读码字符包括第一机读码字符和第二机读码字符;根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息,包括:若所述第一机读码字符、所述第二机读码字符和所述目标机读码字符位于同一基准线上,则将所述第一机读码和所述第二机读码的相互对应的矩形顶点的坐标值的平均值,作为所述目标机读码的相对应的矩形顶点的坐标值;若所述第一机读码字符和所述目标机读码字符所在的基准线垂直于所述第二机读码字符和所述目标机读码字符所在的基准线,则从所述第一机读码的四个矩形顶点的坐标值中提取宽度方向上的两个坐标值,作为所述目标机读码在宽度方向上的两个坐标值,从所述第二机读码的四个矩形顶点的坐标值中提取高度方向上的两个坐标值,作为所述目标机读码在高度方向上的两个坐标值,根据所述目标机读码在宽度方向上的两个坐标值和所述目标机读码在高度方向上的两个坐标值,确定所述目标机读码的四个矩形顶点的坐标值。
可选地,计算机可执行指令在被执行时,所述机读码字符包括被校验字符和用于校验所述被校验字符的校验字符;所述方法还包括:在识别所述机读码字符的字符内容之后,从识别得到的字符内容中提取所述被校验字符的字符内容和所述校验字符的字符内容;利用所述校验字符的字符内容校验所述被校验字符的字符内容,以验证所述机读码字符的字符内容是否识别正确。
需要说明的是,本实施例中的机读码识别设备能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
在另一个具体的实施例中,机读码识别设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对机读码识别设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
需要说明的是,本实施例中的机读码识别设备能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
在另一个具体的实施例中,机读码识别设备包括有存储器,以及一个或一个以上的程序,其中一个或者一个以上程序存储于存储器中,且一个或者一个以上程序可以包括一个或一个以上模块,且每个模块可以包括对机读码识别设备中的一系列计算机可执行指令,且经配置以由一个或者一个以上处理器执行该一个或者一个以上程序包含用于进行以下计算机可执行指令:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算所述机读码字符的位置信息的置信度;
若根据所述置信度,确定各个所述机读码字符中存在待修正位置信息的目标机读码字符,则修正所述目标机读码字符的位置信息,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容,否则,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
需要说明的是,本实施例中的机读码识别设备能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
进一步地,本说明书另一实施例还提供了一种存储介质,用于存储计算机可执行指令,一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算所述机读码字符的位置信息的置信度,根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息;
基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,获取机读码图像,包括:获取用户的证件图像,在所述证件图像中确定所述机读码字符所在的机读码区域;在所述证件图像中提取所述机读码区域处的图像,并将所述机读码区域处的图像的尺寸转换成预定尺寸,将所述预定尺寸的图像作为所述机读码图像。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息,包括:获取所述机读码图像的图像矩阵,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵;所述位置特征矩阵中的元素值表示卷积运算后的图像中像素点的位置特征值;对所述位置特征矩阵进行处理,得到所述机读码图像对应的位置信息矩阵;所述位置信息矩阵的矩阵结构与所述机读码图像中所述机读码字符的排列结构相对应;所述位置信息矩阵中的元素值表示所述机读码字符的位置信息。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵,包括:通过预先训练的卷积核,对所述机读码图像的图像矩阵交替进行第一预定次数的第一类卷积运算和第二预定次数的第二类卷积运算;所述第一类卷积运算后得到的矩阵大小大于运算前的矩阵大小,所述第一类卷积运算后得到的矩阵通道数大于运算前的矩阵通道数;所述第二类卷积运算后得到的矩阵大小小于运算前的矩阵大小,所述第二类卷积运算后得到的矩阵通道数等于运算前的矩阵通道数;将交替卷积运算后得到的矩阵确定为所述机读码图像对应的位置特征矩阵。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,计算所述机读码字符的位置信息的置信度,包括:在所述机读码图像中,根据所述机读码字符的位置信息,确定所述机读码字符的图像区域;预测所述机读码字符的图像区域内存在机读码字符的概率值,将所述概率值作为所述位置信息的置信度。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,修正所述目标机读码字符的位置信息,包括:根据所述目标机读码字符的位置信息,确定在所述机读码图像中与所述目标机读码字符相邻的相邻机读码字符;根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述机读码字符的位置信息包括四个矩形顶点的坐标值;所述相邻机读码字符包括第一机读码字符和第二机读码字符;根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息,包括:若所述第一机读码字符、所述第二机读码字符和所述目标机读码字符位于同一基准线上,则将所述第一机读码和所述第二机读码的相互对应的矩形顶点的坐标值的平均值,作为所述目标机读码的相对应的矩形顶点的坐标值;若所述第一机读码字符和所述目标机读码字符所在的基准线垂直于所述第二机读码字符和所述目标机读码字符所在的基准线,则从所述第一机读码的四个矩形顶点的坐标值中提取宽度方向上的两个坐标值,作为所述目标机读码在宽度方向上的两个坐标值,从所述第二机读码的四个矩形顶点的坐标值中提取高度方向上的两个坐标值,作为所述目标机读码在高度方向上的两个坐标值,根据所述目标机读码在宽度方向上的两个坐标值和所述目标机读码在高度方向上的两个坐标值,确定所述目标机读码的四个矩形顶点的坐标值。
可选地,该存储介质存储的计算机可执行指令在被处理器执行时,所述机读码字符包括被校验字符和用于校验所述被校验字符的校验字符;所述方法还包括:在识别所述机读码字符的字符内容之后,从识别得到的字符内容中提取所述被校验字符的字符内容和所述校验字符的字符内容;利用所述校验字符的字符内容校验所述被校验字符的字符内容,以验证所述机读码字符的字符内容是否识别正确。
需要说明的是,本实施例中的存储介质能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
另一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
需要说明的是,本实施例中的存储介质能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
另一种具体的实施例中,该存储介质可以为U盘、光盘、硬盘等,该存储介质存储的计算机可执行指令在被处理器执行时,能实现以下流程:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算所述机读码字符的位置信息的置信度;
若根据所述置信度,确定各个所述机读码字符中存在待修正位置信息的目标机读码字符,则修正所述目标机读码字符的位置信息,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容,否则,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
需要说明的是,本实施例中的存储介质能够实现前述的机读码识别方法实施例的各个过程,并达到相同的功能和效果,这里不再重复。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字***“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的***、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书的一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书的实施例可提供为方法、***、或计算机程序产品。因此,本说明书的实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的实施例是参照根据本说明书实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本说明书的实施例可提供为方法、***或计算机程序产品。因此,本说明书的实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书的实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书的一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书的一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于***实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本文件。对于本领域技术人员来说,本说明书的实施例可以有各种更改和变化。凡在本文件的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本文件的权利要求范围之内。
Claims (18)
1.一种机读码识别方法,包括:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算所述机读码字符的位置信息的置信度,根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息;
基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
2.根据权利要求1所述的方法,获取机读码图像,包括:
获取用户的证件图像,在所述证件图像中确定所述机读码字符所在的机读码区域;
在所述证件图像中提取所述机读码区域处的图像,并将所述机读码区域处的图像的尺寸转换成预定尺寸,将所述预定尺寸的图像作为所述机读码图像。
3.根据权利要求1所述的方法,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息,包括:
获取所述机读码图像的图像矩阵,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵;所述位置特征矩阵中的元素值表示卷积运算后的图像中像素点的位置特征值;
对所述位置特征矩阵进行处理,得到所述机读码图像对应的位置信息矩阵;所述位置信息矩阵的矩阵结构与所述机读码图像中所述机读码字符的排列结构相对应;所述位置信息矩阵中的元素值表示所述机读码字符的位置信息。
4.根据权利要求3所述的方法,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵,包括:
通过预先训练的卷积核,对所述机读码图像的图像矩阵交替进行第一预定次数的第一类卷积运算和第二预定次数的第二类卷积运算;所述第一类卷积运算后得到的矩阵大小大于运算前的矩阵大小,所述第一类卷积运算后得到的矩阵通道数大于运算前的矩阵通道数;所述第二类卷积运算后得到的矩阵大小小于运算前的矩阵大小,所述第二类卷积运算后得到的矩阵通道数等于运算前的矩阵通道数;
将交替卷积运算后得到的矩阵确定为所述机读码图像对应的位置特征矩阵。
5.根据权利要求1所述的方法,计算所述机读码字符的位置信息的置信度,包括:
在所述机读码图像中,根据所述机读码字符的位置信息,确定所述机读码字符的图像区域;
预测所述机读码字符的图像区域内存在机读码字符的概率值,将所述概率值作为所述位置信息的置信度。
6.根据权利要求1所述的方法,修正所述目标机读码字符的位置信息,包括:
根据所述目标机读码字符的位置信息,确定在所述机读码图像中与所述目标机读码字符相邻的相邻机读码字符;
根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息。
7.根据权利要求6所述的方法,所述机读码字符的位置信息包括四个矩形顶点的坐标值;所述相邻机读码字符包括第一机读码字符和第二机读码字符;根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息,包括:
若所述第一机读码字符、所述第二机读码字符和所述目标机读码字符位于同一基准线上,则将所述第一机读码和所述第二机读码的相互对应的矩形顶点的坐标值的平均值,作为所述目标机读码的相对应的矩形顶点的坐标值;
若所述第一机读码字符和所述目标机读码字符所在的基准线垂直于所述第二机读码字符和所述目标机读码字符所在的基准线,则从所述第一机读码的四个矩形顶点的坐标值中提取宽度方向上的两个坐标值,作为所述目标机读码在宽度方向上的两个坐标值,从所述第二机读码的四个矩形顶点的坐标值中提取高度方向上的两个坐标值,作为所述目标机读码在高度方向上的两个坐标值,根据所述目标机读码在宽度方向上的两个坐标值和所述目标机读码在高度方向上的两个坐标值,确定所述目标机读码的四个矩形顶点的坐标值。
8.根据权利要求1所述的方法,所述机读码字符包括被校验字符和用于校验所述被校验字符的校验字符;所述方法还包括:
在识别所述机读码字符的字符内容之后,从识别得到的字符内容中提取所述被校验字符的字符内容和所述校验字符的字符内容;
利用所述校验字符的字符内容校验所述被校验字符的字符内容,以验证所述机读码字符的字符内容是否识别正确。
9.一种机读码识别方法,包括:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
10.一种机读码识别方法,包括:
获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算所述机读码字符的位置信息的置信度;
若根据所述置信度,确定各个所述机读码字符中存在待修正位置信息的目标机读码字符,则修正所述目标机读码字符的位置信息,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容,否则,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
11.一种机读码识别装置,包括:
第一获取单元,获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
第一检测单元,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
修正单元,计算所述机读码字符的位置信息的置信度,根据所述置信度,在各个所述机读码字符中确定待修正位置信息的目标机读码字符,并修正所述目标机读码字符的位置信息;
第一识别单元,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
12.根据权利要求11所述的装置,所述第一检测单元:
获取所述机读码图像的图像矩阵,对所述机读码图像的图像矩阵进行卷积运算,得到所述机读码图像对应的位置特征矩阵;所述位置特征矩阵中的元素值表示卷积运算后的图像中像素点的位置特征值;
对所述位置特征矩阵进行处理,得到所述机读码图像对应的位置信息矩阵;所述位置信息矩阵的矩阵结构与所述机读码图像中所述机读码字符的排列结构相对应;所述位置信息矩阵中的元素值表示所述机读码字符的位置信息。
13.根据权利要求11所述的装置,所述修正单元:
在所述机读码图像中,根据所述机读码字符的位置信息,确定所述机读码字符的图像区域;
预测所述机读码字符的图像区域内存在机读码字符的概率值,将所述概率值作为所述位置信息的置信度。
14.根据权利要求11所述的装置,所述修正单元:
根据所述目标机读码字符的位置信息,确定在所述机读码图像中与所述目标机读码字符相邻的相邻机读码字符;
根据所述相邻机读码字符的位置信息,修正所述目标机读码字符的位置信息。
15.一种机读码识别装置,包括:
第二获取单元,获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
第二检测单元,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
第二识别单元,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
16.一种机读码识别装置,包括:
第三获取单元,获取机读码图像;所述机读码图像中包括待识别字符内容的多个机读码字符;
第三检测单元,通过单字符位置检测的方式,检测所述机读码图像中所述机读码字符的位置信息;
计算单元,计算所述机读码字符的位置信息的置信度;
第三识别单元,若根据所述置信度,确定各个所述机读码字符中存在待修正位置信息的目标机读码字符,则修正所述目标机读码字符的位置信息,基于修正后的所述机读码字符的位置信息,识别所述机读码字符的字符内容,否则,基于检测到的所述机读码字符的位置信息,识别所述机读码字符的字符内容。
17.一种机读码识别设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器实现上述权利要求1至8任一项所述的机读码识别方法的步骤,或者实现上述权利要求9所述的机读码识别方法的步骤,或者实现上述权利要10所述的机读码识别方法的步骤。
18.一种存储介质,用于存储计算机可执行指令,所述计算机可执行指令在被执行时实现上述权利要求1至8任一项所述的机读码识别方法的步骤,或者实现上述权利要求9所述的机读码识别方法的步骤,或者实现上述权利要10所述的机读码识别方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010280486.4A CN111582259B (zh) | 2020-04-10 | 2020-04-10 | 机读码识别方法、装置、电子设备和存储介质 |
CN202410348955.XA CN118230327A (zh) | 2020-04-10 | 2020-04-10 | 机读码识别方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010280486.4A CN111582259B (zh) | 2020-04-10 | 2020-04-10 | 机读码识别方法、装置、电子设备和存储介质 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410348955.XA Division CN118230327A (zh) | 2020-04-10 | 2020-04-10 | 机读码识别方法、装置、电子设备和存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582259A true CN111582259A (zh) | 2020-08-25 |
CN111582259B CN111582259B (zh) | 2024-04-16 |
Family
ID=72124392
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410348955.XA Pending CN118230327A (zh) | 2020-04-10 | 2020-04-10 | 机读码识别方法、装置、电子设备和存储介质 |
CN202010280486.4A Active CN111582259B (zh) | 2020-04-10 | 2020-04-10 | 机读码识别方法、装置、电子设备和存储介质 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410348955.XA Pending CN118230327A (zh) | 2020-04-10 | 2020-04-10 | 机读码识别方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (2) | CN118230327A (zh) |
Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080212901A1 (en) * | 2007-03-01 | 2008-09-04 | H.B.P. Of San Diego, Inc. | System and Method for Correcting Low Confidence Characters From an OCR Engine With an HTML Web Form |
US20110123114A1 (en) * | 2009-11-24 | 2011-05-26 | Samsung Electronics Co., Ltd. | Character recognition device and method and computer-readable medium controlling the same |
CN102663360A (zh) * | 2012-03-30 | 2012-09-12 | 中南大学 | 一种钢铁板坯编码自动识别方法以及钢铁板坯跟踪*** |
CN103824066A (zh) * | 2014-03-18 | 2014-05-28 | 厦门翼歌软件科技有限公司 | 一种基于视频流的车牌识别方法 |
CN103914680A (zh) * | 2013-01-07 | 2014-07-09 | 上海宝信软件股份有限公司 | 一种喷印字符图像识别与校验***及方法 |
CN105868759A (zh) * | 2015-01-22 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 分割图像字符的方法及装置 |
CN106650714A (zh) * | 2016-10-08 | 2017-05-10 | 迪堡金融设备有限公司 | 一种纸钞的冠字号识别方法及其装置 |
CN107527056A (zh) * | 2017-09-01 | 2017-12-29 | 南京邮电大学 | 一种基于粗定位车牌的字符分割方法 |
WO2018040342A1 (zh) * | 2016-08-31 | 2018-03-08 | 百度在线网络技术(北京)有限公司 | 用于识别图像中文字区域的方法和装置 |
CN108563990A (zh) * | 2018-03-08 | 2018-09-21 | 南京华科和鼎信息科技有限公司 | 一种基于cis图像采集***的证照鉴伪方法及*** |
CN108875722A (zh) * | 2017-12-27 | 2018-11-23 | 北京旷视科技有限公司 | 字符识别与识别模型训练方法、装置和***及存储介质 |
CN109740606A (zh) * | 2018-12-20 | 2019-05-10 | 上海众源网络有限公司 | 一种图像识别方法及装置 |
CN109871938A (zh) * | 2019-01-21 | 2019-06-11 | 重庆大学 | 一种基于卷积神经网络的零部件喷码检测方法 |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN110543877A (zh) * | 2019-09-04 | 2019-12-06 | 北京迈格威科技有限公司 | 标识识别方法及其模型的训练方法、装置和电子*** |
CN110866529A (zh) * | 2019-10-29 | 2020-03-06 | 腾讯科技(深圳)有限公司 | 字符识别方法、装置、电子设备及存储介质 |
-
2020
- 2020-04-10 CN CN202410348955.XA patent/CN118230327A/zh active Pending
- 2020-04-10 CN CN202010280486.4A patent/CN111582259B/zh active Active
Patent Citations (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080212901A1 (en) * | 2007-03-01 | 2008-09-04 | H.B.P. Of San Diego, Inc. | System and Method for Correcting Low Confidence Characters From an OCR Engine With an HTML Web Form |
US20110123114A1 (en) * | 2009-11-24 | 2011-05-26 | Samsung Electronics Co., Ltd. | Character recognition device and method and computer-readable medium controlling the same |
CN102663360A (zh) * | 2012-03-30 | 2012-09-12 | 中南大学 | 一种钢铁板坯编码自动识别方法以及钢铁板坯跟踪*** |
CN103914680A (zh) * | 2013-01-07 | 2014-07-09 | 上海宝信软件股份有限公司 | 一种喷印字符图像识别与校验***及方法 |
CN103824066A (zh) * | 2014-03-18 | 2014-05-28 | 厦门翼歌软件科技有限公司 | 一种基于视频流的车牌识别方法 |
CN105868759A (zh) * | 2015-01-22 | 2016-08-17 | 阿里巴巴集团控股有限公司 | 分割图像字符的方法及装置 |
WO2018040342A1 (zh) * | 2016-08-31 | 2018-03-08 | 百度在线网络技术(北京)有限公司 | 用于识别图像中文字区域的方法和装置 |
CN106650714A (zh) * | 2016-10-08 | 2017-05-10 | 迪堡金融设备有限公司 | 一种纸钞的冠字号识别方法及其装置 |
CN107527056A (zh) * | 2017-09-01 | 2017-12-29 | 南京邮电大学 | 一种基于粗定位车牌的字符分割方法 |
CN108875722A (zh) * | 2017-12-27 | 2018-11-23 | 北京旷视科技有限公司 | 字符识别与识别模型训练方法、装置和***及存储介质 |
CN108563990A (zh) * | 2018-03-08 | 2018-09-21 | 南京华科和鼎信息科技有限公司 | 一种基于cis图像采集***的证照鉴伪方法及*** |
WO2019174130A1 (zh) * | 2018-03-14 | 2019-09-19 | 平安科技(深圳)有限公司 | 票据识别方法、服务器及计算机可读存储介质 |
CN109740606A (zh) * | 2018-12-20 | 2019-05-10 | 上海众源网络有限公司 | 一种图像识别方法及装置 |
CN109871938A (zh) * | 2019-01-21 | 2019-06-11 | 重庆大学 | 一种基于卷积神经网络的零部件喷码检测方法 |
CN110543877A (zh) * | 2019-09-04 | 2019-12-06 | 北京迈格威科技有限公司 | 标识识别方法及其模型的训练方法、装置和电子*** |
CN110866529A (zh) * | 2019-10-29 | 2020-03-06 | 腾讯科技(深圳)有限公司 | 字符识别方法、装置、电子设备及存储介质 |
Non-Patent Citations (3)
Title |
---|
HENG ZHANG 等: "Character confidence based on N-best list for keyword spotting in online Chinese handwritten documents" * |
张强 等: "新型车牌自动识别***的研究与设计" * |
王锋 等: "基于卷积神经网络的数码仪表识别方法" * |
Also Published As
Publication number | Publication date |
---|---|
CN118230327A (zh) | 2024-06-21 |
CN111582259B (zh) | 2024-04-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110348294B (zh) | Pdf文档中图表的定位方法、装置及计算机设备 | |
US20230267619A1 (en) | Method and system of recognizing object edges and computer-readable storage medium | |
KR20200128015A (ko) | 증명서 인식 방법 및 장치, 전자 기기, 컴퓨터 판독 가능한 저장 매체 | |
CN111626383B (zh) | 字体识别方法及装置、电子设备、存储介质 | |
CN110210480B (zh) | 文字识别方法、装置、电子设备和计算机可读存储介质 | |
CN111368638A (zh) | 电子表格的创建方法、装置、计算机设备和存储介质 | |
CN110263805B (zh) | 证件验证、身份验证方法、装置及设备 | |
US11392679B2 (en) | Certificate verification | |
KR20220093187A (ko) | 포지셔닝 방법 및 장치, 전자 기기, 컴퓨터 판독 가능 저장 매체 | |
JP2021135993A (ja) | テキスト認識方法及びテキスト認識装置、電子設備、記憶媒体 | |
CN115631112B (zh) | 一种基于深度学习的建筑轮廓矫正方法及装置 | |
CN111047496A (zh) | 阈值确定方法、水印检测方法、装置和电子设备 | |
CN113449534A (zh) | 二维码图像处理方法和装置 | |
CN114494775A (zh) | 视频切分方法、装置、设备及存储介质 | |
CN115937003A (zh) | 图像处理方法、装置、终端设备和可读存储介质 | |
CN112052702A (zh) | 一种识别二维码的方法和装置 | |
CN110796130A (zh) | 用于文字识别的方法、装置及计算机存储介质 | |
CN113129298B (zh) | 文本图像的清晰度识别方法 | |
CN113936288A (zh) | 倾斜文本方向分类方法、装置、终端设备和可读存储介质 | |
CN117152760A (zh) | 图像处理方法、终端设备及存储介质 | |
WO2020237481A1 (zh) | 反色区域的确定方法、指纹芯片及电子设备 | |
CN111582259B (zh) | 机读码识别方法、装置、电子设备和存储介质 | |
CN110909816A (zh) | 图片识别方法和装置 | |
CN113033542B (zh) | 一种文本识别模型的生成方法以及装置 | |
CN115004245A (zh) | 目标检测方法、装置、电子设备和计算机存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40035933 Country of ref document: HK |
|
GR01 | Patent grant | ||
GR01 | Patent grant |