CN111931783A - 一种训练样本生成方法、机读码识别方法及装置 - Google Patents
一种训练样本生成方法、机读码识别方法及装置 Download PDFInfo
- Publication number
- CN111931783A CN111931783A CN202010829665.9A CN202010829665A CN111931783A CN 111931783 A CN111931783 A CN 111931783A CN 202010829665 A CN202010829665 A CN 202010829665A CN 111931783 A CN111931783 A CN 111931783A
- Authority
- CN
- China
- Prior art keywords
- image
- machine
- readable code
- character string
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/30—Noise filtering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Multimedia (AREA)
- Character Discrimination (AREA)
Abstract
本申请提供一种训练样本生成方法、机读码识别方法及装置。方法包括:根据护照机读码的命名规则随机生成机读码字符串;根据所述机读码字符串生成包括所述机读码字符串的字符图像;获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;根据所述样本图像和所述机读码字符串获得训练样本。本申请实施例通过根据机读码的命名规则随机生成机读码字符串,并将机读码字符串与护照证件的背景图像进行融合,生成训练样本,不需要使用真实的护照图像,并且能够生成充足的训练样本。
Description
技术领域
本申请涉及图像处理技术领域,具体而言,涉及一种训练样本生成方法、机读码识别方法及装置。
背景技术
随着深度学习的兴起,文本识别的准确率相比以前有了较大幅度的提升,文本识别也逐渐用于实际生活中,比如***识别、汽车VN码识别、车牌识别、证件识别等领域。
证件识别的应用领域又细分为多种证件,包括身份证、行驶证、护照等。其中,护照识别的方法主要是两种,第一种是对于带有芯片的电子护照,可以直接读取芯片识别护照相关信息;第二种是对于不带芯片的非电子护照,利用文本识别算法识别护照的机读码,然后将机读码进行解码获得护照相关信息。其中,文本识别一般是指对文本图像进行识别分析处理,获取文字图像上有用文字信息的过程。主要可分为光学文本识别、自然场景中的文本识别、特殊场景中的文本识别。
用于护照机读码识别的文本识别算法涉及深度学习技术,需要大量的护照上的机读码图像数据来进行模型训练,但是因护照本身的隐私性,护照的实际图像数据并不容易获取到,而没有足够的数据用于深度学习文本识别算法的训练,护照机读码识别的准确率就得不到保证。
发明内容
本申请实施例的目的在于提供一种训练样本生成方法、机读码识别方法及装置,用以获得充足的训练样本,从而提高机读码识别模型识别的准确性。
第一方面,本申请实施例提供一种训练样本生成方法,包括:根据护照机读码的命名规则随机生成机读码字符串;根据所述机读码字符串生成包括所述机读码字符串的字符图像;获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;根据所述样本图像和所述机读码字符串获得训练样本。
本申请实施例通过根据机读码的命名规则随机生成机读码字符串,并将机读码字符串与护照证件的背景图像进行融合,生成训练样本,不需要使用真实的护照图像,并且能够生成充足的训练样本。
进一步地,所述将所述字符图像与所述背景图像进行融合,包括:对所述背景图像进行预处理;其中,所述预处理包括随机旋转、裁剪、填充、放大和缩小中的至少一种;将所述字符图像与预处理后的背景图像进行融合。
本申请实施例通过对背景图像进行预处理,增加了背景图像的噪声,从而获得的训练样本能够提高机读码识别模型的泛化能力。
进一步地,在获得样本图像之后,所述方法还包括:对所述样本图像进行噪声处理,获得加噪后的样本图像;所述根据所述样本图像和所述机读码字符串获得训练样本,包括:根据所述加噪后的样本图像和所述机读码字符串获得训练样本。
本申请实施例通过对融合后获得的样本图像进行噪声处理,从而获得的训练样本能够提高机读码识别模型的泛化能力。
进一步地,所述对所述样本图像进行噪声处理,包括:对所述样本图像进行图像模糊处理,以及对所述样本图像中的机读码字符串进行扭曲、歪斜处理。
本申请实施例通过对融合后获得的样本图像进行噪声处理,从而获得的训练样本能够提高机读码识别模型的泛化能力。
第二方面,本申请实施例提供一种机读码识别方法,包括:获取待识别图像,所述待识别图像包括待识别的机读码;将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过第一方面所述的方法生成的训练样本进行训练获得。
本申请实施例通过利用护照机读码的命名规则随机生成机读码字符串,进而获得充足的训练样本,通过充足的训练样本训练获得的机读码识别模型提高了对护照图像中机读码识别的准确性。
进一步地,所述将所述待识别图像输入到识别模型中,包括:对所述待识别图像进行对象检测,获得所述待识别图像中机读码对应的识别框;根据所述识别框对所述待识别图像进行裁剪,获得裁剪后的待识别图像;将所述裁剪后的待识别图像输入到识别模型中。
本申请实施例通过对待识别图像进行对象检测,并对待识别图像进行裁剪后进行图像识别,降低了模型的计算量。
第三方面,本申请实施例提供一种训练样本生成装置,包括:字符串生成模块,用于根据护照机读码的命名规则随机生成机读码字符串;字符图像生成模块,用于根据所述机读码字符串生成包括所述机读码字符串的字符图像;图像融合模块,用于获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;样本获得模块,用于根据所述样本图像和所述机读码字符串获得训练样本。
第四方面,本申请实施例提供一种机读码识别装置,包括:图像获取模块,用于获取待识别图像,所述待识别图像包括待识别的机读码;识别模块,用于将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过第一方面所述的方法生成的训练样本进行训练获得。
第五方面,本申请实施例提供一种电子设备,包括:处理器、存储器和总线,其中,所述处理器和所述存储器通过所述总线完成相互间的通信;所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行第一方面或第二方面的方法。
第六方面,本申请实施例提供一种非暂态计算机可读存储介质,包括:所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行第一方面或第二方面的方法。
本申请的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请实施例了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的一种训练样本生成方法流程示意图;
图2为本申请实施例提供的一种模型训练流程示意图;
图3为本申请实施例提供的一种机读码识别方法流程示意图;
图4为本申请实施例提供的训练样本生成装置结构示意图;
图5为本申请实施例提供的机读码识别装置结构示意图;
图6为本申请实施例提供的电子设备实体结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
可以理解的是,本申请实施例提供的样本生成方法以及机读码识别方法可以应用于终端设备(也可以称为电子设备)以及服务器;其中终端设备具体可以为智能手机、平板电脑、计算机、个人数字助理(Personal DigitalAssitant,PDA)等;服务器具体可以为应用服务器,也可以为Web服务器。另外,模型训练方法以及预测方法均可以是同一终端设备执行,也可以是不同终端设备执行。
为了便于理解,本申请实施例提供的技术方案,下面以终端设备作为执行主体为例,对本申请实施例提供的模型训练方法及预测方法的应用场景进行介绍。
图1为本申请实施例提供的一种训练样本生成方法流程示意图,如图1所示,包括:
步骤101:根据护照机读码的命名规则随机生成机读码字符串;
步骤102:根据所述机读码字符串生成包括所述机读码字符串的字符图像;
步骤103:获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;
步骤104:根据所述样本图像和所述机读码字符串获得训练样本。
在步骤101中,护照的机读码分为两行,每一行都有自己的一套命名规则,一般来说,护照的机读码每行字符串为44位。例如:机读码字符串的第一行为“POCHNLE<<####<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<”,第二行为“G****1114CHN8511015M180101945321212<<<<<<<85”。
其中,第一行中的P代表passport,即护照,共1位;O表示被护照颁发国用于区别不同种类的护照,如果未使用则为<,共1位;CHN:代表中国,共3位;LE<<####<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<<:代表护照持有人的姓名,中文则为拼音,姓后面加<<,然后为“名”的拼音,为了防止用户隐私,“名”用“####”表示,但实际上是护照持有人的名的拼音;空下来的用<填充,直至填充满44个字符。
第二行中G****111表示护照号,为了保护用户隐私,采用“****”表示具体数字,共9位;4:校验码C,共1位;CHN:中国代码,共3位;851010:出生年月日,格式为YYMMDD,共6位;5:校验码C,共1位;M:表示男性,F表示女性,共1位;180101:护照的过期日期,格式为YYMMDD,共6位;9:检验码C,共1位;45321212<<<<<<:共14位,个人号码,由护照颁发国各自决定其作用,不足位用<替代;8:校验码C,共1位;5:校验码X,DRFTR共1位。
根据上述的护照机读码的命名规则可以随机生成护照的机读码字符串。可以理解的是,机读码字符串包括第一行的字符串和第二行的字符串。由于第一行的字符串主要由人名的拼音组成,因此,可以利用已有的第三方人名库,随机从第三方人名库中选择一个人名,并将人名转为拼音后,即可生成第一行的字符串。
在步骤102中,在获得机读码字符串后,生成包含机读码字符串的字符图像,该字符图像可以是的背景色可以为白色,机读码字符串的颜色可以为黑色。其中,背景色为白色的目的为了在步骤103中字符图像与背景图像相融合,防止字符图像的背景色对背景图像中的背景造成干扰,机读码字符串的颜色为黑色是因为真实的护照中的机读码颜色为黑色,这样获得的样本图像更加贴近真实的护照图像。再有,将机读码字符串的颜色设置为黑色,能够使得机读码字符串的颜色与背景颜色相差较大,便于识别机读码字符串。
在步骤103中,护照证件的背景图像可以是采集某个真实的用户的护照获得,也可以从网络中获得。在获取到背景图像后,将背景图像与字符图像进行融合,获得样本图像。其中,图像融合可以分为像素级融合、特征级融合和决策级融合。
(1)像素级图像融合是指在严格配准条件下对待融合的两张图像的原始数据直接进行综合处理的过程。因此,像素级图像融合是直接在原始数据层上的融合,并且要求待融合的两张图像大小相同。
(2)特征级图像融合是指对待融合的两张图像进行特征提取,特征可以包括形状、边缘、区域、轮廓、纹理、角等。然后再对从每张图像中获得的多个特征信息进行综合的分析和处理的过程。特征级图像融合可以分为两大类:目标状态数据融合和目标特征性融合。目标状态数据融合主要用于多传感器目标跟踪领域;目标特性融合就是特征层次的识别。特征级图像融合的方法有:加权平均法、贝叶斯估计方法、聚类分析方法等。
(3)决策级图像融合是指对每张图像的特征信息进行分类、识别等处理,形成相应的结果,进行进一步的融合过程,最终的决策结果是全局最优决策。决策级图像融合的方法主要是基于认知模型的方法,需要大型数据库和专家决策***进行分析、推理、识别和判决。
应当说明的是,在具体应用中可以根据实际情况选择图像融合的方法。目前也有一些第三方图像融合软件,可以方便快速的将两张待融合的图像融合成一张图像。
在步骤104中,在获得样本图像后,样本图像与对应的机读码字符串构成了一个训练样本。
可以理解的是,通过本申请实施例提供的步骤101-步骤104可以获得多个训练样本。
本申请实施例通过根据机读码的命名规则随机生成机读码字符串,并将机读码字符串与护照证件的背景图像进行融合,生成训练样本,不需要使用真实的护照图像,并且能够生成充足的训练样本。
在上述实施例的基础上,所述将所述字符图像与所述背景图像进行融合,包括:
对所述背景图像进行预处理;其中,所述预处理包括随机旋转、裁剪、填充、放大和缩小中的至少一种;
将所述字符图像与预处理后的背景图像进行融合。
在具体的实施过程中,在实际对护照进行识别时,先通过图像采集装置对护照进行采集,获得护照图像,由于环境干扰,图像采集装置在拍摄过程中抖动以及拍摄质量的问题,可能获得的护照图像中有一些噪声。为了提高机读码识别模型的识别准确率,本申请实施例在将字符图像与背景图像进行融合之前,对背景图像进行预处理,可以是随机旋转、裁剪、填充、放大和缩小。其中,随机旋转可以是随机从背景图像中找一点作为圆心,旋转的方向及角度也随机。背景图像中除了护照的图像,可能还包括了其他信息,需要将其他信息裁剪掉,只保留护照的图像。上述预处理操作的目的是为了增加护照背景的多样性。
在上述实施例的基础上,在获得样本图像之后,所述方法还包括:
对所述样本图像进行噪声处理,获得加噪后的样本图像;
所述根据所述样本图像和所述机读码字符串获得训练样本,包括:
根据所述加噪后的样本图像和所述机读码字符串获得训练样本。
在具体的实施过程中,在获得样本图像后,为了提高训练获得的机读码识别模型的泛化能力,可以对样本图像添加噪声。具体可以是对图像进行模糊处理、对样本图像中的文字进行扭曲、歪斜处理等。
其中,对图像进行模糊处理可以是在样本图像上添加各种噪声,以椒盐噪声和高斯噪声为例:
椒盐噪声也称为脉冲噪声,是图像中常见的一种噪声,它是一种随机出现的白点或者黑点,可能是亮的区域有黑色像素或是在暗的区域有白色像素(或是两者皆有)。盐和胡椒噪声的成因可能是影像讯号受到突如其来的强烈干扰而产生、类比数位转换器或位元传输错误等。比如失效的感应器导致像素值为最小值。饱和的感应器导致像素值为最大值。图像模拟加入椒盐噪声是通过随机获取像素点并设置为高亮度点和低灰度点来实现的。
高斯噪声是指概率密度函数服从高斯分布的一类噪声。假设一个噪声,它的幅度分布服从高斯分布,而它的功率谱密度有事均匀分布的,则称这个噪声为高斯白噪声。高斯白噪声二阶矩不相关。一阶矩为常数,是指先后信号在时间上的相关性。
其原理为:根据Box-Muller变换原理,假设随机变量U1、U2相互独立,且均服从(0,1)之间的均匀分布,则经过下面两个式子产生的随机变量Z0,Z1服从标准高斯分布。
上式中Z0,Z1满足正态分布,其中均值为0,方差为1,变量U1和U2可以修改为下式:
可以理解的是,还可以为样本图像增加其他噪声,本申请实施例对此不作具体限定。
可以利用第三方图像处理软件对样本图像中的机读码字符串进行扭曲、歪斜处理,例如可以通过photoshop实现。
在获得加噪后的样本图像后,将加噪后的样本图像和对应的机读码字符串作为一个训练样本。
本申请实施例通过对背景图像进行预处理,增加了背景图像的噪声,从而获得的训练样本能够提高机读码识别模型的泛化能力。
在获得了充足的训练样本后,可以利用训练样本对机读码识别模型进行训练,从而获得训练好的机读码识别模型,其训练过程如图2所示,包括:
步骤201:获取训练样本;可以按照9:1的比例将获得到的训练样本进行划分,获得训练集和验证集;
步骤202:利用训练集对待训练的识别模型进行训练;将训练集中的一批样本图像输入到待训练的识别模型中,获得识别模型输出的预测结果,利用预测结果和样本图像对应的机读码字符串计算损失值,并根据损失值对待训练的识别模型中的参数进行优化。其中,待训练的识别模型可以是CRNN模型网络架构。
步骤203:利用验证集进行验证;在模型训练的同时,利用验证集中的训练样本对优化后的模型进行识别准确率测试,如果识别准确率满足预设要求,则停止训练,否则继续执行步骤202。
本申请实施例通过训练样本生成方法生成充足的训练样本,并利用这些训练样本进行模型训练,获得机读码识别模型能够提高对护照机读码识别的准确性。
图3为本申请实施例提供的一种机读码识别方法流程示意图,如图3所示,包括:
步骤301:获取待识别图像,所述待识别图像包括待识别的机读码;
步骤302:将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过上述实施例所述的方法生成的训练样本进行训练获得。
在步骤301中,获取待识别图像,待识别图像为通过图像采集装置对护照进行图像采集获得,也可以是通过专用的护照扫描器进行扫描获得。本申请实施例针对待识别图像的获得方式不作具体限定。由于护照中的机读码包含了护照持有人的信息,因此,待识别图像中需要包括待识别的机读码。
在步骤302中,识别模型为通过利用上述实施例提供的样本生成方法生成的训练样本进行模型训练获得。在获得识别模型输出的机读码后,可以再次根据机读码的命名规则对机读码进行解析,获得护照持有人的基本信息。
本申请实施例通过利用护照机读码的命名规则随机生成机读码字符串,进而获得充足的训练样本,通过充足的训练样本训练获得的机读码识别模型提高了对护照图像中机读码识别的准确性。
在上述实施例的基础上,所述将所述待识别图像输入到识别模型中,包括:
对所述待识别图像进行对象检测,获得所述待识别图像中机读码对应的识别框;
根据所述识别框对所述待识别图像进行裁剪,获得裁剪后的待识别图像;
将所述裁剪后的待识别图像输入到识别模型中。
在具体的实施过程中,为了降低识别模型的计算量,在获得待识别图像后,可以对待识别图像进行对象检测,识别出机读码在待识别图像中的位置,并用识别框将机读码框出来。可以理解的是,在进行对象检测时,可以采用预先构建的对象检测模型进行检测,对象检测模型的训练样本也可以是采用上述实施例提供的样本生成方法生成。在获得样本图像后,可以人工对样本图像进行标注,即将样本图像中的机读码用矩形框框起来,样本图像和矩形框构成了训练样本。
在获得机读码的识别框后,按照识别框将机读码图像从待识别图像中裁剪出来,获得裁剪后的待识别图像。裁剪后的待识别图像的尺寸减小后,其输入到识别模型中,识别模型的计算量也相对减少。
图4为本申请实施例提供的训练样本生成装置结构示意图,该装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述图1方法实施例对应,能够执行图1方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括:字符串生成模块401、字符图像生成模块402、图像融合模块403和样本获得模块404,其中:
字符串生成模块401用于根据护照机读码的命名规则随机生成机读码字符串;字符图像生成模块402用于根据所述机读码字符串生成包括所述机读码字符串的字符图像;图像融合模块403用于获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;样本获得模块404用于根据所述样本图像和所述机读码字符串获得训练样本。
在上述实施例的基础上,图像融合模块403具体用于:
对所述背景图像进行预处理;其中,所述预处理包括随机旋转、裁剪、填充、放大和缩小中的至少一种;
将所述字符图像与预处理后的背景图像进行融合。
在上述实施例的基础上,该装置还包括加噪模块,用于:
对所述样本图像进行噪声处理,获得加噪后的样本图像;
所述根据所述样本图像和所述机读码字符串获得训练样本,包括:
根据所述加噪后的样本图像和所述机读码字符串获得训练样本。
在上述实施例的基础上,加噪模块具体用于:
对所述样本图像进行图像模糊处理,以及对所述样本图像中的机读码字符串进行扭曲、歪斜处理。
图5为本申请实施例提供的机读码识别装置结构示意图,该装置可以是电子设备上的模块、程序段或代码。应理解,该装置与上述图3方法实施例对应,能够执行图3方法实施例涉及的各个步骤,该装置具体的功能可以参见上文中的描述,为避免重复,此处适当省略详细描述。该装置包括:图像获取模块501和识别模块502,其中:
图像获取模块501用于获取待识别图像,所述待识别图像包括待识别的机读码;识别模块502用于将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过上述实施例提供的训练样本生成方法生成的训练样本进行训练获得。
在上述实施例的基础上,识别模块502具体用于:
对所述待识别图像进行对象检测,获得所述待识别图像中机读码对应的识别框;
根据所述识别框对所述待识别图像进行裁剪,获得裁剪后的待识别图像;
将所述裁剪后的待识别图像输入到识别模型中。
图6为本申请实施例提供的电子设备实体结构示意图,如图6所示,所述电子设备,包括:处理器(processor)601、存储器(memory)602和总线603;其中,
所述处理器601和存储器602通过所述总线603完成相互间的通信;
所述处理器601用于调用所述存储器602中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:根据护照机读码的命名规则随机生成机读码字符串;根据所述机读码字符串生成包括所述机读码字符串的字符图像;获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;根据所述样本图像和所述机读码字符串获得训练样本。或
获取待识别图像,所述待识别图像包括待识别的机读码;将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过上述实施例提供的训练样本生成方法生成的训练样本进行训练获得。
处理器601可以是一种集成电路芯片,具有信号处理能力。上述处理器601可以是通用处理器,包括中央处理器(Central Processing Unit,CPU)、网络处理器(NetworkProcessor,NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各种方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器602可以包括但不限于随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(Programmable Read-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-Only Memory,EPROM),电可擦除只读存储器(Electrically Erasable Programmable Read-Only Memory,EEPROM)等。
本实施例公开一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:根据护照机读码的命名规则随机生成机读码字符串;根据所述机读码字符串生成包括所述机读码字符串的字符图像;获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;根据所述样本图像和所述机读码字符串获得训练样本。或
获取待识别图像,所述待识别图像包括待识别的机读码;将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过上述实施例提供的训练样本生成方法生成的训练样本进行训练获得。
本实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行上述各方法实施例所提供的方法,例如包括:根据护照机读码的命名规则随机生成机读码字符串;根据所述机读码字符串生成包括所述机读码字符串的字符图像;获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;根据所述样本图像和所述机读码字符串获得训练样本。或
获取待识别图像,所述待识别图像包括待识别的机读码;将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过上述实施例提供的训练样本生成方法生成的训练样本进行训练获得。
在本申请所提供的实施例中,应该理解到,所揭露装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个***,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
另外,作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
再者,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。
以上所述仅为本申请的实施例而已,并不用于限制本申请的保护范围,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种训练样本生成方法,其特征在于,包括:
根据护照机读码的命名规则随机生成机读码字符串;
根据所述机读码字符串生成包括所述机读码字符串的字符图像;
获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;
根据所述样本图像和所述机读码字符串获得训练样本。
2.根据权利要求1所述的方法,其特征在于,所述将所述字符图像与所述背景图像进行融合,包括:
对所述背景图像进行预处理;其中,所述预处理包括随机旋转、裁剪、填充、放大和缩小中的至少一种;
将所述字符图像与预处理后的背景图像进行融合。
3.根据权利要求1所述的方法,其特征在于,在获得样本图像之后,所述方法还包括:
对所述样本图像进行噪声处理,获得加噪后的样本图像;
所述根据所述样本图像和所述机读码字符串获得训练样本,包括:
根据所述加噪后的样本图像和所述机读码字符串获得训练样本。
4.根据权利要求3所述的方法,其特征在于,所述对所述样本图像进行噪声处理,包括:
对所述样本图像进行图像模糊处理,以及对所述样本图像中的机读码字符串进行扭曲、歪斜处理。
5.一种机读码识别方法,其特征在于,包括:
获取待识别图像,所述待识别图像包括待识别的机读码;
将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过如权利要求1-4任一项所述的方法生成的训练样本进行训练获得。
6.根据权利要求5所述的方法,其特征在于,所述将所述待识别图像输入到识别模型中,包括:
对所述待识别图像进行对象检测,获得所述待识别图像中机读码对应的识别框;
根据所述识别框对所述待识别图像进行裁剪,获得裁剪后的待识别图像;
将所述裁剪后的待识别图像输入到识别模型中。
7.一种训练样本生成装置,其特征在于,包括:
字符串生成模块,用于根据护照机读码的命名规则随机生成机读码字符串;
字符图像生成模块,用于根据所述机读码字符串生成包括所述机读码字符串的字符图像;
图像融合模块,用于获取护照证件的背景图像,并将所述字符图像与所述背景图像进行融合,获得样本图像;
样本获得模块,用于根据所述样本图像和所述机读码字符串获得训练样本。
8.一种机读码识别装置,其特征在于,包括:
图像获取模块,用于获取待识别图像,所述待识别图像包括待识别的机读码;
识别模块,用于将所述待识别图像输入到识别模型中,获得所述识别模型输出的机读码;其中,所述识别模型为通过如权利要求1-4任一项所述的方法生成的训练样本进行训练获得。
9.一种电子设备,其特征在于,包括:处理器、存储器和总线,其中,
所述处理器和所述存储器通过所述总线完成相互间的通信;
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1-6任一项所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令被计算机运行时,使所述计算机执行如权利要求1-6任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010829665.9A CN111931783A (zh) | 2020-08-18 | 2020-08-18 | 一种训练样本生成方法、机读码识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010829665.9A CN111931783A (zh) | 2020-08-18 | 2020-08-18 | 一种训练样本生成方法、机读码识别方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111931783A true CN111931783A (zh) | 2020-11-13 |
Family
ID=73306152
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010829665.9A Pending CN111931783A (zh) | 2020-08-18 | 2020-08-18 | 一种训练样本生成方法、机读码识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111931783A (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112528998A (zh) * | 2021-02-18 | 2021-03-19 | 成都新希望金融信息有限公司 | 证件图像处理方法、装置、电子设备及可读存储介质 |
CN112819274A (zh) * | 2020-12-30 | 2021-05-18 | 中国农业银行股份有限公司 | 金融凭证样本的生成方法、装置及相关方法 |
CN113256743A (zh) * | 2021-06-16 | 2021-08-13 | 图兮数字科技(北京)有限公司 | 一种图像处理方法、装置、电子设备以及可读存储介质 |
CN113468981A (zh) * | 2021-06-10 | 2021-10-01 | 的卢技术有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
CN114528865A (zh) * | 2022-02-22 | 2022-05-24 | 广东奥普特科技股份有限公司 | 条形码检测模型的训练方法、装置及条形码检测方法、装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108363998A (zh) * | 2018-03-21 | 2018-08-03 | 北京迈格威科技有限公司 | 一种对象的检测方法、装置、***和电子设备 |
CN110163285A (zh) * | 2019-05-23 | 2019-08-23 | 阳光保险集团股份有限公司 | 票证识别训练样本合成方法和计算机存储介质 |
CN110335330A (zh) * | 2019-07-12 | 2019-10-15 | 创新奇智(北京)科技有限公司 | 图像模拟生成方法及其***、深度学习算法训练方法及电子设备 |
CN110659633A (zh) * | 2019-08-15 | 2020-01-07 | 坎德拉(深圳)科技创新有限公司 | 图像文本信息的识别方法、装置以及存储介质 |
CN110956170A (zh) * | 2019-09-30 | 2020-04-03 | 京东数字科技控股有限公司 | 生成护照机读码样本的方法、装置、设备及存储介质 |
CN111291752A (zh) * | 2020-01-22 | 2020-06-16 | 山东浪潮通软信息科技有限公司 | 一种***识别方法及设备、介质 |
-
2020
- 2020-08-18 CN CN202010829665.9A patent/CN111931783A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108363998A (zh) * | 2018-03-21 | 2018-08-03 | 北京迈格威科技有限公司 | 一种对象的检测方法、装置、***和电子设备 |
CN110163285A (zh) * | 2019-05-23 | 2019-08-23 | 阳光保险集团股份有限公司 | 票证识别训练样本合成方法和计算机存储介质 |
CN110335330A (zh) * | 2019-07-12 | 2019-10-15 | 创新奇智(北京)科技有限公司 | 图像模拟生成方法及其***、深度学习算法训练方法及电子设备 |
CN110659633A (zh) * | 2019-08-15 | 2020-01-07 | 坎德拉(深圳)科技创新有限公司 | 图像文本信息的识别方法、装置以及存储介质 |
CN110956170A (zh) * | 2019-09-30 | 2020-04-03 | 京东数字科技控股有限公司 | 生成护照机读码样本的方法、装置、设备及存储介质 |
CN111291752A (zh) * | 2020-01-22 | 2020-06-16 | 山东浪潮通软信息科技有限公司 | 一种***识别方法及设备、介质 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112819274A (zh) * | 2020-12-30 | 2021-05-18 | 中国农业银行股份有限公司 | 金融凭证样本的生成方法、装置及相关方法 |
CN112528998A (zh) * | 2021-02-18 | 2021-03-19 | 成都新希望金融信息有限公司 | 证件图像处理方法、装置、电子设备及可读存储介质 |
CN113468981A (zh) * | 2021-06-10 | 2021-10-01 | 的卢技术有限公司 | 图像处理方法、装置、计算机设备和存储介质 |
CN113256743A (zh) * | 2021-06-16 | 2021-08-13 | 图兮数字科技(北京)有限公司 | 一种图像处理方法、装置、电子设备以及可读存储介质 |
CN114528865A (zh) * | 2022-02-22 | 2022-05-24 | 广东奥普特科技股份有限公司 | 条形码检测模型的训练方法、装置及条形码检测方法、装置 |
CN114528865B (zh) * | 2022-02-22 | 2024-02-20 | 广东奥普特科技股份有限公司 | 条形码检测模型的训练方法、装置及条形码检测方法、装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11676238B2 (en) | Detecting conflicts between multiple different signals within imagery | |
CN111931783A (zh) | 一种训练样本生成方法、机读码识别方法及装置 | |
US20210383150A1 (en) | Iterative recognition-guided thresholding and data extraction | |
CN109492643B (zh) | 基于ocr的证件识别方法、装置、计算机设备及存储介质 | |
AU2020200058B2 (en) | Image quality assessment and improvement for performing optical character recognition | |
CN106991423B (zh) | 识别规格图片中是否包含水印的方法及装置 | |
CN109635627A (zh) | 图片信息提取方法、装置、计算机设备及存储介质 | |
US20150339526A1 (en) | Systems and methods for classifying objects in digital images captured using mobile devices | |
US20230030792A1 (en) | Document authenticity identification method and apparatus, computer-readable medium, and electronic device | |
CN110222694B (zh) | 图像处理方法、装置、电子设备及计算机可读介质 | |
CN111274957A (zh) | 网页页面验证码识别方法、装置、终端和计算机存储介质 | |
CN112528998B (zh) | 证件图像处理方法、装置、电子设备及可读存储介质 | |
CN111445058A (zh) | 数据分析方法、装置、设备及计算机可读存储介质 | |
CN111027545A (zh) | 卡证图片标志检测方法、装置、计算机设备及存储介质 | |
Joshi et al. | First steps toward CNN based source classification of document images shared over messaging app | |
CN110428027B (zh) | 基于lcd防伪标签的识别验伪方法、装置、设备及介质 | |
CN110909733A (zh) | 基于ocr图片识别的模版定位方法、装置和计算机设备 | |
CN114241493B (zh) | 扩增文档分析模型的训练数据的训练方法及训练装置 | |
CN113610090B (zh) | ***图像识别分类方法、装置、计算机设备和存储介质 | |
CN115035533A (zh) | 一种数据鉴真处理方法、装置、计算机设备及存储介质 | |
CN113077355B (zh) | 保险理赔方法、装置、电子设备及存储介质 | |
CN114743016A (zh) | 一种证件真假识别方法、装置、电子设备及存储介质 | |
CN110991451A (zh) | 扫描图像的卡片区域图像的校正方法及装置 | |
CN113255683B (zh) | 一种基于神经网络的图像分割方法、***及存储介质 | |
Boned et al. | Synthetic dataset of ID and Travel Document |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |