CN110046529B - 二维码识别方法、装置及设备 - Google Patents

二维码识别方法、装置及设备 Download PDF

Info

Publication number
CN110046529B
CN110046529B CN201811513649.8A CN201811513649A CN110046529B CN 110046529 B CN110046529 B CN 110046529B CN 201811513649 A CN201811513649 A CN 201811513649A CN 110046529 B CN110046529 B CN 110046529B
Authority
CN
China
Prior art keywords
image
dimensional code
character
recognized
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201811513649.8A
Other languages
English (en)
Other versions
CN110046529A (zh
Inventor
陈家大
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201811513649.8A priority Critical patent/CN110046529B/zh
Publication of CN110046529A publication Critical patent/CN110046529A/zh
Priority to TW108133787A priority patent/TWI726422B/zh
Priority to PCT/CN2019/114218 priority patent/WO2020119301A1/zh
Application granted granted Critical
Publication of CN110046529B publication Critical patent/CN110046529B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14172D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1439Methods for optical code recognition including a method step for retrieval of the optical code
    • G06K7/1443Methods for optical code recognition including a method step for retrieval of the optical code locating of the code in an image

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Toxicology (AREA)
  • Electromagnetism (AREA)
  • Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Image Analysis (AREA)
  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

本说明书实施例提供一种二维码识别方法、装置及设备,获取待识别图像。当待识别图像中包含二维码时,根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。根据指定个数的角点的位置坐标,确定二维码在待识别图像中所在的目标区域。对目标区域进行图像校正,得到校正后的图像。这里的图像校正至少可以包括透视变换。对校正后的图像进行二维码识别。

Description

二维码识别方法、装置及设备
技术领域
本说明书一个或多个实施例涉及图像识别领域,尤其涉及一种二维码识别方法、装置及设备。
背景技术
二维码(2-dimensional bar code)是通过按一定规律在平面的二维方向上分布的图形来记录信息的条码。其中,以QR二维码最为常见。QR二维码具有3个用于定位的类似“回”字的图案(以下称为回字特征),分别位于二维码的左上角,右上角,左下角。其识别方法可以如下:采用图像处理技术,在待识别图像中搜索二维码的3个回字特征。根据回字特征的个数和位置,恢复出正常的待识别图像。再通过二值化方法,转换成二值化点阵。最终根据二维码标准语法解析出点阵隐含的字符内容。
然而,当待识别图像不够完美时,如,待识别图像中的二维码的回字特征出现较大形变、被遮挡或者待识别图像为大角度图像。依照传统的方法通常搜索不到理想的3个回字特征,从而也就不能恢复出正常的待识别图像,最终也就无法对二维码进行识别。因此,需要提供一种鲁棒性更强的二维码识别方法。
发明内容
本说明书一个或多个实施例描述了一种二维码识别方法、装置及设备,可以对非完美图像中的二维码进行准确识别。
第一方面,提供了一种二维码识别方法,包括:
获取待识别图像;
当所述待识别图像中包含二维码时,根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点;
根据所述指定个数的角点的位置坐标,确定所述二维码在所述待识别图像中所在的目标区域;
对所述目标区域进行图像校正,得到校正后的图像;所述图像校正至少包括透视变换;
对所述校正后的图像进行二维码识别。
第二方面,提供了一种二维码识别装置,包括:
获取单元,用于获取待识别图像;
检测单元,用于当所述获取单元获取的所述待识别图像中包含二维码时,根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点;
确定单元,用于根据所述检测单元检测到的所述指定个数的角点的位置坐标,确定所述二维码在所述待识别图像中所在的目标区域;
校正单元,用于对所述确定单元确定的所述目标区域进行图像校正,得到校正后的图像;所述图像校正至少包括透视变换;
识别单元,用于对所述校正单元校正后的图像进行二维码识别。
第三方面,提供了一种二维码识别设备,包括:
存储器;
一个或多个处理器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序被所述处理器执行时实现以下步骤:
获取待识别图像;
当所述待识别图像中包含二维码时,根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点;
根据所述指定个数的角点的位置坐标,确定所述二维码在所述待识别图像中所在的目标区域;
对所述目标区域进行图像校正,得到校正后的图像;所述图像校正至少包括透视变换;
对所述校正后的图像进行二维码识别。
本说明书一个或多个实施例提供的二维码识别方法、装置及设备,获取待识别图像。当待识别图像中包含二维码时,根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。根据指定个数的角点的位置坐标,确定二维码在待识别图像中所在的目标区域。对目标区域进行图像校正,得到校正后的图像。这里的图像校正至少可以包括透视变换。对校正后的图像进行二维码识别。由此可以看出,本说明书提供的方案,在识别二维码之前,先基于深度学习检测算法,在待识别图像中确定出二维码区域。之后对二维码区域进行校正并识别。由此可以实现对非完美图像中二维码的准确识别,此外,还可以大大提升二维码的识别效率。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书提供的二维码识别***示意图;
图2为本说明书一个实施例提供的二维码识别方法流程图;
图3为本说明书提供的二维码示意图;
图4为本说明书提供的待识别区域的放大过程示意图;
图5为本说明书提供的二维码的角点示意图;
图6a为本说明书提供的校正后的图像示意图;
图6b为本说明书提供的对比度增强图像示意图;
图6c为本说明书提供的二值化图像示意图;
图7为本说明书一个实施例提供的二维码识别装置示意图;
图8为本说明书一个实施例提供的二维码识别设备示意图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
在描述本说明书提供的方案之前,先对该方案的发明构思作如下介绍:
由于受到摄像头位置、距离、角度、环境光照等因素的影响,获取的待识别二维码的图像(简称待识别图像)通常不是完美的图像。为了适应各种质量的待识别图像,传统方法通常会设计复杂的多特征融合的逻辑,也即传统的二维码识别方法的复杂度通常都比较高。这里的二维码可以是指PDF417二维码,Datamatrix二维码以及QR二维码等等。在本说明书的以下描述中,以QR二维码为例进行说明。
本申请的申请人考虑到,传统的二维码识别方法之所以复杂,是因为待识别图像本身不够完美。如果能在对待识别图像进行识别之前,先对其进行很好的校正,那么将大大降低二维码识别方法的复杂度。因此,本方案主要是针对待识别图像的前期处理流程(框架)而提出的。
首先,由于本申请是基于深度学习检测算法,来确定待识别图像的二维码区域,之后针对该二维码区域进行校正并识别。而深度学习检测算法是一种比较耗算力的算法,因此要尽量减少不必要的输入。一种实现思路可以是:先对待识别图像是否包含二维码进行判断,在判断其包含二维码的情况下才输入深度学习检测算法。
在一种实现方式中,可以在待识别图像中检测置信度比较高的回字特征。若检测到一个置信度比较高的回字特征,则可以判断该待识别图像中包含二维码。上述回字特征的置信度的判断过程可以如下:以回字特征的中心点为起点,向其周围扩展若干个像素,以得到包含回字特征的正矩形区域。针对正矩形区域进行灰度直方图统计。若统计的灰度直方图为双峰型直方图,则该回字特征的置信度比较高,否则该回字特征的置信度比较低。
在另一种实现方式中,可以尝试在待识别图像中检测3个理想的回字特征,如果检测到该3个理想的回字特征,则也可以判断该待识别图像中包含二维码。
其次,图片校正通常是一个比较耗时的过程,而因为我们最终是为了对待识别图像中的二维码进行识别,因此,为了加快待识别图像的校正效率,可以考虑仅对待识别图像中的二维码区域进行校正。那么如何从待识别图像中确定识别出二维码区域呢?
一种实现思路可以是,根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。根据指定个数的角点的位置坐标,确定待识别图像中的二维码区域。需要说明的是,上述深度学习检测算法可以是根据多张预先标定好二维码的指定个数的角点的多张图像训练得到的。
另一种实现思路可以是,根据在待识别图像中检测到的3个理想的回字特征的位置,来确定二维码区域。
最后,由于通过深度学习检测算法,可以检测出二维码的指定个数的角点。从而基于该指定个数的角点的坐标,可以同时对二维码区域进行透视变换以及镜头畸变校正等图像校正处理。当上述多种图像校正处理可以同时进行时,可以避免图像数据在内存的多次写入,这可以大大提升图像的校正效率,从而可以进一步提升二维码的识别效率。
可以理解的是,在待识别图像经过上述一系列的前期处理之后,可以大幅提升待识别图像的质量,从而使得后续识别算法能够更轻松的识别出二维码包含的内容。
基于上述发明构思,就可以得到本说明提供的方案。以下对本说明书提供的方案进行详细描述。
图1为本说明书提供的二维码识别***示意图。图1中,该二维码识别***10可以包括:特征检测模块102、角点检测模块104、图像校正模块106以及识别模块108。
特征检测模块102,用于在待识别图像中检测置信度比较高的回字特征。这里的回字特征具有如下特点:黑白像素构成的线段长度比为:1:1:3:1:1。利用这个特点,可以在待识别图像中识别出该回字特征。上述回字特征的置信度高低的判断如上所述,在此不复赘述。
角点检测模块104,用于在包含二维码的待识别图像中检测二维码的指定个数的角点。这里的包含二维码的待识别图像可以是指检测到置信度比较高的回字特征的待识别图像。如前所述,角点检测模块104具体可以通过深度学习检测算法,来检测二维码的指定个数的角点。
图像校正模块106,用于对由上述指定个数的角点的位置坐标所确定的区域(即二维码区域)进行图像校正。这里的图像校正可以包括但不限于透视变换以及镜头畸变校正等。需要说明的是,由于通过深度学习检测算法,可以检测出二维码的指定个数的角点。从而基于该指定个数的角点,可以同时对二维码区域进行透视变换以及镜头畸变校正,这可以大大提升图像校正的效率。
识别模块108,用于对图像校正后的二维码区域进行识别。如,识别输出二维码中所包含的内容。
可选地,上述二维码识别***还可以包括对比度增强模块110。对比度增强模块110,用于采用局部直方图的方法对图像校正后的二维码区域进行对比度增强,从而可以得到更好的对比度。
此外,还可以包括二值化模块112。二值化模块112,用于对图像校正后的二维码区域或者对比度增强后的二维码区域进行二值化处理,从而使得二维码区域更易于识别。
图2为本说明书一个实施例提供的二维码识别方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者***或者装置,如,可以为图1中的二维码识别***。如图2所示,所述方法具体可以包括:
步骤202,获取待识别图像。
此处,可以是通过终端设备的摄像头获取待识别图像,这里的终端设备可以是指智能手机、平板电脑、数码相机或其它类似终端设备。在获取到待识别图像之后,可以对待识别图像进行灰度处理,以得到灰度图像。需要说明的是,灰度图像中的像素点的灰度值(简称像素值)的取值范围可以为:[0,255]。
如前所述,为了减少深度学习检测算法的不必要的输入,在得到上述灰度图像之后,还可以执行如下是否包含二维码的判断步骤。该步骤具体可以是由特征检测模块102来执行,其具体可以包括:
步骤a,对灰度图像进行特征检测,以检测待识别图像中是否包含回字特征。
如前所述,本说明书中的回字特征具有1:1:3:1:1的特点,因此可以基于该特点来检测上述回字特征。需要说明的是,在待识别图像比较完美的情况下,通常可以检测出3个回字特征。而在待识别图像中的回字特征出现变形、遮挡或者待识别图像为大角度图像时,往往不能检测出理想的3个回字特征,但是单个回字特征通常还是可以检测到的,从而本说明书实施例的是否包含二维码的判断方法具有较高的鲁棒性。以图3所示的二维码为例来说,可以检测到左上角的回字特征。
步骤b,若检测到该回字特征,则以回字特征的中心点为起点,向其周围扩展若干个像素,以得到包含回字特征的正矩形区域。
这里的“周围”可以是指回字特征的四个方向,因此上述扩展的操作即为在回字特征的四个方向上分别扩展若干个像素。其中,在每个方向上所扩展像素的个数由回字特征的大小确定。具体地,根据上述1:1:3:1:1的特点可知,本说明书中的回字特征可以包含7*7个点阵单元,假设1个点阵单元与1个像素相对应,则回字特征的大小为:1*7=7个像素。在一种实现方式中,上述扩展像素的个数可以为:1*8,这里设定为8是因为最终得到的正矩形区域需包含回字特征(也即要大于7个点阵单元),这里的1代表前述1个像素。当然,在实际应用中,公式中的8也可以替换为任一大于8的数字,本说明书对此不作限定。
步骤c,针对正矩形区域进行灰度直方图统计。
这里的灰度直方图的横坐标可以为正矩形区域所包含的不同的像素值,如前所述,这里的像素值的取值范围为:[0,255],纵坐标为不同像素值的个数。
步骤d,若统计的灰度直方图为双峰型直方图,则判断待识别图像中包含二维码。
需要说明的是,上述步骤b-步骤d可以是在检测不到理想的3个回字特征时执行。若通过步骤a可以检测到3个理想的回字特征,则可以直接判断待识别图像中包含二维码,而不执行步骤b-步骤d,本说明书对此不作限定。
本说明书实施例通过检测单个置信度较高的回字特征,来判断待识别图像中是否包含二维码的方法,可以降低是否包含二维码的误识别率。
步骤204,当待识别图像中包含二维码时,根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。
此处,可以是指角点检测模块104根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。
可选地,为了确保在待识别图像包含二维码时,深度学习检测算法能够检测到该二维码的指定个数的角点,本说明书实施例在执行步骤204之前,还可以执行如下二维码大小的判断步骤,包括:
获取回字特征的大小。根据预设的换算规则以及回字特征的大小,换算二维码的大小。若二维码的大小不满足预设条件,则从待识别图像中提取以回字特征为中心的待识别区域。对该待识别区域进行放大。
上述二维码的大小的换算过程可以举例如下:假设获取的回字特征的大小为:3*7=21个像素,从而可以确定回字特征的1个点阵单元对应3个像素。且假设预设的换算规则为:二维码的大小根据1个点阵单元对应的像素个数与预设的最大二维码点阵确定。那么当预设的最大二维码点阵为:57*57时,二维码的大小可以为:3*57=171个像素。
当然,在实际应用中,上述预设的换算规则也可以设定为其它算法,如,将回字特征的大小放大预设倍数来确定二维码的大小,本说明书对此不作限定。
图4示出了待识别区域的放大过程示意图。图4中,假设待识别图像的大小为:1000*1000,且假设根据上述换算规则,换算得到的二维码的大小不满足预设条件,则可以从待识别图像中提取以回字特征为中心的待识别区域,其大小可以为400*400,之后对该400*400的待识别区域进行放大。
可以理解的是,当还执行待识别区域的放大操作时,步骤204可以替换为:根据深度学习检测算法,在放大后的待识别区域中检测二维码的指定个数的角点。
在一个例子中,步骤204中,或者上述替换后的步骤中的指定个数的角点可以是指二维码的4的角点。还以图3为例来说,检测出的4个角点可以如图5所示。
此外,本说明书中的深度学习检测算法可以是根据多张预先标定好二维码的指定个数的角点的多张图像训练得到的。通过训练该深度学习检测算法,可以模拟人眼对二维码角点的感知能力,从而得到较高的鲁棒性。当出现新的场景时,通过深度学习微调(finetune),也可以较快的更新算法。
由此可以看出,本说明书检测出的单个置信度较高的回字特征,不仅可以用于判断待识别图像中是否包含二维码,其大小还可以用于换算二维码的大小。当二维码的大小不满足预设条件时,可以对回字特征的周围区域进行放大,由此来提升二维码的角点的检测的成功率。此外,放大后的区域也可以理解为是二维码的粗定位,通过该粗定位方式,可以降低深度学习检测算法的搜索空间。
再者,本说明书实施例通过深度学习检测算法,来确定二维码区域的方法相比于传统的方法(即基于3个理想的回字特征来定位二维码区域),具有较好的鲁棒性。具体地,本说明书实施例提供的深度学习检测算法,在二维码的回字特征出现变形、被遮挡或者待识别图像为大角度图像时,也能够准确地对二维码区域进行定位。
步骤206,根据指定个数的角点的位置坐标,确定二维码在待识别图像中所在的目标区域。
以图5为例来说,该步骤确定的目标区域可以为由图中4个角点所构成的矩形区域。
步骤208,对目标区域进行图像校正,得到校正后的图像。
如,可以是由图像校正模块108来执行上述步骤206以及步骤208。
还以图5为例来说,在对其目标区域进行图像校正之后,可以得到如图6a所示的校正后的图像。
上述图像校正至少可以包括透视变换。此外,还可以包括镜头畸变校正等。需要说明的是,由于通过步骤204已经可以确定出目标区域的4个角点,所以该步骤可以直接进行透视变换。而无需先对目标区域进行镜头畸变校正,以确定目标区域的4个角点,之后再对其进行透视变换。在一种实现方式中,当还对目标区域进行镜头畸变校正时,该镜头畸变校正与透视变换可以同时进行,也即只需向内存中写入一次图像数据,从而可以大大提升图像校正的效率。
此外,由于镜头畸变校正属于非线性变化,其非常消耗资源。因此本步骤只对目标区域进行图像校正,而不对整个待识别图像进行图像校正的方式,可以大大降低运算量。
步骤210,对校正后的图像进行二维码识别。
如,可以是由识别模块110来对校正后的图像进行二维码识别。
为了使得校正后的图像更易于识别,本说明书实施例还可以对校正后的图像执行对比度增强以及二值化等图像处理步骤。具体地,先采用局部直方图的方法,对校正后的图像进行对比度增强处理,得到对比度增强图像。再对增强图像进行二值化处理,得到二值化图像。最后对二值化图像进行二维码识别。
以图6a为例来说,在对其执行对比度增强处理之后,可以得到如图6b所示的对比度增强图像。之后,当对图6b所示的图像进行二值化处理之后,可以得到如图6c所示的二值化图像。
综上,本说明书实施例提供的二维码识别方法,通过检测单个置信度较高的回字特征,来判断待识别图像中是否包含二维码。对不包含二维码的待识别图像进行丢弃,由此可以避免所有图像都经过后续比较耗算力的深度学习检测算法。此外,通过该单个置信度较高的回字特征,还可以实现二维码的粗定位,以便在二维码的大小不满足预设条件时,以该回字特征为中心,对其周围区域进行放大。再者,通过训练深度学习检测算法,来对二维码的角点进行定位,可以避免传统算法为了适应各种二维码图像质量,而设计复杂的多特征融合的逻辑。最后,基于深度学习检测算法所检测出的角点,可以同时对二维码区域进行透视变化以及镜头畸变校正等图像校正处理,从而大大提升了图像的校正效率。
与上述二维码识别方法对应地,本说明书一个实施例还提供的一种二维码识别装置,如图7所示,该装置可以包括:
获取单元702,用于获取待识别图像。
检测单元704,用于当获取单元702获取的待识别图像中包含二维码时,根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。
检测单元704的功能可以由角点检测模块104来实现。
确定单元706,用于根据检测单元704检测到的指定个数的角点的位置坐标,确定二维码在待识别图像中所在的目标区域。
校正单元708,用于对确定单元706确定的目标区域进行图像校正,得到校正后的图像,这里的图像校正至少可以包括透视变换。此外,还可以包括镜头畸变校正等。
上述确定单元706以及校正单元708的功能可以由图像校正模块106来实现。
识别单元710,用于对校正单元708校正后的图像进行二维码识别。
其中,识别单元710的功能可以由识别模块108来实现。
可选地,该装置还可以包括:判断单元712,用于对待识别图像进行特征检测,以检测待识别图像中是否包含回字特征。若检测到回字特征,则以回字特征的中心点为起点,向其周围扩展若干个像素,以得到包含回字特征的正矩形区域。针对所述正矩形区域进行灰度直方图统计。若统计的灰度直方图为双峰型直方图,则判断待识别图像中包含二维码。
上述判断单元712的功能可以由特征检测模块102来实现。
可选地,该装置还可以包括:换算单元714、提取单元716以及放大单元718。
获取单元702,还用于获取回字特征的大小。
换算单元714,用于根据预设的换算规则以及获取单元702获取的回字特征的大小,换算二维码的大小。
提取单元716,用于若换算单元714换算的二维码的大小不满足预设条件,则从待识别图像中提取以回字特征为中心的待识别区域。
放大单元718,用于对提取单元716提取的待识别区域进行放大。
检测单元704具体用于:
根据深度学习检测算法,在放大后的待识别区域中检测二维码的指定个数的角点。
识别单元710具体用于:
采用局部直方图的方法,对校正后的图像进行对比度增强处理,得到对比度增强图像。
对对比度增强图像进行二值化处理,得到二值化图像。
对二值化图像进行二维码识别。
这里的识别单元710的功能可以由上述识别模块108、对比度增强模块110以及二值化模块112共同来实现。
本说明书上述实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本说明书一个实施例提供的装置的具体工作过程,在此不复赘述。
本说明书一个实施例提供的二维码识别装置,获取单元702获取待识别图像。当待识别图像中包含二维码时,检测单元704根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。确定单元706根据指定个数的角点的位置坐标,确定二维码在待识别图像中所在的目标区域。校正单元708对目标区域进行图像校正,得到校正后的图像,这里的图像校正至少可以包括透视变换。识别单元710对校正后的图像进行二维码识别。由此,可以实现对非完美图像中二维码的准确识别,此外,还可以大大提升二维码的识别效率。
与上述二维码识别方法对应地,本说明书实施例还提供了一种二维码识别设备,如图8所示,该设备可以包括:存储器802、一个或多个处理器804以及一个或多个程序。其中,该一个或多个程序存储在存储器802中,并且被配置成由一个或多个处理器804执行,该程序被处理器804执行时实现以下步骤:
获取待识别图像。
当待识别图像中包含二维码时,根据深度学习检测算法,在待识别图像中检测二维码的指定个数的角点。
根据指定个数的角点的位置坐标,确定二维码在待识别图像中所在的目标区域。
对目标区域进行图像校正,得到校正后的图像,该图像校正至少包括透视变换。
对校正后的图像进行二维码识别。
本说明书一个实施例提供的二维码识别设备,可以实现对非完美图像中二维码的准确识别。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于服务器中。当然,处理器和存储介质也可以作为分立组件存在于服务器中。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述的具体实施方式,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。

Claims (9)

1.一种二维码识别方法,包括:
获取待识别图像;
在所述待识别图像中检测置信度比较高的一个回字特征;其中,所述置信度比较高的一个回字特征的判断过程包括:以回字特征的中心点为起点,向其周围扩展若干个像素,以得到包含回字特征的正矩形区域;针对该正矩形区域进行灰度直方图统计,若统计的灰度直方图为双峰型直方图,则判断该回字特征的置信度较高;
若检测到所述置信度比较高的一个回字特征,则判断所述待识别图像中的包含二维码;
当所述待识别图像中包含二维码时,根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点;
根据所述指定个数的角点的位置坐标,确定所述二维码在所述待识别图像中所在的目标区域;
根据所述指定个数的角点的位置坐标,对所述目标区域进行图像校正,得到校正后的图像;所述图像校正至少包括透视变换;
对所述校正后的图像进行二维码识别。
2.根据权利要求1所述的方法,在所述根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点之前,还包括:
获取所述回字特征的大小;
根据预设的换算规则以及所述回字特征的大小,换算所述二维码的大小;
若所述二维码的大小不满足预设条件,则从所述待识别图像中提取以所述回字特征为中心的待识别区域;
对所述待识别区域进行放大;
所述根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点,包括:
根据深度学习检测算法,在放大后的待识别区域中检测所述二维码的指定个数的角点。
3.根据权利要求1所述的方法,所述图像校正还包括镜头畸变校正。
4.根据权利要求1-3任一项所述的方法,所述对所述校正后的图像进行二维码识别,包括:
采用局部直方图的方法,对所述校正后的图像进行对比度增强处理,得到对比度增强图像;
对所述对比度增强图像进行二值化处理,得到二值化图像;
对所述二值化图像进行二维码识别。
5.一种二维码识别装置,包括:
获取单元,用于获取待识别图像;
检测单元,用于在所述待识别图像中检测置信度比较高的一个回字特征;其中,所述置信度比较高的一个回字特征的判断过程包括:以回字特征的中心点为起点,向其周围扩展若干个像素,以得到包含回字特征的正矩形区域;针对该正矩形区域进行灰度直方图统计,若统计的灰度直方图为双峰型直方图,则判断该回字特征的置信度较高;
若检测到所述置信度比较高的一个回字特征,则判断所述待识别图像中的包含二维码;
当所述获取单元获取的所述待识别图像中包含二维码时,根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点;
确定单元,用于根据所述检测单元检测到的所述指定个数的角点的位置坐标,确定所述二维码在所述待识别图像中所在的目标区域;
校正单元,用于根据所述指定个数的角点的位置坐标,对所述确定单元确定的所述目标区域进行图像校正,得到校正后的图像;所述图像校正至少包括透视变换;
识别单元,用于对所述校正单元校正后的图像进行二维码识别。
6.根据权利要求5所述的装置,还包括:换算单元、提取单元以及放大单元;
所述获取单元,还用于获取所述回字特征的大小;
所述换算单元,用于根据预设的换算规则以及所述获取单元获取的所述回字特征的大小,换算所述二维码的大小;
所述提取单元,用于若所述换算单元换算的所述二维码的大小不满足预设条件,则从所述待识别图像中提取以所述回字特征为中心的待识别区域;
所述放大单元,用于对所述提取单元提取的所述待识别区域进行放大;
所述检测单元具体用于:
根据深度学习检测算法,在放大后的待识别区域中检测所述二维码的指定个数的角点。
7.根据权利要求5所述的装置,所述图像校正还包括镜头畸变校正。
8.根据权利要求5-7任一项所述的装置,所述识别单元具体用于:
采用局部直方图的方法,对所述校正后的图像进行对比度增强处理,得到对比度增强图像;
对所述对比度增强图像进行二值化处理,得到二值化图像;
对所述二值化图像进行二维码识别。
9.一种二维码识别设备,包括:
存储器;
一个或多个处理器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序被所述处理器执行时实现以下步骤:
获取待识别图像;
在所述待识别图像中检测置信度比较高的一个回字特征;其中,所述置信度比较高的一个回字特征的判断过程包括:以回字特征的中心点为起点,向其周围扩展若干个像素,以得到包含回字特征的正矩形区域;针对该正矩形区域进行灰度直方图统计,若统计的灰度直方图为双峰型直方图,则判断该回字特征的置信度较高;
若检测到所述置信度比较高的一个回字特征,则判断所述待识别图像中的包含二维码;
当所述待识别图像中包含二维码时,根据深度学习检测算法,在所述待识别图像中检测所述二维码的指定个数的角点;
根据所述指定个数的角点的位置坐标,确定所述二维码在所述待识别图像中所在的目标区域;
根据所述指定个数的角点的位置坐标,对所述目标区域进行图像校正,得到校正后的图像;所述图像校正至少包括透视变换;
对所述校正后的图像进行二维码识别。
CN201811513649.8A 2018-12-11 2018-12-11 二维码识别方法、装置及设备 Active CN110046529B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN201811513649.8A CN110046529B (zh) 2018-12-11 2018-12-11 二维码识别方法、装置及设备
TW108133787A TWI726422B (zh) 2018-12-11 2019-09-19 二維碼識別方法、裝置及設備
PCT/CN2019/114218 WO2020119301A1 (zh) 2018-12-11 2019-10-30 二维码识别方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811513649.8A CN110046529B (zh) 2018-12-11 2018-12-11 二维码识别方法、装置及设备

Publications (2)

Publication Number Publication Date
CN110046529A CN110046529A (zh) 2019-07-23
CN110046529B true CN110046529B (zh) 2020-06-09

Family

ID=67273847

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811513649.8A Active CN110046529B (zh) 2018-12-11 2018-12-11 二维码识别方法、装置及设备

Country Status (3)

Country Link
CN (1) CN110046529B (zh)
TW (1) TWI726422B (zh)
WO (1) WO2020119301A1 (zh)

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110046529B (zh) * 2018-12-11 2020-06-09 阿里巴巴集团控股有限公司 二维码识别方法、装置及设备
CN110490023A (zh) * 2019-08-27 2019-11-22 广东工业大学 一种二维码形变恢复方法、装置及设备
CN110705329B (zh) * 2019-09-30 2021-09-14 联想(北京)有限公司 一种处理方法、装置及电子设备
CN112686959B (zh) * 2019-10-18 2024-06-11 菜鸟智能物流控股有限公司 待识别图像的矫正方法及装置
CN111860489A (zh) * 2019-12-09 2020-10-30 北京嘀嘀无限科技发展有限公司 一种证件图像校正方法、装置、设备及存储介质
CN110751004B (zh) * 2019-10-25 2024-04-30 北京达佳互联信息技术有限公司 二维码检测方法、装置、设备及存储介质
CN113378595B (zh) * 2020-03-10 2023-09-22 顺丰科技有限公司 二维码定位方法、装置、设备及存储介质
CN111222510B (zh) * 2020-03-13 2024-03-15 中冶长天国际工程有限责任公司 一种烧结机的台车箅条图像摄取方法及***
CN111612012A (zh) * 2020-05-25 2020-09-01 信雅达***工程股份有限公司 健康码的识别方法及装置
CN111428707B (zh) * 2020-06-08 2020-11-10 北京三快在线科技有限公司 图形识别码的识别方法、装置、存储介质及电子设备
CN111612115B (zh) * 2020-06-15 2023-10-20 支付宝(杭州)信息技术有限公司 交通卡的计次方法、装置、扫码设备和计次卡服务器
CN111723802A (zh) * 2020-06-30 2020-09-29 北京来也网络科技有限公司 一种基于ai的二维码识别方法、装置、设备和介质
CN112818979B (zh) * 2020-08-26 2024-02-02 腾讯科技(深圳)有限公司 文本识别方法、装置、设备及存储介质
CN112308899B (zh) * 2020-11-09 2024-05-07 北京经纬恒润科技股份有限公司 一种挂车角度识别方法及装置
CN112541367A (zh) * 2020-12-11 2021-03-23 上海品览数据科技有限公司 一种基于深度学习和图像处理的多种二维码识别方法
CN113935909A (zh) * 2021-09-22 2022-01-14 南方电网深圳数字电网研究院有限公司 一种二维码校正识别方法及装置
CN114139564B (zh) * 2021-12-07 2024-05-07 Oppo广东移动通信有限公司 二维码检测方法、装置、终端设备及检测网络的训练方法
EP4202856A1 (de) * 2021-12-22 2023-06-28 Bayer AG Auslesen von optisch lesbaren codes
CN116882433B (zh) * 2023-09-07 2023-12-08 无锡维凯科技有限公司 一种基于机器视觉的扫码识别方法和***

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200188A (zh) * 2014-08-25 2014-12-10 北京慧眼智行科技有限公司 一种快速定位qr码位置探测图形的方法和***
CN105260693A (zh) * 2015-12-01 2016-01-20 浙江工业大学 一种激光二维码定位方法

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104424458B (zh) * 2013-08-23 2017-08-04 希姆通信息技术(上海)有限公司 图像识别方法及装置、网络服务器、图像识别设备及***
CN104268498B (zh) * 2014-09-29 2017-09-19 杭州华为数字技术有限公司 一种二维码的识别方法及终端
CN104809422B (zh) * 2015-04-27 2017-09-05 江苏中科贯微自动化科技有限公司 基于图像处理的qr码识别方法
CN104881770A (zh) * 2015-06-03 2015-09-02 秦志勇 一种快递单信息识别***和方法
CN105046184B (zh) * 2015-07-22 2017-07-18 福建新大陆自动识别技术有限公司 基于畸变图像校正的二维码解码方法和***
CN105701434A (zh) * 2015-12-30 2016-06-22 广州卓德信息科技有限公司 二维码扭曲图像的图像校正方法
CN106951812B (zh) * 2017-03-31 2018-12-07 腾讯科技(深圳)有限公司 识别二维码的方法、装置和终端
CN108416412B (zh) * 2018-01-23 2021-04-06 浙江瀚镪自动化设备股份有限公司 一种基于多任务深度学习的物流复合码识别方法
CN108629221B (zh) * 2018-05-11 2021-08-10 南京邮电大学 一种褶皱畸变qr二维码的校正方法
CN110046529B (zh) * 2018-12-11 2020-06-09 阿里巴巴集团控股有限公司 二维码识别方法、装置及设备

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104200188A (zh) * 2014-08-25 2014-12-10 北京慧眼智行科技有限公司 一种快速定位qr码位置探测图形的方法和***
CN105260693A (zh) * 2015-12-01 2016-01-20 浙江工业大学 一种激光二维码定位方法

Also Published As

Publication number Publication date
TW202024997A (zh) 2020-07-01
WO2020119301A1 (zh) 2020-06-18
CN110046529A (zh) 2019-07-23
TWI726422B (zh) 2021-05-01

Similar Documents

Publication Publication Date Title
CN110046529B (zh) 二维码识别方法、装置及设备
US10817741B2 (en) Word segmentation system, method and device
KR101617681B1 (ko) 히스토그램들을 갖는 다중 층 연결 요소들을 사용하는 텍스트 검출
CN107220640B (zh) 字符识别方法、装置、计算机设备和计算机可读存储介质
US9076056B2 (en) Text detection in natural images
CN109117846B (zh) 一种图像处理方法、装置、电子设备和计算机可读介质
WO2018059365A1 (zh) 图形码处理方法及装置、存储介质
CN110647882A (zh) 图像校正方法、装置、设备及存储介质
US11341739B2 (en) Image processing device, image processing method, and program recording medium
US20200302135A1 (en) Method and apparatus for localization of one-dimensional barcodes
CN112307786B (zh) 一种多个不规则二维码批量定位识别方法
CN112163443A (zh) 一种扫码方法、扫码装置及移动终端
CN113557520A (zh) 字符处理及字符识别方法、存储介质和终端设备
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
CN113129298A (zh) 文本图像的清晰度识别方法
CN114998347B (zh) 一种半导体面板角点定位方法及装置
CN116976372A (zh) 基于方形基准码的图片识别方法、装置、设备及介质
CN113065480B (zh) 书法作品风格的识别方法、装置、电子装置和存储介质
CN115223173A (zh) 对象识别方法、装置、电子设备及存储介质
CN115527215A (zh) 包含文本的图像处理方法、***及存储介质
CN111768384B (zh) 基于三维扫描成像的细胞计数方法及***
CN109389000B (zh) 一种条形码识别方法及应用该方法的计算机
CN109871910B (zh) 一种手写字符识别方法及装置
CN110245668B (zh) 基于图像识别的终端信息获取方法、获取装置及存储介质
JP7478628B2 (ja) 画像処理装置、制御方法及び制御プログラム

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40011374

Country of ref document: HK

TR01 Transfer of patent right

Effective date of registration: 20201013

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201013

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Patentee after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Patentee before: Alibaba Group Holding Ltd.

TR01 Transfer of patent right