CN114528865B - 条形码检测模型的训练方法、装置及条形码检测方法、装置 - Google Patents

条形码检测模型的训练方法、装置及条形码检测方法、装置 Download PDF

Info

Publication number
CN114528865B
CN114528865B CN202210162962.1A CN202210162962A CN114528865B CN 114528865 B CN114528865 B CN 114528865B CN 202210162962 A CN202210162962 A CN 202210162962A CN 114528865 B CN114528865 B CN 114528865B
Authority
CN
China
Prior art keywords
bar code
sample data
training
data
detection model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202210162962.1A
Other languages
English (en)
Other versions
CN114528865A (zh
Inventor
高红超
江维
李昌源
刘华祠
曹继华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong OPT Machine Vision Co Ltd
Original Assignee
Guangdong OPT Machine Vision Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong OPT Machine Vision Co Ltd filed Critical Guangdong OPT Machine Vision Co Ltd
Priority to CN202210162962.1A priority Critical patent/CN114528865B/zh
Publication of CN114528865A publication Critical patent/CN114528865A/zh
Application granted granted Critical
Publication of CN114528865B publication Critical patent/CN114528865B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14131D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K19/00Record carriers for use with machines and with at least a part designed to carry digital markings
    • G06K19/06Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
    • G06K19/06009Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking
    • G06K19/06018Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking one-dimensional coding
    • G06K19/06028Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking one-dimensional coding using bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K19/00Record carriers for use with machines and with at least a part designed to carry digital markings
    • G06K19/06Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code
    • G06K19/06009Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking
    • G06K19/06037Record carriers for use with machines and with at least a part designed to carry digital markings characterised by the kind of the digital marking, e.g. shape, nature, code with optically detectable marking multi-dimensional coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14172D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Toxicology (AREA)
  • Electromagnetism (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开了一种条形码检测模型的训练方法、装置及条形码检测方法、装置,仅需要少量的初始样本数据,即可获得大量的、高质量的训练数据,基于该数据训练得到的条形码检测模型的通用性强、鲁棒性高,可适合多种不同工业场景下读码定位,可以对工业常用的任意角度的QRCode、Data Matrix二维码与一维码进行定位和识别,具有标注数据少、生成训练数据质量高、训练得到的定位模型检测准确率高、速度快等优点。

Description

条形码检测模型的训练方法、装置及条形码检测方法、装置
技术领域
本发明属于机器视觉技术领域,尤其涉及一种条形码检测模型的训练方法、装置及条形码检测方法、装置。
背景技术
条形码(barcode)是将宽度不等的多个黑条和空白,按照一定的编码规则排列,用以表达一组信息的图形标识符,包括一维条形码(一维码)和二维条形码(二维码)。随着智能化工业生产需求的不断提高,智能制造***的复杂性不断增加,利用一维码和二维码对工业产品及零部件进行标识,实现对产品及零部件的生成追踪,装配管理,生命周期维护等已经成为自动化工业的行业标准。同时,二维码在仓储物流、文件管理、票务信息存储和处理等方面的应用使得这些领域的便捷性有了显著提升。
与民用条形码不同,工业条形码的应用环境通常较为复杂,例如存在失真、模糊、磨损、对比度低、无静止区、噪声干扰严重等问题,导致常规的检测定位方法无法满足其需求。
基于深度学习的检测定位方法在鲁棒性、准确率方面都优于常规的检测定位方法,然而,基于深度学习训练模型时则需要规模较大的训练数据,同时该方法实施起来对硬件要求也较高。
发明内容
本发明提供了一种条形码检测模型的训练方法、装置及条形码检测方法、装置,可以解决或者至少部分解决上述技术问题。
为此,本发明采用以下技术方案:
第一方面,提供了一种条形码检测模型的训练方法,包括:
获取第一样本数据,所述第一样本数据包括第一数量的带有条形码图形的条形码图片,所述条形码图形包括一维码和/或二维码;
获取第二样本数据,所述第二样本数据包括第二数量的不带有条形码图形的背景图片;
基于所述第一样本数据和所述第二样本数据,生成第三样本数据,所述第三样本数据包括第三数量的训练数据,所述训练数据由所述条形码图形和所述背景图片组合得到,所述第三数量大于所述第二数量和第一数量;
基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型。
可选地,所述基于所述第一样本数据和所述第二样本数据,生成第三样本数据,包括:
分别裁剪所述第一数量的条形码图片,得到所述条形码图片中的条形码图形;
对裁剪得到的条形码图形进行几何图像变化操作,得到所述几何图像变化操作后的条形码图形;
将所述几何图像变化操作后的条形码图形分别随机贴到所述第二数量的背景图片上,生成所述第三数量的训练数据。
可选地,所述基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型,包括:
基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,对于每一批次的第三样本数据,依次经过特征提取、特征融合、目标预测、损失计算和参数更新等阶段,逐步调整模型参数,训练得到所述条形码的检测模型。
可选地,在所述特征提取阶段,提取得到所述第三样本数据的特征图。
可选地,在所述特征融合阶段,输入至卷积神经网络中的特征图大小分别缩小为第一尺寸大小、第二尺寸大小和第三尺寸大小。
可选地,在所述目标预测阶段,对所述特征融合阶段得到的数据进行预测,分别得到所述第三样本数据中条形码图形的中心点的横坐标、中心点的纵坐标、宽、高和旋转角度。
可选地,所述几何图像变化操作包括翻转、旋转、缩放、模糊、加噪、彩色转换和随机擦除中的至少一种。
第二方面,提供了一种条形码检测方法,包括:
获取待检测的目标图片;
基于如上所述的方法训练得到的条形码的检测模型,检测所述目标图片中的条形码,若存在则输出条形码的位置和类别。
第三方面,提供了一种条形码检测模型的训练装置,包括:
第一获取单元,用于获取第一样本数据,所述第一样本数据包括第一数量的带有条形码图形的条形码图片,所述条形码图形包含一维码和/或二维码;
第二获取单元,用于获取第二样本数据,所述第二样本数据包括第二数量的不带有条形码图形的背景图片;
生成单元,用于基于所述第一样本数据和所述第二样本数据,生成第三样本数据,所述第三样本数据包括第三数量的训练数据,所述训练数据由所述条形码图形和所述背景图片组合得到,所述第三数量大于所述第二数量和第一数量;
模型训练单元,用于基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型。
第四方面,提供了一种条形码检测装置,包括:
图片获取模块,用于获取待检测的目标图片;
条形码检测模块,用于基于如上所述的方法训练得到的条形码的检测模型,检测所述目标图片中的条形码,若存在则输出条形码的位置和类别。
与现有技术相比,本发明实施例具有以下有益效果:
本发明实施例提供的一种条形码检测模型的训练方法、装置及条形码检测方法、装置,仅需要少量的第一样本数据(第一数量的条形码图片)和便于获取的第二样本数据,即可获得大量的、高质量的第三样本数据(第三数量的训练数据),基于该数据训练得到的条形码检测模型的通用性强、鲁棒性高,准确率高、检测速度快,适合多种不同工业场景下读码定位,可以对工业常用的任意角度的QRCode、Data Matr ix二维码与一维码进行定位和识别。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本发明可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本发明所能产生的功效及所能达成的目的下,均应仍落在本发明所揭示的技术内容所能涵盖的范围内。
图1和图2为本实施例提供的条形码检测模型的训练方法的方法流程图;
图3为本实施例提供的条形码检测方法的方法流程图;
图4为本实施例提供的条形码检测模型的训练装置的组成单元图;
图5为本实施例提供的条形码检测装置的组成模块图;
图6为本实施例提供的检测模型的网络结构图;
具体实施方式
为使得本发明的目的、特征、优点能够更加的明显和易懂,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,下面所描述的实施例仅仅是本发明一部分实施例,而非全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
请参阅图1至图6所示。
如图1~图3所示,本实施例提供了一种条形码检测模型的训练方法和条形码检测方法,具有对数据依赖量少、生成数据质量高、模型通用性强、鲁棒性高等优点,用于解决现有技术中的一维码或二维码依赖数据规模大、通用性差、鲁棒性低等问题。具体地,如图1所示,条形码检测模型的训练方法包括以下步骤:
S11、获取第一样本数据,所述第一样本数据包括第一数量的带有条形码图形的条形码图片,所述条形码图形包括一维码和/或二维码;可选地,一个条形码图形可以包括一个或多个一维码,或者包括一个或多个二维码,也可以同时包括一个或多个一维码以及一个或多个二维码。
S12、获取第二样本数据,所述第二样本数据包括第二数量的不带有条形码图形的背景图片;
S13、基于所述第一样本数据和所述第二样本数据,生成第三样本数据,所述第三样本数据包括第三数量的训练数据,所述训练数据由所述条形码图形和所述背景图片组合得到,所述第三数量大于所述第二数量和第一数量;可选地,组合得到的训练数据可以包括:一维码和背景图片的组合数据,二维码和背景图片的组合数据,或者一维码、二维码和背景图片的组合数据。
S14、基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型。
在步骤S11中,第一样本数据仅需要包括少量的条形码图片,条形码图片中的条形码图形可以是带旋转角度的,也可以是不带旋转角度的。具体地,收集第一样本数据后,可以对条形码图形的矩形框进行标注,然后根据标注信息对每个条形码图形进行裁剪,生成数据集。
步骤S12~S13的目的为生成大量的训练数据,即第三样本数据。需要说明的是,第二样本数据相对于第一样本数据更容易获取,例如可以使用工业相机拍摄图片或者网络爬虫抓取图片等手段,以获得背景图片。在步骤S13中,通过将条形码图形和背景图片组合,可以获得大量(即第三数量)的训练数据。然后经过步骤S14,可以顺利训练得到条形码的检测模型。
如图2所示,作为本实施例的一种可选实施方式,步骤S13具体包括以下步骤:
S131、分别裁剪所述第一数量的条形码图片,得到所述条形码图片中的条形码图形;
S132、对裁剪得到的条形码图形进行几何图像变化操作,得到所述几何图像变化操作后的条形码图形;
S133、将所述几何图像变化操作后的条形码图形分别随机贴到所述第二数量的背景图片上,生成所述第三数量的训练数据。
其中,所述几何图像变化操作包括翻转、旋转、缩放、模糊、加噪、彩色转换和随机擦除中的至少一种。需要说明的是,在进行几何图像变化操作时,可以随机选择翻转、旋转、缩放、模糊、加噪、彩色转换和随机擦除中的至少一种进行操作。
需要说明的是,本实施例不仅可以使用第三样本数据进行模型训练,还可以选择原始的第一样本数据对模型进行训练。
对于步骤S133,在随机贴的过程中,随机生成预粘贴的位置,计算和已粘贴区域的IOU(图像交并比)最大值Max_IOU,若Max_IOU<0.1(表示和已粘贴区域不重复或者重复率较低)则粘贴到该位置,并记录该位置的条形码信息。
进一步地,如图6所示,检测模型的网络结构包括特征提取、特征融合和目标预测三部分。因此,步骤S14可以包括以下步骤:
基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,对于每一批次的第三样本数据,依次经过特征提取、特征融合、目标预测、损失计算和参数更新等阶段,逐步调整模型参数,训练得到所述条形码的检测模型。
具体地,在所述特征提取阶段,提取得到第三样本数据的特征图。
进一步地,在所述特征融合阶段,输入至卷积神经网络中的特征图大小分别缩小为第一尺寸大小、第二尺寸大小和第三尺寸大小,所述特征图为所述第三样本数据经过所述特征提取阶段提取得到的。例如,第一尺寸(宽或高)为目标图像尺寸的16分之一,第二尺寸为32分之一,第三尺寸为64分之一,可以降低模型规模,提高检测效率。
进一步地,本实施例在所述目标预测阶段,对所述特征融合阶段得到的数据进行预测,分别得到所述第三样本数据中条形码图形的中心点的横坐标x、中心点的纵坐标y、宽w、高h和旋转角度θ。相比于现有技术,本实施例预测的目标框的描述增加有旋转角度θ,因此可以对工业常用的任意角度的QRCode、Data Matrix二维码与一维码进行定位和识别。
具体地,在目标预测阶段,对条形码数据进行聚类分析,网络结构设计3个Head,每个Head有4个锚框,预测的目标框的描述增加有旋转角度θ。
模型的计算量计算公式为:
其中,C/中的C表示卷积核的个数,表示第层卷积;K表示卷积核的大小,例如,具体的卷积核的大小可以表示为K*K、3*3等;N表示网络有N个卷积层;Fw表示特征图的宽;Fh表示特征图的高。
作为本实施例的一种具体应用场景,假如检测模型为YOLO V5,对于输入的待检测的目标图片,该待检测的目标图片的参数为WxH(其中,W为目标图片的宽,H为目标图片的高),本实施例模型中,输入至卷积神经网络的特征图大小缩小为w/8*h/8(表征w缩小为原来的八分之一,h缩小为原来的八分之一)、w/16*h/16和w/32*h/32,可以提高检测速度。
进一步地,本实施例将现有的预测的目标框的描述(x,y,w,h),修改为(x,y,w,h,θ),即增加了图像的旋转角度θ描述,具备对带有旋转角度的二维码和一维码的检测能力。
具体地,该网络结构可检查QRCode、Data Matrix二维码、一维码三种类型的常用码,每一层目标预测模块包含4种不同规模的锚框,因此该模块的输出维度为:
4*(x,y,w,h,θ,conf,pdm,pqr,pbarcode)=36
其中,x,y,w,h,θ分别代表框的中心点坐标(x,y),宽w,高h和旋转角度θ,有无条形码的置信度conf,属于DM,QR和一维码的概率分别为pdm,pqr,pbarcode
进一步地,模型的损失函数为:
Loss=λcoord∑loss(xy)+λcoord∑loss(wh)+λconf∑loss(conf)+λcls∑loss(cls)+λangle∑loss(θ)
其中,loss(xy)表示模型预测码的中心点损失,loss(wh)表示模型预测码的宽、高的损失,loss(conf)表示模型预测的是否是码的置信度损失,loss(cls)表示模型预测的类别损失,loss(θ)表示模型预测角度的损失。
具体地,模型的优化器可以选用Adam优化算法,momentum:0.937,初始化学习率0.01,训练数据规模50万张图片,训练90轮后停止。
请参阅图3所示,本实施例提供的条形码检测方法,包括以下步骤:
S21、获取待检测的目标图片;
S22、基于如上所述的训练方法训练得到的条形码的检测模型,检测所述目标图片中的条形码,若存在则输出条形码的位置和类别(例如一维码或二维码)。
具体地,通过模型对所述待检测的目标图片进行特征提取,通过目标预测获得大量的候选二维码或一维码目标候选框;然后利用非极大值抑制算法从候选框中删除冗余的候选框,设定合适的阈值τ,输出候选框的置信度conf i>τ的目标框。
本实施例提供的一种条形码检测方法,仅需要少量的第一样本数据(第一数量的条形码图片),即可获得大量的、高质量的第三样本数据(第三数量的训练数据);基于该数据训练得到的条形码检测模型的通用性强、鲁棒性高,适合多种不同工业场景下读码定位,可以对工业常用的任意角度的QRCode、Data Matr i x二维码与一维码进行定位和识别,具有检测速度快、通用性高和检测准确率高等优点。
如图4所示,在本申请的另一实施例中,提供了一种条形码检测模型的训练装置,可用于实现上述的条形码检测模型的训练方法,具体包括:
第一获取单元11,用于获取第一样本数据,所述第一样本数据包括第一数量的带有条形码图形的条形码图片,所述条形码图形包含一维码和/或二维码;
第二获取单元12,用于获取第二样本数据,所述第二样本数据包括第二数量的不带有条形码图形的背景图片,所述第二数量大于所述第一数量;
生成单元13,用于基于所述第一样本数据和所述第二样本数据,生成第三样本数据,所述第三样本数据包括第三数量的训练数据,所述训练数据由所述条形码图形和所述背景图片组合得到,所述第三数量大于所述第二数量;
模型训练单元14,用于基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型。
由于具体如何实现条形码检测模型的训练方法已在上述阐明,此处不再赘述。与现有技术相比,本实施例提供的条形码检测模型的训练装置,仅需要少量的初始样本数据,即可获得大量的、高质量的训练样本数据,具有标注数据少、生成训练数据质量高、训练得到的定位模型检测准确率高、速度快等优点。
如图5所示,在本申请的另一实施例中,还提供了一种条形码检测装置,具体包括:
图片获取模块21,用于获取待检测的目标图片;
条形码检测模块22,用于基于如上所述的训练方法训练得到的条形码的检测模型,检测所述目标图片中的条形码,若存在则输出条形码的位置和类别(例如一维码或二维码)。
由于具体如何实现条形码检测模型的训练方法和实现条形码检测方法已在上述阐明,此处不再赘述。与现有技术相比,本实施例提供的条形码检测装置,仅需要少量的初始样本数据,即可获得大量的、高质量的训练样本数据,具有标注数据少、生成训练数据质量高、训练得到的定位模型检测准确率高、速度快等优点。
以上所述,以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (8)

1.条形码检测模型的训练方法,其特征在于,包括:
获取第一样本数据,所述第一样本数据包括第一数量的带有条形码图形的条形码图片,所述条形码图形包括一维码和/或二维码;
获取第二样本数据,所述第二样本数据包括第二数量的不带有条形码图形的背景图片;
基于所述第一样本数据和所述第二样本数据,生成第三样本数据,所述第三样本数据包括第三数量的训练数据,所述训练数据由所述条形码图形和所述背景图片组合得到,所述第三数量大于所述第二数量和第一数量;
基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型;
所述基于所述第一样本数据和所述第二样本数据,生成第三样本数据,包括:
分别裁剪所述第一数量的条形码图片,得到所述条形码图片中的条形码图形;
对裁剪得到的条形码图形进行几何图像变化操作,得到所述几何图像变化操作后的条形码图形;
将所述几何图像变化操作后的条形码图形分别随机贴到所述第二数量的背景图片上,生成所述第三数量的训练数据;
所述基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型,包括:
基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,对于每一批次的第三样本数据,依次经过特征提取、特征融合、目标预测、损失计算和参数更新等阶段,逐步调整模型参数,训练得到所述条形码的检测模型;
所述条形码图形的目标框包括中心横坐标描述x、中心纵坐标描述y、框体高度描述h、框体宽度描述w和框体旋转角度描述θ。
2.根据权利要求1所述的训练方法,其特征在于,在所述特征提取阶段,提取得到所述第三样本数据的特征图。
3.根据权利要求1所述的训练方法,其特征在于,在所述特征融合阶段,输入至卷积神经网络中的特征图大小分别缩小为第一尺寸大小、第二尺寸大小和第三尺寸大小。
4.根据权利要求1所述的训练方法,其特征在于,在所述目标预测阶段,对所述特征融合阶段得到的数据进行预测,分别得到所述第三样本数据中条形码图形的中心点的横坐标、中心点的纵坐标、宽、高和旋转角度。
5.根据权利要求1所述的训练方法,其特征在于,所述几何图像变化操作包括翻转、旋转、缩放、模糊、加噪、彩色转换和随机擦除中的至少一种。
6.条形码检测方法,其特征在于,包括:
获取待检测的目标图片;
基于权利要求1~5中任一所述的方法训练得到的条形码的检测模型,检测所述目标图片中的条形码,若存在则输出条形码的位置和类别。
7.条形码检测模型的训练装置,其特征在于,包括:
第一获取单元,用于获取第一样本数据,所述第一样本数据包括第一数量的带有条形码图形的条形码图片,所述条形码图形包含一维码和/或二维码;
第二获取单元,用于获取第二样本数据,所述第二样本数据包括第二数量的不带有条形码图形的背景图片;
生成单元,用于基于所述第一样本数据和所述第二样本数据,生成第三样本数据,所述第三样本数据包括第三数量的训练数据,所述训练数据由所述条形码图形和所述背景图片组合得到,所述第三数量大于所述第二数量和第一数量;
所述生成单元依如下步骤生成第三样本数据:
分别裁剪所述第一数量的条形码图片,得到所述条形码图片中的条形码图形;
对裁剪得到的条形码图形进行几何图像变化操作,得到所述几何图像变化操作后的条形码图形;
将所述几何图像变化操作后的条形码图形分别随机贴到所述第二数量的背景图片上,生成所述第三数量的训练数据;
模型训练单元,用于基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,训练得到条形码的检测模型;
所述模型训练单元依据如下步骤训练得到条形码的检测模型:
基于所述第三样本数据和所述第三样本数据中的条形码图形的目标框,对于每一批次的第三样本数据,依次经过特征提取、特征融合、目标预测、损失计算和参数更新等阶段,逐步调整模型参数,训练得到所述条形码的检测模型。
8.条形码检测装置,其特征在于,包括:
图片获取模块,用于获取待检测的目标图片;
条形码检测模块,用于基于权利要求1~7中任一所述的方法训练得到的条形码的检测模型,检测所述目标图片中的条形码,若存在则输出条形码的位置和类别。
CN202210162962.1A 2022-02-22 2022-02-22 条形码检测模型的训练方法、装置及条形码检测方法、装置 Active CN114528865B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210162962.1A CN114528865B (zh) 2022-02-22 2022-02-22 条形码检测模型的训练方法、装置及条形码检测方法、装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210162962.1A CN114528865B (zh) 2022-02-22 2022-02-22 条形码检测模型的训练方法、装置及条形码检测方法、装置

Publications (2)

Publication Number Publication Date
CN114528865A CN114528865A (zh) 2022-05-24
CN114528865B true CN114528865B (zh) 2024-02-20

Family

ID=81625708

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210162962.1A Active CN114528865B (zh) 2022-02-22 2022-02-22 条形码检测模型的训练方法、装置及条形码检测方法、装置

Country Status (1)

Country Link
CN (1) CN114528865B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115310469B (zh) * 2022-10-12 2023-02-14 广东奥普特科技股份有限公司 条形码定位模型训练方法、定位方法、***、设备及介质
CN117036767A (zh) * 2023-04-10 2023-11-10 广东奥普特科技股份有限公司 二维码识别方法、装置、设备和存储介质
US12020114B1 (en) * 2024-01-22 2024-06-25 The DTX Company Real-time comprehensive quick response (“QR”) code testing for reliable scanning

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376830A (zh) * 2018-10-17 2019-02-22 京东方科技集团股份有限公司 二维码生成方法及装置
CN111523610A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种样本高效标注的物品识别方法
CN111861955A (zh) * 2020-06-22 2020-10-30 北京百度网讯科技有限公司 构建图像编辑模型的方法以及装置
CN111931783A (zh) * 2020-08-18 2020-11-13 创新奇智(重庆)科技有限公司 一种训练样本生成方法、机读码识别方法及装置
CN112183150A (zh) * 2020-10-16 2021-01-05 上海了物网络科技有限公司 图像二维码及其制备方法、解析装置和解析方法
CN112580382A (zh) * 2020-12-28 2021-03-30 哈尔滨工程大学 基于目标检测二维码定位方法
CN112949338A (zh) * 2021-03-16 2021-06-11 太原科技大学 深度学习与Hough变换结合的二维条码精确定位方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109376830A (zh) * 2018-10-17 2019-02-22 京东方科技集团股份有限公司 二维码生成方法及装置
CN111523610A (zh) * 2020-05-06 2020-08-11 青岛联合创智科技有限公司 一种样本高效标注的物品识别方法
CN111861955A (zh) * 2020-06-22 2020-10-30 北京百度网讯科技有限公司 构建图像编辑模型的方法以及装置
CN111931783A (zh) * 2020-08-18 2020-11-13 创新奇智(重庆)科技有限公司 一种训练样本生成方法、机读码识别方法及装置
CN112183150A (zh) * 2020-10-16 2021-01-05 上海了物网络科技有限公司 图像二维码及其制备方法、解析装置和解析方法
CN112580382A (zh) * 2020-12-28 2021-03-30 哈尔滨工程大学 基于目标检测二维码定位方法
CN112949338A (zh) * 2021-03-16 2021-06-11 太原科技大学 深度学习与Hough变换结合的二维条码精确定位方法

Also Published As

Publication number Publication date
CN114528865A (zh) 2022-05-24

Similar Documents

Publication Publication Date Title
CN114528865B (zh) 条形码检测模型的训练方法、装置及条形码检测方法、装置
CN112232349B (zh) 模型训练方法、图像分割方法及装置
CN110322495B (zh) 一种基于弱监督深度学习的场景文本分割方法
CN113591967B (zh) 一种图像处理方法、装置、设备及计算机存储介质
CN111680690B (zh) 一种文字识别方法及装置
CN111209858B (zh) 一种基于深度卷积神经网络的实时车牌检测方法
CN112949338A (zh) 深度学习与Hough变换结合的二维条码精确定位方法
CN111242026B (zh) 一种基于空间层次感知模块和度量学习的遥感图像目标检测方法
CN113392669B (zh) 一种图像信息检测方法、检测装置及存储介质
CN111833237A (zh) 基于卷积神经网络和局部单应性变换的图像配准方法
CN111860027A (zh) 二维码的识别方法及装置
CN114119480A (zh) 一种基于深度学习的裂纹缺陷检测***
CN116994140A (zh) 基于遥感影像的耕地提取方法、装置、设备和介质
CN111523429A (zh) 基于深度学习的堆钢识别方法
CN111680680B (zh) 一种目标码定位方法、装置、电子设备及存储介质
CN114677596A (zh) 一种基于注意力模型的遥感图像船舶检测方法和装置
CN115761225A (zh) 一种基于神经网络可解释性的图像标注方法
CN116612280A (zh) 车辆分割方法、装置、计算机设备和计算机可读存储介质
CN111783608A (zh) 一种换脸视频检测方法
CN112580382B (zh) 基于目标检测二维码定位方法
CN110991201A (zh) 条码检测方法及相关装置
CN111597845A (zh) 一种二维码检测方法、装置、设备及可读存储介质
CN115909378A (zh) 单据文本检测模型的训练方法及单据文本检测方法
CN113657225B (zh) 一种目标检测方法
CN113486879A (zh) 图像区域建议框检测方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant