CN111753572A - 一种基于深度学习的复杂背景低质量二维条码检测方法 - Google Patents

一种基于深度学习的复杂背景低质量二维条码检测方法 Download PDF

Info

Publication number
CN111753572A
CN111753572A CN202010405518.9A CN202010405518A CN111753572A CN 111753572 A CN111753572 A CN 111753572A CN 202010405518 A CN202010405518 A CN 202010405518A CN 111753572 A CN111753572 A CN 111753572A
Authority
CN
China
Prior art keywords
bar code
dimensional bar
image
images
deep learning
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010405518.9A
Other languages
English (en)
Inventor
何卫平
魏小红
李亮
张旭
王荣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Hover Information Physics Integration Innovation Research Institute Co Ltd
AECC Aviation Power Co Ltd
Original Assignee
Nanjing Hover Information Physics Integration Innovation Research Institute Co Ltd
AECC Aviation Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Hover Information Physics Integration Innovation Research Institute Co Ltd, AECC Aviation Power Co Ltd filed Critical Nanjing Hover Information Physics Integration Innovation Research Institute Co Ltd
Priority to CN202010405518.9A priority Critical patent/CN111753572A/zh
Priority to PCT/CN2020/109776 priority patent/WO2021227289A1/zh
Publication of CN111753572A publication Critical patent/CN111753572A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1408Methods for optical code recognition the method being specifically adapted for the type of code
    • G06K7/14172D bar codes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/01Input arrangements or combined input and output arrangements for interaction between user and computer
    • G06F3/011Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/14Digital output to display device ; Cooperation and interconnection of the display device with other functional units
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1439Methods for optical code recognition including a method step for retrieval of the optical code
    • G06K7/1443Methods for optical code recognition including a method step for retrieval of the optical code locating of the code in an image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06KGRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
    • G06K7/00Methods or arrangements for sensing record carriers, e.g. for reading patterns
    • G06K7/10Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
    • G06K7/14Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
    • G06K7/1404Methods for optical code recognition
    • G06K7/1439Methods for optical code recognition including a method step for retrieval of the optical code
    • G06K7/1452Methods for optical code recognition including a method step for retrieval of the optical code detecting bar code edges
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T19/00Manipulating 3D models or images for computer graphics
    • G06T19/006Mixed reality

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Health & Medical Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Toxicology (AREA)
  • Electromagnetism (AREA)
  • Human Computer Interaction (AREA)
  • Software Systems (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Molecular Biology (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Graphics (AREA)
  • Computer Hardware Design (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Abstract

本发明公开了一种基于深度学习的复杂背景低质量二维条码检测方法,步骤如下:步骤1,收集图像并制作成VOC2007格式的二维条码数据集;步骤2,采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取;步骤3,对接收到的图像通过现有的基于稀疏卷积核估计的算法进行预处理;步骤4,基于步骤3中的卷积核估计值,运用非凸优化算法对图像进行最后的复原处理;步骤5,利用卷积神经网络对复原后含有二维条码的图像进行特征提取;步骤6,对获取到的特征图利用改进的Faster‑RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。本发明对二维条码存在的模糊、磨损以及光照不均等问题均可准确检测定位。

Description

一种基于深度学习的复杂背景低质量二维条码检测方法
技术领域
本发明属于图像处理技术领域,具体涉及一种基于深度学习的复杂背景低质量二维条码检测方法。
背景技术
随着“工业4.0”和“中国制造2025”概念的不断深入,智能化和自动化逐渐成为企业生产所关注的重点。在信息物理融合***中,信息世界和物理世界的联系越来越密切,整个***都需要对周围环境有一个“感知”,这个过程就是由自动识别技术实现的。其中零件直接标刻Data Matrix技术在工业应用中更加广泛,因此快速准确检测识别产品表面的二维条码,是实现产品信息追踪管理的前提,同时也是提升物流管理效率、实现产品生产过程信息获取以及产品实时追踪的重点。
在条码检测方面,企业还是使用传统的图像处理方式来进行二维条码的检测。有利用L边对二维条码进行检测定位,利用Hough变换或者Radon变换检测直线边缘得到“L”形寻边区的位置和旋转角度,但是要想取得较好的变换精度,这种方法计算量大,如果变换精读太小降低了计算量,但是又无法取得较好的检测效果。传统的图像处理方法需要针对不同的条码检测情况设计不同的图像特征,这是一项耗费人力物力的工作,而且设计的图像特征也不具有通用性;据统计,85%的识读时间都消耗在寻找可能识读的位置上,针对复杂背景中的条码或者微小二维条码的鲁棒性较差,条码的检测时间长,识读准确率低。
中国专利公开号CN 107066914 A公开了一种复杂背景下的二维条码图像定位方法及***,所述方法包括:对二维条码图像进行预处理,获取预处理后的二维条码图像;对所述预处理后的二维条码图像进行轮廓提取处理,获取二维条码图像的条码轮廓,并作为候选条码区;判断每个候选条码区是否为矩形,去除非矩形的候选条码区;对保留下来的候选区进行矩形中心重叠去除处理,获取对边平行的候选条码区;根据所述对边平行的候选条码区获取二维条码图像的定位。上述现有技术解决了复杂背景下完整二维条码图像定位的问题,但是对于标刻在零件表面的二维条码,在零件运输过程中,难免会因为磨损或者油污导致二维条码的辨识度降低,导致条码检测的难度会加大,甚至无法达到检测定位要求,难以检测定位到二维条码。
发明内容
本发明的目的就是针对上述现有技术的不足,提供一种扩大了条码检测的适用范围,对二维条码存在模糊、部分遮挡、磨损以及光照不均的情况均可准确检测定位的基于深度学习的复杂背景低质量二维条码检测方法。
本发明采用的技术方案如下:
一种基于深度学习的复杂背景低质量二维条码检测方法,步骤如下:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器;
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理;
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理;
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
步骤1的具体步骤为:(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集;(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息,并将其转化为TFrecord格式。
步骤2的具体步骤为:(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;(b)在固定端中,将多个工业相机均匀分布在场景之中,确保工业相机可以对整个场景进行图像拍摄。
步骤3的具体步骤为:(a)采用高斯滤波对图像进行预平滑处理来构造图像的边缘;(b)选择具有边缘的图像进行卷积核估计;(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
步骤5的具体步骤为:(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力;(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图。
步骤5中,所述卷积神经网络为VGG16模型,所述VGG16模型包含13个卷积层和4个池化层。
本发明的有益效果有:
(1)本发明对二维条码图像存在模糊、部分遮挡、磨损以及光照不均的情况均可准确检测定位;
(2)本发明移动端的操作人员可以通过佩戴AR眼镜即可进行二维条码检测,AR眼镜上的相机对工作场景进行中图像获取,然后将获取的图片传输到服务器进行运算,服务器将检测的结果回传给AR眼镜,并将结果渲染到AR眼镜上,将虚实进行结合,给予操作者更加直观的感受,可以极大提高工作效率;
(3)在大视野范围下采用固定端的图像获取方式可以进行复杂大背景情况下的二维条码检测,改进了Faster-RCNN的边框回归模型,增加了角度的回归,使其更加适用于二维条码检测,可以准确检测二维条码。
附图说明
图1为本发明的流程图;
图2为本发明的移动端图像获取流程图;
图3为本发明的固定端图像获取流程图。
具体实施方式
通过以下说明和实施例对本发明的基于深度学习的复杂背景低质量二维条码检测方法作进一步的说明。
如图1-3所示,本发明它包括:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器,其中移动端最后获取的检测信息在AR眼睛上进行显示,固定端最后获取的检测信息在服务器的显示屏上进行显示;
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理,其卷积核初始化算法流程表如表1所示;
表1
Figure BDA0002491098200000041
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理,其卷积核优化流程如表2所示;
表2
Figure BDA0002491098200000042
ISD是一个迭代的方法,在每次迭代的开始,使用先前估计的核ki形成部分支持,也就是说,将大值元素放入集合Si+1中,而所有其他的元素都属于集合Si+1,Si+1被构造为:
Figure BDA0002491098200000043
其ki中的索引j和εs均为正数,在迭代中不断变化,从而形成部分支持。以ki的升序对所有元素进行排序,并计算每两个相邻元素之间的差d0,d1···,然后从d0开始依次检查这些差,搜寻满足dj=||ki||/(2h·i)的第一个元素,h是内核宽度,||ki||返回ki的最大值,随后将位置j的内核值分配给εs,每个集合S中的元素在优化中将减少损失,从而导致自适应内核优化过程,最小化式为:
Figure BDA0002491098200000051
最小化式(2)用于扩散函数(PSF)细化,其阈值通过自适应正则化轻柔地应用到函数中,该阈值使能量可以集中在重要值上,从而自动保持PSF稀疏性,更好服务去模糊过程。
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
步骤1的具体步骤为:
(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;
(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集,图像原始的分辨率均为2592*1944,包含了各种遮挡、光照不均、磨损、油污等情况;
(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息,并将其转化为TFrecord格式。
步骤2的具体步骤为:
(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;
(b)在固定端中,将多个工业相机均匀分布在场景之中,例如:选取三个工业相机,确保三个工业相机可以对整个场景进行图像拍摄。
步骤3的具体步骤为:
(a)采用高斯滤波对图像进行预平滑处理来构造图像的边缘,该高斯滤波具有以下表现形式:
Figure BDA0002491098200000061
其中,
Figure BDA0002491098200000062
Figure BDA0002491098200000063
分别为一阶导数和二阶导数,I0表示高斯平滑的输入图像,用于迭代更新
Figure BDA0002491098200000064
的初始输入。
(b)选择具有边缘的图像进行卷积核估计,用一种新的准则来选择用于估计的边缘,定义为:
Figure BDA0002491098200000065
其中B表示模糊图像,Nh(x)是一个以像素x为中心的h×h的窗口,常数0.5是为了防止在平坦区域产生较大的r。狭窄物体(尖峰)带符号的▽B(y)大部分会在
Figure BDA0002491098200000066
中抵消,
Figure BDA0002491098200000067
是Nh(x)中绝对梯度大小的总和,它估计窗口中图像结构的强度,r的值较小表示涉及到尖峰或平坦区域,这会导致中和许多梯度分量,然后使用掩码排除较小r值窗口的像素,由此可得掩模M的表达式为:
M=H(r-τr) (5)
其中H(·)是Heaviside阶跃函数,对于负值输出零,其他情况输出1,τr是一个阈值,用于核估计的最终选择边缘确定为:
Figure BDA0002491098200000068
其中
Figure BDA0002491098200000069
表示滤波图像,τs是梯度幅值的阈值,等式(6)排除幅度的一部分,这取决于幅度
Figure BDA00024910982000000610
和先前的掩模M,该选择过程减小了随后的卷积核估计中的歧义。经过不同迭代计算的
Figure BDA00024910982000000611
映射表明,包括更多的边并不一定有益于卷积核估计,优化可能会被误导,尤其是在前几次迭代中,因此,图像边缘选择过程对于减少混乱至关重要。
(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
步骤5的具体步骤为:
(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力,其中卷积神经网络为VGG16模型,该VGG16模型包括13个卷积层和4个池化层;
(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;
(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图,该特征图经过4个池化层,大小都为2卷积核,将得到大小为输入图1/16的特征图,从而提高检测的效率。
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
所述改进的Faster-RCNN算法中的锚点在尺度上具有8、16和32三种条码尺寸,常规的二维条码的形状为正方形,故锚点比例取为1,而二维条码旋转的角度为
Figure BDA0002491098200000071
Figure BDA0002491098200000072
0,
Figure BDA0002491098200000073
Figure BDA0002491098200000074
这6个正负样本,其中二维条码选装的角度为预测条码和原始条码之间的夹角,夹角越小则预测越精准。
结合锚点的尺寸和二维条码旋转的角度,选取最合适的锚点进行二维条码的框选和显示,所以在提取的特征图上的每个点生成3×1×7=21个锚,其中锚点用于确定二维条码的位置信息,而二维条码旋转的角度用于确定其方向信息。
所述正负样本包括正样本和负样本,所述正样本的定义为旋转矩形的候选框与原标记框的交并比大于0.7,且与元标记框的夹角小于
Figure BDA0002491098200000075
所述负样本的定义为旋转矩形的候选框与原标记框的交并比小于0.3或者旋转矩形的候选框与原标记框的交并比大于0.7,且与原标记框的夹角大于
Figure BDA0002491098200000076
其他情况的样本不参与训练。
其中对候选框的损失函数采用多任务损失的形式,具体定义如下:
L(p,l,v*,v)=Lcls(p,l)+λlLreg(v*,v) (7)
l是分类标签,对于有二维条码的情况下l=1,只有背景的情况下l=0,p是经过Softmax函数计算的概率值,v*是标记的数组值,v是网络最后的预测参数,这两个参数的权衡通过参数λ来控制。而分类损失定义为:
Lcls(p,l)=-logpl (8)
对于候选框,采用L1损失函数来对二维条码的感兴趣区域进行回归,定义如下:
Figure BDA0002491098200000077
其中,
Figure BDA0002491098200000081
尺度不变的超参数计算如下:
Figure BDA0002491098200000082
Figure BDA0002491098200000083
其中x,xa和x*分别表示预测框,锚和标注真值的参数,不同形式的y,h,w和θ表示规则同x,aΘb=a-b+kπ,其中k∈Z,可以确保
Figure BDA0002491098200000084
实施例:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
具体实现步骤如下:
(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;
(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集;
(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息,并将其转化为TFrecord格式。
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器;
具体实现步骤如下:
(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;
(b)在固定端中,将三个工业相机均匀分布在场景之中,确保三个工业相机可以对整个场景进行图像拍摄。
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理;
具体实现步骤如下:
(a)采用高斯滤波对图像进行预平滑处理来构造图像的边缘;
(b)选择具有边缘的图像进行卷积核估计;
(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理;
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
具体实现步骤如下:
(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力;
(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;
(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图。
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
本发明涉及的其它未说明部分与现有技术相同。

Claims (6)

1.一种基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤如下:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器;
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理;
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理;
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
2.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤1的具体步骤为:(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集;(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息。
3.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤2的具体步骤为:(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;(b)在固定端中,将多个工业相机均匀分布在场景之中,确保工业相机可以对整个场景进行图像拍摄。
4.根据权利要求1所述的基于深度学***滑处理来构造图像的边缘;(b)选择具有边缘的图像进行卷积核估计;(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
5.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤5的具体步骤为:(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力;(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图。
6.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤5中,所述卷积神经网络为VGG16模型,所述VGG16模型包含13个卷积层和4个池化层。
CN202010405518.9A 2020-05-14 2020-05-14 一种基于深度学习的复杂背景低质量二维条码检测方法 Pending CN111753572A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010405518.9A CN111753572A (zh) 2020-05-14 2020-05-14 一种基于深度学习的复杂背景低质量二维条码检测方法
PCT/CN2020/109776 WO2021227289A1 (zh) 2020-05-14 2020-08-18 一种基于深度学习的复杂背景低质量二维条码检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010405518.9A CN111753572A (zh) 2020-05-14 2020-05-14 一种基于深度学习的复杂背景低质量二维条码检测方法

Publications (1)

Publication Number Publication Date
CN111753572A true CN111753572A (zh) 2020-10-09

Family

ID=72674383

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010405518.9A Pending CN111753572A (zh) 2020-05-14 2020-05-14 一种基于深度学习的复杂背景低质量二维条码检测方法

Country Status (2)

Country Link
CN (1) CN111753572A (zh)
WO (1) WO2021227289A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114139564B (zh) * 2021-12-07 2024-05-07 Oppo广东移动通信有限公司 二维码检测方法、装置、终端设备及检测网络的训练方法
CN114943238B (zh) * 2022-07-26 2022-10-14 北京紫光青藤微***有限公司 用于条码识读设备的测试设备及其测试方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091315A (zh) * 2014-07-22 2014-10-08 中国科学技术大学 一种车牌图像去模糊的方法及***
CN107967482A (zh) * 2017-10-24 2018-04-27 广东中科南海岸车联网技术有限公司 图标识别方法及装置
CN109961049A (zh) * 2019-03-27 2019-07-02 东南大学 一种复杂场景下香烟品牌识别方法
CN110969589A (zh) * 2019-12-03 2020-04-07 重庆大学 基于多流注意对抗网络的动态场景模糊图像盲复原方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102346850B (zh) * 2011-10-13 2013-08-14 西北工业大学 复杂金属背景下DataMatrix条码区域定位方法
KR20170130478A (ko) * 2015-03-30 2017-11-28 템프타임 코포레이션 동적 환경 데이터를 갖는 2차원 바코드 시스템, 방법, 및 장치
CN107066914A (zh) * 2017-03-13 2017-08-18 广州卓德信息科技有限公司 一种复杂背景下的二维条码图像定位方法及***
CN108416412B (zh) * 2018-01-23 2021-04-06 浙江瀚镪自动化设备股份有限公司 一种基于多任务深度学习的物流复合码识别方法
CN109165538B (zh) * 2018-07-18 2021-10-22 苏州飞搜科技有限公司 基于深度神经网络的条形码检测方法及装置
CN110610174A (zh) * 2019-07-16 2019-12-24 北京工业大学 复杂条件下银行***识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104091315A (zh) * 2014-07-22 2014-10-08 中国科学技术大学 一种车牌图像去模糊的方法及***
CN107967482A (zh) * 2017-10-24 2018-04-27 广东中科南海岸车联网技术有限公司 图标识别方法及装置
CN109961049A (zh) * 2019-03-27 2019-07-02 东南大学 一种复杂场景下香烟品牌识别方法
CN110969589A (zh) * 2019-12-03 2020-04-07 重庆大学 基于多流注意对抗网络的动态场景模糊图像盲复原方法

Also Published As

Publication number Publication date
WO2021227289A1 (zh) 2021-11-18

Similar Documents

Publication Publication Date Title
CN111062915B (zh) 一种基于改进YOLOv3模型的实时钢管缺陷检测方法
CN111179225B (zh) 一种基于灰度梯度聚类的试纸表面纹理缺陷检测方法
CN109977723B (zh) 大票据图片文字识别方法
Neogi et al. Defect detection of steel surfaces with global adaptive percentile thresholding of gradient image
CN107784669A (zh) 一种光斑提取及其质心确定的方法
CN111915704A (zh) 一种基于深度学习的苹果分级识别方法
CN113658131B (zh) 一种基于机器视觉巡游式环锭纺断纱检测方法
CN111523540A (zh) 基于深度学习的金属表面缺陷检测方法
CN111598856A (zh) 基于缺陷导向多点定位神经网络的芯片表面缺陷自动检测方法及***
CA3136674C (en) Methods and systems for crack detection using a fully convolutional network
CN109977834B (zh) 从深度图像中分割人手与交互物体的方法和装置
CN110276759B (zh) 一种基于机器视觉的手机屏坏线缺陷诊断方法
CN113177924A (zh) 一种工业流水线产品瑕疵检测方法
CN113393426A (zh) 一种轧钢板表面缺陷检测方法
CN113298809B (zh) 基于深度学习和超像素分割的复材超声图像缺陷检测方法
CN111753572A (zh) 一种基于深度学习的复杂背景低质量二维条码检测方法
CN113989604A (zh) 基于端到端深度学习的轮胎dot信息识别方法
CN111222507A (zh) 数字式仪表读数的自动识别方法、计算机可读存储介质
CN116342525A (zh) 基于Lenet-5模型的SOP芯片引脚缺陷检测方法及***
CN113705564B (zh) 一种指针式仪表识别读数方法
CN112686872B (zh) 基于深度学习的木材计数方法
CN115511775A (zh) 一种基于语义分割的轻量型瓷砖表面缺陷检测方法
CN111243006A (zh) 一种基于图像处理的液滴接触角及尺寸的测量方法
CN117197010A (zh) 一种在激光熔覆加工中进行工件点云融合的方法及装置
CN111797832A (zh) 一种图像感兴趣区域自动生成方法及***及图像处理方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20201009

RJ01 Rejection of invention patent application after publication