CN111753572A - 一种基于深度学习的复杂背景低质量二维条码检测方法 - Google Patents
一种基于深度学习的复杂背景低质量二维条码检测方法 Download PDFInfo
- Publication number
- CN111753572A CN111753572A CN202010405518.9A CN202010405518A CN111753572A CN 111753572 A CN111753572 A CN 111753572A CN 202010405518 A CN202010405518 A CN 202010405518A CN 111753572 A CN111753572 A CN 111753572A
- Authority
- CN
- China
- Prior art keywords
- bar code
- dimensional bar
- image
- images
- deep learning
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 21
- 238000013135 deep learning Methods 0.000 title claims abstract description 13
- 239000011521 glass Substances 0.000 claims abstract description 18
- 238000013527 convolutional neural network Methods 0.000 claims abstract description 12
- 238000005457 optimization Methods 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000010586 diagram Methods 0.000 claims abstract description 6
- 238000007781 pre-processing Methods 0.000 claims abstract description 6
- 238000000034 method Methods 0.000 claims description 24
- 238000012549 training Methods 0.000 claims description 21
- 230000008569 process Effects 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000009499 grossing Methods 0.000 claims description 4
- 238000011176 pooling Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 4
- 238000005299 abrasion Methods 0.000 abstract description 4
- 238000005286 illumination Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 description 6
- 230000009466 transformation Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 206010063385 Intellectualisation Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000009432 framing Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 229910052704 radon Inorganic materials 0.000 description 1
- SYUHGPGVQRZVTB-UHFFFAOYSA-N radon atom Chemical compound [Rn] SYUHGPGVQRZVTB-UHFFFAOYSA-N 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
- G06K7/1417—2D bar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/011—Arrangements for interaction with the human body, e.g. for user immersion in virtual reality
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/14—Digital output to display device ; Cooperation and interconnection of the display device with other functional units
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1439—Methods for optical code recognition including a method step for retrieval of the optical code
- G06K7/1443—Methods for optical code recognition including a method step for retrieval of the optical code locating of the code in an image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1439—Methods for optical code recognition including a method step for retrieval of the optical code
- G06K7/1452—Methods for optical code recognition including a method step for retrieval of the optical code detecting bar code edges
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T19/00—Manipulating 3D models or images for computer graphics
- G06T19/006—Mixed reality
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Toxicology (AREA)
- Electromagnetism (AREA)
- Human Computer Interaction (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Graphics (AREA)
- Computer Hardware Design (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
本发明公开了一种基于深度学习的复杂背景低质量二维条码检测方法,步骤如下:步骤1,收集图像并制作成VOC2007格式的二维条码数据集;步骤2,采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取;步骤3,对接收到的图像通过现有的基于稀疏卷积核估计的算法进行预处理;步骤4,基于步骤3中的卷积核估计值,运用非凸优化算法对图像进行最后的复原处理;步骤5,利用卷积神经网络对复原后含有二维条码的图像进行特征提取;步骤6,对获取到的特征图利用改进的Faster‑RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。本发明对二维条码存在的模糊、磨损以及光照不均等问题均可准确检测定位。
Description
技术领域
本发明属于图像处理技术领域,具体涉及一种基于深度学习的复杂背景低质量二维条码检测方法。
背景技术
随着“工业4.0”和“中国制造2025”概念的不断深入,智能化和自动化逐渐成为企业生产所关注的重点。在信息物理融合***中,信息世界和物理世界的联系越来越密切,整个***都需要对周围环境有一个“感知”,这个过程就是由自动识别技术实现的。其中零件直接标刻Data Matrix技术在工业应用中更加广泛,因此快速准确检测识别产品表面的二维条码,是实现产品信息追踪管理的前提,同时也是提升物流管理效率、实现产品生产过程信息获取以及产品实时追踪的重点。
在条码检测方面,企业还是使用传统的图像处理方式来进行二维条码的检测。有利用L边对二维条码进行检测定位,利用Hough变换或者Radon变换检测直线边缘得到“L”形寻边区的位置和旋转角度,但是要想取得较好的变换精度,这种方法计算量大,如果变换精读太小降低了计算量,但是又无法取得较好的检测效果。传统的图像处理方法需要针对不同的条码检测情况设计不同的图像特征,这是一项耗费人力物力的工作,而且设计的图像特征也不具有通用性;据统计,85%的识读时间都消耗在寻找可能识读的位置上,针对复杂背景中的条码或者微小二维条码的鲁棒性较差,条码的检测时间长,识读准确率低。
中国专利公开号CN 107066914 A公开了一种复杂背景下的二维条码图像定位方法及***,所述方法包括:对二维条码图像进行预处理,获取预处理后的二维条码图像;对所述预处理后的二维条码图像进行轮廓提取处理,获取二维条码图像的条码轮廓,并作为候选条码区;判断每个候选条码区是否为矩形,去除非矩形的候选条码区;对保留下来的候选区进行矩形中心重叠去除处理,获取对边平行的候选条码区;根据所述对边平行的候选条码区获取二维条码图像的定位。上述现有技术解决了复杂背景下完整二维条码图像定位的问题,但是对于标刻在零件表面的二维条码,在零件运输过程中,难免会因为磨损或者油污导致二维条码的辨识度降低,导致条码检测的难度会加大,甚至无法达到检测定位要求,难以检测定位到二维条码。
发明内容
本发明的目的就是针对上述现有技术的不足,提供一种扩大了条码检测的适用范围,对二维条码存在模糊、部分遮挡、磨损以及光照不均的情况均可准确检测定位的基于深度学习的复杂背景低质量二维条码检测方法。
本发明采用的技术方案如下:
一种基于深度学习的复杂背景低质量二维条码检测方法,步骤如下:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器;
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理;
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理;
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
步骤1的具体步骤为:(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集;(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息,并将其转化为TFrecord格式。
步骤2的具体步骤为:(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;(b)在固定端中,将多个工业相机均匀分布在场景之中,确保工业相机可以对整个场景进行图像拍摄。
步骤3的具体步骤为:(a)采用高斯滤波对图像进行预平滑处理来构造图像的边缘;(b)选择具有边缘的图像进行卷积核估计;(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
步骤5的具体步骤为:(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力;(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图。
步骤5中,所述卷积神经网络为VGG16模型,所述VGG16模型包含13个卷积层和4个池化层。
本发明的有益效果有:
(1)本发明对二维条码图像存在模糊、部分遮挡、磨损以及光照不均的情况均可准确检测定位;
(2)本发明移动端的操作人员可以通过佩戴AR眼镜即可进行二维条码检测,AR眼镜上的相机对工作场景进行中图像获取,然后将获取的图片传输到服务器进行运算,服务器将检测的结果回传给AR眼镜,并将结果渲染到AR眼镜上,将虚实进行结合,给予操作者更加直观的感受,可以极大提高工作效率;
(3)在大视野范围下采用固定端的图像获取方式可以进行复杂大背景情况下的二维条码检测,改进了Faster-RCNN的边框回归模型,增加了角度的回归,使其更加适用于二维条码检测,可以准确检测二维条码。
附图说明
图1为本发明的流程图;
图2为本发明的移动端图像获取流程图;
图3为本发明的固定端图像获取流程图。
具体实施方式
通过以下说明和实施例对本发明的基于深度学习的复杂背景低质量二维条码检测方法作进一步的说明。
如图1-3所示,本发明它包括:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器,其中移动端最后获取的检测信息在AR眼睛上进行显示,固定端最后获取的检测信息在服务器的显示屏上进行显示;
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理,其卷积核初始化算法流程表如表1所示;
表1
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理,其卷积核优化流程如表2所示;
表2
ISD是一个迭代的方法,在每次迭代的开始,使用先前估计的核ki形成部分支持,也就是说,将大值元素放入集合Si+1中,而所有其他的元素都属于集合Si+1,Si+1被构造为:
其ki中的索引j和εs均为正数,在迭代中不断变化,从而形成部分支持。以ki的升序对所有元素进行排序,并计算每两个相邻元素之间的差d0,d1···,然后从d0开始依次检查这些差,搜寻满足dj=||ki||∞/(2h·i)的第一个元素,h是内核宽度,||ki||∞返回ki的最大值,随后将位置j的内核值分配给εs,每个集合S中的元素在优化中将减少损失,从而导致自适应内核优化过程,最小化式为:
最小化式(2)用于扩散函数(PSF)细化,其阈值通过自适应正则化轻柔地应用到函数中,该阈值使能量可以集中在重要值上,从而自动保持PSF稀疏性,更好服务去模糊过程。
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
步骤1的具体步骤为:
(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;
(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集,图像原始的分辨率均为2592*1944,包含了各种遮挡、光照不均、磨损、油污等情况;
(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息,并将其转化为TFrecord格式。
步骤2的具体步骤为:
(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;
(b)在固定端中,将多个工业相机均匀分布在场景之中,例如:选取三个工业相机,确保三个工业相机可以对整个场景进行图像拍摄。
步骤3的具体步骤为:
(a)采用高斯滤波对图像进行预平滑处理来构造图像的边缘,该高斯滤波具有以下表现形式:
(b)选择具有边缘的图像进行卷积核估计,用一种新的准则来选择用于估计的边缘,定义为:
其中B表示模糊图像,Nh(x)是一个以像素x为中心的h×h的窗口,常数0.5是为了防止在平坦区域产生较大的r。狭窄物体(尖峰)带符号的▽B(y)大部分会在中抵消,是Nh(x)中绝对梯度大小的总和,它估计窗口中图像结构的强度,r的值较小表示涉及到尖峰或平坦区域,这会导致中和许多梯度分量,然后使用掩码排除较小r值窗口的像素,由此可得掩模M的表达式为:
M=H(r-τr) (5)
其中H(·)是Heaviside阶跃函数,对于负值输出零,其他情况输出1,τr是一个阈值,用于核估计的最终选择边缘确定为:
其中表示滤波图像,τs是梯度幅值的阈值,等式(6)排除幅度的一部分,这取决于幅度和先前的掩模M,该选择过程减小了随后的卷积核估计中的歧义。经过不同迭代计算的映射表明,包括更多的边并不一定有益于卷积核估计,优化可能会被误导,尤其是在前几次迭代中,因此,图像边缘选择过程对于减少混乱至关重要。
(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
步骤5的具体步骤为:
(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力,其中卷积神经网络为VGG16模型,该VGG16模型包括13个卷积层和4个池化层;
(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;
(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图,该特征图经过4个池化层,大小都为2卷积核,将得到大小为输入图1/16的特征图,从而提高检测的效率。
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
所述改进的Faster-RCNN算法中的锚点在尺度上具有8、16和32三种条码尺寸,常规的二维条码的形状为正方形,故锚点比例取为1,而二维条码旋转的角度为 0,和这6个正负样本,其中二维条码选装的角度为预测条码和原始条码之间的夹角,夹角越小则预测越精准。
结合锚点的尺寸和二维条码旋转的角度,选取最合适的锚点进行二维条码的框选和显示,所以在提取的特征图上的每个点生成3×1×7=21个锚,其中锚点用于确定二维条码的位置信息,而二维条码旋转的角度用于确定其方向信息。
其中对候选框的损失函数采用多任务损失的形式,具体定义如下:
L(p,l,v*,v)=Lcls(p,l)+λlLreg(v*,v) (7)
l是分类标签,对于有二维条码的情况下l=1,只有背景的情况下l=0,p是经过Softmax函数计算的概率值,v*是标记的数组值,v是网络最后的预测参数,这两个参数的权衡通过参数λ来控制。而分类损失定义为:
Lcls(p,l)=-logpl (8)
对于候选框,采用L1损失函数来对二维条码的感兴趣区域进行回归,定义如下:
尺度不变的超参数计算如下:
实施例:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
具体实现步骤如下:
(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;
(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集;
(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息,并将其转化为TFrecord格式。
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器;
具体实现步骤如下:
(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;
(b)在固定端中,将三个工业相机均匀分布在场景之中,确保三个工业相机可以对整个场景进行图像拍摄。
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理;
具体实现步骤如下:
(a)采用高斯滤波对图像进行预平滑处理来构造图像的边缘;
(b)选择具有边缘的图像进行卷积核估计;
(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理;
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
具体实现步骤如下:
(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力;
(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;
(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图。
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
本发明涉及的其它未说明部分与现有技术相同。
Claims (6)
1.一种基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤如下:
步骤1:收集图像并制作成VOC2007格式的二维条码数据集;
步骤2:采用移动端的AR眼镜或固定端的工业相机进行二维条码的图像获取,并将获取的图像发送给服务器;
步骤3:对接收到的图像通过现有的基于稀疏卷积核估计的算法进行去模糊的预处理;
步骤4:基于步骤3中的卷积核估计值,运用现有的非凸优化算法对预处理后的的图像进行最后的复原处理;
步骤5:利用卷积神经网络对复原之后含有二维条码的图像进行特征提取,得到二维条码图像的特征图;
步骤6:对获取到的特征图利用改进的Faster-RCNN算法进行检测,最后得到二维条码图像和二维条码边框的坐标以及角度。
2.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤1的具体步骤为:(a)收集拍摄到的5000张原始图像,随机选取500张图像作为VOC2007内的测试集;(b)剩余的4500张图像进行数据增强扩充到18000张图像作为VOC2007内的训练集;(c)对训练集中的包含有二维条码的图像用标记工具进行标注,获取二维条码的位置和类别信息。
3.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤2的具体步骤为:(a)在移动端中,操作者配戴AR眼镜,面对工作场景,选定要获取的场景后,利用手势或者AR眼镜自带的相机进行拍摄;(b)在固定端中,将多个工业相机均匀分布在场景之中,确保工业相机可以对整个场景进行图像拍摄。
4.根据权利要求1所述的基于深度学***滑处理来构造图像的边缘;(b)选择具有边缘的图像进行卷积核估计;(c)使用预测的锐利边缘梯度作为空间先验,指导图像的初步恢复。
5.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤5的具体步骤为:(a)利用卷积神经网络在VOC2007格式的数据集上的预训练数据来增强二维条码数据集的泛化能力;(b)在训练过程中不断调整修改学习率、训练批次和迭代次数的相关参数;(c)将调整后的图像作为输入图经过特征提取器获取二维条码图像的特征图。
6.根据权利要求1所述的基于深度学习的复杂背景低质量二维条码检测方法,其特征是,步骤5中,所述卷积神经网络为VGG16模型,所述VGG16模型包含13个卷积层和4个池化层。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010405518.9A CN111753572A (zh) | 2020-05-14 | 2020-05-14 | 一种基于深度学习的复杂背景低质量二维条码检测方法 |
PCT/CN2020/109776 WO2021227289A1 (zh) | 2020-05-14 | 2020-08-18 | 一种基于深度学习的复杂背景低质量二维条码检测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010405518.9A CN111753572A (zh) | 2020-05-14 | 2020-05-14 | 一种基于深度学习的复杂背景低质量二维条码检测方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111753572A true CN111753572A (zh) | 2020-10-09 |
Family
ID=72674383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010405518.9A Pending CN111753572A (zh) | 2020-05-14 | 2020-05-14 | 一种基于深度学习的复杂背景低质量二维条码检测方法 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN111753572A (zh) |
WO (1) | WO2021227289A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114139564B (zh) * | 2021-12-07 | 2024-05-07 | Oppo广东移动通信有限公司 | 二维码检测方法、装置、终端设备及检测网络的训练方法 |
CN114943238B (zh) * | 2022-07-26 | 2022-10-14 | 北京紫光青藤微***有限公司 | 用于条码识读设备的测试设备及其测试方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091315A (zh) * | 2014-07-22 | 2014-10-08 | 中国科学技术大学 | 一种车牌图像去模糊的方法及*** |
CN107967482A (zh) * | 2017-10-24 | 2018-04-27 | 广东中科南海岸车联网技术有限公司 | 图标识别方法及装置 |
CN109961049A (zh) * | 2019-03-27 | 2019-07-02 | 东南大学 | 一种复杂场景下香烟品牌识别方法 |
CN110969589A (zh) * | 2019-12-03 | 2020-04-07 | 重庆大学 | 基于多流注意对抗网络的动态场景模糊图像盲复原方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102346850B (zh) * | 2011-10-13 | 2013-08-14 | 西北工业大学 | 复杂金属背景下DataMatrix条码区域定位方法 |
KR20170130478A (ko) * | 2015-03-30 | 2017-11-28 | 템프타임 코포레이션 | 동적 환경 데이터를 갖는 2차원 바코드 시스템, 방법, 및 장치 |
CN107066914A (zh) * | 2017-03-13 | 2017-08-18 | 广州卓德信息科技有限公司 | 一种复杂背景下的二维条码图像定位方法及*** |
CN108416412B (zh) * | 2018-01-23 | 2021-04-06 | 浙江瀚镪自动化设备股份有限公司 | 一种基于多任务深度学习的物流复合码识别方法 |
CN109165538B (zh) * | 2018-07-18 | 2021-10-22 | 苏州飞搜科技有限公司 | 基于深度神经网络的条形码检测方法及装置 |
CN110610174A (zh) * | 2019-07-16 | 2019-12-24 | 北京工业大学 | 复杂条件下银行***识别方法 |
-
2020
- 2020-05-14 CN CN202010405518.9A patent/CN111753572A/zh active Pending
- 2020-08-18 WO PCT/CN2020/109776 patent/WO2021227289A1/zh active Application Filing
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104091315A (zh) * | 2014-07-22 | 2014-10-08 | 中国科学技术大学 | 一种车牌图像去模糊的方法及*** |
CN107967482A (zh) * | 2017-10-24 | 2018-04-27 | 广东中科南海岸车联网技术有限公司 | 图标识别方法及装置 |
CN109961049A (zh) * | 2019-03-27 | 2019-07-02 | 东南大学 | 一种复杂场景下香烟品牌识别方法 |
CN110969589A (zh) * | 2019-12-03 | 2020-04-07 | 重庆大学 | 基于多流注意对抗网络的动态场景模糊图像盲复原方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2021227289A1 (zh) | 2021-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111062915B (zh) | 一种基于改进YOLOv3模型的实时钢管缺陷检测方法 | |
CN111179225B (zh) | 一种基于灰度梯度聚类的试纸表面纹理缺陷检测方法 | |
CN109977723B (zh) | 大票据图片文字识别方法 | |
Neogi et al. | Defect detection of steel surfaces with global adaptive percentile thresholding of gradient image | |
CN107784669A (zh) | 一种光斑提取及其质心确定的方法 | |
CN111915704A (zh) | 一种基于深度学习的苹果分级识别方法 | |
CN113658131B (zh) | 一种基于机器视觉巡游式环锭纺断纱检测方法 | |
CN111523540A (zh) | 基于深度学习的金属表面缺陷检测方法 | |
CN111598856A (zh) | 基于缺陷导向多点定位神经网络的芯片表面缺陷自动检测方法及*** | |
CA3136674C (en) | Methods and systems for crack detection using a fully convolutional network | |
CN109977834B (zh) | 从深度图像中分割人手与交互物体的方法和装置 | |
CN110276759B (zh) | 一种基于机器视觉的手机屏坏线缺陷诊断方法 | |
CN113177924A (zh) | 一种工业流水线产品瑕疵检测方法 | |
CN113393426A (zh) | 一种轧钢板表面缺陷检测方法 | |
CN113298809B (zh) | 基于深度学习和超像素分割的复材超声图像缺陷检测方法 | |
CN111753572A (zh) | 一种基于深度学习的复杂背景低质量二维条码检测方法 | |
CN113989604A (zh) | 基于端到端深度学习的轮胎dot信息识别方法 | |
CN111222507A (zh) | 数字式仪表读数的自动识别方法、计算机可读存储介质 | |
CN116342525A (zh) | 基于Lenet-5模型的SOP芯片引脚缺陷检测方法及*** | |
CN113705564B (zh) | 一种指针式仪表识别读数方法 | |
CN112686872B (zh) | 基于深度学习的木材计数方法 | |
CN115511775A (zh) | 一种基于语义分割的轻量型瓷砖表面缺陷检测方法 | |
CN111243006A (zh) | 一种基于图像处理的液滴接触角及尺寸的测量方法 | |
CN117197010A (zh) | 一种在激光熔覆加工中进行工件点云融合的方法及装置 | |
CN111797832A (zh) | 一种图像感兴趣区域自动生成方法及***及图像处理方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201009 |
|
RJ01 | Rejection of invention patent application after publication |