CN113569829A - 集装箱编码数据识别方法及*** - Google Patents

集装箱编码数据识别方法及*** Download PDF

Info

Publication number
CN113569829A
CN113569829A CN202110643866.4A CN202110643866A CN113569829A CN 113569829 A CN113569829 A CN 113569829A CN 202110643866 A CN202110643866 A CN 202110643866A CN 113569829 A CN113569829 A CN 113569829A
Authority
CN
China
Prior art keywords
area
feature map
container
coded data
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110643866.4A
Other languages
English (en)
Inventor
彭浩宇
张宇航
王勋
胡嘉安
姚江海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang Xianlin Information Technology Co ltd
Zhejiang Gongshang University
Original Assignee
Zhejiang Xianlin Information Technology Co ltd
Zhejiang Gongshang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang Xianlin Information Technology Co ltd, Zhejiang Gongshang University filed Critical Zhejiang Xianlin Information Technology Co ltd
Priority to CN202110643866.4A priority Critical patent/CN113569829A/zh
Publication of CN113569829A publication Critical patent/CN113569829A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/20Image enhancement or restoration using local operators
    • G06T5/30Erosion or dilatation, e.g. thinning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/50Image enhancement or restoration using two or more images, e.g. averaging or subtraction

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Evolutionary Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本发明公开一种集装箱编码数据识别方法及***,其中方法包括以下步骤:获取目标图像;检测所述目标图像中的门锁杆、编号末位数字及文本,获得相应的检测结果,所述编号末位数字包含边界框;基于所述检测结果确定待识别区域;基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据。本发明通过检测目标图像中门锁杆、编号末位数字和文本的位置,以确定集装箱编码数据所在区域,将该区域作为待识别区域,本发明中仅对待识别区域的文本进行识别,无需识别其他字符,还无需从大量的识别结果中检测并提取集装箱编码数据,有效提升识别效率,可适用于大型港口、货运集散地等需对大量集装箱进行管理的场景。

Description

集装箱编码数据识别方法及***
技术领域
本发明涉及图像处理领域,尤其涉及一种集装箱编码数据识别技术。
背景技术
机器视觉技术被广泛用于各类行业中,用于对所采集的图像数据进行分析处理,快速准确的识别图像中所包含的文字信息并进行录入,有效降低人工录入成本,并提高录入准确率。
随着物流货运重量的提升,现今需要对集装箱编码数据进行自动识别,以实现对集装箱的管理,参照图2,其中集装箱编码数据包括集装箱编号和箱型代码,其中集装箱编号共11个字符,前4位字符为字母,用于指示集装箱的所有人和集装箱的类型,后7个字符为数字,其中前6位数字为箱体注册码,具有唯一性,最后一位数字为校验码,其外部有边界框,箱型代码共4个字符,用于指示集装箱的尺寸及类型。
现有技术识别集装箱编码数据的效率低,不满足大型港口、货运集散地等场景下管理集装箱的需求。
发明内容
本发明针对现有技术中集装箱编码数据的识别效率低的缺点,提供了一种通过获取目标图像中的待识别区域,仅对待识别区域进行文本识别的集装箱编码数据识别技术。
为了解决上述技术问题,本发明通过下述技术方案得以解决:
一种集装箱编码数据识别方法,包括以下步骤:
获取目标图像,即,包含集装箱编码数据的图像;
检测所述目标图像中的门锁杆、编号末位数字及文本,获得相应的检测结果,所述编号末位数字包含边界框;
基于所述检测结果确定待识别区域;
基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据,集装箱编码数据包括集装箱编号和箱型代码。
作为一种可实施方式:
对所述目标图像进行特征提取,生成相应的目标特征图;
对所述目标特征图进行逐像素分类,基于所得分类结果获得门锁杆区域、编号末位数字区域和若干个文本区域,并提取各文本区域的核心区域;
基于所述门锁杆区域和所述编号末位数字区域确定检测区域;
对位于所述检测区域中的核心区域进行膨胀操作,获得待识别区域。
作为一种可实施方式,将位于所述检测区域中的核心区域作为待膨胀区域,将所述核心区域所在的文本区域作为候选区域,同时对各待膨胀区域进行膨胀操作,获得相应的待识别区域,具体步骤为:
获取与待膨胀区域相邻的像素点,从所得像素点中提取候选点,所述候选点不属于任一待膨胀区域;
当所述候选点位于检测区域内,且,所述候选点位于相应的候选区域内时,利用该候选点更新所述待膨胀区域;
重复进行上述步骤,直至所述待膨胀区域停止更新,获得与所述待膨胀区域相对应的待识别区域。
作为一种可实施方式:
从编号末位数字区域中提取第一定位坐标;
基于所述第一定位坐标从门锁杆区域中提取第二定位坐标,所述第一定位坐标和所述第二定位坐标的纵坐标相同;
以所述第二定位坐标为中心,基于第一定位坐标和第二定位坐标的距离向外扩展,获得检测区域。
作为一种可实施方式:
获取第一定位坐标和第二定位坐标的距离,基于所得距离生成扩展值;
以所述第二定位坐标为中心,构建长和宽均为2倍扩展值的矩形区域,获得检测区域。
作为一种可实施方式:
对目标图像进行特征提取,获得特征图集,其包含若干个不同尺寸的特征图;
基于各特征图进行特征融合,将所得的融合特征图作为目标特征图。
作为一种可实施方式:
步骤A:按照尺寸从小到大的顺序,将上一张特征图的上采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
步骤B:按照尺寸从大到小的顺序,将上一张特征图的降采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
步骤C:按照预设的融合次数重复上述步骤A和步骤B,将最终获得的特征图进行特征融合,将所得的融合特征图作为目标特征图。
本发明还提出一种集装箱编码数据识别***,包括:
获取模块,用于获取目标图像;
检测模块,用于检测所述目标图像中的门锁杆及编号末位数字,获得相应的检测结果,所述编号末位数字包含边界框;还用于基于所述检测结果确定待识别区域;
识别模块,用于基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据。
作为一种可实施方式,所述检测模块包括提取单元、分类单元、计算单元和膨胀单元;
所述提取单元,用于对所述目标图像进行特征提取,生成相应的目标特征图;
所述分类单元,用于对所述目标特征图进行逐像素分类,基于所得分类结果获得门锁杆区域、编号末位数字区域和若干个文本区域,并提取各文本区域的核心区域;
所述计算单元,用于基于所述门锁杆区域和所述编号末位数字区域确定检测区域;
所述膨胀单元,用于对位于所述检测区域中的核心区域进行膨胀操作,获得待识别区域。
本发明还提出一种可读存储介质,其存储有计算机程序,该程序被处理器执行时实现上述任意一项所述集装箱编码数据识别方法的步骤。
本发明由于采用了以上技术方案,具有显著的技术效果:
本发明通过检测目标图像中门锁杆、编号末位数字和文本的位置,以确定集装箱编码数据所在区域,即,待识别区域,与现有技术中对所有字符进行识别,在对识别结果进行后处理的方案相比,仅需对待识别区域进行文本识别即可获得相应的集装箱编码数据,减少无效识别,不仅能够加快文本识别的速度,还能减少对识别结果后处理的用时,大大提升集装箱编码数据的识别效率,可适用于大型港口、货运集散地等需对大量集装箱进行管理的场景。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明一种集装箱编码数据识别方法的流程示意图;
图2是集装箱编码数据的示意图;
图3是实施例1中待识别区域的检测结果示意图;
图4是实施例1中神经网络模型的处理流程示意图
图5是图4中ResNet神经网络的结构示意图;
图6是本发明一种集装箱编码数据识别***的模块连接示意图。
具体实施方式
下面结合实施例对本发明做进一步的详细说明,以下实施例是对本发明的解释而本发明并不局限于以下实施例。
实施例1、一种集装箱编码数据识别方法,如图1所示,包括以下步骤:
S100、获取目标图像;
所述目标图像即包含集装箱编码的集装箱照片,此为现有技术,故不再本实施例中进行详细介绍。
S200、检测所述目标图像中的门锁杆、编号末位数字及文本,获得相应的检测结果,所述编号末位数字包含边界框;
S300、基于所述检测结果确定待识别区域,待识别区域用于指示集装箱编码数据在目标图像中的位置;
S400、基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据。
参照图2,集装箱上不仅标注有集装箱编码数据,还标注其他字符,用于指示集装箱尺寸、配货毛重、体积等信息;
由于集装箱编码数据在集装箱上的位置及排列方式均不统一,且集装箱编码数据周围存在其他字符,故现有技术中往往对整个箱壁上的字符进行识别,再对识别结果进行后处理,以准确提取集装箱编号和箱型代码,由图2可知,集装箱编码数据占字符重量的比重较小,故现有识别技术不仅需要额外识别大量字符,还需要对识别结果进行复杂的后处理,从而导致识别速度慢,当目标图像数量较大的场景下,难以满足用户对识别速度的要求。
本实施例中通过检测目标图像中门锁杆、编号末位数字和文本的位置,以确定集装箱编码数据所在区域,即,待识别区域,从而仅需对待识别区域进行文本识别即可获得相应的集装箱编码数据。
由于本实施例中仅需对待识别区域进行文本识别,减少无效识别,不仅能够加快文本识别的速度,还能减少对识别结果后处理的用时,大大提升集装箱编码数据的识别效率,可适用于大型港口、货运集散地等需对大量集装箱进行管理的场景。
进一步地,步骤S200中检测所述目标图像中的门锁杆、编号末位数字及文本,获得相应的检测结果的具体步骤为:
S210、对所述目标图像进行特征提取,生成相应的目标特征图;
S220、对所述目标特征图进行逐像素分类,基于所得分类结果获得门锁杆区域、编号末位数字区域和若干个文本区域,并提取各文本区域的核心区域;
S230、基于所述门锁杆区域和所述编号末位数字区域确定检测区域;
S240、对位于所述检测区域中的核心区域进行膨胀操作,获得待识别区域。
本实施例中巧妙的应用门锁杆区域和编号末位数字区域对集装箱编码数据的所在区域进行定位,对位于所述检测区域中的核心区域进行膨胀操作,使得最终生成的待识别区域能够完整包含集装箱编码数据某一字符,且能将集装箱编码数据中各字符相分离,以保证最终识别结果的完整性和准确性。
进一步地,步骤S210中对所述目标图像进行特征提取,生成相应的目标特征图的具体步骤为:
S211、对目标图像进行特征提取,获得特征图集,其包含若干个不同尺寸的特征图,按照尺寸对特征图进行排列后,相邻特征图的尺寸呈倍数关系,且倍数相同。
本领域技术人员可根据实际需要自行设定特征图的个数以及各特征图的尺寸,本实施例中特征图的数量为5,尺寸分别为原图像的1/2,1/4,1/8,1/16,1/32。
本实施例中采用预训练的ResNet神经网络进行特征提取。
S212、基于各特征图进行特征融合,将所得的融合特征图作为目标特征图。
具体步骤为:
步骤A:按照尺寸从小到大的顺序,将上一张特征图的上采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
特征图集包含n个按照尺寸从小到大的顺序排列的特征图时,按照以下公式依次更新各特征图:
Figure BDA0003108225000000051
其中,Fk表示第k张特征图,本步骤中k∈[2~n];Fk(i,j)表示第k张特征图中的像素,up(Fk-1)表示对第k-1张特征图进行上采样;
例如,特征图F1的尺寸为原图像的1/32、特征图F2的尺寸为原图像的1/16、特征图F3的尺寸为原图像的1/8;
当前特征图为特征图F1时,上一张特征图为空,不对特征图F1进行更新;
当前特征图为特征图F2时,上一张特征图为特征图F1,将特征图F1进行上采样后,将相应的上采样结果up(F1)与特征图F2进行逐元素相加,将所得结果更新特征图F2
当前特征图为特征图F3时,上一张特征图为更新后的特征图F2,将该其进行上采样后,将相应的上采样结果up(F2)与特征图F3进行逐元素相加,将所得结果更新特征图F3
即,本步骤通过将上一张特征图放大后,与当前特征图逐元素相加,以实现不同层次的特征的融合。
步骤B:按照尺寸从大到小的顺序,将上一张特征图的降采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
本步骤中特征图集所包含的特征图为按照步骤A进行更新后所得的特征图时,基于下述公式按照从大到小的顺序依次更新各特征图:
Figure BDA0003108225000000061
其中,Fk表示第k张特征图,本步骤中k∈[1~n-1];Fk(i,j)表示第k张特征图中的像素,dm(Fk+1)表示对第k+1张特征图进行降采样;
例如,特征图F3的尺寸为原图像的1/8、特征图F4的尺寸为原图像的1/4、特征图F5的尺寸为原图像的1/2;
当前特征图为特征图F5时,上一张特征图为空,不对特征图F5进行更新;
当前特征图为特征图F4时,上一张特征图为特征图F5,将特征图F5进行降采样后,将相应的降采样结果dm(F5)与特征图F4进行逐元素相加,将所得结果更新特征图F4
当前特征图为特征图F3时,上一张特征图为更新后的特征图F4,将其进行降采样后,将相应的降采样结果dm(F4)与特征图F3进行逐元素相加,将所得结果更新特征图F3
即,本步骤为步骤A的逆向步骤,本步骤通过将上一张特征图缩小后,与当前特征图逐元素相加,以实现不同层次的特征的融合。
步骤C:按照预设的融合次数重复上述步骤A和步骤B,将最终获得的特征图进行特征融合,将所得的融合特征图作为目标特征图。
本领域技术人员可根据实际需要自行设定融合次数,通过重复多次步骤A和步骤B加深融合程度。
当融合次数达到预设值时,将步骤B输出的各特征图的尺寸变换为同一尺寸后(如原图尺寸)进行拼接,以获得相应的目标特征图,例如本实施例中原图尺寸为800*450,特征图的数量为5,所得目标特征图的尺寸为800*450*5。
本实施例通过使用降采样与图像插值算法融合目标图像高层次与低层次的特征,并串联重复多次加深融合程度,使所得目标特征图包含所述目标图像高低层次、粗细粒度的不同特征,以保障后续逐元素分类的准确性。
进一步地,步骤S220中对所述目标特征图进行逐像素分类,基于所得分类结果获得门锁杆区域、编号末位数字区域和若干个文本区域的具体步骤为:
基于所得的目标特征图,逐个像素计算σ分类损失,计算公式为:
Figure BDA0003108225000000071
其中,p(i,j)表示当前像素点,σ
(i,j)表示当前像素点p(i,j)的分类损失,其为置信度矩阵,e为欧拉数,F为目标特征图,目标特征图中各像素点由p(m,l)指代。
基于σ分类损失对当前像素点p(i,j)进行分类的公式为:
Cl=∑max(σ(i,j))(i,j)∈F;
其中,Cl为分类结果,包括文本、末位数字以及门锁杆,即,取基于最大置信度确定对应像素点的类别。
基于各像素点的分类结果对各像素点进行分类,获得相应的门锁杆区域、编号末位数字区域和文本区域,参照图3可知,文本之间存在间隙,故将分类获得若干个文本区域。
提取各文本区域所对应的核心区域的方法为:
遍历文本区域中每一个像素点属于文本的置信度,当其超过预设的置信度阈值时,判定该像素点属于文本核心;
基于属于文本核心的像素点生成至少一个核心区域。
本实施例中的核心区域用于区分相邻不同文本以保证识别的准确性,故无需包含完整的集装箱编号或箱型代码,在实际使用过程中,本领域技术人员可自行设定像素属于文本的置信度阈值(如60%)。
一个文本区域中可以包含多个核心区域,如图3所示,集装箱编号和箱型代码相距较近,亦被分类于同一文本区域内,本实施例通过对核心区域的设计,能够区分同一文本区域中多段文本;
在实际使用过程中,本领域技术人员还可根据实际需要,通过对置信度阈值(如95%)的限定,将属于同一文本的不同字符相分离,以便于后续进行文本识别。
进一步地,步骤S230中基于所述门锁杆区域和所述编号末位数字区域确定检测区域的具体步骤为:
S231、从编号末位数字区域中提取第一定位坐标;
本领域技术人员可自行设定第一定位坐标的提取规则,如遍历编号末位数字区域中的各像素点,提取位于编号末位数字区域右上角、左上角、右下角或左下角的像素点的坐标作为第一定位坐标,本实施例不对其做具体限制。
本实施例中,提取位于编号末位数字区域右上角的像素点的坐标作为第一定位坐标,记为C1(x1,y1)。
S232、基于所述第一定位坐标从门锁杆区域中提取第二定位坐标,所述第一定位坐标和所述第二定位坐标的纵坐标相同;
本领域技术人员可自行设定第二定位坐标的提取规则,如基于第一定位坐标的纵坐标遍历门锁杆区域中的各像素点,从与第一定位坐标的纵坐标相同的像素点中提取任意一点的坐标作为第二定位坐标,本实施例不对其做具体限制。
本实施例中,提取与第一定位坐标处于同一水平线,且位于门锁杆区域最左侧的像素点的坐标作为第二定位坐标,记为C2(x2,y1)。
S233、以所述第二定位坐标为中心,基于第一定位坐标和第二定位坐标的距离向外扩展,获得检测区域。第一定位坐标和第二定位坐标的距离为∣x1-x2∣;
在实际使用过程中,为保证字符完全位于检测区域内,本领域技术人员可根据实际情况自行设定宽限值a,如,以第二定位坐标为圆心,以(∣x1-x2∣+a)为半径,构建检测区域。
本实施例中检测区域为矩形区域,其构建方法为:
获取第一定位坐标和第二定位坐标的距离∣x1-x2∣,基于所得距离生成扩展值(∣x1-x2∣+a);
以所述第二定位坐标为中心,构建长和宽均为2倍扩展值的矩形区域,获得检测区域,即长和宽均为2(∣x1-x2∣+a)。
本领域技术人员可根据实际需要自行设定膨胀值,使位于所述检测区域中的核心区域按照预设的膨胀值进行膨胀,但此种膨胀方式中膨胀值为固定值,当膨胀值较小时,待识别区域内的字符可能存在缺失,影响后续文本识别的准确性,当膨胀值较大时,可能会将其他字符纳入待识别区域的范围;
为解决上述缺陷,本实施例中,步骤S240中对位于所述检测区域中的核心区域进行膨胀操作,获得待识别区域的具体方案为:
将位于所述检测区域中的核心区域作为待膨胀区域,将所述核心区域所在的文本区域作为候选区域,同时对各待膨胀区域进行膨胀操作,获得相应的待识别区域;
由于各待膨胀区域所进行的膨胀操作相同,故本实施例中以一个待膨胀区域为例,对其所进行的膨胀操作进行详细描述,具体步骤为:
S241、获取与待膨胀区域相邻的像素点,获得候选点;
将待膨胀区域记为kn(xi,yj),获取待膨胀区域kn(xi,yj)边缘处的像素点,获得边缘像素点Pn(i,j),(i,j∈kn);
获取边缘像素点Pn(i,j)相邻的像素点,从中提取不属于任意一个待膨胀区域kn(xi,yj)的像素点作为候选点Pnb(l,m)。
S242、当所述候选点位于检测区域内,且,所述候选点位于候选区域内时,利用该候选点更新所述待膨胀区域;
即,将待膨胀区域kn(xi,yj)
与其相对应的文本区域合并,并与同一文本区域中其他待膨胀区域分离,从而获得各段文本所对应的区域。
S243、重复进行上述步骤S241和步骤S242,直至所述待膨胀区域停止更新,将所得待膨胀区域作为待识别区域。
本实施例中通过以位于所述检测区域中的核心区域为基础,与其相对应的文本区域进行合并,可根据实际情况向任意方向膨胀,所获得的待识别区域更加准确。
注:待识别区域为多个,待识别区域的检测效果如图3所示。
进一步地,步骤S400基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据的具体步骤为:
基于待识别区域对所述目标图像进行裁剪,获得若干个待识别图像;
将所述待识别图像按左上至右下的顺序排列并进行缩放,使缩放后的待识别图像尺寸统一,在实际使用过程中可在缩放后填充黑色像素使其保持原有比例。
对各待识别图像进行文本识别,获得相应的集装箱编码数据。
本实施例中,将各待识别图像输入至预训练的CRNN网络中,由CRNN网络进行文本识别,输出各字符的预测结果所对应的概率权值,概率权值反映预测结果为真实值的可能性;
基于所述概率权值确定最终输出结果,即,选择概率权值最高的预测结果作为最终输出结果,获得相应的集装箱编码数据。
在实际使用过程中,本领域技术人员可通过构建神经网络模型,基于所述神经网络模型实现上述识别方法,构建神经网络模型的步骤如下:
1、构建深度学习网络:
参照图4,本实施例中所述深度学习网络包括ResNet网络、融合模块、分类器、后处理模块和CRNN网络,所述ResNet网络的结构示意图如图5所示,图5中x为前一层的输出,f(x)为当前层的输出,relu=max(0,f(x));
其中:
ResNet网络的输入是目标图像(尺寸为800*450),输出是特征图集;
特征图集中各特征图经过融合模块进行特征融合后,输出目标特征图,本实施例中融合模块采用U形结构;
目标特征图在分类器中进行逐元素分类,获得每个像素所对应的分类结果;
基于分类结果于后处理模块中进行膨胀,获得待识别区域,并由后处理模块对目标图像进行裁剪、缩放等处理,以获得与待识别区域相对应的待识别图像;
将所得待识别图像输入CRNN网络,由CRNN网络进行文本识别,以获得各字符所对应的预测结果。
2、训练数据准备:
采集不同环境、角度、光照下的集装箱编号侧图像,将过曝、模糊等难以识别的图像是为负样本,其余视为正样本,本实施例中设定正负样本比例为3:1。
人工标注集装箱编号及箱型代码的位置及其内容
将标注完的数据划分为3部分,其中60%为训练集,20%为验证集,20%为测试集。
3、使用训练集对所构建的深度学习网络进行训练,步骤包括:
3.1、用深度学习网络进行训练200个epoch,每个epoch结束后,输出中间模型,并使用该中间模型对验证集进行预测,保存准确率最高的中间模型。
3.2、200个epoch结束后使用保存的中间模型对测试集进行预测,并记录准确率、保存模型。
调整步长、优化器等模型参数后重复步骤3.1和3.2,保存准确率最高的模型作为神经网络模型。
3、验证:
选取600张不同环境、角度、光照下的集装箱编号侧图像,且此批图像未出现在训练过程中。
从上述600张各类图像中各选取40张共120张作为样本图像,通过手工标定得到各项参数,即,集装箱标号和箱型代码的位置及相应字符。
将剩余的480张图像输入上述训练获得的神经网络模型中,由神经网络模型按照本实施例所公开的方法进行集装箱编码数据的检测识别,统计得到平均识别时间为0.0568秒,由此可证明本发明所公开的方法能够有效提升识别速度。
将检测得到的待识别区域于原图上进行标记,记为Ca;将识别获得结果记为Ra,并保存。
采用人工对这480张图像的进行手工标记,获得标准识别区域Cm,和标准字符Rm。
用P(Ca,Cm)表示重叠率,基于重叠率评价检测效果;
P(Ca,Cm)=S(Ca∩Cm)/S(Cm);
其中,S(Cm)表示标准识别区域Cm的面积,S(Ca∩Cm
)表示Ca和Cm重叠部分的面积;本实施例中测得480张图像的重叠率P(Ca,Cm)的平均值为98.82%。
用acc表示识别接受率,acc=1-(Rm-Ra)/Rm,本实施例中测得480张图像的acc的平均值为99.37%,符合预期。
在某港口数据中心服务器中执行本实施例所公开的识别方法一段时间后,随机抽取1000张检测结果图像,首先采用目测方式筛选出78张检测结果较差的图像;然后对这78张图像进行手工标记,算得P(Ca,Cm)的平均值为92.69%,由此可证明待识别区域的检测、定位准确率能够达到客户需求。
实施例2、一种集装箱编码数据识别***,包括:
获取模块100,用于获取目标图像;
检测模块200,用于检测所述目标图像中的门锁杆及编号末位数字,获得相应的检测结果,所述编号末位数字包含边界框;还用于基于所述检测结果确定待识别区域;
识别模块300,用于基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据。
进一步地,所述检测模块200包括提取单元210、分类单元220、计算单元230和膨胀单元240;
所述提取单元210,用于对所述目标图像进行特征提取,生成相应的目标特征图;
所述分类单元220,用于对所述目标特征图进行逐像素分类,基于所得分类结果获得门锁杆区域、编号末位数字区域和若干个文本区域,并提取各文本区域的核心区域;
所述计算单元230,用于基于所述门锁杆区域和所述编号末位数字区域确定检测区域;
所述膨胀单元240,用于对位于所述检测区域中的核心区域进行膨胀操作,获得待识别区域。
进一步地,所述提取单元210包括提取子单元和融合子单元:
所述提取子单元,用于对目标图像进行特征提取,获得特征图集,其包含若干个不同尺寸的特征图,本实施例中提取子单元采用预训练的ResNet神经网络;
所述融合子单元,用于基于各特征图进行特征融合,将所得的融合特征图作为目标特征图,本实施例中融合子单元为u形结构;
进一步地,所述融合子单元包括上采样子单元、降采样子单元和拼接单元:
上采样子单元,用于按照尺寸从小到大的顺序,将上一张特征图的上采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
下采样子单元,用于按照尺寸从大到小的顺序,将上一张特征图的降采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
拼接子单元,用于从所述下采样子单元处获取最终获得的特征图并进行特征融合,将所得的融合特征图作为目标特征图。
进一步地,所述计算单元230被配置为:
从编号末位数字区域中提取第一定位坐标;
基于所述第一定位坐标从门锁杆区域中提取第二定位坐标,所述第一定位坐标和所述第二定位坐标的纵坐标相同;
以所述第二定位坐标为中心,基于第一定位坐标和第二定位坐标的距离向外扩展,获得检测区域,即,
获取第一定位坐标和第二定位坐标的距离,基于所得距离生成扩展值;以所述第二定位坐标为中心,构建长和宽均为2倍扩展值的矩形区域,获得检测区域。
进一步地,所述膨胀单元240将位于所述检测区域中的核心区域作为待膨胀区域,将所述核心区域所在的文本区域作为候选区域,同时对各待膨胀区域进行膨胀操作,获得相应的待识别区域,其被配置为:
获取与待膨胀区域相邻的像素点,获得候选点;
当所述候选点位于检测区域内,且,所述候选点位于候选区域内时,利用该候选点更新所述待膨胀区域;
重复进行上述步骤,直至所述待膨胀区域停止更新,获得与所述待膨胀区域相对应的待识别区域。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
实施例3、一种可读存储介质,其存储有计算机程序,该程序被处理器执行时实现实施例1中任意一项所述集装箱编码数据识别方法的步骤。
本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明的方法、终端设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
需要说明的是:
说明书中提到的“一个实施例”或“实施例”意指结合实施例描述的特定特征、结构或特性包括在本发明的至少一个实施例中。因此,说明书通篇各个地方出现的短语“一个实施例”或“实施例”并不一定均指同一个实施例。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
此外,需要说明的是,本说明书中所描述的具体实施例,其零、部件的形状、所取名称等可以不同。凡依本发明专利构思所述的构造、特征及原理所做的等效或简单变化,均包括于本发明专利的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实施例做各种各样的修改或补充或采用类似的方式替代,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。

Claims (10)

1.一种集装箱编码数据识别方法,其特征在于包括以下步骤:
获取目标图像;
检测所述目标图像中的门锁杆、编号末位数字及文本,获得相应的检测结果,所述编号末位数字包含边界框;
基于所述检测结果确定待识别区域;
基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据。
2.根据权利要求1所述的集装箱编码数据识别方法,其特征在于:
对所述目标图像进行特征提取,生成相应的目标特征图;
对所述目标特征图进行逐像素分类,基于所得分类结果获得门锁杆区域、编号末位数字区域和若干个文本区域,并提取各文本区域的核心区域;
基于所述门锁杆区域和所述编号末位数字区域确定检测区域;
对位于所述检测区域中的核心区域进行膨胀操作,获得待识别区域。
3.根据权利要求2所述的集装箱编码数据识别方法,其特征在于,将位于所述检测区域中的核心区域作为待膨胀区域,将所述核心区域所在的文本区域作为候选区域,同时对各待膨胀区域进行膨胀操作,获得相应的待识别区域,具体步骤为:
获取与待膨胀区域相邻的像素点,从所得像素点中提取候选点,所述候选点不属于任一待膨胀区域;
当所述候选点位于检测区域内,且,所述候选点位于相应的候选区域内时,利用该候选点更新所述待膨胀区域;
重复进行上述步骤,直至所述待膨胀区域停止更新,获得与所述待膨胀区域相对应的待识别区域。
4.根据权利要求3所述的集装箱编码数据识别方法,其特征在于:
从编号末位数字区域中提取第一定位坐标;
基于所述第一定位坐标从门锁杆区域中提取第二定位坐标,所述第一定位坐标和所述第二定位坐标的纵坐标相同;
以所述第二定位坐标为中心,基于第一定位坐标和第二定位坐标的距离向外扩展,获得检测区域。
5.根据权利要求4所述的集装箱编码数据识别方法,其特征在于:
获取第一定位坐标和第二定位坐标的距离,基于所得距离生成扩展值;
以所述第二定位坐标为中心,构建长和宽均为2倍扩展值的矩形区域,获得检测区域。
6.根据权利要求2至5任一所述的集装箱编码数据识别方法,其特征在于:
对目标图像进行特征提取,获得特征图集,其包含若干个不同尺寸的特征图;
基于各特征图进行特征融合,将所得的融合特征图作为目标特征图。
7.根据权利要求6所述的集装箱编码数据识别方法,其特征在于:
步骤A:按照尺寸从小到大的顺序,将上一张特征图的上采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
步骤B:按照尺寸从大到小的顺序,将上一张特征图的降采样结果与当前特征图逐元素相加,以更新当前特征图,重复本步骤,直至完成对所有特征图的更新;
步骤C:按照预设的融合次数重复上述步骤A和步骤B,将最终获得的特征图进行特征融合,将所得的融合特征图作为目标特征图。
8.一种集装箱编码数据识别***,其特征在于包括:
获取模块,用于获取目标图像;
检测模块,用于检测所述目标图像中的门锁杆及编号末位数字,获得相应的检测结果,所述编号末位数字包含边界框;还用于基于所述检测结果确定待识别区域;
识别模块,用于基于所述待识别区域对所述目标图像进行文本识别,获得相应的集装箱编码数据。
9.根据权利要求8所述的集装箱编码数据识别***,其特征在于,检测模块包括提取单元、分类单元、计算单元和膨胀单元;
所述提取单元,用于对所述目标图像进行特征提取,生成相应的目标特征图;
所述分类单元,用于对所述目标特征图进行逐像素分类,基于所得分类结果获得门锁杆区域、编号末位数字区域和若干个文本核心,并提取各文本区域的核心区域;
所述计算单元,用于基于所述门锁杆区域和所述编号末位数字区域确定检测区域;
所述膨胀单元,用于对位于所述检测区域中的核心区域进行膨胀操作,获得待识别区域。
10.一种可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1至7任意一项所述集装箱编码数据识别方法的步骤。
CN202110643866.4A 2021-06-09 2021-06-09 集装箱编码数据识别方法及*** Pending CN113569829A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110643866.4A CN113569829A (zh) 2021-06-09 2021-06-09 集装箱编码数据识别方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110643866.4A CN113569829A (zh) 2021-06-09 2021-06-09 集装箱编码数据识别方法及***

Publications (1)

Publication Number Publication Date
CN113569829A true CN113569829A (zh) 2021-10-29

Family

ID=78161899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110643866.4A Pending CN113569829A (zh) 2021-06-09 2021-06-09 集装箱编码数据识别方法及***

Country Status (1)

Country Link
CN (1) CN113569829A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343125A (zh) * 2023-03-30 2023-06-27 北京国泰星云科技有限公司 一种基于计算机视觉的集装箱箱底锁头检测方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180173988A1 (en) * 2016-12-16 2018-06-21 Tata Consultancy Servies Limited Method and system for container code recognition
JP2018147178A (ja) * 2017-03-03 2018-09-20 Necプラットフォームズ株式会社 コンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラム
CN110119742A (zh) * 2019-04-25 2019-08-13 添维信息科技(天津)有限公司 一种集装箱号的识别方法、装置及移动终端
CN110619329A (zh) * 2019-09-03 2019-12-27 中国矿业大学 基于机载视觉的铁路货运敞车车厢编号及装载状态识别方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20180173988A1 (en) * 2016-12-16 2018-06-21 Tata Consultancy Servies Limited Method and system for container code recognition
JP2018147178A (ja) * 2017-03-03 2018-09-20 Necプラットフォームズ株式会社 コンテナ番号読取り装置、コンテナ番号読取り方法およびコンテナ番号読取りプログラム
CN110119742A (zh) * 2019-04-25 2019-08-13 添维信息科技(天津)有限公司 一种集装箱号的识别方法、装置及移动终端
CN110619329A (zh) * 2019-09-03 2019-12-27 中国矿业大学 基于机载视觉的铁路货运敞车车厢编号及装载状态识别方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116343125A (zh) * 2023-03-30 2023-06-27 北京国泰星云科技有限公司 一种基于计算机视觉的集装箱箱底锁头检测方法
CN116343125B (zh) * 2023-03-30 2024-04-02 北京国泰星云科技有限公司 一种基于计算机视觉的集装箱箱底锁头检测方法

Similar Documents

Publication Publication Date Title
US11055574B2 (en) Feature fusion and dense connection-based method for infrared plane object detection
WO2019238063A1 (zh) 文本检测分析方法、装置及设备
CN110599537A (zh) 基于Mask R-CNN的无人机图像建筑物面积计算方法及***
CN113033604B (zh) 一种基于SF-YOLOv4网络模型的车辆检测方法、***及存储介质
CN111797829A (zh) 一种车牌检测方法、装置、电子设备和存储介质
CN105574550A (zh) 一种车辆识别方法及装置
CN109740515B (zh) 一种评阅方法及装置
US9330336B2 (en) Systems, methods, and media for on-line boosting of a classifier
CN111369581A (zh) 图像处理方法、装置、设备及存储介质
CN112200081A (zh) 异常行为识别方法、装置、电子设备及存储介质
CN112819821B (zh) 一种细胞核图像检测方法
CN112418278A (zh) 一种多类物体检测方法、终端设备及存储介质
CN111144215A (zh) 图像处理方法、装置、电子设备及存储介质
CN115239644B (zh) 混凝土缺陷识别方法、装置、计算机设备和存储介质
CN112819753B (zh) 一种建筑物变化检测方法、装置、智能终端及存储介质
CN111753642B (zh) 一种确定关键帧的方法及装置
CN111626295A (zh) 车牌检测模型的训练方法和装置
CN113221956A (zh) 基于改进的多尺度深度模型的目标识别方法及装置
CN115424111A (zh) 一种抗原检测试剂盒智能识别方法、装置、设备及介质
CN113569829A (zh) 集装箱编码数据识别方法及***
CN115115947A (zh) 遥感图像检测方法、装置、电子设备以及存储介质
CN116246161A (zh) 领域知识引导下的遥感图像目标精细类型识别方法及装置
CN115311630A (zh) 区分阈值生成、目标识别模型训练、目标识别方法及装置
JP4963824B2 (ja) 変化領域抽出装置及び変化領域抽出方法
CN112598055A (zh) 头盔佩戴检测方法、计算机可读存储介质和电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination