CN117636026B - 一种集装箱锁销类别图片识别方法 - Google Patents

一种集装箱锁销类别图片识别方法 Download PDF

Info

Publication number
CN117636026B
CN117636026B CN202311618851.8A CN202311618851A CN117636026B CN 117636026 B CN117636026 B CN 117636026B CN 202311618851 A CN202311618851 A CN 202311618851A CN 117636026 B CN117636026 B CN 117636026B
Authority
CN
China
Prior art keywords
picture
standard material
lock pin
standard
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202311618851.8A
Other languages
English (en)
Other versions
CN117636026A (zh
Inventor
邬承基
程铿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI FANSHUN INDUSTRIAL CO LTD
Original Assignee
SHANGHAI FANSHUN INDUSTRIAL CO LTD
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI FANSHUN INDUSTRIAL CO LTD filed Critical SHANGHAI FANSHUN INDUSTRIAL CO LTD
Publication of CN117636026A publication Critical patent/CN117636026A/zh
Application granted granted Critical
Publication of CN117636026B publication Critical patent/CN117636026B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/0464Convolutional networks [CNN, ConvNet]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/42Global feature extraction by analysis of the whole pattern, e.g. using frequency domain transformations or autocorrelation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/82Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Software Systems (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Biomedical Technology (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及一种集装箱锁销类别的识别方法,属于计算机视觉领域技术。其中,该方法包括:获取标准素材数据集和集装箱锁销样本图片,对所述集装箱锁销样本图片进行预处理得到标准素材。获取集装箱锁销采集图片,对所述集装箱锁销采集图片进行所述预处理得到目标图片。将所述标准素材和所述目标图片输入到CNN卷积神经网络模型,输出标准素材特征向量和目标图片特征向量。根据所述目标图片特征向量与所述标准素材特征向量计算目标图片与标准素材的相似度。将相似度最大值对应的标准素材的类别标签发送到中央控制中心。使用基于CNN卷积神经网络模型,加强层级之间的特征提取和传递。能够精确、高效的识别集装箱锁销图片类别,实现集装箱自动化运输。

Description

一种集装箱锁销类别图片识别方法
技术领域
本发明属于计算机视觉领域技术,具体涉及一种集装箱类别图片识别方法。
背景技术
集装箱作为一种物流运输工具,普遍运用在物流、运输、海关、港口等各个行业中。锁销是集装箱之间绑扎的重要工具,集装箱的装船和卸船都需要拆装锁销,锁销类别识别可以实现对集装箱的快速准确分类和调度,从而提高物流效率。锁销类别识别属于图片识别技术主要运用了深度学习技术,如今深度学习技术应用广泛,它可以自动提取图像特征,并具有较高的分类准确性和鲁棒性。实现集装箱锁销类别自动识别才能能够实现集装箱锁销拆卸自动化,从而实现集装箱运输自动化。因此通过图片识别技术对锁销进行分类和识别,对于提高物流效率、增强安全性、降低成本等方面都具有重要的意义。传统的人工识别锁销类型拆装锁销效率低下,人力成本较高,传统的自动化锁销类别识别准确率较低。
发明内容
针对现有技术纯在问题,本发明提供一种集装箱类型的识别方法,第一方面,本发明的方法可以通过以下技术方案实施:
S1:获取集装箱锁销样本图片,对所述集装箱锁销样本图片进行预处理得到标准素材,根据像素点LBP值计算公式:得到所述标准素材像素点的LBP值,根据所述标准素材LBP值构建纹理特征直方图得到纹理特征,对所述纹理特征进行分布式处理得到特征向量,对所述纹理特征向量进行权重计算得到加权特征向量,对所述的加权特征向量进行分类得到标准素材数据集,所述预处理包括图像归一化,滤波去噪,图像增强;
S3:将所述标准素材和所述目标图片输入到CNN卷积神经网络模型,输出标准素材特征向量和目标图片特征向量,所述CNN卷积神经网络模型包括卷积层、池化层、全连接层;
S4:根据所述目标图片特征向量与所述标准素材特征向量计算目标图片与标准素材的相似度;
S5:对所述标准素材数据集重复S3-S4的步骤,得到目标图片和标准素材相似度的最大值。将所述最大值对应的标准素材的类别标签发送到中央控制中心。
具体地,S1中预处理包括:
S101:将集装箱锁销图片的像素值归一化到0-1的范围,所述图像归一化方法是减去像素值的均值并除以标准差;
S102:使用均值滤波的方法去除集装箱锁销样本图片的噪声;
S103:所述图像增强包括旋转、裁剪、缩放,将所述集装箱锁销图片进行图像的裁剪至只有集装箱锁销部分,将所述集装箱锁销图片缩放至200×200像素,将所述集装箱锁销图片旋转90度。
具体地,S3中的卷积层的运算包括:
将所述标准素材和目标图片输入所述卷积层,对标准素材和目标图片进行纹理特征提取、角点特征提取、边缘特征提取得到标准特征图和目标特征图。
具体地,S3中的池化层的运算包括:
将所述标准特征图和目标特征图输入所述池化层得到标准降维特征图和目标降维特征图;
具体地,S3中的全连接层的运算包括:
将标准降维特征图和所述目标降维特征图输入全连接层得到标准素材特征向量和目标图片特征向量。
具体地,S4步骤为:
S401:计算所述标准素材特征向量和所述的目标图片特征向量的余弦相似度;
S402:根据所述余弦相似度计算加权值,计算公式为:其中J为所述标准素材数据集中的标准素材总数,根据所述加权值得到加权标准素材特征向量和加权目标图片特征向量;
S403:将所述加权标准素材特征和所述加权目标图片特征进行融合得到融合特征,融合公式为:v=[x;y;x+y;|x-y|],其中x为所述标准素材特征,y为目标图片特征,对所述融合特征使用softmax分类器计算概率分布,根据所述概率分布得到所述标准素材和所述的目标图片相似度u。
具体地,S3中的模型的损失函数定义为:
其中,z为所述标准素材的类别标签,u为所述目标图片与标准素材相似度。
第二方面,本发明提供了一种集装箱锁销类别识别***,如权如上方法运行,其特征在于,包括如下模块:
数据集、采集图片获取模块、向量生成模块,相似度计算模块、中央控制中心,其中所述标准素材数据集为预构建的集装箱锁销样本图片与类别标签的关联数据集;
所述采集图片获取模块用于获取所述集装箱锁销采集图片,将所述集装箱锁销采集图片经过预处理后得到目标图片;
所述向量生成模块包括将标准素材和目标图片输入所述CNN卷积神经网络经过3次先卷积再池化后输入到所述全连接层得到标准素材特征向量和目标图片特征向量;
所述相似度计算模块用于计算所述标准素材特征向量和目标图片特征向量的相似度,得到标准素材和目标图片的相似度;
所述中央控制中心用于接收相似度最大时的标准素材对应的类别标签。
本发明的有益效果为:
(1)使用深度卷积神经网络,加强了对集装箱锁销图片的特征提取,尽可能的减少特征的损失,类别识别准确率较高、效率高。
(2)通过图像识别技术,可以实现集装箱锁销的智能化管理和监控,从而降低运输成本和减少人力资源的浪费。
附图说明
为了便于本领域技术人员理解,下面结合附图对本发明作进一步的说明。
图1为本发明的基于集装箱锁销类别图像识别方法的流程示意图。
图2为本发明中的基于集装箱锁销类别图像识别***的结构框图。
具体实施方式
为更进一步阐述本发明为实现预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明的具体实施方式、结构、特征及其功效,详细说明如下。
请参阅图1,一种集装箱锁销类别图片识别方法的流程示意图,包括如下步骤:
S1:获取集装箱锁销样本图片,对所述集装箱锁销样本图片进行预处理得到标准素材,根据像素点LBP值计算公式:得到所述标准素材像素点的LBP值,根据所述标准素材LBP值构建纹理特征直方图得到纹理特征,对所述纹理特征进行分布式处理得到特征向量,对所述纹理特征向量进行权重计算得到加权特征向量,对所述的加权特征向量进行分类得到标准素材数据集,所述预处理包括图像归一化,滤波去噪,图像增强;
S2:获取集装箱锁销采集图片,对所述集装箱锁销采集图片进行所述预处理得到目标图片;
S3:将所述标准素材和所述目标图片输入到CNN卷积神经网络模型,输出标准素材特征向量和目标图片特征向量,所述CNN卷积神经网络模型包括卷积层、池化层、全连接层;
S4:根据所述目标图片特征向量与所述标准素材特征向量计算目标图片与标准素材的相似度;
S5:对所述标准素材数据集重复S3-S4的步骤,得到目标图片和标准素材相似度的最大值。将所述最大值对应的标准素材的类别标签发送到中央控制中心。
具体地,具体地,S1中预处理包括:
S101:将集装箱锁销图片的像素值归一化到0-1的范围,所述图像归一化方法是减去像素值的均值并除以标准差;
S102:使用均值滤波的方法去除集装箱锁销样本图片的噪声;
S103:所述图像增强包括旋转、裁剪、缩放,将所述集装箱锁销图片进行图像的裁剪至只有集装箱锁销部分,将所述集装箱锁销图片缩放至200×200像素,将所述集装箱锁销图片旋转90度。
具体地,S3中的卷积层的运算包括:
将所述标准素材和目标图片输入所述卷积层,对标准素材和目标图片进行纹理特征提取、角点特征提取、边缘特征提取得到标准特征图和目标特征图,计算公式为:式中/>为第l-1层的第i张输入特征图,/>为第l-1层的第i张输入特征图到第l层第j张输出特征图的卷积核;/>为第l层的第j张输出特征图。
具体地,S3中的池化层的运算包括:
将所述标准特征图和目标特征图输入所述池化层得到标准降维特征图和目标降维特征图,计算公式为:式中:down()为降采样函数;β为网络乘性偏置;
具体地,S3中的全连接层的运算包括:
将标准降维特征图和所述目标降维特征图输入全连接层得到标准素材特征向量和目标图片特征向量。
具体地,S4中的标准素材和目标图片相似度的计算方式如下:
S401:计算所述标准素材特征向量和所述的目标图片特征向量的余弦相似度,计算公式为:其中,/>为所述标准素材特征向量,/>为所述目标图片特征向量;
S402:根据所述余弦相似度计算加权值,计算公式为:其中J为所述标准素材数据集中的标准素材总数,根据所述加权值得到加权标准素材特征向量和加权目标图片特征向量;
S403:将所述加权标准素材特征和所述加权目标图片特征进行融合得到融合特征,融合公式为:v=[x;y;x+y;|x-y|],其中x为所述标准素材特征,y为目标图片特征,对所述融合特征使用softmax分类器计算概率分布,根据所述概率分布得到所述标准素材和所述的目标图片相似度u。
具体地,S3中的模型的损失函数定义为:
其中,z为所述标准素材的类别标签,u为所述目标图片与标准素材相似度。
第二方面,本发明提供了一种集装箱锁销类别识别***,如权如上方法运行,其特征在于,包括如下模块:
数据集、采集图片获取模块、向量生成模块,相似度计算模块、中央控制中心,其中所述标准素材数据集为预构建的集装箱锁销样本图片与类别标签的关联数据集;
所述采集图片获取模块用于获取所述集装箱锁销采集图片,将所述集装箱锁销采集图片经过预处理后得到目标图片;
所述向量生成模块包括将标准素材和目标图片输入所述CNN卷积神经网络经过3次先卷积再池化后输入到所述全连接层得到标准素材特征向量和目标图片特征向量;
所述相似度计算模块用于计算所述标准素材特征向量和目标图片特征向量的相似度,得到标准素材和目标图片的相似度;
所述图像获取模块用于获取集装箱锁销样本图片和集装箱锁销采集图片。以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭示如上,然而并非用以限定本发明,任何本领域技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容做出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案内容,依据本发明的技术实质对以上实施例所作的任何简介修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (7)

1.一种集装箱锁销类别的图片识别方法,其特征在于,包括如下步骤:
S1:获取集装箱锁销样本图片,对所述集装箱锁销样本图片进行预处理得到标准素材,根据像素点LBP值计算公式:,得到所述标准素材像素点的LBP ,根据所述标准素材LBP值构建纹理特征直方图得到纹理特征,对所述纹理特征进行分布式处理得到特征向量,对所述纹理特征向量进行权重计算得到加权特征向量,对所述的加权特征向量进行分类得到标准素材数据集,所述预处理包括图像归一化,滤波去噪,图像增强;
S2:获取集装箱锁销采集图片,对所述集装箱锁销采集图片进行所述预处理得到目标图片;
S3:将所述标准素材和所述目标图片输入到CNN卷积神经网络模型,输出标准素材特征向量和目标图片特征向量,所述CNN卷积神经网络模型包括卷积层、池化层、全连接层;
S4:根据所述目标图片特征向量与所述标准素材特征向量计算目标图片与标准素材的相似度,具体步骤包括:
S401:计算所述标准素材特征向量和所述的目标图片特征向量的余弦相似度;
S402:根据所述余弦相似度计算加权值,计算公式为:,其中/>为所述标准素材数据集中的标准素材的总数,根据所述加权值得到加权标准素材特征向量和加权目标图片特征向量;
S403:将所述加权标准素材特征和所述加权目标图片特征进行融合得到融合特征,融合公式为:,其中/>为所述标准素材特征,/>为目标图片特征,对所述融合特征使用softmax分类器计算概率分布,根据所述概率分布得到所述标准素材和所述目标图片的相似度/>
S5:对所述标准素材数据集重复S3-S4的步骤,得到目标图片和标准素材相似度的最大值;将所述最大值对应的标准素材的类别标签发送到中央控制中心。
2.根据权利要求1所述方法,其特征在于,所述S1中的预处理包括:
S101:将集装箱锁销图片的像素值归一化到0-1的范围,所述图像归一化方法是减去像素值的均值并除以标准差;
S102:使用均值滤波的方法去除集装箱锁销样本图片的噪声;
S103:所述图像增强包括旋转、裁剪、缩放,将所述集装箱锁销图片进行图像的裁剪至只包含集装箱锁销部分,将所述集装箱锁销图片缩放至200×200像素,将所述集装箱锁销图片旋转90度。
3.根据权利要求1所述方法,其特征在于,所述S3中的卷积层的运算包括:
将所述标准素材和目标图片输入所述卷积层,对标准素材和目标图片进行纹理特征提取、角点特征提取、边缘特征提取得到标准特征图和目标特征图。
4.根据权利要求3所述方法,其特征在于,所述S3中的池化层的运算包括:
将所述标准特征图和所述目标特征图输入所述池化层得到标准降维特征图和目标降维特征图。
5.根据权利要求4所述方法,其特征在于,所述S3中的全连接层的运算包括:
将所述标准降维特征图和所述目标降维特征图输入全连接层得到标准素材特征向量和目标图片特征向量。
6.根据权利要求1所述方法,其特征在于,所述S3中的模型的损失函数定义为:,其中,z为所述标准素材的类别标签,/>为所述目标图片与标准素材相似度。
7.一种集装箱锁销类别图片识别的***,用如权利要求1-6任一项所述的方法运行,其特征在于,包括如下模块:
标准素材数据集、目标图片获取模块、向量生成模块,相似度计算模块、中央控制中心,其中所述标准素材数据集为预构建的集装箱锁销样本图片与类别标签的关联数据集;
所述目标图片获取模块用于获取所述集装箱锁销采集图片,将所述集装箱锁销采集图片经过预处理后得到目标图片;
所述向量生成模块包括将所述标准素材和所述目标图片输入所述CNN卷积神经网络经过3次先卷积再池化后输入到所述全连接层得到标准素材特征向量和目标图片特征向量;
所述相似度计算模块用于计算所述标准素材特征向量和目标图片特征向量的相似度,得到标准素材和目标图片的相似度;
所述中央控制中心用于接收相似度最大时的标准素材对应的类别标签。
CN202311618851.8A 2023-11-17 2023-11-30 一种集装箱锁销类别图片识别方法 Active CN117636026B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202311534756X 2023-11-17
CN202311534756 2023-11-17

Publications (2)

Publication Number Publication Date
CN117636026A CN117636026A (zh) 2024-03-01
CN117636026B true CN117636026B (zh) 2024-06-11

Family

ID=90017739

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202311618851.8A Active CN117636026B (zh) 2023-11-17 2023-11-30 一种集装箱锁销类别图片识别方法

Country Status (1)

Country Link
CN (1) CN117636026B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019237646A1 (zh) * 2018-06-14 2019-12-19 清华大学深圳研究生院 一种基于深度学习和语义分割的图像检索方法
CN110751027A (zh) * 2019-09-09 2020-02-04 华中科技大学 一种基于深度多示例学习的行人重识别方法
CN112287144A (zh) * 2020-10-29 2021-01-29 苏州科达科技股份有限公司 图片检索方法、设备及存储介质
WO2023206944A1 (zh) * 2022-04-25 2023-11-02 深圳思谋信息科技有限公司 一种语义分割方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019237646A1 (zh) * 2018-06-14 2019-12-19 清华大学深圳研究生院 一种基于深度学习和语义分割的图像检索方法
CN110751027A (zh) * 2019-09-09 2020-02-04 华中科技大学 一种基于深度多示例学习的行人重识别方法
CN112287144A (zh) * 2020-10-29 2021-01-29 苏州科达科技股份有限公司 图片检索方法、设备及存储介质
WO2023206944A1 (zh) * 2022-04-25 2023-11-02 深圳思谋信息科技有限公司 一种语义分割方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN117636026A (zh) 2024-03-01

Similar Documents

Publication Publication Date Title
US6915025B2 (en) Automatic image orientation detection based on classification of low-level image features
CN111652317B (zh) 基于贝叶斯深度学习的超参数图像分割方法
Joshi et al. Recent advances in local feature detector and descriptor: a literature survey
CN111079847A (zh) 一种基于深度学习的遥感影像自动标注方法
Zakir et al. Road sign detection and recognition by using local energy based shape histogram (LESH)
CN109145964B (zh) 一种实现图像颜色聚类的方法和***
Agrawal et al. Supervised approach for object identification using speeded up robust features
Chiu et al. A novel directional object detection method for piled objects using a hybrid region-based convolutional neural network
CN112633297A (zh) 目标对象的识别方法、装置、存储介质以及电子装置
Tribak et al. QR code recognition based on principal components analysis method
Lim et al. Text segmentation in color images using tensor voting
CN112784754A (zh) 一种车辆再识别方法、装置、设备及存储介质
CN114842478A (zh) 文本区域的识别方法、装置、设备及存储介质
CN111414917B (zh) 一种低像素密度文本的识别方法
CN111178464A (zh) 一种基于神经网络的ocr识别在物流行业快递面单的应用
CN108090728B (zh) 一种基于智能终端的快递信息录入方法及录入***
CN117292193B (zh) 多工位智能物流输送***
CN117636026B (zh) 一种集装箱锁销类别图片识别方法
Quispe et al. Shape prior based image segmentation using manifold learning
CN105844299B (zh) 一种基于词袋模型的图像分类方法
WO2019071476A1 (zh) 一种基于智能终端的快递信息录入方法及录入***
CN111476524A (zh) 一种基于人工智能的成品出库用货品拣货方法、***、装置及可读存储介质
CN112529513A (zh) 一种智能验印方法及***
CN115601586A (zh) 标签信息获取方法、装置、电子设备及计算机存储介质
Chen et al. Design and Implementation of Second-generation ID Card Number Identification Model based on TensorFlow

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant