CN111985470A

CN111985470A - 一种自然场景下的船牌矫正识别方法

Info

Publication number: CN111985470A
Application number: CN202010656239.XA
Authority: CN
Inventors: 宣琦; 张鑫辉; 孙翊杰; 赵佳康; 翔云; 钱丽萍
Original assignee: Zhejiang University of Technology ZJUT
Current assignee: Zhejiang University of Technology ZJUT
Priority date: 2020-07-09
Filing date: 2020-07-09
Publication date: 2020-11-24
Anticipated expiration: 2040-07-09
Also published as: CN111985470B

Abstract

一种自然场景下的船牌矫正识别方法，包括以下步骤：1)数据获取：通过摄像头采集港口进出船舶的图片；2)数据处理：对图片进行标注并将船牌图像裁剪；3)模型训练：用标注的船牌图片训练船牌矫正识别模型；4)模型检测：用训练好的救生衣检测模型对船牌图像进行识别，得到矫正后的船牌图像和船牌名；本发明选取深度学习模型，在无需添加额外的标注情况下，提高对船牌的识别速度和准确率，具有较高的实际应用价值。

Description

一种自然场景下的船牌矫正识别方法

技术领域

本发明涉及计算机应用技术领域及文本矫正领域，特别是涉及一种自然场景下的船牌矫正方法。

背景技术

近年来，随着科技和陆路交通的发展，车牌自动识别***越来越成熟，然而我国水路交通并未得到很好发展，在旅游业和渔业日益发展的今天，船舶的船牌自动识别技术也越来与重要，它可以广泛的应用到水路的交通管控、交通管理、航道网建设等场景。

然而，自然环境下的船牌识别面临许多困难和挑战，摄像头拍摄的船牌是一个矩形图片，大部分船舶船牌印刷在弯曲的船侧，本身存在一定弯曲，还有船舶经过摄像头监控点时，其位置的不确定性和摄像头也会产生不可避免的角度变化，这导致最终的船牌图像存在不同程度上的扭曲和倾斜，这种不同程度的图像变形会对识别***带来不利影响，容易造成字符误分割，从而导致了识别率的下降。当前，研究者们针对特定牌照图像的矫正研究也提出很多方法，大部分都是基于传统方法，通过检测边缘直线，确定图像倾斜角，用几何变换达到矫正效果，但这种算法受到内存及运算速度的限制，无法达到实时处理的效果，而且在处理船牌这种本身存在一定扭曲的图像上效果也不是很好。

因此，需要一种有效的船牌矫正识别方法，能快速的将扭曲和倾斜的船牌矫正成正常的船牌并识别，这对实现海洋和河道航道智能交通***功能具有重大的理论意义和实现价值。

发明内容

为了克服现有技术的不足，本发明提供一种自然场景下的船牌矫正识别方法。该方法使用文字校正模型，能够解决不规则排列文字的文字识别问题，可以有效矫正船牌，提高船牌矫正的速度和船牌识别率。

本发明解决其技术问题所采用的技术方案如下：

一种自然场景下的船牌矫正识别方法,包括以下步骤：

S1：数据获取：通过摄像头采集港口进出船舶的图片；

S2：数据处理：对原图裁剪获取船牌图片；

S3：模型训练：用文字矫正模型训练船牌矫正，过程如下：

S3-1:将船牌图像I传入，将图像转换成小图I_d，然后传入定位网络，回归出一系列坐标点，通过激活函数归一化为[-1,1]，确定出20个确定文字区域的基准点C；

S3-2:将船牌图片I与S3-1中生成的20个基准点的坐标输入网格生成网络，通过TPS变换输出另一组基准点C′，并生成输出坐标；

S3-3:通过采样器进行双线性插值并将超出图的部分直接删掉，得到修正后的输出图像I′；

S3-4：将矫正后的船牌图像I′输入识别网络，识别网络主要分为编码层和解码层，图像输入后先通过编码层提取文字特征，再通过解码层得到正向船牌识别结果和反向船牌识别结果；

S4：模型检测：用训练好的船牌矫正模型对船牌进行矫正并得到船牌名；

优选地，所述步骤S1中，利用港口摄像头拍摄来往船舶视频，每隔0.5秒取帧并保存为JPEG格式。

进一步，所述步骤S2中，将包含船牌的JPEG图片通过人工用软件Labelimg手动标定船牌边框，标签类别标成船牌名，然后生成xml文件。将船牌从原图中切割，将船牌转换成64*200大小并保存，然后制作船牌编码表文件，最后以8:2的比例分别在train.txt文件和eval.txt文件中保存对应文件名和船牌名。

再进一步，所述步骤S3-1中，定位网络包括8层卷积层、7个最大池化层、2个全连接层。

所述步骤S3-2中，TPS变换：

其中d_i,k表示p′_i和C′_k的欧氏距离，

为常量，K＝20。

P＝{p_i},i＝1,2,…,N表示输入图像，P′＝{p′_i},i＝1,2,…,N表示网格生成网络中对应原图生成的网格坐标信息，其中p_i跟p′_i表示每一个像素点的坐标，N为图像的像素点个数。

所述步骤S3-4中，编码层由卷积层和双向LSTM模块构成，解码层由注意力机制模块和LSTM模块构成，图片通过卷积层提取文字特征，再经过双向LSTM模块编码得到特征序列图，然后通过注意力机制模块提取到具体每个船牌文字所在位置信息，并通过双向LSTM模块进行解码分别得到正向船牌识别结果和反向船牌识别结果。

所述步骤S4中，将船牌图片转换成64*200大小，传入训练好的船牌矫正识别模型，得到矫正后的船牌图像和船牌名对应的编码，经过正反向船牌识别置信度判断，选取置信度较高的识别结果，通过编码表文件进行解码，得到最后的船牌名。

本发明的有益效果为：由于自然场景下船牌扭曲、倾斜程度不同，用传统方法很难对所有船牌图像进行很好的矫正。本发明选取深度学习模型对船牌矫正并识别，节省成本与空间，相比于传统手动提取图像特征与简单利用神经网络的方法，本发明选取不同类型、不同大小等各种不同特征的船牌图像训练船牌矫正识别模型，节省了矫正时间并且提高了船牌识别准确率。

附图说明

图1为本发明实施例的自然场景下的船牌矫正识别方法的流程图；

图2为本发明实施例的船牌矫正模型流程图；

图3为本发明实施例的矫正结果示例图。

具体实施方式

下面结合说明书附图对本发明的具体实施方式作进一步详细的描述。

参照图1～图3，一种自然场景下的船牌矫正识别方法，包括以下步骤：

S1：数据获取：通过摄像头采集港口进出船舶的图片；

S2：数据处理：对原图裁剪获取船牌图片；

S3：模型训练：用文字矫正模型训练船牌矫正识别；

S4：模型检测：用训练好的船牌矫正模型对船牌进行矫正识别并得到船牌名；

所述步骤S2包括以下步骤：

S2-1:去除不含船牌的图片，将包含船牌的JPEG图片通过人工用软件Labelimg手动标定船牌边框，4个顶点的坐标记为(x1,y1),(x2,y2),(x3,y3),(x4,y4)，标签类别标成船牌名，生成xml文件；

S2-2:编写图像切割程序，通过图像和xml文件将船牌从原图中切出，并转换成64*200大小并保存；

S2-3:将船牌图片中出现的所有文字进行编码，得到编码表文件dict.json，每个文字对应一个数字(只有编码后的中文才能传入模型训练)；

S2-4：编写程序将全部船牌顺序打乱，将80％的船牌作为训练集，20％的作为验证集，然后将对应文件名和船牌名分别保存在train.txt文件和eval.txt文件中。

所述步骤S3对应图2包括以下步骤：

S3-1:将船牌图像I传入，将图像转换成小图I_d(减少网络参数，降低计算量)，然后传入定位网络，回归出一系列坐标点，通过激活函数tanh归一化为[-1,1],确定出20个确定文字区域的基准点C，定位网络包括8层卷积层、7个最大池化层、2个全连接层；

TPS变换：

其中d_i,k表示p′_i和C′_k的欧氏距离，

为常量，K＝20；

P＝{p_i},i＝1,2,…,N表示输入图像，P′＝{p′_i},i＝1,2,…,N表示网格生成网络中对应原图生成的网格坐标信息，其中p_i跟p′_i表示每一个像素点的坐标，N为图像的像素点个数；

S3-3:通过采样器进行双线性插值并将超出图的部分直接删掉，得到修正后的输出图像I′，I′＝V(P,I)；

S3-4：将矫正后的船牌图像I′输入识别网络，识别网络主要分为编码层和解码层，编码层由卷积层和双向LSTM模块构成，解码层由注意力机制模块和LSTM模块构成，图像输入后先通过卷积层提取文字特征，再经过双向LSTM模块编码得到特征序列图，然后通过注意力机制模块提取到具体每个船牌文字所在位置信息，并通过双向LSTM模块进行解码分别得到正向船牌识别结果和反向船牌识别结果；

所述步骤S4中，将船牌图片转换成64*200大小，传入训练好的船牌矫正识别模型，得到矫正后的船牌图像和船牌名对应的编码，经过正反向船牌识别置信度判断，选取置信度较高的识别结果，通过编码表文件dict.json进行解码，得到最后的船牌名。

如上所述为本发明自然场景下的船牌矫正识别方法的实施例介绍，本发明通过标注不同程度扭曲和倾斜的船牌图片制作训练数据，训练得到船牌矫正识别模型，并使用模型矫正扭曲和倾斜的船牌，并识别出具体船牌名。本发明相比于传统手动提取特征的方法和简单的神经网络方法，具有检测速度快和准确率高的优势。

以上所述，仅为本发明专利较佳的实施例，对本发明而言仅仅是说明性，而非限制性，任何熟悉本技术领域的技术人员在本发明专利所公开的范围内，根据本发明专利的技术方案及其发明专利构思加以等同替换或改变，都属于本发明专利的保护范围。

Claims

1.一种自然场景下的船牌矫正识别方法，其特征在于，所述方法包括以下步骤：

S1：数据获取：通过摄像头采集港口进出船舶的图片；

S2：数据处理：对原图裁剪获取船牌图片；

S3：模型训练：用文字矫正模型训练船牌矫正识别，过程如下：

2.如权利要求1所述的一种自然场景下的船牌矫正识别方法，其特征在于，所述步骤S2包括以下步骤：

S2-1：去除不含船牌的图片，对包含船牌的图片中的船牌边框四个顶点进行标定，四个顶点的坐标记为(x1,y1),(x2,y2)，(x3,y3)，(x4,y4)，标签类别标成船牌名，生成xml文件；

S2-2：编写图像切割程序，通过图像和xml文件将船牌切割，并转换成64*200大小并保存；

S2-3：将船牌图片中出现的所有文字进行编码，得到编码文件；

S2-4：编写程序将全部船牌顺序打乱，将一部分的船牌作为训练集，余下的的作为验证集，然后将对应文件名和船牌名分别保存在train.txt文件和eval.txt文件中。

3.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法，其特征在于，所述步骤S3-1中，定位网络包括8层卷积层、7个最大池化层、2个全连接层。

4.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法，其特征在于，所述步骤S3-2中，TPS变换：

其中d_i,k表示p′_i和C′_k的欧氏距离，

为常量，K＝20。

5.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法，其特征在于，所述步骤S3-4中，编码层由卷积层和双向LSTM模块构成，解码层由注意力机制模块和LSTM模块构成，图片通过卷积层提取文字特征，再经过双向LSTM模块编码得到特征序列图，然后通过注意力机制模块提取到具体每个船牌文字所在位置信息，并通过双向LSTM模块进行解码分别得到正向船牌识别结果和反向船牌识别结果。

6.如权利要求1或2所述的一种自然场景下的船牌矫正识别方法，其特征在于，所述步骤S4中，将船牌图片转换成64*200大小，传入训练好的船牌矫正识别模型，得到矫正后的船牌图像和船牌名对应的编码，经过正反向船牌识别置信度判断，选取置信度较高的识别结果，通过编码表文件进行解码，得到最后的船牌名。