CN102509091B - 一种飞机尾号识别方法 - Google Patents
一种飞机尾号识别方法 Download PDFInfo
- Publication number
- CN102509091B CN102509091B CN 201110388239 CN201110388239A CN102509091B CN 102509091 B CN102509091 B CN 102509091B CN 201110388239 CN201110388239 CN 201110388239 CN 201110388239 A CN201110388239 A CN 201110388239A CN 102509091 B CN102509091 B CN 102509091B
- Authority
- CN
- China
- Prior art keywords
- tail number
- airplane tail
- image
- sigma
- airplane
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Image Analysis (AREA)
Abstract
本发明公开了一种飞机尾号识别方法,首先基于Otsu动态阈值二值化对飞机尾号图像进行预处理,将飞机尾号图像与背景分离,再采用连通域法对飞机尾号图像进行字符分割,得到飞机尾号的单个字符并获取射影变换标记点,以此作为标准对飞机尾号图像进行逆射影变换;在飞机尾号字符识别中研究了最优参数支持向量机分类器;对飞机尾号字符采用重心法提取字符特征,支持向量机采用RBF核函数,利用二次网格搜索方法得到最优参数,采用“一对一”多类分类方法,获取基于最优参数支持向量机的飞机尾号。本发明具有较高的识别正确率,能够适用于光照环境多样性的机场场面环境。
Description
技术领域
本发明属于尾号识别的技术领域,特别涉及一种飞机尾号识别方法。
背景领域
飞机尾号识别***中的飞机尾号字符识别技术,其本质是模式识别范畴中的重要方向——文字识别。文字识别(Optical Character Recognition,OCR)概念是由德国科学家Tausheck于1929年首次提出。随着计算机的出现和发展,OCR在全球范围内广泛研究。经过近一个世纪的发展,OCR已经成为当今模式识别领域中最活跃的研究内容之一。它综合了数字图像处理、计算机图形学和人工智能等多方面的知识,并在其相关领域中得到广泛应用。通常OCR识别方法可以分为如下3类:统计特征字符识别技术、结构字符识别技术和基于人工神经网络的识别技术。统计特征字符识别技术一般选取同一类字符中共有的、相对稳定的并且分类性能好的统计特征作为特征向量。常用的统计特征有字符二维平面的位置特征、字符在水平或者垂直方向投影的直方图特征、矩特征和字符经过频域变换或其他形式变换后的特征等。二维的图像被一维的投影代替,计算量减少,同时也消除了文字在投影方向偏移的影响,但是对于字符的旋转变形却无能为力。
基于结构的文字识别实际上是将字符映射到了基元组成的结构空间进行识别。识别过程是在提取基元的基础上,利用形式语言和自动机理论,采取词法分析、树匹配、图匹配和知识推理的方法分析字符结构的过程。J.Park分析了传统结构识别方法的弊端,提出主动字符识别(Active Character Recognition)的思想,主动依据输入图像,动态确定结构特征的选取,达到节省资源、加速识别的目的。与统计识别方法相对应,字符的结构识别技术更加便于区分字型变化大的字符和字型相近的字符。但是由于对结构特征的描述和比较要占用大量的存储和计算资源,因此算法在实现上相对复杂、识别速度慢。
基于人工神经网络的字符识别技术力图通过对人脑功能和结构的模拟来实现字符的高效识别。经过近几年的迅速发展,人工神经网络在字符识别方面得到了广泛的应用。在OCR***中,人工神经网络主要充当分类器的功能。网络的输入是字符的特征向量,输出是字符的分类结果,即识别结果。经过反复学习,神经网络可以智能地将特征向量优化,去除冗余、矛盾的信息,强化类间的差异。由于神经网络采用分布式的网络结构,本身具备可以并行的条件,可以加快大规模问题的求解速度。Krezyak和Le Cun主要研究了BP(Back-Propagation)神经网络在文字识别方面的应用,针对BP网络学习速度慢、泛化能力弱的缺点,在BP网络的基础上产生了竞争监督学习的策略。
在飞机尾号识别方法研究过程中,需要准确的对飞机尾号进行定位、分割和识别,所面临的主要难题有:
1、拍摄得到的机场场面图像受环境因素干扰,图片质量很难保证;
2、飞机尾号图像部分被遮挡和飞机尾号图像变形;
3、机场场面监控图像背景复杂和一幅图像多飞机尾号等问题;
4、受环境中光线等因素的影响,飞机尾号图像会有较大的噪声干扰,造成待分割的尾号字符的字迹模糊,相邻字符粘连,甚至残缺不全。
发明内容
本发明的目的在于针对现有技术的不足,提出一种不同视角下的高分辨率的飞机尾号识别方法,提高***的识别性能,满足国内实际***的性能。本发明是对飞机尾号识别方法的研究,学习现有的模式识别和文字识别技术,并进行改进和创新,将其应用在飞机尾号识别领域,为我国的A-SMGCS***研究和实现提供机场飞机与车辆探测与识别方面的支持,从而为我国的机场场面监视向着A-SMGCS***的过渡和发展提供理论研究和技术支持。
为实现上述目的,本发明的技术方案为:一种飞机尾号识别方法,包括如下具体步骤:
步骤一、原始图片的图像捕获,从不同的视角拍摄多幅图像,并从多幅图像中找出含有飞机尾号的图像;
步骤二、飞机尾号定位预处理,先根据飞机尾号的区域特征来判断牌照,从包含整个机场场面监控的图像中找到尾号区域的位置;
步骤三、基于DCT域和边缘检测的飞机尾号定位技术,由于飞机尾号部分存在大量的边缘信息,提出了基于DCT域和边缘特征的飞机尾号定位技术;
步骤四、采用Otsu动态阈值二值化的飞机尾号分割图像预处理,对已经定位的飞机尾号区域实施基于Otsu动态阈值二值化的飞机尾号分割图像预处理,获得更清晰的飞机尾号的目标区域;
步骤五、连通区域飞机尾号分割,然后采用连通区域分割法将飞机尾号区域分割成单个字符区域;
步骤六、飞机尾号识别,提出基于最优参数支持向量机的飞机尾号识别算法实现飞机尾号识别;
步骤七、识别结果后处理。
其中,步骤四所述的采用Otsu动态阈值二值化的飞机尾号分割图像预处理具体方法为:
采用Otsu动态二值化算法的具体步骤如下:设图像中的灰度级范围为0-L-1,灰度级为i的像素点数为ni,则图像的全部像素数为:
N=n0+n1+...+nL-1 (2)
归一化直方图得到:
阈值t将灰度划分为两类:
C1={1,2,...,t},C2={t+1,t+2,...,L-1} (4)
由图像的灰度直方图可得C1和C2类的出现概率为:
则C1和C2类各自的均值分别为:
C1和C2类各自的方差分别为:
则Otsu动态二值化算法的准则函数为:
从最小灰度值到最大灰度值遍历t,当t使得η取得最大值时的T即为Otsu最佳分割阈值,Otsu动态阈值二值化算法实现较为简单,只要找到遍历所有t的范围,找到一个合适的阈值T即可,该方法对飞机尾号目标和背景分离、图像二值化效果较好。
其中,步骤五所述的采用连通区域分割法将飞机尾号区域分割成单个字符区域的具体的字符切分方法步骤如下:
步骤A1、扫描图像,找到一个当前不属于任何区域的像素,也即要找出一个新的进行区域增长的起点;
步骤A2、把这个像素的灰度与其周围的4邻域(上、下、左、右。或8邻域,本飞机尾号识别***中为了减轻字符粘连的影响,采用4领域)不属于任何一个区域的像素灰度相比较,如果满足一定判断准则,就把它作为同一个区域加以合并;
步骤A3、对于那些新合并的像素,反复进行步骤A2的操作;
步骤A4、反复进行步骤A2、步骤A3的操作,直至区域不能再扩张为止;
步骤A5、返回到步骤A1,寻求能成为新区域出发点的像素。
本发明和现有技术相比的优点在于:
1、本发明采用的基于Otsu动态阈值二值化的飞机尾号分割图像预处理算法,使阈值分割的两类的类间方差大,类内方差小,即类间方差与类内方差的比最大,取到动态的最佳阈值,这种方法能够适用于光照环境多样性的机场场面环境。
2、本发明基于飞机尾号国籍标志的飞机尾号逆射影变换方法能够消除摄像头在机场场面监控对飞机尾号图像采集过程中产生的射影变换,对飞机尾号进行逆射影变换能够有效提高飞机尾号识别***的识别正确率。
附图说明
图1为本发明中飞机尾号识别方法的实现过程;
图2为飞机尾号定位图像预处理过程中灰度变换原理图;这样的变换发现可以把我们感兴趣的灰度区间(r0-r1)内的灰度范围拉开,从而达到增强对比度的目的;
图3为使用基于DCT域和边缘特征的飞机尾号定位技术的飞机尾号定位效果;图3(a)为RGB图像转换后的灰度图像;图3(b)是将灰度图像分割为8×8的图像块,对每一图像块做二维DCT变换,从而得到二维的DCT矩阵;图3(c)使用Canny算子对尾号区域作边缘检测,得到该区域的边缘图;图3(d)为使用基于DCT域和边缘特征的飞机尾号定位技术的得到的尾号定位结果;
图4为采用Otsu动态阈值图像二值化进行飞机尾号分割图像预处理得到的部分实验结果;
图5为本发明采用的连通区域法进行飞机尾号字符分割的实验结果;
图6为飞机尾号图像的逆射影变换去控制点的过程;
图7为机尾号图像的逆射影变换的实验结果;
图8为二维两类线性可分的样本集的情况下的支持向量机最优分类面;
图9为使用网格重心法提取飞机尾号字符特征的效果;
图10为多类分类器方法。
具体实施方式:
为了更好的理解本发明的技术方案,以下结合附图对本发明的具体实施方式作进一步的描述。
图1为本发明的飞机尾号识别方法的实现过程。各个步骤具体实施细节如下:
步骤一、原始图片的图像捕获,从不同的视角拍摄多幅图像,并从多幅图像中找出含有飞机尾号的图像。
在传统道路交通违章抓拍中,专用相机在特定的触发下,进行拍照,所以抓拍到的汽车车牌一般出现在图像的固定区域。由于相机焦距和视角都是固定的,所以车牌的大小和角度也相对确定。而且,车牌的字符数和字体都相对固定。然而上述识别方法并不适用于机场场面飞机的机尾号识别,主要存在以下两个难点:1、机尾号分割难度大。由于飞机停放位置、与摄像头的相对角度不同、机身为光滑弧度曲面,导致机尾号在图像中的位置、大小不固定,字体存在透视变形;机尾号也不存在边框与图像其它部分分割,因此图像分割难度比较大;2、字符多样性。机身上的字体(正体、斜体)、颜色(有白底黑字、深色底白字)和长短(字符数)也各异,加之字符间固有的相似性,很大程度上影响了识别的准确率。
针对以上两个难点,我们需要从不同的视角拍摄多幅图像,并从多幅图像中找出含有飞机尾号的图像。
步骤二、飞机尾号定位预处理。
对机场场面监控图像进行飞机尾号定位的预处理首先要对图像进行灰度化。在RGB模型中,如果R=G=B,则颜色表示一种灰度颜色,其中R=G=B的值叫做灰度值,我们用g来表示。由彩色转换为灰度的过程叫做灰度化处理。由于彩色图像的存储往往占用很大的空间,在对图像进行识别等处理中经常将彩色图像转换为灰度图像,以加快后续的处理速度。R、G、B的取值范围是0-255,所以灰度的级别是256级。
使用灰度变换的主要目的就是提高图像的对比度,即增强原图像各部分的反差。如果一幅图成像时由于光线过暗或者曝光不足,则整幅图偏暗(如灰度范围从0到63);光线过亮或曝光过度则图像偏亮(如灰度范围从200到255),都会造成图像对比度偏低问题,即灰度都挤在一起了,没有拉开。我们可以采用灰度变换的方法来增强图像的对比度。
所谓灰度变换就是将一个灰度区间映射到另一个灰度区间的变换。一种分段线性灰度变换可以定义为:
其原理如图2所示。其中横坐标r表示变换前的灰度等级,纵坐标s表示变换后对应灰度等级,图中粗线(折线)表示了输出灰度和输入灰度的函数关系,细虚线(直线)表示不做任何变换时的情况。经过对比可以发现,这样的变换发现可以把我们感兴趣的灰度区间(r0-r1)内的灰度范围拉开,从而达到增强对比度的目的。
步骤三、基于DCT域和边缘检测的飞机尾号定位技术。
首先通过像素插值将待处理的机场场面监控RGB图像缩放到240×320像素尺寸,然后将RGB图像转换到YUV空间,抽取图像的亮度分量作为灰度图像,如图3(a)所示。将灰度图像分割为8×8的图像块,对每一图像块做二维DCT变换,从得到的二维DCT矩阵中选取一种合适的DCT域特征,为图像中各个图像块计算特征值,如图3(b)所示。选取适当的分类方法,将图像块分为尾号块和背景块两类,由此从图像中初步定位。由于飞机尾号区域边缘信息比较丰富,使用Canny算子对尾号区域作边缘检测,得到该区域的边缘图,如图3(c)所示,然后对此边缘图进行水平扫描,垂直扫描,计算尾号区域各块的边缘密度,再利用阈值方法排除掉误判块,由此尾号区域优化便得到了图像中的较可靠文本区域。使用基于DCT域和边缘特征的飞机尾号定位技术的飞机尾号定位效果如图3(d)所示。
步骤四、采用Otsu动态阈值二值化的飞机尾号分割图像预处理。
全局动态二值化算法从整个灰度图像的像素分布出发,寻求一个最佳的门限值,其中的经典算法Otsu算法,其基本思想是:取一个阈值值t,将图像像索按灰度大小分为大于等于t和小于t两类,然后求出两类像素的平均值方差,即类间方差和两类像素各自的均方差,即类内方差。找出使两个方差比η最大的阈值t,该阈值值即为二值化图像的最佳阈值。这种二值化方法不论图像的直方图有无明显的双峰,都能得到较为满意的效果。因此这种方法是阈值自动选取的较优方法。
Otsu动态二值化算法的具体步骤如下:设图像中的灰度级范围为0-L-1,灰度级为i的像素点数为ni,则图像的全部像素数为:
N=n0+n1+...+nL-1 (2)
归一化直方图得到:
阈值t将灰度划分为两类:
C1={1,2,...,t},C2={t+1,t+2,...,L-1} (4)
由图像的灰度直方图可得C1和C2类的出现概率为:
则C1和C2类各自的均值分别为:
C1和C2类各自的方差分别为:
则Otsu动态二值化算法的准则函数为:
从最小灰度值到最大灰度值遍历t,当t使得η取得最大值时的T即为Otsu最佳分割阈值。Otsu动态二值化算法以阈值划分的两类的类间方差与类内方差的比值反映两类模式在模式空间的分布情况。类间方差越大,类内方差越小,则说明分类结果类与类之间距离大,每类自身各像素性质相似度越大,即阈值分类结果越好。
Otsu动态阈值二值化算法实现较为简单,只要找到遍历所有t的范围,找到一个合适的阈值T即可。在本项目中实际的飞机尾号识别***中即应用了Otsu动态二值化算法,实验结果发现,该方法对飞机尾号目标和背景分离、图像二值化效果较好。采用Otsu动态阈值二值化算法对飞机尾号字符分割图像预处理的部分实验结果如图4所示。
步骤五、连通区域飞机尾号分割。
在理想的情况下,对于飞机尾号的各个字符,每个字符都构成了一个独立的连通区域。连通区域分割法把图像分割成特征相同的小区域(最小的单位是像素),研究与其相邻的各个小区域之间的特征,把具有类似特征的小区域依据一定的判断准则依次合并起来,于是只要得到每个连通区域的最小外界矩阵,我们就可以得到各个飞机尾号字符的位置。具体的字符切分方法如下:
步骤A1、扫描图像,找到一个当前不属于任何区域的像素,也即要找出一个新的进行区域增长的起点;
步骤A2、把这个像素的灰度与其周围的4邻域(上、下、左、右。或8邻域,本飞机尾号识别***中为了减轻字符粘连的影响,采用4领域)不属于任何一个区域的像素灰度相比较,如果满足一定判断准则,就把它作为同一个区域加以合并;
步骤A3、对于那些新合并的像素,反复进行步骤A2的操作;
步骤A4、反复进行步骤A2、步骤A3的操作,直至区域不能再扩张为止;
步骤A5、返回到步骤A1,寻求能成为新区域出发点的像素。
本发明中,进行区域增长的图像是己经进行了阈值分割的二值化图像,图像中只含有0和255两种像素,因此寻找起点和确定区域增长的判断准则都比较简单。实验中,从图像左上角开始,从左到右,从上到下扫描图像,找到第一个黑像素,即灰度值为0的像素,作为第一个起点,进行区域增长,增长方向为4邻域,即从上、下、左、右四个方向搜索满足条件的下一个像素。而判断准则定义为邻域像素与中心像素的差值为0,即同为黑像素的点合并到同一个区域中。程序中,定义了队列来存放区域中的像素。如果遇到黑像素就入队列,则可能会出现黑像素多次入队列的情况,队列中就会出现很多“冗余”的信息。因此,本文采用了“记号填充”的方法,把第一次压入队列的像素做个标记,使它区别于图像中原有的像素0和255。对已标记的像素,下一次区域增长时,就不需要处理了。这样减少了队列空间,提高了处理速度。由此,得到本***对阈值分割后的二值化图像的连通域分割算法:
步骤B1、从左上角开始,扫描二值图像,找到第一个黑色像素,以此像素作为第一个区域进行连通区域的起点,并将其加上标记后,把坐标位置压入队列std::queue regionStack中保存,记录当前区域大小的记数值nRegionSize++;
步骤B2、取出队列中的像素,对该像素进行4邻域搜索,找到其他未被标记的黑色像素,加上标记后放入队列尾部,合并到当前连通区域中,记录当前区域大小的记数值nRegionSize++;
步骤B3、对于队列中那些新合并的像素,反复进行2的操作;
步骤B4、反复进行步骤B2、步骤B3的操作,直至区域不能再扩张,堆栈为空为止;
以上操作即得到飞机尾号图像中的一个连通域。重复以上步骤,得到飞机尾号图像中的所有连通区域。根据国际民用航空组织对飞机尾号格式的标准定义我们可知,正常的飞机尾号应分为6个连通区域。将各连通区域按区域大小排序,将排序在6以后的连通区域消除,这些区域被认为是噪声。对于排序前6位的区域按从左到右的顺序,即为飞机尾号的国籍标志、“-”号分隔符和登记标志的四位数字。图5就是采用连通区域法进行飞机尾号字符分割的实验结果。
步骤六、飞机尾号识别。
步骤C1、逆仿射变换的飞机尾号识别预处理
为了进行飞机尾号图像的逆射影变换,需要获取飞机尾号图像中的4个“信标”点的坐标,和它们在原始图像中相对应的坐标值,即可计算出射影变换矩阵T的值。通过前几部分中对机场场面监控图像进行飞机尾号定位和飞机尾号分割,我们已经得到了飞机尾号中的单个字符,其中包括飞机尾号国际标志和飞机尾号登记标志。本发明即从飞机尾号图像中的国籍标志字母出发,获取影射变换的“信标”控制点,对飞机尾号图片进行逆影射变换。
首先对经过飞机尾号定位和飞机尾号分割得到的飞机尾号国籍标志部分(即为影射变换后的字母“B”,本发明提出的逆射影变换方法目前仅限在国籍标志为中国注册的飞机尾号)。取国籍标志部分与斜率分别为k1=1、k2=-1的直线的切点,作为射影变换的两个控制点。分析该两个控制点连线的斜率k,以决定是否需要进行逆射影变换。本发明中取当连线与y轴之间的夹角大于10°时即进行逆影射变换。再取斜率为k的直线与国籍标志右侧上、下部分的切点作为另外两个控制点。取控制点的过程如图6所示。采用如上所述的算法,对国籍标志部分取4个控制点,即可得到上述射影变换方程中的射影变换矩阵T。计算出影射变换矩阵T后,即可对整个飞机尾号图片进行逆影射变换。在实际应用中,采用如上算法的逆射影变换飞机尾号图像预处理效果较好,能够有效去除摄像机机场场面监控中采集图像受到的射影变换的影响。具体效果如7图所示。
步骤C2、基于支持向量机的飞机尾号字符特征提取
支持向量机的分类方法,基于结构风险最小化原则的统计学习理论是一种专门的小样本统计理论,它为研究有限样本情况下的统计模式识别,并为更广泛的机器学习问题建立了一个较好的理论框架,同时也发展了一种新的模式识别方法——支持向量机(Support VectorMachine,SVM)。这是统计学习理论中最为年轻的一部分,其主要内容在1992-1995年间才基本完成,目前仍处在不断发展阶段。可以说,统计学习理论之所以从20世纪90年代以来受到越来越多的重视,很大程度上是因为其发展出了支持向量机这一通用学习方法。
SVM方法是从线性可分情况下的最优分类面(Optimal Hyperplane)提出的。考虑图8所示的二维两类线性可分的样本集的情况,图中带“+”号的点和带“×”号的点分别表示两类的训练样本,H为把两类样本没有错误分开的分类线,H1,H2分别为过各类样本中离分类线最近的点且平行于分类线的直线,H1和H2之间的距离叫做两类的分类空隙或分类间隔(margin)。所谓的最优分类线就是要求分类线不但能将两类无错误的分开,而且要使两类的分类间隔最大。结合前一章的论述,无错划分是使经验风险最小(为0),而使分类间隔最大实际上是使推广性的界中的置信范围最小,从而使真实风险最小。将这一模型推广到高维空间,最优分类线就扩展为最优分类面。
基于支持向量机的飞机尾号字符特征提取具体为:
如果直接将字符图像作为分类器的输入,将会带来较大的计算量。例如,假设一个飞机尾号的单个字符图像的规格为16×16像素,若以每个像素的灰度值作为特征,则每个输入都是多达256维的特征向量。如此庞大的特征量,无论是从计算的复杂度还是对分类器的性能来看都是很不利的。
字符特征提取总的出发点就是找到从识别的角度而言较有效的特征向量,即来自同一类别的不同样本的特征值应该非常相近,而来自不同样本的特征值应该有很大的差异。对于字符识别来说,抽取有效的字符特征是完成字符识别的首要任务。字符的特征可以分为结构特征和统计特征两大类。
结构特征的提取重点在于确定以基元表示的结构信息,目前主要有基于骨架、轮廓、笔划等得到的结构特征。骨架是人们对字符的抽象认识,基于骨架的结构特征包括特征点——端点、交叉点、转折点等。基于骨架的特征提取极大地依赖于图像细化质量。由于现有的细化算法都或多或少的会出现一些拓扑结构的改变,如Y形分叉、毛刺、断线等。这就要求后继识别有较大的规则灵活性。轮廓也可以反映字符图像的结构,通过在一定范围内寻找轮廓的最远、最近点和最大、最小点得到一系列的结构特征。轮廓相对于骨架,带入了更精确的位置,也节省了细化的运算量,但它易受到笔划宽度和断线的影响,它较适用于图像质量较好,书写较固定的环境。
统计特征是从原始数据中提取与分类最相关的信息,使类内差距极小化,类间差距极大化。特征应对同一字符类的形变尽量保持不变。统计特征可分为全局特征和局部特征。全局特征是对整个字符图像进行变换,将变换后的系数作为图像的一种特征,主要包括:KL(Karhunen-Leeve)变换、Fourier变换、Hadamand变换、Hough变换、矩特征等。局部特征是在特定的位置对特定大小的窗内图像进行变换,主要包括局部灰度特征、投影特征、方向线素特征等。局部灰度特征又称粗网格特征,它通过将标准化图像划分成固定或弹性的网格,并求出每个网格中的平均灰度或目标像素点的个数,得到维数为网格数目的特征向量。投影特征通过对标准化的图像求X和Y方向的投影得到两个N维特征向量,投影特征计算简单,在粗分类是有较好的分辨性。方向线素特征将字符划分为一定的网格,在各个网格中对每个点的不同方向的相邻黑点分为若干类。
结构特征和统计特征提取特征方法各有其优缺点:对于统计特征方法,在确定了某种特征后,特征提取算法简单,易于训练,给定的训练集上能得到相对较高的识别率。但最大的缺点是在特征选择上较难;结构特征方法的主要优点之一是能够描述字符的结构,将字符模式整体分解为笔划、笔段和字根等子模式。在识别过程中能有效地结合几何和结构的知识,因此能得到可靠性较高的识别结果,但计算量大,对归属不明确的线段难以表征或易于产生错误编码。
事实表明,任何一种特征都很难完美地代表任意模式。因为在实际问题中不容易找到那些最重要的特征,或者受条件所限不能对它们进行测量,这就使得特征的选择和提取任务复杂化,进而成为构造模式识别***最困难的任务之一。因此,如何寻求将上述二种方法的优点有机结合的特征提取方法是值得深入研究的课题。
本发明最终选用了网格重心法来提取字符图像的特征。重心特征提取的步骤如下:
步骤(1)、计算图像的重心O0;
步骤(2)、以O0将图像分成四部分,并计算每个部分的重心,得到O1,O2,O3,O4;
步骤(3)、分别以O1,O2,O3,O4将每个部分再次划分成四个子部分,这样共形成16个小部分,取每个小部分的重心O5,O6,...,O20。
本文采用了两种征维数分别为24和48的重心特征:24维的特征取归一化后的O1,O2,O3,O4的X,Y坐标和图像被划分为的16个部分的像素数作为飞机尾号特征;48维的特征取O5,O6,O7,...,O20的X,Y坐标和图像被划分为的16部分的像素数作为飞机尾号特征。
这种网格重心特征能较好的反应字符在图像中的分布情况,因此区分不同类别字符的能力较强,受噪声影响较小,而且由于特征维数较小,空间和时间的复杂度都比较小,是一种较好的字符图像特征提取方法。假设一幅灰度飞机尾号图像大小为M×N,f(x,y)表示位于图像中(x-1)行,(y-1)列的像素的灰度值。图像的重心计算公式为:
重心特征提取的效果如图9所示。
步骤C3、多分类器识别
支持向量机本身是一个两类问题的判别方法,实际应用中经常需要对多类问题进行分类,这就涉及到多类问题到二类问题的转换。多类SVM算法的实现思想主要有以下两种:
1、通过某种方式把多类分类问题分解为多个二类分类问题,该方法需要对训练样本进行重新分配,使得样本符合新的多个二类问题分类的需要,同时根据算法的实现采取不同策略决定测试样本所属类别。
2、把多个分类面的求解合并到一个最优化问题中,该方法是二类问题的推广,一次性的求解一个大的二次规划问题,直接将多类问题同时分开。该方法虽然比第一种思想简单,但其算法复杂度大大增加,需要更多的变量,训练时间较长,推广能力也不比第一种方法更优,不适合应用于大规模的数据样本。
下面基于第一种思想,介绍几种比较常用的多类分类方法。
1、一类对余类法。一类对余类法(One Versus Rest,OVR)是最早出现也是目前应用最为广泛的方法之一,其步骤是构造n个两类分类器(共有n个类别),其中第i个分类器把第i类同余下的各类划分开,训练时第i个分类器取训练集中第i类为正类,其余类别点为负类进行训练。判别时,输入信号分别经过n个分类器共得到n个输出值fi(x)=sgn(gi(x)),若只有一个+1出现,则其对应类别为输入信号类别;若输出不只一个+1(不只一类声称它属于自己),或者没有一个输出为+1(即没有一个类声称它属于自己),则比较g(x)输出值,最大者对应类别为输入的类别。该方法实现比较简单,只需要训练n个两类分类支持向量机,故其所得到分类函数个数较少(n个),所以识别速度较快。但是该算法的缺点也很是明显,每个分类器的训练都是将全部的样本作为训练样本,这样就需要求解n个二次规划问题,因为每个支持向量机的训练速度随着训练样本的数量急剧减慢,因此,这种方法的训练时间比较长。
2、一对一分类法。一对一分类法(One Versus One,OVO)也称为成对分类法。在训练集T(共有k个不同类别)中找出所有不同类别的两两组合,共有P=k(k-1)/2个,分别用这两个类别样本点组成两类问题训练集T(i,j),然后用求解两类问题的支持向量机分类法分别求得P个判别函数f(i,j)(x)=sgn(gi,j(x))。判别时将输入信号X分别送到P个判别函数f(i, j)(x),若f(i,j)(x)=1,判X为i类,i类获得一票,否则判为j类,j类获得一票。分别统计k个类别在P个判别函数结果中的得票数,得票数最多的类别就是最终判定类别。在这种方法中,对k类问题就有k(k-1)/2个两类分类器,比上面的“一对多”方法得到的分类器的数目大很多。尽管如此,“一对一”方法的每个分类问题的规模却小了很多,要学习的问题也比较简单。但是如果k很大,需要的分类器的数目就会非常大,这时此方法的速度就会慢许多。
上述两种多类分类器方法的图示如图10所示。
步骤七、识别结果后处理。
最后,本发明设计了飞机尾号识别***演示软件用来演示提出的飞机尾号识别算法。在本发明中提到的飞机尾号分割、飞机尾号识别等模块均嵌入该演示软件。由于视频监视方法不仅能提供机场范围飞机、车辆精确检测和位置测量,而且能对滑行道、停机坪上的飞机尾号进行图像自动识别,所以我们将识别结果与融入到最终显示界面中,为监视结果自动加入标签。
Claims (1)
1.一种飞机尾号识别方法,其特征在于:该方法包括如下具体步骤:
步骤一、原始图片的图像捕获,从不同的视角拍摄多幅图像,并从多幅图像中找出含有飞机尾号的图像;
步骤二、飞机尾号定位预处理,先根据飞机尾号的区域特征来判断牌照,从包含整个机场场面监控的图像中找到尾号区域的位置;
步骤三、基于DCT域和边缘检测的飞机尾号定位技术,由于飞机尾号部分存在大量的边缘信息,提出了基于DCT域和边缘特征的飞机尾号定位技术;
步骤四、采用Otsu动态阈值二值化的飞机尾号分割图像预处理,对已经定位的飞机尾号区域实施基于Otsu动态阈值二值化的飞机尾号分割图像预处理,获得更清晰的飞机尾号的目标区域;
所述的采用Otsu动态阈值二值化的飞机尾号分割图像预处理具体方法为:
采用Otsu动态二值化算法的具体步骤如下:设图像中的灰度级范围为0-L-1,灰度级为i的像素点数为ni,则图像的全部像素数为:
N=n0+n1+...+nL-1 (2)
归一化直方图得到:
阈值t将灰度划分为两类:
由图像的灰度直方图可得C1和C2类的出现概率为:
则C1和C2类各自的均值分别为:
C1和C2类各自的方差分别为:
则Otsu动态二值化算法的准则函数为:
从最小灰度值到最大灰度值遍历t,当t使得η取得最大值时的T即为Otsu最佳分割阈值,Otsu动态阈值二值化算法实现较为简单,只要找到遍历所有t的范围,找到一个合适的阈值T即可,该方法对飞机尾号目标和背景分离、图像二值化效果较好;
步骤五、连通区域飞机尾号分割,然后采用连通区域分割法将飞机尾号区域分割成单个字符区域;
所述的采用连通区域分割法将飞机尾号区域分割成单个字符区域的具体的字符切分方法步骤如下:
步骤A1、扫描图像,找到一个当前不属于任何区域的像素,也即要找出一个新的进行区域增长的起点;
步骤A2、把这个像素的灰度与其周围的4邻域不属于任何一个区域的像素灰度相比较,如果满足判断准则,就把它作为同一个区域加以合并;
步骤A3、对于那些新合并的像素,反复进行步骤A2的操作;
步骤A4、反复进行步骤A2、步骤A3的操作,直至区域不能再扩张为止;
步骤A5、返回到步骤A1,寻求能成为新区域出发点的像素;
其中,进行区域增长的图像是己经进行了阈值分割的二值化图像,对阈值分割后的二值化图像的连通域分割算法:
步骤B1、从左上角开始,扫描二值图像,找到第一个黑色像素,以此像素作为第一个区域进行连通区域的起点,并将其加上标记后,把坐标位置压入队列std::queue regionStack中保存,记录当前区域大小的记数值nRegionSize++;
步骤B2、取出队列中的像素,对该像素进行4邻域搜索,找到其他未被标记的黑色像素,加上标记后放入队列尾部,合并到当前连通区域中,记录当前区域大小的记数值nRegionSize++;
步骤B3、对于队列中那些新合并的像素,反复进行B2的操作;
步骤B4、反复进行步骤B2、步骤B3的操作,直至区域不能再扩张,堆栈为空为止;
以上操作即得到飞机尾号图像中的一个连通域,重复以上步骤,得到飞机尾号图像中的所有连通区域;
步骤六、飞机尾号识别,提出基于最优参数支持向量机的飞机尾号识别算法实现飞机尾号识别;具体步骤如下:
步骤C1、逆仿射变换的飞机尾号识别预处理;
步骤C2、基于支持向量机的飞机尾号字符特征提取;
步骤C3、多分类器识别;
步骤七、识别结果后处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110388239 CN102509091B (zh) | 2011-11-29 | 2011-11-29 | 一种飞机尾号识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN 201110388239 CN102509091B (zh) | 2011-11-29 | 2011-11-29 | 一种飞机尾号识别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102509091A CN102509091A (zh) | 2012-06-20 |
CN102509091B true CN102509091B (zh) | 2013-12-25 |
Family
ID=46221172
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN 201110388239 Expired - Fee Related CN102509091B (zh) | 2011-11-29 | 2011-11-29 | 一种飞机尾号识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN102509091B (zh) |
Families Citing this family (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103500323B (zh) * | 2013-09-18 | 2016-02-17 | 西安理工大学 | 基于自适应灰度图像滤波的模板匹配方法 |
CN103971091B (zh) * | 2014-04-03 | 2017-04-26 | 北京首都国际机场股份有限公司 | 飞机机号自动识别方法 |
CN105335688B (zh) * | 2014-08-01 | 2018-07-13 | 深圳中集天达空港设备有限公司 | 一种基于视觉图像的飞机机型识别方法 |
CN104156706A (zh) * | 2014-08-12 | 2014-11-19 | 华北电力大学句容研究中心 | 一种基于光学字符识别技术的中文字符识别方法 |
CN104243935B (zh) * | 2014-10-10 | 2018-02-16 | 南京莱斯信息技术股份有限公司 | 基于视频识别的机场场监***目标监控方法 |
CN104408678A (zh) * | 2014-10-31 | 2015-03-11 | 中国科学院苏州生物医学工程技术研究所 | 一种供个人使用的电子病历*** |
CN105512682B (zh) * | 2015-12-07 | 2018-11-23 | 南京信息工程大学 | 一种基于Krawtchouk矩和KNN-SMO分类器的密级标识识别方法 |
CN106056751B (zh) * | 2016-05-20 | 2019-04-12 | 聚龙股份有限公司 | 冠字号码的识别方法及*** |
CN105957238B (zh) * | 2016-05-20 | 2019-02-19 | 聚龙股份有限公司 | 一种纸币管理方法及其*** |
CN106374394A (zh) * | 2016-09-28 | 2017-02-01 | 刘子轩 | 一种基于图像识别技术的管道机器人和控制方法 |
CN108734158B (zh) * | 2017-04-14 | 2020-05-19 | 成都唐源电气股份有限公司 | 一种实时列车车号识别方法及装置 |
CN108090442A (zh) * | 2017-12-15 | 2018-05-29 | 四川大学 | 一种基于卷积神经网络的机场场面监视方法 |
CN108256493A (zh) * | 2018-01-26 | 2018-07-06 | 中国电子科技集团公司第三十八研究所 | 一种基于车载视频的交通场景文字识别***及识别方法 |
CN108564064A (zh) * | 2018-04-28 | 2018-09-21 | 北京宙心科技有限公司 | 一种基于视觉高效ocr识别算法 |
CN109409373A (zh) * | 2018-09-06 | 2019-03-01 | 昆明理工大学 | 一种基于图像处理的字体识别方法 |
CN109299743B (zh) * | 2018-10-18 | 2021-08-10 | 京东方科技集团股份有限公司 | 手势识别方法及装置、终端 |
CN109850518B (zh) * | 2018-11-12 | 2022-01-28 | 太原理工大学 | 一种基于红外图像的实时矿用胶带预警撕裂检测方法 |
CN109858484B (zh) * | 2019-01-22 | 2022-10-14 | 电子科技大学 | 一种基于偏斜评价的多类别变换车牌校正方法 |
CN110097052A (zh) * | 2019-04-22 | 2019-08-06 | 苏州海赛人工智能有限公司 | 一种基于图像的真假车牌判别方法 |
CN111110189B (zh) * | 2019-11-13 | 2021-11-09 | 吉林大学 | 一种基于dsp声音与图像识别技术的防打鼾装置及方法 |
CN111429403B (zh) * | 2020-02-26 | 2022-11-08 | 北京航空航天大学杭州创新研究院 | 一种基于机器视觉的汽车齿轮成品缺陷检测方法 |
CN113449574A (zh) * | 2020-03-26 | 2021-09-28 | 上海际链网络科技有限公司 | 目标上内容的识别方法及装置、存储介质、计算机设备 |
CN111582237B (zh) * | 2020-05-28 | 2022-08-12 | 国家海洋信息中心 | 基于atsm模型的高分影像飞机类型识别方法 |
CN116912845B (zh) * | 2023-06-16 | 2024-03-19 | 广东电网有限责任公司佛山供电局 | 一种基于nlp与ai的智能内容识别与分析方法及装置 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8345968B2 (en) * | 2007-06-28 | 2013-01-01 | Mitsubishi Electric Corporation | Image encoding device, image decoding device, image encoding method and image decoding method |
CN100590675C (zh) * | 2007-12-28 | 2010-02-17 | 北京航空航天大学 | 一种固定式卡口电子警察抓拍装置 |
CN101789080B (zh) * | 2010-01-21 | 2012-07-04 | 上海交通大学 | 车辆车牌实时定位字符分割的检测方法 |
CN101859382B (zh) * | 2010-06-03 | 2013-07-31 | 复旦大学 | 一种基于最大稳定极值区域的车牌检测与识别的方法 |
CN101976340B (zh) * | 2010-10-13 | 2013-04-24 | 重庆大学 | 基于压缩域的车牌定位方法 |
-
2011
- 2011-11-29 CN CN 201110388239 patent/CN102509091B/zh not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
CN102509091A (zh) | 2012-06-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102509091B (zh) | 一种飞机尾号识别方法 | |
CN109840521B (zh) | 一种基于深度学习的一体化车牌识别方法 | |
Yuan et al. | Large-scale solar panel mapping from aerial images using deep convolutional networks | |
Pan et al. | A robust system to detect and localize texts in natural scene images | |
CN102663348B (zh) | 一种光学遥感图像中的海上舰船检测方法 | |
CN102609686B (zh) | 一种行人检测方法 | |
CN101859382B (zh) | 一种基于最大稳定极值区域的车牌检测与识别的方法 | |
CN103761531B (zh) | 基于形状轮廓特征的稀疏编码车牌字符识别方法 | |
CN110598690B (zh) | 一种端到端光学字符检测识别方法与*** | |
Zhang et al. | Study on traffic sign recognition by optimized Lenet-5 algorithm | |
CN107103317A (zh) | 基于图像融合和盲反卷积的模糊车牌图像识别算法 | |
Zhang et al. | CDNet: A real-time and robust crosswalk detection network on Jetson nano based on YOLOv5 | |
CN106529532A (zh) | 一种基于积分特征通道与灰度投影的车牌识别*** | |
CN105868700A (zh) | 一种基于监控视频的车型识别与跟踪方法及*** | |
CN102708356A (zh) | 一种基于复杂背景下的车牌自动定位和识别方法 | |
CN110008900B (zh) | 一种由区域到目标的可见光遥感图像候选目标提取方法 | |
CN108427919B (zh) | 一种基于形状引导显著性模型的无监督油罐目标检测方法 | |
Saleh et al. | Traffic signs recognition and distance estimation using a monocular camera | |
Sugiharto et al. | Traffic sign detection based on HOG and PHOG using binary SVM and k-NN | |
Kilic et al. | Turkish vehicle license plate recognition using deep learning | |
Sheng et al. | Real-time anti-interference location of vehicle license plates using high-definition video | |
Pham et al. | CNN-based character recognition for license plate recognition system | |
Ying et al. | License plate detection and localization in complex scenes based on deep learning | |
Singh et al. | Road sign recognition using LeNet5 network model | |
Wang et al. | Extraction of main urban roads from high resolution satellite images by machine learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20131225 Termination date: 20211129 |