CN107122777A

CN107122777A - 一种基于视频文件的车辆分析***及分析方法

Info

Publication number: CN107122777A
Application number: CN201710277862.2A
Authority: CN
Inventors: 段明磊; 罗春燕; 肖强; 李明洪; 何磊; 崔雪梅; 孙文杰; 尹存源; 李玲
Original assignee: INSTITUTE OF COMMUNICATION SCIENCE YUNNAN PROVINCE
Current assignee: INSTITUTE OF COMMUNICATION SCIENCE YUNNAN PROVINCE
Priority date: 2017-04-25
Filing date: 2017-04-25
Publication date: 2017-09-01

Abstract

本发明属于数据处理技术领域，公开了一种基于视频文件的车辆分析***及分析方法，包括：读入图像单元，图像预处理单元，车牌定位与提取单元，字符分割单元，字符识别单元；分析方法包括：通过图像灰度化、图像增强、边缘提取、二值化等技术，将车牌图像转换为用于车牌定位的二值化图像；车牌定位及图像信息提取；通过字符分割单元，定位车牌信息字符边界，截取所有字符；应用模板匹配算法进行字符识别，识别车牌内部数字。本发明大大提高了车辆分析后续处理的速度，并通过基于彩色分量的定位方法，实现了对于蓝色牌照车辆的定位。

Description

一种基于视频文件的车辆分析***及分析方法

技术领域

本发明属于数据处理技术领域，尤其涉及一种基于视频文件的车辆分析***及分析方法。

背景技术

在建设平安城市的进程中，安全是政府日常管理工作中的重要任务。随着城市报警和监控***的建设，对于监控数据的分析也日显重要，需要对重点街道或路口采集的视频数据进行分析。实现可以对街道或路口的车辆流量进行统计，一方面解决了从海量数据中人工分析的困难，另一方面通过机动车辆的统计，对城市道路建设以及交通管理都具有重要指导意义。

实现机动车牌照的自动识别是一切智能交通管理活动的基础。如何开发一套行之有效的车牌自动识别***，特别是车牌定位子***，具有重要意义。

随着图形图像技术的发展，目前国内外车牌识别的准确率逐渐得到提高，但是，一套完整的车牌识别***通常由触发、图像采集、图像识别模块、辅助光源和通信模块组成，并涉及到光学、电器、电子控制、数字图像处理、计算视觉、人工智能等多项技术，其中，目前对于车牌定位与图像处理问题的研究尚不成熟，仍然存在一系列问题，主要体现在现有的车辆分析***在获取整个图像中车牌的区域，并识别出车牌号的能力较差。

随着智能交通***在交通领域中的广泛应用，图像处理技术成为智能交通***的重要研究领域，具有极其重要的理论和应用价值。利用图像处理的各种技术来进行车辆的牌照定位，车辆牌照定位的精确和清晰，是保证识别准确的前提和基础。本发明提出了一套基于视频的车辆分析***及分析方法，对于道路交通中的车辆识别与分析具有重大的意义，对城市交通安全与车辆的智能管理具有决定性作用，同时也拓展了图形处理技术对车***的应用价值。

发明内容

针对现有技术存在的问题，本发明提供了一种基于视频文件的车辆分析***及分析方法。

本发明是这样实现的，一种基于视频文件的车辆分析***，所述基于视频文件的车辆分析***包括：

读入图像单元，用于输入车牌图像，并将输入的图像默认为清晰的、没有倾斜角度的图像；

图像预处理单元，用于把读入图像单元输入的图像，经过图像灰度化，图像增强，边缘提取，二值化后，转换成用于车牌定位的二值化图像；

车牌定位与提取单元，用于对车牌进行定位和提取图像信息；

字符分割单元，用于对定位的车牌信息进行定位字符边界，进而将车牌内的所有字符截取出来；

字符识别单元，应用模板匹配的算法用于字符的识别，识别出车牌内部的数字。

本发明另一目的在于提供一种基于视频文件的车辆的分析方法，通过读入图像单元，输入车牌图像，并将输入的图像默认为清晰的、没有倾斜角度的图像；

通过图像预处理单元，把读入图像单元输入的图像，经过图像灰度化，图像增强，边缘提取，二值化后，转换成用于车牌定位的二值化图像；

通过车牌定位与提取单元对车牌进行定位和提取图像信息；

通过字符分割单元，对定位的车牌信息进行定位字符边界，进而将车牌内的所有字符截取出来；

通过字符识别单元，采用应用模板匹配的算法进行字符的识别，识别出车牌内部的数字。

进一步，所述图像灰度化的方法包括：利用加权平均法，将图像灰度化，公式如下：

f(i,j)＝0.299R(i,j)+0.588G(i,j)+0.114B(i,j)。

进一步，所述边缘提取的方法包括：

利用差分法边缘提取。

进一步，所述图像二值化的方法包括：

图像的二值化把灰度图像处理成二值图像；找到合适的阈值来区分对象和背景；

阈值计算公式：T＝Gmax-(Gmax-Gmin)/3；

图像二值化公式：

进一步，所述车牌定位方法包括：

利用车牌区域的特征来判断牌照，将车牌区域从整幅车辆图像中分割出来；

车牌字符和牌照底色在灰度值上存在大的跳变，根据图像中水平方向的跳变点的变化规律来进行车牌位置上的纹理特征的提取，定位车牌的上下边界；定位出上下边界之后，计算车牌的近似高度，根据车牌的宽高比例，计算出车牌的宽度，得出一个自定义的固定大小的车牌区域；在查找到的车牌上下界范围内，利用得出的区域大小横向遍历图像，统计区域内前景点数，满足要求即认为找到车牌区域，否则继续搜索，直到找到符合要求的区域；

求图像的行投影和列投影的公式分别为：

式中，i和j分别为图像的行数和列数；f_v-sum(i)，f_h-sum(i)分别为图像水平投影和垂直投影的统计信息。根据投影特征，再结合频率分析和跳变次数，即可找到车牌的上下边界。

进一步，字符分割算法包括：

车牌中字符间存在一定间隔，则车牌的直方图中出现连续的波峰和波谷；波谷处即为字符的边界处；排列统计二值化后的车牌图像，计算出所有列中含前景点最少的点数；再排列扫描图像，一次查找相邻的含有最小像素点数的两列，计算两列的间距，如果小于2，则是分隔符，确定字符的边界，并依据边界将每个字符从车牌图像中截取出来；

依据灰度阈值分割方法，利用直方图统计法，找到每个字符的左右边界点，判断是否为字符，是的话保留左右边界，否则向后查找。

进一步，字符分割算法包括字符归一化方法，具体为：

设切割出的字符图像大小为M×N，模板大小为L×K，则归一化字符图像为L×K大小。主要思想为，将字符图像均匀分成L×K块区域，分别统计各块中字符前景点的个数，如果大于块内像素数的50％，则认为此块在转换成L×K大小后相对应的像素位前景点；

若切割出的字符图像不能够满足均匀分成L×K块区域，则先定义一个(M×L)×(N×K)的矩阵，将字符图像按比例扩大为(M×L)×(N×K)大小，这样无论切割出的字符图像为多大，均切分成L×K块区域，实现字符的归一化处理；

字符分割算法还包括字符细化方法：

采用OPTA细化算法，将归一化地字符图像上下、左右边界加1的扩展，扩展的边缘默认为背景，在字符图像中自上而下、从左向右地遍历每个前景点像素，与已给的3×3的消去模板和4×4的保留模板进行比较，符合消去模板则将该点设为背景点，符合保留模板的则不变，仍使其为前景点。

进一步，字符识别方法包括：

a)特征提取；采用五个特征组成特征向量进行模板匹配；五个特征值分别为：

模板及待识别字符图像1/5宽度处一列与模板和带识别字符的交点数；

模板及待识别字符图像1/2宽度处一列与模板和带识别字符的交点数；

模板及待识别字符图像4/5宽度处一列与模板和带识别字符的交点数；

模板及待识别字符图像1/4高度处一行与模板和带识别字符的交点数；模

板及待识别字符图像3/4高度处一行与模板和带识别字符的交点数；

b)模板匹配；

将待识别字符图像的特征向量与10个模板的特征向量一次进行比较,结果值最小的为识别出的结果，返回相应模板所代表的数字，特征向量比较公式如下：

进一步，输入的图像中，需进行车牌图像的去噪处理，具体包括：

采用低通滤波和带通滤波来去噪。

本发明的优点及积极效果为：

本发明分别从图像预处理、车牌定位、字符分割以及字符识别等方面进行了***的分析。通过整理和总结国内外在车牌定位、分割、字符识别方面的分析成果和发展方向，以及我国车牌的固有特征，以及车牌识别的特点，采用基于灰度跳变的定位方法，对图像进行预处理以及二值化操作，实现了相关功能。经过相关测试，本发明主要的技术效果如下：

1.本方法既保留了车牌区域的信息，又减少了噪声的干扰，从而简化了二值化处理过程，提高了后续处理的速度；

2.基于彩色分量的定位方法，运用基于蓝色象素点统计特性的方法对车牌是蓝色的车牌进行定位，实验表明，通过该方法实现的车牌定位准确率较高。

附图说明

图1是本发明实施例提供的基于视频文件的车辆分析***示意图。

图中：1、读入图像单元；2、图像预处理单元；3、车牌定位与提取单元；4、字符分割单元；5、字符识别单元。

图2是本发明实施例提供的基于视频文件的车辆分析方法流程图。

图3是本发明实施例提供的车牌区域精确定位流程。

图4是本发明实施例提供的字符分割流程图。

图5是本发明实施例提供的字符识别方法流程图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

下面结合附图对本发明的应用原理作进一步描述。

如图1所示，本发明实施例提供的基于视频文件的车辆分析***，包括：

读入图像单元1，用于输入车牌图像，并将输入的图像默认为清晰的、没有倾斜角度的图像；

图像预处理单元2，用于把读入图像单元输入的图像，经过图像灰度化，图像增强，边缘提取，二值化后，转换成用于车牌定位的二值化图像；

车牌定位与提取单元3，用于对车牌进行定位和提取图像信息；

字符分割单元4，用于对定位的车牌信息进行定位字符边界，进而将车牌内的所有字符截取出来；

字符识别单元5，应用模板匹配的算法用于字符的识别，识别出车牌内部的数字。

如图2所示，本发明实施例提供的提供基于视频文件的车辆的分析方法，包括：

S101:通过读入图像单元，输入车牌图像，并将输入的图像默认为清晰的、没有倾斜角度的图像；

S102:通过图像预处理单元，把读入图像单元输入的图像，经过图像灰度化，图像增强，边缘提取，二值化后，转换成用于车牌定位的二值化图像；

S103:通过车牌定位与提取单元对车牌进行定位和提取图像信息；

S104:通过字符分割单元，对定位的车牌信息进行定位字符边界，进而将车牌内的所有字符截取出来；

S105:通过字符识别单元，采用应用模板匹配的算法进行字符的识别，识别出车牌内部的数字。

下面结具体实施例对本发明作进一步描述。

本发明实施例提供的基于视频文件的车辆分析方法，包括：

1)图像预处理方法：

图像灰度化：

利用加权平均法，将图像灰度化，公式如下：

f(i,j)＝0.299R(i,j)+0.588G(i,j)+0.114B(i,j)

边缘提取：

采用上述中的差分法边缘提取。针对***的图像要求，利用差分法边缘提取可以达到很好的边缘提取效果，而且实现简单，容易理解。

图像二值化：

在***中因为边缘提取用的是差分法，所以整个图像的灰度值有大幅度的下降，所以经过实验统计重新设定二值化阈值为公式所计算出的阈值的1/3。

图像二值化后前景点(即字符)为白色，背景点为黑色。为方便显示和观察，将其转换为前景点为黑色，背景点为白色。

2)车牌搜索与定位方法：

车牌定位方法的出发点是利用车牌区域的特征来判断牌照，将车牌区域从整幅车辆图像中分割出来。车牌自身具有许多的固有特征，这些特征对于不同的国家是不同的。

从人的视觉角度出发，我国车牌具有以下可用于定位的特征:

车牌宽440mm，高140mm，宽高比3.14.内部字符宽45mm，高90mm，间隔符10mm，每个字符间距12mm；

车牌有一个连续或由于磨损而不连续的边框；

车牌底色一般与车身颜色、字符颜色有较大差异，字符和牌照底色在灰度值上存在较大的跳变，有较多的跳变点出现；

数字字符纵向是连通的。

由车牌上述的特征可以知道，车牌字符和牌照底色在灰度值上存在较大的跳变，因此可以根据图像中水平方向的跳变点的变化规律来进行车牌位置上的纹理特征的提取，定位车牌的上下边界。定位出上下边界之后，可计算车牌的近似高度，根据车牌的宽高比例，近似计算出车牌的宽度，此时则可得出一个自定义的固定大小的车牌区域。在查找到的车牌上下界范围内，利用得出的区域大小横向遍历图像，统计区域内前景点数，满足要求即认为找到车牌区域，否则继续搜索，直到找到符合要求的区域。

3)字符分割算法

由车牌中字符的特点可知，各字符间存在一定间隔，则车牌的直方图中必然后出现连续的波峰和波谷。波谷处即为字符的边界处。因此，按列统计二值化后的车牌图像，计算出所有列中含前景点最少的点数。再案例扫描图像，一次查找相邻的含有最小像素点数的两列(字符的两个边界)，计算两列的间距，如果小于2，则是分隔符，可确定字符的边界，并依据边界将每个字符从车牌图像中截取出来。

4)字符归一化方法：

主要做法如下：

设切割出的字符图像大小为M×N，模板大小为L×K，则归一化字符图像为L×K大小。主要思想为，将字符图像均匀分成L×K块区域，分别统计各块中字符前景点的个数，如果大于块内像素数的50％，则认为此块在转换成L×K大小后相对应的像素位前景点。

但是切割出的字符图像不能够满足可以均匀分成L×K块区域，因此***中的做法是，先定义一个(M×L)×(N×K)的矩阵，将字符图像按比例扩大为(M×L)×(N×K)大小，这样无论切割出的字符图像为多大，均可以切分成L×K块区域，从而实现字符的归一化处理。

5)字符细化方法：

6)字符识别方法：

***中使用模板匹配的算法来进行字符的识别。***中采用的识别模板为下载的标准的20×40的灰度图像(黑底白字)，包含0到9十个数字。将模板也做细化处理，以便进行模板数字特征的提取。

a)特征提取

***采用五个特征组成特征向量进行模板匹配。五个特征值分别为：

(1)模板及待识别字符图像1/5宽度处一列与模板和带识别字符的交点数；

(2)模板及待识别字符图像1/2宽度处一列与模板和带识别字符的交点数；

(3)模板及待识别字符图像4/5宽度处一列与模板和带识别字符的交点数；

(4)模板及待识别字符图像1/4高度处一行与模板和带识别字符的交点数；

(5)模板及待识别字符图像3/4高度处一行与模板和带识别字符的交点数；

b)模板匹配

将待识别字符图像的特征向量与10个模板的特征向量一次进行比较,其中结果值最小的即为识别出的结果，返回相应模板所代表的数字，特征向量比较公式如下：

下面结合具体实施例对本发明作进一步描述。

1、本发明实施例提供的数字图像的存储和显示：

1)图像采集到计算机中，是以图像文件的形式存储的，在需要使用时，由程序对这些文件进行及信息处理。

图片的文件结构：

头文件，用于存放图像基本信息，包括各种特征参数、像素数据和调色版数据在文件中的位置，以及文字注释等；

像素数据，以位图的形式存放，每像素数据对应图像相应位置上的颜色值，具体颜色值的定义由调色板数据提供；

调色板数据，是指二值、16色、256色彩色图像的色调数据，真彩色图像的像素数据中已有颜色分量，故不再需要调色板信息。

应该注意的是图像的扫描方向(存储顺序)，大多数图像文件采取的扫描方向为自上而下(如TIF和JPEG文件等)，少数为自下而上(如BMP文件等)。

2)图像显示：

图像显示过程是按照图片存储过程相反方向进行。

2、图像的灰度化方法：

将彩色图像转化为灰度图像的灰度化。彩色图像每个像素包含R、G、B三个颜色分量，每个颜色分量有256个中值可取。而灰度图像是R、G、B三个颜色分量值相等的特殊的颜色图像。

在RGB模型中，如果R＝G＝B时，则彩色表示一种灰度颜色，其中R＝G＝B的值叫灰度值，因此，灰度图像每个像素只需一个字节存放灰度值(又称强度值、亮度值)，灰度范围为0到255。一般有以下四种方法对彩色图像进行灰度化：

分量法：

将彩色图像中的三分量的亮度作为三个灰度图像的灰度值，可根据应用需要选取一种灰度图像。

f₁(i,j)＝R(i,j)f₂(i,j)＝G(i,j)f₃(i,j)＝B(i,j)

其中f_k(i,j)(k＝1,2,3)为转换后的灰度图像在(i,j)处的灰度值。

最大值法：

将彩色图像中的三分量亮度的最大值作为灰度图的灰度值。

f(i,j)＝maxR(i,j)G(i,j)B(i,j)

平均值法：

将彩色图像中的三分量亮度求平均值得到一个灰度图。

f(i,j)＝(R(i,j)+G(i,j)+B(i,j))/3

加权平均法：

根据重要性及其他指标，将三个分量以不同的权值进行加权平均。由于人眼对绿色的敏感最高，对蓝色敏感最低，因此，按下式对RGB三分量进行加权平均能得到较合理的灰度图像。

f(i,j)＝0.299R(i,j)+0.588G(i,j)+0.114B(i,j)。

3、图像二值化方法：

图像的二值化即把灰度图像处理成二值图像的过程。二值化的关键是要找到合适的阈值来区分对象和背景。灰度图像二值化能显著减小数据存储的容量，并能降低后续处理的复杂度。根据阈值选取方法的不同，二值化方法主要分为三类：全局阈值法、局部阈值法和动态阈值法。

A)全局阈值二值化方法：

全局阈值二值化方法是根据图像的直方图或灰度空间分布确定一个阈值，并且据此阈值实现灰度图像到二值化图像的转化。典型的全局阈值法包括Ostu方法、最大熵方法等。全局阈值方法的优点在于算法简单，对目标和背景明显分离、直方图是双峰的图像效果良好，但对输入图像量化噪声或不均匀光照等情况抵抗力差，应用受到限制。

B)局部阈值二值化方法：

由像素(i,j)的灰度值f(i,j)和像素周围点的局部灰度特性确定阈值的方法称为局部阈值选择法。非均匀光照条件等情况虽然影响整体图像的灰度分布却不影响局部的图像性质。邻域的规定及邻域计算模板的选取都是决定算法效果的关键因素。局部阈值法也存在缺点和问题，如实现速度慢，不能保证字符笔画连通性，以及容易出现伪影现象等。

C)动态阈值二值化方法：

当阈值选择不仅取决于该像素阈值以及其周围像素的灰度值，而且还和该像素坐标位置有关时，称之为动态阈值选择法。由于充分考虑了每个像素邻域的特征，能更好的突出背景和目标的边界，使相距很近的两条线不会产生粘连现象，可以处理低质量甚至单峰值直方图图像。但是，这种方法的计算量很大，运算速度一般比较慢。

阈值计算公式：T＝Gmax-(Gmax-Gmin)/3；

图像二值化公式：

4、车牌图像的去噪处理方法：

在图像中，由于获取图像的设备会产生噪声，在图像传输过程中也会存在噪声，而车牌本身也会有噪声，这就使得我们获得的图像都夹杂着或多或少的噪声。是否需要将图像进行去噪处理，这取决于噪声对图像的影响程度。一般来说我们只有对图像进行去噪处理后才能更好的实现车牌的分割和识别。一般将图像中的噪声分为两种：一种是加性噪声，另一种是乘性噪声。加性噪声和原图像是加的关系，可以用表达式(1)表示。而乘性噪声和原图像数据是相乘的关系，可用表达式(2)表示。

g(x,y)＝f(x,y)+η(x,y) (1)

g(x,y)＝f(x,y)*η(x,y) (2)。

产生的噪声会因产生原因的不同而表现出不同特点。常见的噪声类型有：均匀分布噪声、高斯噪声、脉冲噪声、指数分布噪声、瑞利噪声、伽马噪声等噪声类型。在去噪时，我们需要根据噪声的特点采取相应的方法去噪。大体上可以分为两种，一种是在时域进行去噪，另一种是在频域进行去噪。这两种方法是根据不同的思想进行去噪的，一个是利用信号和噪声的时域特征来去噪，另一个是利用信号和噪声的频域特征来去噪。不管是哪一种方法，我们都是为了将信号和噪声分离从而得到一个含有少量噪声的图像数据。在时域上去噪的方法有很多种，比如：均值滤波、顺序滤波、自适应滤波等滤波方法。而在频域上去噪主要是利用噪声和信号所占频带的不同从而将其分离，根据噪声所在不同的频带，我们可以采用低通滤波和带通滤波来去噪。

5、图像的增强方法：

图像增强，即增强图像中的有用信息，一般是一个失真的过程，其目的是要增强视觉效果，将原来不清晰的图像变得清晰或强调某些感兴趣的特征，抑制不感兴趣的特征，使之改善图像质量、丰富信息量，加强图像判读和识别效果。

图像增强的目的是改善图像的视觉效果，针对给定图像的应用场合，有目的地强调图像的整体或局部特性，扩大图像中不同物体特征之间的差别，满足某些特殊分析的需要。其方法是通过一定手段对原图像附加一些信息或变换数据，有选择地突出图像中感兴趣的特征或者抑制图像中某些不需要的特征，使图像与视觉响应特性相匹配。

图像增强按所用方法可分成频率域法和空间域法。采用低通滤波(即只让低频信号通过)法，可去掉图中的噪声；采用高通滤波法，则可增强边缘等高频信号，使模糊的图片变得清晰。具有代表性的空间域算法有局部求平均值法和中值滤波(取局部邻域中的中间像素值)法等，它们可用于去除或减弱噪声。

结合对车辆牌照特征的分析以及对各种定位方法的比较，本***采用的是基于行扫描灰度跳变分析的车牌定位方法。该方法综合了基于纹理特征分析和基于边缘检测分析方法的特点，具有速度快和准确性高的优点。

6、边缘检测方法：

图像的边缘是图像的最基本的特征。所谓边缘是指周围像素灰度有阶跃变化或屋顶变化的那些像素的集合。物体的边缘是由灰度不连续性所反映的。边缘广泛存在于物体与背景之间、物体与物体之间、基元与基元之间，是图像分割、纹理特征提取和形状特征提取等图像分析的重要基础。图像分析和理解的第一步往往是边缘检测。

一般边缘的提取方法是考察图像的每个像素在某个领域内灰度的变化，利用边缘邻近一阶或二阶方向导数变化规律，选取适当的算子，用卷积的方法检测边缘。边缘提取的，最大好处就是能够突出边缘区域，并使背景图像中无关的部分暗淡。车牌部分是边缘相对集中的区域，在对其边缘分割后，可看到车牌部分很明显的突现出来。

图像边缘检测大幅度地减少了数据量，并且剔除了可以认为不相关的信息，保留了图像重要的结构属性。常用的边缘检测方法有Sobel算子、Roberts算子、Prewitt算子等。

一)Roberts算子：

Roberts算子是最古老的算子之一，是一种交叉差分算子。由于它只使用当前像素的2×2邻域，是最简单的梯度算子，所以计算非常简单。Roberts算子计算时利用的像素一共有4个，可以用模板对应4个像素与模板相应的元素相乘相加得到。

Roberts算子边缘定位准，主要缺点是其对噪声的高度敏感性，原因在于仅使用了很少的几个像素来近似梯度。实用于边缘明显且噪声较少的图像分割。因此，通常用3×3的邻域计算梯度值。

二)Sobel算子：

采用梯度微分锐化图像，同时会使噪声、条纹等得到增强，Sobel算子则在一定程度上克服了这个问题。Sobel算子不像普通梯度算子那样用两个像素的差值，这就导致了两个优点：

由于引入了平均因素，因而对图像中的随机噪声有一定的平滑作用；

由于它是相隔两行或两列之差分，故边缘两侧元素得到了增强，边缘显得粗而亮。

三)Prewitt算子：

Prewitt算子进行计算时要用到9个像素。对于每个方向的梯度，可以用模板对应的9个像素与模板相应的元素相乘相加得到，其计算过程与Roberts算子类似。

Prewitt算子对噪声有抑制作用，抑制噪声的原理是通过像素平均。但是像素平均相当于对图像进行低通滤波，所以Prewitt算子对边缘的定位不如Roberts算子。

四)Canny算子：

Canny算子是基于图像一阶导数特性的效果最佳的边缘检测算法。Canny算法其实是在边缘检测的过程中引入了一些边缘连接的思想，所以其效果比较理想。

Canny算子的基本原理是通过查找图像梯度强度局部的最大值的方法来得到边缘信息，图像梯度的计算采用Gauss滤波器。为了消除噪声干扰、提高边缘检测的精度，Canny算子采用双阈值来提取边缘点。高阈值用于提取对比度较强的边缘像素点。如果梯度强度不满足高阈值的检测条件，但是与已检测出的较强边缘点相连接，并且满足低阈值条件，则确定为弱边缘点。双阈值法使Canny算子提取的边缘点更具有鲁棒性。

利用Canny算子检测图像边缘的关键是选取适当的Gauss滤波器参数以及双阈值。Gauss滤波器的标准差σ参数影响着边缘提取的尺度，σ越小，边缘的定位精度越高，但是不能有效地抑制虚假边缘和噪声；σ越大，对小尺度边缘和噪声点的抑制越强，同时降低定位精度。

五)Laplacian算子：

为了突出增强图像中的孤立点、孤立线或孤立端点，在某些实际用途中常采用Laplacian算子，这个算子是旋转不变算子。以上四种算子为一阶算子，而Laplacian算子为二阶算子。Laplacian算子是近似只给出梯度幅值的二阶导数的流行方法。通常使用3×3的掩模，根据邻域不同可以分为4邻域和8邻域。

Laplacian算子对于边缘比较敏感。一般增强技术对于陡峭的边缘和缓慢的边缘很难确定其边缘线的位置，此算子可以用二次微分正峰和负峰之间的过零点来确定。

Laplacian算子对噪声比较敏感，所以图像一般先经过平滑处理。因此Laplacian算子通常与平滑算子结合使用来对图像进行分割。Laplacian算子的一个缺点是它对图像中的某些边缘产生双重响应。

7、特征提取方法：

1)纹理特征提取方法：

纹理是图像分析和识别中常用的概念，但目前尚无对它正式的定义，一般说来可以认为纹理是由许多相互接近的、相互编制的元素构成，并常富有周期性。也可以认为是灰度在空间以一定的形式变化而产生的图案。

主要方法是灰度直方图统计法。直方图是图像窗口中，多种不同灰度的像素分布的概率统计。纹理是像素灰度级变化具有空间规律性的视觉表现。因此，可以根据灰度的规律性变化来找到图像中的纹理特征。

2)形状和结构特征提取方法：

对于一个图像识别***而言，物体的形状是一个赖以识别的重要特征。一个图像的形状和结构特征有两种形式，一种是数字特征，主要包括几何属性和拓扑属性；另一种是句法语言。

由于感兴趣的是图像的形状和结构特征，所以其灰度信息往往可以忽略，只要能将目标和背景分离即可，常用的一种技术就是图像的二值化。将感兴趣的部分标以最大灰度级，把背景标以最小灰度级。

下面结合定位方法对本发明作进一步描述。

1、定位：

自然环境下，汽车图像背景复杂，光照不均匀，在自然背景中准确地确定牌照区域是整个图像识别过程中的关键。首先对采集到的图像进行大范围相关搜索，找到符合汽车牌照特征的若干区域作为候选区，然后对这些侯选区域做进一步分析、评判。最后选定一个最佳区域作为牌照区域，将其从图像中分割出来。同时要考虑车牌倾斜问题。算法流程如下：

(1)对二值图像进行区域提取，计算并比较区域特征参数，提取车牌区域。

(2)计算包含所标记区域的最小宽和高，并根据先前知识，提取并显示更接近的车牌二子值图。

(3)通过计算车牌旋转角度解决车牌倾斜问题。由于车牌倾斜导致投影效果峰不明显，需车牌矫正处理。采取线性拟合方法。计算出车牌上边或下边图像值为l的点拟合直线与水平轴的夹角。用MATLAB函数的旋转车牌图象函数Imrotate。计算车牌旋转角度和经旋转、二值化后的车牌二值子图。

本发明经过大量实践后找到了基于图像差分投影法，从而将车牌识别时间缩短到一百毫秒以内。其原理是将车辆灰色图像按水平方向求差分图，然后按垂直方向求差分，最后对差分后的车辆图像分别在水平和垂直方向投影，按照给定的车牌尺寸范围找出可似车牌区域。

采用基于车牌纹理和颜色信息的综合车牌定位方法对车牌区域精确定位，其实现流程如下图3所示。

假设输入彩色图像为I，通过Gray＝0.229×R+0.587×G+0.114×B将I转化为灰度图Gray，采用迭代求阈值的方法求出最佳阈值T，根据T对Gray进行二值化处理得到图像B；用Sobel垂直算子进行边缘检测，得到边缘图像S；对S，利用平滑方法对其消噪，用腐蚀方法去除一些孤立点和细的突出，用膨胀方法融合图像中的隙缝弯孔和小洞，得到图像F；在F中搜索连通区域形成车牌侯选区域Rect[i]，对于每个Rect[i]根据颜色信息去除伪车牌区域，然后对校正后的车牌区域通过区域行跳变Rect[i]jumpnum、垂直投影Rect[i].hproject及水平投影Rect[i].vproject对车牌区域精确定位。

1.1车牌粗定位方法：

车牌粗定位即对车牌区域进行筛选。由于图像背景往往比较复杂，车体的其他区域存在着干扰因素，因此车牌定位所提取出的车牌候选区域往住有多个，需要进一步对这些候选区域进行筛选，剔除干扰区域，定位出真正的车牌。

假设第i个候选区域的高为h，宽为W，则该候选区域高与宽的比R及面积A分别为

R_i＝ω_i/h_i，A_i＝ω_ih_i；

再假设第i个候选区域黄、蓝色、白三色像素个数分别为S_i,y，S_i,b和S_i,w；跳变次数为S_i,j；二值化后第j行白色点数为n_ij,w。

1)车牌通常有一定的长度和宽度，并且长宽有一定的比例，国内的单行车牌长宽比为440/140＝22/7。利用车牌的这一特征，如果300像素≤A_i≤1200像素，或者3≤R_i≤4，就认为第i个候选区域是车牌区域，否则将之去除。通常候选区域会比实际的车牌区域大，如果严格按标准车牌区域的长宽比来判定车牌区域就会导致错误筛选。为此在粗定位时根据实际情况放宽候选区域的限制，以杜绝“错误筛选”的发生。

2)车牌区域还有一个明显的特征就是其底色与字符有固定的搭配，如我国的标准车牌有4种固定搭配：蓝底白字、黄底黑字、白底黑字及白底红字。如果S_i,_y≥A_i/4，或者S_i,b≥A_i/4，或者S_i,w≥A_i/4，并且S_i,j≥14，此区域就被认为是车牌区域，否则就是伪车牌区域。

3)为进一步提高车牌定位的速度，考虑到车牌区域二值化后每行的白点数目比较多，在***实现时，设定一个阈值T。如果n_ij,w≤T，则候选区域第J行就过滤掉。这样能减少车牌定位时的计算量，从而减少候选车牌连通区域的数量。

通过上面3个条件即可在车牌的候选区域中筛选出真正的车牌。

1.2图像的倾斜矫正方法：

由于拍摄时镜头与牌照的角度、车辆的运动及路面的状况等因素的影响，例如车牌在捕捉图像中的位置不固定，捕捉图像时车头或者镜头发生摆动以及车牌本身就挂歪了或路况较差，都可能使拍摄到的车牌图像有一定的倾斜度，为了正确识别需要进行倾斜度校正，否则将无法进行单个字符的正确分割，字符识别的误差率就会上升。但是若以某个固定的经验值对所有牌照统一进行旋转处理，又会使原本正常的牌照倾斜，导致新的错误。因此有必要针对特定的牌照图像提取其倾斜角度，再加以相应的旋转处理。如何从牌照中自动提取其倾斜度是预处理过程中的一个难点，一般使用Hough变换检测图像中的直线来对图像的倾斜进行相应的矫正。

具体算法是根据图像上左右两边的黑色像素的平均高度来确定的。字符组成的图像它的左右两边的字符像素高度应该是处于水平位置附近的，如果两边字符像素的平均位置有比较大的起落，那就说明图像存在倾斜，需要进行调整。首先要计算图像左半边和右半边的像素的平均高度，然后求斜率，根据斜率重新组织图像，也就是从新图像到旧图像的映射。如果新图像中的像素映射到旧图像时超出了旧图像的范围，则把新图像中的该像素置成白色。

1.3车牌边框和柳钉的去除方法：

在实际处理中，面对要识别的牌照字符背景非常复杂，存在较大的干扰、噪声。当车牌的二值图像统一为黑底白字并经过对图像梯度锐化和去除噪声后，还会有汽车保险杠与牌照四条边框的残缺图像以及牌照上两个铆钉干扰的一个区域。借助先验知识，可以采取图像处理方法从上述复杂背景中去除干扰。将车牌图像进行二值化后，图像仅黑、白二值。白色像素点(灰度值2 5 5)取l，黑色像素点(灰度值0)取0，这里采用的是白底黑字模式。车牌图像中上下边框和铆钉的去除是很重要的，没有去除边框线和铆钉的车牌图像，经常出现铆钉和字符及边框线粘连的现象，给后续车牌字符的分割造成很大的困难。在车牌边框线的内侧，通常有四个铆钉，他们不同程度地与第2个字符或第6个字符粘连，如果不去除铆钉，将给第2和第6在字符的识别造成困难。

对于标准车牌，字符间间距为12㎜，第2、3个字符间间距为34㎜，其中，中间小圆点l0㎜宽，小圆点与第2、3个字符间间距分别为12㎜。根据这些先验知识，对车牌图像逐行进行从内向外式扫描，当扫描到车牌图像某一行中，白色像素点的宽度大于某一阀值时(第一个符合条件的行)，则认为是车牌字符的边沿处，切除这一行以上或以下的所有行。以除去车牌的上边框和铆钉干扰为例，其算法思想为：设要处理的图片尺寸为m×n，其中m为行，n为列，取经验值9n/l0作为在行方向投影的门限值，从i＝2m/3行开始往上逐行扫描，若该行在行方向上的投影j>9n/l0，就认为找到了字符的上边界为i+l行处，将从i开始的所有行全部切除。若没有找到符合条件的行，则认为无上边框干扰。

1.4车牌精确定位方法：

粗定位车牌成功后，在得到的车牌区域中除了车牌图像外还有其他一些背景信息，必须把这些背景信息过滤掉，得到只有车牌字符的图像才能进行车牌字符更精确的分割和识别。经倾斜矫正后，通过投影法搜索车牌边界。

1)搜索车牌上下边界

车牌上下边界的提取将频率法和投影法结合起来使用。所谓投影法就是分析图像的纵横方向的投影值，来找到车牌的边界。求图像的行投影和列投影的公式分别为：

2)搜索车牌左右边界方法：

车牌区域在垂直投影上表现出不同的统计特征：真车牌区域的垂直投影有明显的峰一谷一峰的现象；由于车牌字符是7个，所以波峰数一般大于7个(假设字符灰度级高于车牌背景)；波峰与波峰、波谷与波谷之间的值相差不大。根据投影特征，再结合频率分析，即可找到车牌的左右边界。

下面结合车牌区域处理对本发明作进一步描述。

车牌区域处理：

由于本***的车牌图像是在室外拍摄的，因此不可避免地会受到自然光线、季节等因素的影响。要去除这些干扰就得先对车牌图像进行预处理。原始图像的数据一般比较大，对其进行处理的时间一般也较长，而由于实时性的要求，车牌的提取需要一次性处理就能把绝大多数特征提取出来。需要把得到的图像进行预处理。预处理的过程需要把图像转化为二值图像，这样会大大减少数据量，为实时性提供一定程度的保证。二值化后的车牌要能再现原字符图像，基本不出现笔画断裂和粘连现象，尽量不丢失原字符的特征。经试验，采用阈值为0.2附近时车牌字符最为清楚，杂点最少。

图像预处理主要包括：灰度化、二值化、梯度锐化、降噪、分割、归一化。

下面结合字符分割方法对本发明作进一步描述。

如图4所示，字符分割：

采用灰度投影法对字符进行分割。此算法的思想是基于图像投影直方图即二值图像中的行或列与每行或每列的白色象素值的出现个数的统计关系中存在波峰波谷起伏变化，其中波谷可能就是相邻字符的间隔处。根据先验知识，标准的车辆牌照有7个字符，首位为省名简称(汉字)，次位为英文字母，最后一位是汉字(挂)或英文字母或数字，其他位为英文字母或数字。考虑到汉字偏旁与部首之间投影后可能会出现一定的波谷，并且汉字与噪声之间也会存在波谷，因此采用投影法直接分割。即设置一个阈值，将投影之间波谷距离小于这个阈值的投影进行合并，从而使汉字偏旁和部首的投影进行合并。合并后，计算其第一个字符和最后一个字符的宽度，如果计算值大于车牌字符平均宽度的1.5倍，就认为是错误合并，则撤销合并以排除错误合并，避免将车牌边框的投影合并在字符中。对于其他5个字符，由于是数字和字母，其结构具有连通性的特点，所以采用数学形态学中连通域法对其进行分割。

下面结合字符识别方法对本发明作进一步描述。

字符识别方法：采用自适应性和学习能力强的BP神经网路对分割出的字符进行识别，其识别流程如下图5所示。

下面结合神经网络分类器的设计和应用对本发明作进一步描述。

车牌字符的分布是有规律的。根据车牌上字符分布的规律性，在***中设计“汉字网络”，“数字、字母网络”及“汉字、字母、数字网络”等3个识别网络。

应用时，将第1个分割字符送到“汉字网络”，第7个文字送到“汉字、字母、数字网络”，其他字符送到“数字、字母网络”。

1.1BP神经网络的设计：

1)初始权值的选取。初始权值直接影响神经网络收敛的速度，若选得不好，神经网络将处于饱和而导致难以收敛或陷入局部极小。在***中，初始权值选取0～1之间均匀分布的随机值。

2)输入层节点数的确定。将分割字符规格化为2O×16点阵大小的字符图像，故输入层神经元个数取320。

3)输出层节点数的确定。输出层节点数和待识别的字符个数有关，***中需要识别50个汉字，1O个数字和25个字母(不包括字母I，因为车牌字符无字母I)。***中采用字符的8421码来对识别字符进行编码，所以输出层节点数取7。

4)隐含层节点数的确定。隐含层节点数少了，学习过程不收敛；隐含层节点数多了，网络的学习及推理效率变差。隐层节点数目选择的经验公式为其中，N为隐层神经元个数，n为输入层神经元个数，m为输出层神经元个数，a为1～10之间的整数。取，n＝320，m＝7。另根据以往的经验，并对大量的实验结果进行分析、比较，知隐含层节点数为30时识别效果比较好，故取N＝30。

5)特征归一化。将输入的字符图像归一化为20×16点阵大小的字符图像，***将归一化后的字符图像二值化，然后统一转化为黑底白字字符作为神经网络的输人特征。

1.2训练样本的选取：

在字符识别中，每一类字符所选取的训练样本必须能真实地反映该类字符的共同特征。车牌字符分割结果不理想时会出现分割字符不规范的观象，若为了追求字符识别而将不规范字符作为了训练样本，结果往往使网络虽然学会了该不规范字符，但对真正较正规的字符的识别率却下降了。因此，在***中将字符分割后的图像显示出来，如果分割效果比较好但识别不正确时再使用神经网络进行训练，这样可以达到***兼容其他常见车牌分割字符识别的目的。当然，考虑到***识别的其他因素，如车辆在静止或运动时分割出来的字符效果有差异，在***中提供保存和读取不同网络连接权值的功能，以便在识别不同目标分割出的字符时进行切换训练文件来对分割字符精确识别。

1.3BP网络的识别过程：

对于一个训练好的网络，识别过程其实就是一个利用训练好的权值完成一次顺传播过程，然后在输出层得到一个识别结果。***中输出层有7个节点，每个节点的输出结果都和一个待识别字符的编码相对应。字符编码采用8421码，如果节点的输出和字符编码相同，就认为输入的字符为该节点对应的字符。由于***采用的激活函数Sigmoid函数的输出永远不可能等于0或者1，同时为了提高***识别率，定义：当输出值≤0.1时，输出为0；而当输出值≥O.9时输出为1。

下面结合CR识别方法对本发明作进一步描述。

OCR识别：

图像输入：

对于不同的图像格式，有着不同的存储格式，不同的压缩方式，针对不同的格式的图片进行解析，获取图片像素内容，然后继续下面的操作。

二值化：

对摄像头拍摄的图片，大多数是彩色图像，彩色图像所含信息量巨大，对于图片的内容，我们可以简单的分为前景与背景，为了让计算机更快的，更好的识别文字，需要先对彩色图进行处理，使图片只前景信息与背景信息，可以简单的定义前景信息为黑色，背景信息为白色，这就是二值化图了。

噪声去除搜索：

对于不同的文档，对噪声的定义可以不同，根据燥声的特征进行去燥，就叫做噪声去除。

倾斜较正：

由于一般用户，在拍照文档时，都比较随意，因此拍照出来的图片不可避免的产生倾斜，这就需要文字识别软件进行较正。

版面分析：

将文档图片分段落，分行的过程就叫做版面分析，由于实际文档的多样性，复杂性，因此，目前还没有一个固定的，最优的切割模型。

字符切割：

由于拍照条件的限制，经常造成字符粘连，断笔，因此极大限制了识别***的性能，这就需要文字识别软件有字符切割功能。

字符识别：

以特征提取为主，由于文字的位移，笔画的粗细，断笔，粘连，旋转等因素的影响，极大影响特征的提取的难度。

版面恢复：

人们希望识别后的文字，仍然像原文档图片那样排列着，段落不变，位置不变，顺序不变地输出到word文档、pdf文档等。

后处理、校对：

根据特定的语言上下文的关系，对识别结果进行较正。

以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

1.一种基于视频文件的车辆分析***，其特征在于，所述基于视频文件的车辆分析***包括：

2.一种如权利要求1所述基于视频文件的车辆分析***的分析方法，其特征在于，所述基于视频文件的车辆的分析方法，通过读入图像单元，输入车牌图像，并将输入的图像默认为清晰的、没有倾斜角度的图像；

通过车牌定位与提取单元对车牌进行定位和提取图像信息；

3.如权利要求2所述的基于视频文件的车辆分析方法，其特征在于，

所述图像灰度化的方法包括：利用加权平均法，将图像灰度化，公式如下：

f(i,j)＝0.299R(i,j)+0.588G(i,j)+0.114B(i,j)。

4.如权利要求2所述的基于视频文件的车辆分析方法，其特征在于，

所述边缘提取的方法包括：

利用差分法边缘提取。

5.如权利要求2所述的基于视频文件的车辆分析方法，其特征在于，所述图像二值化的方法包括：

阈值计算公式：T＝Gmax-(Gmax-Gmin)/3；

图像二值化公式：

<mrow> <mo>{</mo> <mi>f</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>=</mo> <mtable> <mtr> <mtd> <mn>1</mn> </mtd> <mtd> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo>&GreaterEqual;</mo> <mi>T</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>f</mi> <mrow> <mo>(</mo> <mi>x</mi> <mo>,</mo> <mi>y</mi> <mo>)</mo> </mrow> <mo><</mo> <mi>T</mi> </mrow> </mtd> </mtr> </mtable> <mo>.</mo> </mrow>

6.如权利要求2所述的基于视频文件的车辆分析方法，其特征在于，所述车牌定位方法包括：

求图像的行投影和列投影的公式分别为：

<mrow> <msub> <mi>f</mi> <mrow> <mi>v</mi> <mo>-</mo> <mi>s</mi> <mi>u</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> </munder> <mi>x</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

<mrow> <msub> <mi>f</mi> <mrow> <mi>h</mi> <mo>-</mo> <mi>s</mi> <mi>u</mi> <mi>m</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> </munder> <mi>x</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>,</mo> </mrow>

7.如权利要求2所述的基于视频文件的车辆分析方法，其特征在于，字符分割算法包括：

8.如权利要求7所述的基于视频文件的车辆分析方法，其特征在于，字符分割算法包括字符归一化方法，具体为：

设切割出的字符图像大小为M×N，模板大小为L×K，则归一化字符图像为L×K大小；将字符图像均匀分成L×K块区域，分别统计各块中字符前景点的个数，如果大于块内像素数的50％，则认为此块在转换成L×K大小后相对应的像素位前景点；

字符分割算法还包括字符细化方法：

9.如权利要求2所述的基于视频文件的车辆分析方法，其特征在于，字符识别方法包括：

模板及待识别字符图像1/4高度处一行与模板和带识别字符的交点数；

模板及待识别字符图像3/4高度处一行与模板和带识别字符的交点数；

b)模板匹配；

<mrow> <mi>D</mi> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>0</mn> </mrow> <mn>4</mn> </munderover> <msup> <mrow> <mo>(</mo> <mi>s</mi> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>-</mo> <mi>t</mi> <mo>(</mo> <mi>i</mi> <mo>)</mo> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>.</mo> </mrow>

10.如权利要求2所述的基于视频文件的车辆分析方法，其特征在于，输入的图像中，需进行车牌图像的去噪处理，具体包括：

采用低通滤波和带通滤波来去噪。