CN105913031A

CN105913031A - 一种具有场景识别功能的摄像机移动终端

Info

Publication number: CN105913031A
Application number: CN201610232128.XA
Authority: CN
Inventors: 吴本刚
Original assignee: Individual
Current assignee: Individual
Priority date: 2016-04-14
Filing date: 2016-04-14
Publication date: 2016-08-31

Abstract

本发明一种具有场景识别功能的摄像机移动终端，包括摄像机移动终端和安装在摄像机移动终端上的场景识别装置，场景识别装置包括图像预处理模块、图像极值点检测模块、图像特征点定位模块、主方向确定模块、和特征提取模块和场景判定模块，其中所述图像特征点定位模块通过剔除所述各极值点中对噪声敏感的低对比度点以及不稳定的边缘点来确定作为特征点的极值点，所述主方向确定模块用于将关于所述特征点的梯度方向直方图中的任意相邻两个峰值连线以形成多个子线段，并将具有相近斜率且相邻的子线段在长度方向上进行合并形成一条线段后将多条线段中的最优线段的方向作为特征点的主方向。本发明具有场景识别精度高、速度快的优点。

Description

一种具有场景识别功能的摄像机移动终端

技术领域

本发明涉及摄影领域，具体涉及一种具有场景识别功能的摄像机移动终端。

背景技术

一般的摄像机只能对图像进行获取，如果摄像机移动终端能够对场景进行判定，进而实现对影像资料的自动分类，无疑效率将会大大提高，从而减少人类的工作量。但是，目前的摄像机移动终端并不具备场景判定功能。此外，为了对大量的图像数据进行处理，需要提高分析处理效率和精度。

发明内容

针对上述问题，本发明提供一种具有场景识别功能的摄像机移动终端。

本发明的目的采用以下技术方案来实现：

提供了一种具有场景识别功能的摄像机移动终端，用于对场景进行识别，包括摄像机移动终端和安装在摄像机移动终端上的场景识别装置，场景识别装置包括：

(1)图像预处理模块，其包括用于将彩色图像转化为灰度图像的图像转换子模块和用于对所述灰度图像进行滤波的图像滤波子模块，所述图像转换子模块的图像灰度转换公式为：

\begin{matrix} I (x, y) = \frac{m a x (R (x, y), G (x, y), B (x, y)) + m i n (R (x, y), G (x, y), B (x, y))}{2} \\ + 2 [m a x (R (x, y), G (x, y), B (x, y)) - m i n (R (x, y), G (x, y), B (x, y))] \end{matrix}

其中，R(x,y)、G(x,y)、B(x,y)分别代表像素点(x,y)处的红绿蓝强度值，I(x,y)代表像素点(x,y)处的灰度值；

(2)图像极值点检测模块，其通过由高斯差分算子与图像进行卷积建立成的图像的高斯差分尺度空间来检测各极值点的位置，当采样点相对于与它同尺度的8个相邻点和上下相邻尺度对应的18个点的值皆大时，所述采样点为极大值点，当采样点相对于与它同尺度的8个相邻点和上下相邻尺度对应的18个点的值皆小时，所述采样点为极小值点，所述高斯差分尺度空间的简化计算公式为：

D(x,y,σ)＝(G(x,kσ)-G(x,σ))*I'(x,y)+(G(y,kσ)-G(y,σ))*I'(x,y)

此处

G (x, σ) = \frac{1}{\sqrt{2 π} σ} e^{- x^{2} / 2 σ^{2}}, G (y, σ) = \frac{1}{\sqrt{2 π} σ} e^{- y^{2} / 2 σ^{2}}

其中，D(x,y,σ)表示高斯差分尺度空间函数，I'(x,y)为由图像转化子模块输出的图像函数，*表示卷积运算，σ表示尺度空间因子，G(x,σ)、G(y,σ)为定义的尺度可变的高斯函数，k为不变倍增因子；

(3)图像特征点定位模块，其通过剔除所述各极值点中对噪声敏感的低对比度点以及不稳定的边缘点来确定作为特征点的极值点，包括依次连接的用于极值点精确定位的第一定位子模块、用于去除低对比度点的第二定位子模块和用于去除不稳定边缘点的第三定位子模块，其中：

a、所述第一定位子模块通过对所述高斯差分尺度空间函数进行二次泰勒展开并求导得到极值点的精确位置，极值点的尺度空间函数为：

D (\hat{X}) = D (x, y, σ) + \frac{\partial D {(x, y, σ)}^{T}}{\partial x} \hat{X}

其中，表示极值点的尺度空间函数，D(x,y,σ)^T为相对于极值点的偏移量，表示极值点的精确位置；

b、所述第二定位子模块对由图像转换子模快输出的图像依次进行灰度增强、归一化处理后剔除所述低对比度点，增强后的灰度值为：

此处

所述低对比度点的判定公式为：

D (\hat{X}) < T_{1}, T_{1} &Element; [0.01, 0.06]

其中，I”(x,y)表示灰度值增强后的图像函数，为包含局部信息的校正系数，M为像素的最大灰度值，所述最大灰度值M＝255，m_H为图像中灰度值高于128的所有像素的均值，m_L是灰度值低于128的所有像素的均值，为由图像滤波子模块处理后的图像，T₁为设定的阈值；

c、所述第三定位子模块通过计算极值点的位置尺度为2×2的Hessian矩阵H得到该极值点的主曲率，并通过剔除主曲率比值大于设定的阈值T₂的极值点来剔除所述不稳定边缘点，其中阈值T₂的取值范围为[10,15]，所述主曲率比值通过比较矩阵H的特征值之间的比值来确定；

优选地，所述具有场景识别功能的摄像机移动终端，场景识别装置还包括：

(1)主方向确定模块，包括依次连接的连线子模块、合并子模块和处理子模块，所述连线在模块用于将关于所述特征点的梯度方向直方图中的任意相邻两个峰值连线以形成多个子线段，所述合并子模块用于将具有相近斜率且相邻的子线段在长度方向上进行合并形成一条线段，所述处理子模块用于将多条线段中的最优线段的方向作为特征点的主方向，所述最优线段的判定公式为：

L_{Y} = L_{{\overset{&OverBar;}{g}}_{m a x}}, {\overset{&OverBar;}{g}}_{m a x} = m a x ({\overset{&OverBar;}{g}}_{L_{n}}), {\overset{&OverBar;}{g}}_{L_{n}} = \frac{1}{k} Σ_{k = 1}^{k} g_{k}, L_{n} &Element; L_{&upsi;})

其中，L_Y表示最优线段，为平均梯度值为的线段，为所述多条线段中第n条线段的平均梯度值，g_k为所述第n条线段中的第k条子线段，L_υ为所述多条线段中线段长度大于平均线段长度的线段集合；

(2)特征提取模块，其根据所述主方向来旋转特征点的邻域，并根据旋转后的邻域对所述特征点进行描述，从而生成所述特征点的描述符；

(3)场景判定模块，采用提取的特征与数据库中的场景特征进行对比，完成场景判定。

进一步地，所述具有相近斜率的子线段为斜率差小于预设阈值T₃的子线段，所述阈值T₃的取值范围为(0,0.1]。

本发明的有益效果为：

1、设置的图像预处理模块考虑了视觉习惯以及人眼对不同色彩的感知度同色彩强度的非线性关系，能够更为准确的描述图像；

2、提出了高斯差分尺度空间的简化计算公式，减少了运算量，提高了运算速度，进而提高了图像分析的速度；

3、设置的图像特征点定位模块对极值点进行低对比度点和不稳定边缘点的去除，保证特征点的有效性，其中对图像的灰度值进行增强，能够大大增加图像的稳定性，更为精确的对低对比度点进行去除，进而提高图像分析的准确度；

4、设置主方向确定模块，提出了最优线段的判定公式，以特征点梯度方向直方图中的任意相邻两个峰值连线形成的线段中的最优线段的方向作为特征点的主方向，线段相对于点更加稳定，使得图像对应的特征点的描述符具有可重复性，提高了特征描述符的准确性，进而能够更加快速、准确的对图像进行识别检测，具有很高的鲁棒性。

附图说明

利用附图对本发明作进一步说明，但附图中的实施例不构成对本发明的任何限制，对于本领域的普通技术人员，在不付出创造性劳动的前提下，还可以根据以下附图获得其它的附图。

图1是本发明各模块的连接示意图。

具体实施方式

结合以下实施例对本发明作进一步描述。

实施例1

参见图1，本实施例具有场景识别功能的摄像机移动终端，包括摄像机移动终端和安装在摄像机移动终端上的场景识别装置，场景识别装置包括：

\begin{matrix} I (x, y) = \frac{m a x (R (x, y), G (x, y), B (x, y)) + m i n (R (x, y), G (x, y), B (x, y))}{2} \\ + 2 [m a x (R (x, y), G (x, y), B (x, y)) - m i n (R (x, y), G (x, y), B (x, y))] \end{matrix}

D(x,y,σ)＝(G(x,kσ)-G(x,σ))*I'(x,y)+(G(y,kσ)-G(y,σ))*I'(x,y)

此处

G (x, σ) = \frac{1}{\sqrt{2 π} σ} e^{- x^{2} / 2 σ^{2}}, G (y, σ) = \frac{1}{\sqrt{2 π} σ} e^{- y^{2} / 2 σ^{2}}

D (\hat{X}) = D (x, y, σ) + \frac{\partial D {(x, y, σ)}^{T}}{\partial x} \hat{X}

此处

所述低对比度点的判定公式为：

D (\hat{X}) < T_{1}, T_{1} &Element; [0.01, 0.06]

L_{Y} = L_{{\overset{&OverBar;}{g}}_{m a x}}, {\overset{&OverBar;}{g}}_{m a x} = m a x ({\overset{&OverBar;}{g}}_{L_{n}}), {\overset{&OverBar;}{g}}_{L_{n}} = \frac{1}{k} Σ_{k = 1}^{k} g_{k}, L_{n} &Element; L_{&upsi;})

本实施例设置的图像预处理模块考虑了视觉习惯以及人眼对不同色彩的感知度同色彩强度的非线性关系，能够更为准确的描述图像；提出了高斯差分尺度空间的简化计算公式，减少了运算量，提高了运算速度，进而提高了图像分析的速度；设置的图像特征点定位模块对极值点进行低对比度点和不稳定边缘点的去除，保证特征点的有效性，其中对图像的灰度值进行增强，能够大大增加图像的稳定性，更为精确的对低对比度点进行去除，进而提高图像分析的准确度；设置主方向确定模块，提出了最优线段的判定公式，以特征点梯度方向直方图中的任意相邻两个峰值连线形成的线段中的最优线段的方向作为特征点的主方向，线段相对于点更加稳定，使得图像对应的特征点的描述符具有可重复性，提高了特征描述符的准确性，进而能够更加快速、准确的对图像进行识别检测，具有很高的鲁棒性；本实施例取阈值T₁＝0.01，T₂＝10，T₃＝0.1，图像分析的精度提高了2％，速度提高了1％。

实施例2

\begin{matrix} I (x, y) = \frac{m a x (R (x, y), G (x, y), B (x, y)) + m i n (R (x, y), G (x, y), B (x, y))}{2} \\ + 2 [m a x (R (x, y), G (x, y), B (x, y)) - m i n (R (x, y), G (x, y), B (x, y))] \end{matrix}

D(x,y,σ)＝(G(x,kσ)-G(x,σ))*I'(x,y)+(G(y,kσ)-G(y,σ))*I'(x,y)

此处

G (x, σ) = \frac{1}{\sqrt{2 π} σ} e^{- x^{2} / 2 σ^{2}}, G (y, σ) = \frac{1}{\sqrt{2 π} σ} e^{- y^{2} / 2 σ^{2}}

D (\hat{X}) = D (x, y, σ) + \frac{\partial D {(x, y, σ)}^{T}}{\partial x} \hat{X}

此处

所述低对比度点的判定公式为：

D (\hat{X}) < T_{1}, T_{1} &Element; [0.01, 0.06]

L_{Y} = L_{{\overset{&OverBar;}{g}}_{m a x}}, {\overset{&OverBar;}{g}}_{m a x} = m a x ({\overset{&OverBar;}{g}}_{L_{n}}), {\overset{&OverBar;}{g}}_{L_{n}} = \frac{1}{k} Σ_{k = 1}^{k} g_{k}, L_{n} &Element; L_{&upsi;})

本实施例设置的图像预处理模块考虑了视觉习惯以及人眼对不同色彩的感知度同色彩强度的非线性关系，能够更为准确的描述图像；提出了高斯差分尺度空间的简化计算公式，减少了运算量，提高了运算速度，进而提高了图像分析的速度；设置的图像特征点定位模块对极值点进行低对比度点和不稳定边缘点的去除，保证特征点的有效性，其中对图像的灰度值进行增强，能够大大增加图像的稳定性，更为精确的对低对比度点进行去除，进而提高图像分析的准确度；设置主方向确定模块，提出了最优线段的判定公式，以特征点梯度方向直方图中的任意相邻两个峰值连线形成的线段中的最优线段的方向作为特征点的主方向，线段相对于点更加稳定，使得图像对应的特征点的描述符具有可重复性，提高了特征描述符的准确性，进而能够更加快速、准确的对图像进行识别检测，具有很高的鲁棒性；本实施例取阈值T₁＝0.02，T₂＝11，T₃＝0.08，图像分析的精度提高了1％，速度提高了1.5％。

实施例3

\begin{matrix} I (x, y) = \frac{m a x (R (x, y), G (x, y), B (x, y)) + m i n (R (x, y), G (x, y), B (x, y))}{2} \\ + 2 [m a x (R (x, y), G (x, y), B (x, y)) - m i n (R (x, y), G (x, y), B (x, y))] \end{matrix}

D(x,y,σ)＝(G(x,kσ)-G(x,σ))*I'(x,y)+(G(y,kσ)-G(y,σ))*I'(x,y)

此处

G (x, σ) = \frac{1}{\sqrt{2 π} σ} e^{- x^{2} / 2 σ^{2}}, G (y, σ) = \frac{1}{\sqrt{2 π} σ} e^{- y^{2} / 2 σ^{2}}

D (\hat{X}) = D (x, y, σ) + \frac{\partial D {(x, y, σ)}^{T}}{\partial x} \hat{X}

此处

所述低对比度点的判定公式为：

D (\hat{X}) < T_{1}, T_{1} &Element; [0.01, 0.06]

L_{Y} = L_{{\overset{&OverBar;}{g}}_{m a x}}, {\overset{&OverBar;}{g}}_{m a x} = m a x ({\overset{&OverBar;}{g}}_{L_{n}}), {\overset{&OverBar;}{g}}_{L_{n}} = \frac{1}{k} Σ_{k = 1}^{k} g_{k}, L_{n} &Element; L_{&upsi;})

其中，L_Y表示最优线段，为平均梯度值为的线段，为所述多条线段中第n条线段的平均梯度值，g_k为所述第n条线段中的第k条子线段，L_v为所述多条线段中线段长度大于平均线段长度的线段集合；

本实施例设置的图像预处理模块考虑了视觉习惯以及人眼对不同色彩的感知度同色彩强度的非线性关系，能够更为准确的描述图像；提出了高斯差分尺度空间的简化计算公式，减少了运算量，提高了运算速度，进而提高了图像分析的速度；设置的图像特征点定位模块对极值点进行低对比度点和不稳定边缘点的去除，保证特征点的有效性，其中对图像的灰度值进行增强，能够大大增加图像的稳定性，更为精确的对低对比度点进行去除，进而提高图像分析的准确度；设置主方向确定模块，提出了最优线段的判定公式，以特征点梯度方向直方图中的任意相邻两个峰值连线形成的线段中的最优线段的方向作为特征点的主方向，线段相对于点更加稳定，使得图像对应的特征点的描述符具有可重复性，提高了特征描述符的准确性，进而能够更加快速、准确的对图像进行识别检测，具有很高的鲁棒性；本实施例取阈值T₁＝0.03，T₂＝12，T₃＝0.06，图像分析的精度提高了2.5％，速度提高了3％。

实施例4

\begin{matrix} I (x, y) = \frac{m a x (R (x, y), G (x, y), B (x, y)) + m i n (R (x, y), G (x, y), B (x, y))}{2} \\ + 2 [m a x (R (x, y), G (x, y), B (x, y)) - m i n (R (x, y), G (x, y), B (x, y))] \end{matrix}

D(x,y,σ)＝(G(x,kσ)-G(x,σ))*I'(x,y)+(G(y,kσ)-G(y,σ))*I'(x,y)

此处

G (x, σ) = \frac{1}{\sqrt{2 π} σ} e^{- x^{2} / 2 σ^{2}}, G (y, σ) = \frac{1}{\sqrt{2 π} σ} e^{- y^{2} / 2 σ^{2}}

D (\hat{X}) = D (x, y, σ) + \frac{\partial D {(x, y, σ)}^{T}}{\partial x} \hat{X}

此处

所述低对比度点的判定公式为：

D (\hat{X}) < T_{1}, T_{1} &Element; [0.01, 0.06]

L_{Y} = L_{{\overset{&OverBar;}{g}}_{m a x}}, {\overset{&OverBar;}{g}}_{m a x} = m a x ({\overset{&OverBar;}{g}}_{L_{n}}), {\overset{&OverBar;}{g}}_{L_{n}} = \frac{1}{k} Σ_{k = 1}^{k} g_{k}, L_{n} &Element; L_{&upsi;})

本实施例设置的图像预处理模块考虑了视觉习惯以及人眼对不同色彩的感知度同色彩强度的非线性关系，能够更为准确的描述图像；提出了高斯差分尺度空间的简化计算公式，减少了运算量，提高了运算速度，进而提高了图像分析的速度；设置的图像特征点定位模块对极值点进行低对比度点和不稳定边缘点的去除，保证特征点的有效性，其中对图像的灰度值进行增强，能够大大增加图像的稳定性，更为精确的对低对比度点进行去除，进而提高图像分析的准确度；设置主方向确定模块，提出了最优线段的判定公式，以特征点梯度方向直方图中的任意相邻两个峰值连线形成的线段中的最优线段的方向作为特征点的主方向，线段相对于点更加稳定，使得图像对应的特征点的描述符具有可重复性，提高了特征描述符的准确性，进而能够更加快速、准确的对图像进行识别检测，具有很高的鲁棒性；本实施例取阈值T₁＝0.04，T₂＝13，T₃＝0.04，图像分析的精度提高了1.5％，速度提高了2％。

实施例5

\begin{matrix} I (x, y) = \frac{m a x (R (x, y), G (x, y), B (x, y)) + m i n (R (x, y), G (x, y), B (x, y))}{2} \\ + 2 [m a x (R (x, y), G (x, y), B (x, y)) - m i n (R (x, y), G (x, y), B (x, y))] \end{matrix}

D(x,y,σ)＝(G(x,kσ)-G(x,σ))*I'(x,y)+(G(y,kσ)-G(y,σ))*I'(x,y)

此处

G (x, σ) = \frac{1}{\sqrt{2 π} σ} e^{- x^{2} / 2 σ^{2}}, G (y, σ) = \frac{1}{\sqrt{2 π} σ} e^{- y^{2} / 2 σ^{2}}

D (\hat{X}) = D (x, y, σ) + \frac{\partial D {(x, y, σ)}^{T}}{\partial x} \hat{X}

此处

所述低对比度点的判定公式为：

L_{Y} = L_{{\overset{&OverBar;}{g}}_{m a x}}, {\overset{&OverBar;}{g}}_{m a x} = m a x ({\overset{&OverBar;}{g}}_{L_{n}}), {\overset{&OverBar;}{g}}_{L_{n}} = \frac{1}{k} Σ_{k = 1}^{k} g_{k}, L_{n} &Element; L_{&upsi;})

本实施例设置的图像预处理模块考虑了视觉习惯以及人眼对不同色彩的感知度同色彩强度的非线性关系，能够更为准确的描述图像；提出了高斯差分尺度空间的简化计算公式，减少了运算量，提高了运算速度，进而提高了图像分析的速度；设置的图像特征点定位模块对极值点进行低对比度点和不稳定边缘点的去除，保证特征点的有效性，其中对图像的灰度值进行增强，能够大大增加图像的稳定性，更为精确的对低对比度点进行去除，进而提高图像分析的准确度；设置主方向确定模块，提出了最优线段的判定公式，以特征点梯度方向直方图中的任意相邻两个峰值连线形成的线段中的最优线段的方向作为特征点的主方向，线段相对于点更加稳定，使得图像对应的特征点的描述符具有可重复性，提高了特征描述符的准确性，进而能够更加快速、准确的对图像进行识别检测，具有很高的鲁棒性；本实施例取阈值T₁＝0.05，T₂＝14，T₃＝0.02，图像分析的精度提高了1.8％，速度提高了1.5％。

最后应当说明的是，以上实施例仅用以说明本发明的技术方案，而非对本发明保护范围的限制，尽管参照较佳实施例对本发明作了详细地说明，本领域的普通技术人员应当理解，可以对本发明的技术方案进行修改或者等同替换，而不脱离本发明技术方案的实质和范围。

Claims

1.一种具有场景识别功能的摄像机移动终端，用于对周围场景进行识别，其特征是，包括摄像机移动终端和安装在摄像机移动终端上的场景识别装置，场景识别装置包括：

\begin{matrix} I (x, y) = \frac{m a x (R (x, y), G (x, y), B (x, y)) + m i n (R (x, y), G (x, y), B (x, y))}{2} \\ + 2 [m a x (R (x, y), G (x, y), B (x, y)) - m i n (R (x, y), G (x, y), B (x, y))] \end{matrix}

D(x,y,σ)＝(G(x,kσ)-G(x,σ))*I'(x,y)+(G(y,kσ)-G(y,σ))*I'(x,y)

此处

G (x, σ) = \frac{1}{\sqrt{2 π} σ} e^{- x^{2} / 2 σ^{2}}, G (y, σ) = \frac{1}{\sqrt{2 π} σ} e^{- y^{2} / 2 σ^{2}}

D (\hat{X}) = D (x, y, σ) + \frac{\partial D {(x, y, σ)}^{T}}{\partial x} \hat{X}

此处

所述低对比度点的判定公式为：

D (\hat{X}) < T_{1}, T_{1} &Element; [0.01, 0.06]

其中，I”(x,y)表示灰度值增强后的图像函数，为包含局部信息的校正系数，M为像素的最大灰度值，所述最大灰度值M＝255，m_H为图像中灰度值高于128的所有像素的均值，m_L是灰度值低于128的所有像素的均值，ψ(x,y)为由图像滤波子模块处理后的图像，T₁为设定的阈值；

c、所述第三定位子模块通过计算极值点的位置尺度为2×2的Hessian矩阵H得到该极值点的主曲率，并通过剔除主曲率比值大于设定的阈值T₂的极值点来剔除所述不稳定边缘点，其中阈值T₂的取值范围为[10,15]，所述主曲率比值通过比较矩阵H的特征值之间的比值来确定。

2.根据权利要求1所述的一种具有场景识别功能的摄像机移动终端，其特征是，场景识别装置还包括：

L_{Y} = L_{{\overset{&OverBar;}{g}}_{m a x}}, {\overset{&OverBar;}{g}}_{\max} = m a x ({\overset{&OverBar;}{g}}_{L_{n}}), {\overset{&OverBar;}{g}}_{L_{n}} = \frac{1}{k} Σ_{k = 1}^{k} g_{k}, L_{n} &Element; L_{&upsi;})

3.根据权利要求1所述的一种具有场景识别功能的摄像机移动终端，其特征是，所述具有相近斜率的子线段为斜率差小于预设阈值T₃的子线段，所述阈值T₃的取值范围为(0,0.1]。