CN109409224B

CN109409224B - 一种自然场景火焰检测的方法

Info

Publication number: CN109409224B
Application number: CN201811108891.7A
Authority: CN
Inventors: 巫义锐; 何粤超; 郭红鑫; 李子铭; 贾柠晖
Original assignee: Hohai University HHU
Current assignee: Hohai University HHU
Priority date: 2018-09-21
Filing date: 2018-09-21
Publication date: 2023-09-05
Anticipated expiration: 2038-09-21
Also published as: CN109409224A

Abstract

本发明公开了一种自然场景火焰检测的方法，属于消防领域。本发明包括以下步骤：步骤1，提取输入图像的最大稳定极值区域；步骤2，通过最大稳定极值区域的色彩特征和面积来过滤多余的极值区域，得到火焰候选区域；步骤3，将火焰候选区域输入到卷积神经网络模型中提取卷积特征；步骤4，将提取出的卷积特征输入到训练好的支持向量机分类器中进行分类，判断是否真的为火焰；步骤5，将火焰区域合并，得到最终的火焰区域。本发明具有很强的鲁棒性，检测效果好，可以准确完成火焰检测任务。

Description

一种自然场景火焰检测的方法

技术领域

本发明涉及一种自然场景火焰检测的方法，属于消防领域。

背景技术

火灾一直是破坏性最大而又最常见的灾害之一，从居民住宅到野外环境，火灾一旦发生而没有被及时扑救，将会产生巨大的损失。因此火焰检测的技术得到了国内外研究者的广泛关注。现阶段已有多种检测火焰的技术，然而，由于应用场景的多样性及复杂性，传统的火焰检测技术(例如烟感、温感检测)总会存在一定的局限性，因此基于计算机视觉的火焰检测技术是预防火灾的一个新方向。

发明内容

针对烟感、温感检测器使用环境的局限性，以及视频监控***的普及，本发明提出了一种自然场景火焰检测的方法，基于数字图像处理与深度学习，检测成本低、具有强鲁棒性。

本发明为解决其技术问题采用如下技术方案：

一种自然场景火焰检测的方法，包括以下步骤：

步骤1，提取输入图像的最大稳定极值区域；

步骤2，通过最大稳定极值区域的色彩特征和面积来过滤多余的极值区域，得到火焰候选区域；

步骤3，将火焰候选区域输入到卷积神经网络模型中提取卷积特征；

步骤4，将提取出的卷积特征输入到训练好的支持向量机分类器中进行分类，判断是否真的为火焰；

步骤5，将火焰区域合并，得到最终的火焰区域。

所述步骤1的具体过程如下：

步骤11，将输入的图像转化为灰度图，记为I_gray；

步骤12，按照阈值升序的顺序，求出各个阈值下I_gray中的极值区域，极值区域Q_i定义如下：

其中I_gray(p)和I_gray(q)表示I_gray中像素点p和q的值，i∈[0,255]表示极值区域的阈值,表示与极值区域Q_i相邻但不属于极值区域的像素集合；

步骤13，对I_gray求极值区域的变化率：

极值区域变化率定义为：

其中，Δ为灰度阈值的微小变化量，Q_i+Δ为灰度阈值增加后得到的极值区域，Q_i-Δ为为灰度阈值减小后得到的极值区域，r(i)为i阈值时区域Q_i的变化率；

步骤14，对I_gray求最大稳定极值区域：

当区域Q_ii的变化率r(i)小于阈值T，就认为该区域是最大稳定极值区域。

所述步骤2的具体过程如下：

步骤21，计算每个最大稳定极值区域的面积S，计算每一像素点的RGB值，并判断像素点是否为火焰像素点，其计算公式为：

其中r为RGB图像中的R通道的值，g为RGB图像中的G通道的值，b为RGB图像中的B通道的值，r_t为R通道的阈值、b_t为B通道的阈值、g_t为G通道的阈值；

步骤22，通过火焰像素点的总数n和最大稳定极值区域的面积，过滤掉多余区域，剩下的最大稳定极值区域即为火焰候选区域，过滤条件如下：

其中H为阈值，S为最大稳定极值区域的面积。

所述步骤3中所述提取卷积特征的步骤如下：

步骤31，对输入图片进行预处理，得到224×224×3的图像；

步骤32，对输入图像先进行两次步长为1、卷积核大小为3×3、卷积和数量为64的卷积操作，再进行一次池化尺寸为2×2、步长为2的池化操作，得到一个112×112×64的特征图；

步骤33，对于步骤31得到的特征图，先进行两次步长为1、卷积核大小为3×3、卷积和数量为128的卷积操作，再进行一次池化操作，得到一个56×56×128的特征图；

步骤34，对于步骤32得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积和数量为256的卷积操作，再进行一次池化操作，得到一个28×28×256的特征图；

步骤35，对于步骤33得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积和数量为512的卷积操作，再进行一次池化操作，得到一个14×14×512的特征图；

步骤36，对于步骤34得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积和数量为512的卷积操作，再进行一次池化操作，得到一个7×7×128的特征图；

步骤37，将步骤35得到的特征图转换为1×1×4096的特征向量；

步骤38，将步骤36得到的特征向量转换为1×1×1000的特征向量。

所述步骤31具体过程如下：

第一步，缩放图片，使其尺寸变为224×224×3；

第二步，对图片的像素值进行归一化，计算方法为：

其中r为RGB图像中的R通道的值，g为RGB图像中的G通道的值，b为RGB图像中的B通道的值；

第三步，对图片像素值进行去均值化，计算方法如下：

其中，r_mean、b_mean、g_mean分别表示图片R通道、G通道、B通道的平均值。

所述步骤32的具体过程如下：

(1)卷积操作：

假设A是输入的特征图M_i中的一张特征面，矩阵K是一个卷积核：

其中：a₀₀表示特征面A中第0行第0列的像素值，a₀₁表示特征面A中第0行第1列的像素值，a₀₂表示特征面A中第0行第2列的像素值，a₁₀表示特征面A中第1行第0列的像素值，a₁₁表示特征面A中第1行第1列的像素值，a₁₂表示特征面A中第1行第2列的像素值，a₂₀表示特征面A中第2行第0列的像素值，a₂₁表示特征面A中第2行第1列的像素值，a₂₂表示特征面A中第2行第2列的像素值，w₀₀表示卷积核K中第0行第0列的权重值；w₀₁表示卷积核K中第0行第1列的权重值；w₀₂表示卷积核K中第0行第2列的权重值；w₁₀表示卷积核K中第1行第0列的权重值；w₁₁表示卷积核K中第1行第1列的权重值；w₁₂表示卷积核K中第1行第2列的权重值；w₂₀表示卷积核K中第2行第0列的权重值；w₂₁表示卷积核K中第2行第1列的权重值；w₂₂表示卷积核K中第2行第2列的权重值；

在步长stride＝(1,1)的条件下，

其中：a_ij表示特征面A中第i行第j列的像素值，w_ij表示卷积核K中第i行第j列的权重值，A₀₀为A*K中第0行第0列的值，A₀₁为A*K中第0行第1列的值，A₁₀为A*K中第1行第0列的值，A₁₁为A*K中第1行第1列的值，K为卷积核，步长stride＝(1,1)表示卷积核K在特征面A上横向和纵向移动的距离都为1，当卷积核移动特征面边缘时，若特征面的元素数量不足，不足的地方用‘0’填充，以保证经过卷积操作后得到的输出图像与输入图像大小一样。

假设B是输出的特征图M_o中的一张特征面：

其中,A_i为输入特征图M_o的第i张特征面，符号*表示卷积，n是卷积核的数量；卷积操作进行两次；

(2)池化操作：

假设B是经过卷积后得到的特征图M中的一张特征面，C是池化后得到的特征面：

其中，b₀₀表示特征面B中第0行第0列的像素值，b₀₁表示特征面B中第0行第1列的像素值，b₀₂表示特征面B中第0行第2列的像素值，b₀₃表示特征面B中第0行第3列的像素值，b₁₀表示特征面B中第1行第0列的像素值，b₁₁表示特征面B中第0行第1列的像素值，b₁₂表示特征面B中第1行第2列的像素值，b₁₃表示特征面B中第1行第3列的像素值，b₂₀表示特征面B中第2行第0列的像素值，b₂₁表示特征面B中第2行第1列的像素值，b₂₂表示特征面B中第2行第2列的像素值，b₂₃表示特征面B中第2行第3列的像素值，b₃₀表示特征面B中第3行第0列的像素值，b₃₁表示特征面B中第3行第1列的像素值，b₃₂表示特征面B中第3行第2列的像素值，b₃₃表示特征面B中第3行第3列的像素值；c₀₀为b₀₀、b₀₁、b₁₀、b₁₁中的最大值，c₀₁为b₀₂、b₀₃、b₁₂、b₁₃中的最大值，c₁₀为b₂₀、b₂₁、b₃₀、b₃₁中的最大值，c₁₁为b₂₂、b₂₃、b₃₂、b₃₃中的最大值。

经过该池化操作后，得到特征面C，尺寸降低为原来的一半；

(3)池化后，再用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：c_ij为特征图C第i行第j列的值。

所述步骤37的具体过程如下：

1)将步骤35得到的特征图转换为1×1×(7*7*512)的向量；

2)将步骤6得到的向量乘以已训练好的权重，得到1×1×4096的特征向量，计算公式如下：

其中a₀为特征向量第0个值，a₁为特征向量第1个值，a₄₀₉₅为特征向量第4095个值；w₀₀为权重矩阵第0行第0列的值，w₀₁为权重矩阵第0行第1列的值，w₁₀为权重矩阵第1行第0列的值，w₁₁为权重矩阵第1行第1列的值；b₀为偏置向量第0个值，b₁为偏置向量第1个值，b₄₀₉₅为偏置向量第4095个值；x₀为输入向量第0个值，x₁为输入向量第1个值，x₅₁₂为输入向量第512个值。

3)用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：a_i为特征向量第i个值。

所述步骤38包括：

a)将步骤36得到的特征向量乘以已训练好的权重，得到1×1×1000的特征向量，计算公式如下：

其中a₀为特征向量第0个值，a₁为特征向量第1个值，a₉₉₉为特征向量第999个值；w₀₀为权重矩阵第0行第0列的值，w₀₁为权重矩阵第0行第1列的值，w₁₀为权重矩阵第1行第0列的值，w₁₁为权重矩阵第1行第1列的值；b₀为偏置向量第0个值，b₁为偏置向量第1个值，b₉₉₉为偏置向量第999个值；x₀为输入向量第0个值，x₁为输入向量第1个值，x₉₉₉为输入向量第999个值；

b)用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：a_i为特征向量第i个值。

所述步骤4中训练支持向量机的步骤包括：

步骤41，取火焰训练数据集，通过上述步骤1,2,3提取出所有火焰候选区域的卷积特征，并以此作为训练集；

步骤42，把该训练集输入支持向量机中进行二分类问题训练，其中支持向量机学习算法的求解步骤包括：

(1)选择合适的参数C，构造并求解最优化问题：

约束条件

求得最优解为其中的第1个值，/>为其中的第2个值，/>为其中的第N个值；α_i为第i个拉格朗日乘子，α_j为第j个拉格朗日乘子，x_i是第i个训练样本，x_j是第j个训练样本，y_i∈{-1,1}是第i个样本对应的分类标签；y_j∈{-1,1}是第j个样本对应的分类标签，K(x_i,x_j)是高斯核函数，其公式如下：

其中：σ为标准差；

(2)选择α^*的一个正分量为其中的第j个值，计算

其中：b^*为所求偏置；

(3)构造决策函数：

其中：为所求最优解中的第i个值，sign()表示符号函数，当括号中的项大于某一阈值时，f(x)＝1，当括号中的项小于某一阈值时，f(x)＝0。

所述步骤5的具体过程如下：

步骤51，对于步骤4中得到的火焰区域集合S，计算所有s_i∈S中心点c_i，s_i为火焰区域集合S中的第i个区域；

步骤52，对于任意火焰区域s_i,s_j∈S，s_j为火焰区域集合S中的第j个区域，如果它们的中心点c_i和c_j之间的欧拉距离小于阈值F，则将它们合并，得到最终火焰区域。

本发明的有益效果如下：

(1)本发明用MSER(最大稳定极值区域算法)及RGB(一种颜色空间)特征来提取火焰候选区域，这个特征利用图像灰度值变化率及RGB值来描述火焰候选区域。因为火焰区域颜色变化范围很小，而且火焰颜色具有一定规律并能用RGB模型来表示，所以该方法具有较强的鲁棒性。

(2)本发明利用卷积神经网络来提取火焰区域特征，卷积神经网络可提取大量特征，能很好地描述火焰。

(3)本发明不仅可检测出图像中是否有火焰，且能够准确标示出火焰位置。

附图说明

图1是检测流程图。

图2是卷积神经网络提取卷积特征流程图。

具体实施方式

下面结合附图对本发明创造做进一步详细说明。

本发明是一种自然场景火焰检测的方法，操作过程如图1所示，包括以下步骤：

步骤1：将待检测火焰图像输入；

步骤2：包括以下步骤：

首先，将输入的图像转化为灰度图，记为I_gray；

其次，按照阈值升序的顺序，求出各个阈值下I_gray中的极值区域，极值区域Q_i定义如下：

在改变阈值的过程中，对I_gray求极值区域的变化率，极值区域变化率定义为：

其中，Δ为灰度阈值的微小变化量，Q_i+Δ为灰度阈值增加后得到的极值区域，Q_i-Δ为为灰度阈值减小后得到的极值区域，r(i)为i阈值时区域Q_i的变化率；当区域Q_i的变化率r(i)小于阈值T，就认为该区域是最大稳定极值区域；

然后，计算每个最大稳定极值区域的面积S，计算每一像素点的RGB值，并判断像素点是否为火焰像素点，其计算公式为：

其中r为RGB图像中的R通道的值，g为RGB图像中的G通道的值，b为RGB图像中的B通道的值，r_t为R通道的阈值、b_t为B通道的阈值、g_t为G通道的阈值。

最后，通过火焰像素点的总数n和最大稳定极值区域的面积，过滤掉多余区域，剩下的最大稳定极值区域即为火焰候选区域，过滤条件如下：

其中H为阈值，S为最大稳定极值区域的面积。

步骤3：包括以下步骤：

首先，对输入图片进行预处理，得到224×224×3的图像，具体操作过程如下：

(1)缩放图片，使其尺寸变为224×224×3；

(2)对图片的像素值进行归一化，计算方法为：

(3)对图片像素值进行去均值化，计算方法如下：

其中，r_mean、b_mean、g_mean分别表示图片R通道、G通道、B通道的平均值；

其次，对图像进行卷积、池化等操作，具体过程如下：

(1)对输入图像先进行两次步长为1、卷积核大小为3×3、卷积和数量为64的卷积操作，再进行一次池化尺寸为2×2、步长为2的池化操作，得到一个112×112×64的特征图；

(2)对于得到的特征图，先进行两次步长为1、卷积核大小为3×3、卷积和数量为128的卷积操作，再进行一次池化操作，得到一个56×56×128的特征图；

(3)对于得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积和数量为256的卷积操作，再进行一次池化操作，得到一个28×28×256的特征图；

(4)对于得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积和数量为512的卷积操作，再进行一次池化操作，得到一个14×14×512的特征图；

(5)对于得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积和数量为512的卷积操作，再进行一次池化操作，得到一个7×7×128的特征图；

然后，将得到的特征图转换为1×1×4096的特征向量；

最后，将得到的特征向量转换为1×1×1000的特征向量；

其中卷积操作过程如下：

假设A是输入的特征图M_i中的一张特征面，矩阵K是一个3×3的卷积核：

其中：a₀₀表示特征面A中第0行第0列的像素值，a₀₁表示特征面A中第0行第1列的像素值，a₀₂表示特征面A中第0行第2列的像素值，a₁₀表示特征面A中第1行第0列的像素值，a₁₁表示特征面A中第1行第1列的像素值，a₁₂表示特征面A中第1行第2列的像素值，a₂₀表示特征面A中第2行第0列的像素值，a₂₁表示特征面A中第2行第1列的像素值，a₂₂表示特征面A中第2行第2列的像素值；w₀₀表示卷积核K中第0行第0列的权重值；w₀₁表示卷积核K中第0行第1列的权重值；w₀₂表示卷积核K中第0行第2列的权重值；w₁₀表示卷积核K中第1行第0列的权重值；w₁₁表示卷积核K中第1行第1列的权重值；w₁₂表示卷积核K中第1行第2列的权重值；w₂₀表示卷积核K中第2行第0列的权重值；w₂₁表示卷积核K中第2行第1列的权重值；w₂₂表示卷积核K中第2行第2列的权重值；

在步长stride＝(1,1)的条件下，

假设B是输出的特征图M_o中的一张特征面：

其中,A_i为输入特征图M_o的第i张特征面，符号*表示卷积，n是卷积核的数量。卷积操作进行两次。

池化操作过程如下：

经过该池化操作后，得到特征面C，尺寸降低为原来的一半。

池化后，再用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：c_ij为特征图C第i行第j列的值。

将卷积操作得到的结果转换为特征向量的步骤如下：

(1)将得到的特征图转换为1×1×(7*7*512)的向量；

(2)得到的向量乘以已训练好的权重，得到1×1×4096的特征向量，计算公式如下：

(3)用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：a_i为特征向量第i个值。

(4)将上一步得到的结果乘以已训练好的权重，得到1×1×1000的特征向量，计算公式如下：

其中：a₉₉₉为特征向量第999个值；b₉₉₉为偏置向量第999个值；x₉₉₉为输入向量第999个值。

(5)用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：a_i为特征向量第i个值。

步骤4，训练支持向量机的步骤包括：

首先，取火焰训练数据集，通过上述步骤1,2,3提取出所有火焰候选区域的卷积特征，并以此作为训练集；

然后，把该训练集输入支持向量机中进行二分类问题训练，其中支持向量机学习算法的求解步骤包括：

(1)选择合适的参数C，构造并求解最优化问题：

约束条件/>

求得最优解为其中的第1个值，/>为其中的第2个值，/>为其中的第N个值。α_i为第i个拉格朗日乘子，α_j为第j个拉格朗日乘子，x_i是第i个训练样本，x_j是第j个训练样本，y_i∈{-1,1}是第i个样本对应的分类标签；y_j∈{-1,1}是第j个样本对应的分类标签，K(x_i,x_j)是高斯核函数，其公式如下：

其中：σ为标准差。

(2)选择α^*的一个正分量为其中的第j个值，计算

其中：b^*为所求偏置。

(3)构造决策函数：

其中：为所求最优解中的第i个值，sign()表示符号函数，当括号中的项大于某一阈值时，f(x)＝1，当括号中的项小于某一阈值时，f(x)＝0。利用该决策函数，便可对输入的特征向量进行分类。

步骤5：包括以下步骤：

首先，对于步骤2中得到的火焰区域S，计算所有s_i∈S中心点c_i，其中s_i为火焰区域集合S中的第i个区域；

然后，对于任意火焰区域s_i,s_j∈S，s_j为火焰区域集合S中的第j个区域，如果它们的中心点c_i和c_j之间的欧拉距离小于阈值F，则将它们合并，得到最终火焰区域。

Claims

1.一种自然场景火焰检测的方法，其特征在于：包括以下步骤：

步骤1，提取输入图像的最大稳定极值区域；

步骤2，通过最大稳定极值区域的色彩特征和面积来过滤多余的极值区域，得到火焰候选区域；步骤2的具体过程如下：

其中H为阈值，S为最大稳定极值区域的面积；

步骤3，将火焰候选区域输入到卷积神经网络模型中提取卷积特征；步骤3中提取卷积特征的步骤如下：

步骤31，对输入图片进行预处理，得到224×224×3的图像；

步骤32，对输入图像先进行两次步长为1、卷积核大小为3×3、卷积核数量为64的卷积操作，再进行一次池化尺寸为2×2、步长为2的池化操作，得到一个112×112×64的特征图；

步骤33，对于步骤32得到的特征图，先进行两次步长为1、卷积核大小为3×3、卷积核数量为128的卷积操作，再进行一次池化操作，得到一个56×56×128的特征图；

步骤34，对于步骤33得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积核数量为256的卷积操作，再进行一次池化操作，得到一个28×28×256的特征图；

步骤35，对于步骤34得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积核数量为512的卷积操作，再进行一次池化操作，得到一个14×14×512的特征图；

步骤36，对于步骤35得到的特征图，先进行四次步长为1、卷积核大小为3×3、卷积核数量为512的卷积操作，再进行一次池化操作，得到一个7×7×512的特征图；

步骤37，将步骤36得到的特征图转换为1×1×4096的特征向量；

步骤38，将步骤37得到的特征向量转换为1×1×1000的特征向量；

步骤5，将火焰区域合并，得到最终的火焰区域；步骤5的具体过程如下：

2.根据权利要求1所述的一种自然场景火焰检测的方法，其特征在于：所述步骤1的具体过程如下：

步骤11，将输入的图像转化为灰度图，记为I_gray；

步骤13，对I_gray求极值区域的变化率：

极值区域变化率定义为：

其中，△为灰度阈值的微小变化量，Q_i+Δ为灰度阈值增加后得到的极值区域，Q_i-Δ为灰度阈值减小后得到的极值区域，r(i)为i阈值时区域Q_i的变化率；

步骤14，对I_gray求最大稳定极值区域：

当区域Q_i的变化率r(i)小于阈值T，就认为该区域是最大稳定极值区域。

3.根据权利要求1所述的一种自然场景火焰检测的方法，其特征在于：所述步骤31具体过程如下：

第一步，缩放图片，使其尺寸变为224×224×3；

第二步，对图片的像素值进行归一化，计算方法为：

第三步，对图片像素值进行去均值化，计算方法如下：

其中，r_mean、b_mean、g_mean分别表示图片R通道、B通道、G通道的平均值。

4.根据权利要求1所述一种自然场景火焰检测的方法，其特征在于：所述步骤37的具体过程如下：

1)将步骤36得到的特征图转换为1×1×(7*7*512)的向量；

2)将步骤36得到的向量乘以已训练好的权重，得到1×1×4096的特征向量；

3)用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：a_i为特征向量第i个值。

5.根据权利要求1所述一种自然场景火焰检测的方法，其特征在于：所述步骤38包括：

a)将步骤37得到的特征向量乘以已训练好的权重，得到1×1×1000的特征向量；

b)用RELU函数对输出结果做非线性变换，RELU公式如下：

其中：a_i为特征向量第i个值。

6.根据权利要求1所述的一种自然场景火焰检测的方法，其特征在于：所述步骤4中训练支持向量机的步骤包括：

(1)选择参数C，构造并求解最优化问题：

0≤α_i≤C,i＝1,2,...,N

求得最优解为其中的第1个值，/>为其中的第2个值，/>为其中的第N个值，α_i为第i个拉格朗日乘子，α_j为第j个拉格朗日乘子，x_i是第i个训练样本，x_j是第j个训练样本，y_i∈{-1,1}是第i个样本对应的分类标签；y_j∈{-1,1}是第j个样本对应的分类标签，K(x_i,x_j)是高斯核函数，其公式如下：

其中：σ为标准差；

(2)选择α^*的一个正分量为其中的第j个值，计算

其中：b^*为所求偏置；

(3)构造决策函数：

其中：为所求最优解中的第i个值，sign()表示符号函数，当括号中的项大于某一阈值时，f(x)＝1，当括号中的项小于某一阈值时，f(x)＝0。/>