具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的实施方式;相反,提供这些实施方式使得本发明将全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。在图中相同的附图标记表示相同或类似的结构,因而将省略对它们的重复描述。
所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本发明的实施方式的充分理解。然而,本领域技术人员应意识到,没有所述特定细节中的一个或更多,或者采用其它的方法、组元等,也可以实践本发明的技术方案。在其它情况下,不详细示出或描述公知结构或者操作以避免模糊本发明。
图1为根据一示例实施例示出的光纤周界入侵信号的识别方法的流程图。如图1所示,该方法10包括:
步骤S110,从光纤周界监测***的监测信号中获取实时信号y(t)。
例如,对一光纤周界入侵报警***的信号进行监测,并从该监测信号中获取实时信号y(t)。通常,该实时信号y(t)经以一采样频率采样后获得。
步骤S120,对实时信号y(t)进行预处理,以去除其噪声,获得去噪后的信号y’(t)。
例如,可以采用小波变换对实时信号y(t)进行预处理,以去除其中的背景白噪声等噪声。
步骤S130,判断去噪后的信号y’(t)是否为入侵信号。
通常,光纤周界***中的入侵信号大致被分为攀爬、敲击及环境(例如风、雨、雪及车辆来往等)等几类。在一些实施例中,例如可以采用将去噪后的信号y’(t)与一阈值进行比较的方法来判断其是否为入侵信号。当去噪后的信号y’(t)高于该阈值时,判断该去噪后的信号y’(t)为入侵信号。
步骤S140,当判断去噪后的信号y’(t)为入侵信号时,对其进行相关特征量的提取。
首先,截取该去噪后的信号y’(t),以获得离散的信号片段{x(ti)},i=1,...,N。
之后,提取信号片段{x(ti)},i=1,...,N的相关特征量。相关特征量例如包括峰均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)及频域特征量中的部分或全部。其中均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)属于时域特征量。下面分别定义信号片段{x(ti)},i=1,...,N的上述特征量:
峰值均值差(Diff)定义为信号片段{x(ti)},i=1,...,N中最大值max(x(t))和平均值的差值,其计算公式如下:
方差(D)的计算公式如下:
偏度(Skew)的计算公式如下:
峭度(K)的计算公式如下:
极值点数目(Num)用于统计信号片段{x(ti)},i=1,...,N中极值点的数目。
频域特征量包括采用小波包分解获得的特征量[T'1,T'2,......,T'r],其计算过程如下:
将信号片段{x(ti)},i=1,...,N进行j层小波包分解,设采样频率为2f,则可形成2j个等宽的频带,每个频带宽度为分解后,得到j层小波包系数其中k=1,2,...,2j-1,m为位置指标。选择其中r个对能量最为敏感的频带,求出其能量并归一化处理,其计算公式如下:
步骤S150,根据预先创建的决策树模型所确定的分类规则与所提取的相关特征量,对入侵信号进行分类。
上述预先创建的决策树模型既可以包括含有单棵决策树的模型,也可以包括含有多棵决策树组合的模型。下面我们首先介绍如何根据包含有单棵决策树的决策树模型所确定的分类规则及相关特征量,对入侵信号进行分类。
当预先创建的决策树模型建立后,相应的分类规则也已经确立。具体地,从该决策树模型确定的决策树中抽取分类规则。图2为根据一示例实施例示出的用于识别光纤周界入侵信号的单棵决策树的示意图。以图2所示的单棵决策树来说明如何获得决策树所确定的分类规则,及进行分类。
如图2所示,其中A1、A2及A3表示一棵决策树的三个属性,每个属性例如为上述的相关特征量之一;其中A1对应三个不同属性条件a1,1、a1,2及a1,3,A2对应两个不同属性条件a2,1、a2,2,A3对应两个不同属性条件a3,1、a3,2;C1和C2表示入侵信号的两个类别,例如如上所述,包括攀爬、敲击及环境(例如风、雨、雪及车辆来往等)等。从根(如图中A1)到叶的每一条路径创建一个分类规则,分别以IF-THEN形式表示,其中沿着路径上的每个属性条件形成规则前件(即IF部分)的一个合取项,包含分类(Cn)的叶结点,形成规则后件(即THEN部分)。例如,如果(IF)被分类信号对A1属性值满足条件a1,2,则(THEN)分类为C1;如果被分类信号对A1属性值满足条件a1,1且对A2属性值满足条件a2,2,则分类为C2。以此类推,不再一一赘述。需要说明的是,上述获得决策树模型所确定的分类规则仅为示例说明,而非限制本发明。
获得分类规则后,将所提取的相关特征量套用于该分类规则,以对该入侵信号进行分类。例如,从该入侵信号所提取的特征向量A1、A2的属性条件分别满足条件为a1,1和a2,1,则将该入侵信号分类为C1。
如上所述,预先创建的决策树模型也可以为一决策树组合模型T,该决策树组合模型T包括多棵决策树T1,T2,...,Tk。下面着重说明如何根据决策树组合模型T,确定分类结果。采用简单投票法,对输入的入侵信号进行分类。对每个输入的入侵信号,决策树组合模型T中的每棵决策树T1,T2,...,Tk都会如上述单棵决策树的方法得到一个分类结果,即相当于对某个类型Ci,i=1,2,...,n投了一票。统计各个类型Ci,i=1,2,...,n的票数,最终选择获得票数最多的分类Cj,1≤j≤n,以此作为对该入侵信号的最终分类结果。或者,对每棵决策树T1,T2,...,Tk的分类结果进行分组,从而获得至少一组分类结果,分别统计各组分类结果中所包含的分类结果的数量,以其中分类结果数量最多的一组中的分类结果作为最终的分类结果。
下面将具体介绍在进行上述识别方法之前,如何创建上述的决策树模型,该决策树模型既包括仅具有单棵决策树的决策树模型,也包括参与投票相应的多棵决策树的组合模型。
图3为根据一示例实施例示出的创建用于识别光纤周界入侵信号的决策树模型的方法的流程图。如图3所示,该方法20包括:
步骤S210,预先从光纤周界监测***的监测信号中分别获取多组已知分类的入侵信号Y(t),以及其对应的分类结果。
为了建立用于入侵信号分类的决策树模型,需要预先从光纤周界监测信号中分别获取多组已知分类的入侵信号Y(t)。所述已知的分类例如包括上述的攀爬、敲击及环境(例如风、雨、雪及车辆来往等)等,但本发明不以此为限。
步骤S220,分别对多组已知分类的入侵Y(t)进行预处理,以去除其噪声,分别获得去噪后的多组信号Y’(t)。
例如,可以采用小波变换对多组已知分类的入侵信号Y’(t)进行处理,以去除其中的背景白噪声等。
步骤S230,分别截取去除噪声后的多组信号Y’(t),以从中获得多组离散的入侵信号片段{X(ti)},i=1,...,N,并分别提取多组离散的入侵信号片段{X(ti)},i=1,...,N的相关特征量。
具体地,相关特征量例如包括峰均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)及频域特征量中的部分或全部。其中均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)属于时域特征量。上述相关特征向量的定义与计算如前所述,在此不再赘述。
步骤S240,根据多组入侵信号片段{X(ti)},i=1,...,N的相关特征量,建立训练数据集,创建决策树模型。
具体地,设每组入侵信号片段{X(ti)},i=1,...,N的相关特征量包括{A1,A2,......,AM},这些特征向量组成了一个输入向量,多组输入向量组成了决策树模型的训练数据集D。
根据总体训练数据集D,创建决策树模型。首先介绍包含有单棵决策树的决策树模型的创建。下面以采用Gini指标作为***属性度量方法的CART算法为例进行说明。
首先,Gini指标定义为如下公式:
其中,pi是类别Ci在训练数据集D中出现的概率。
对于训练数据集D中某个属性A,如果将训练数据集D划分为两个部分D1和D2,则给定的D的Gini指标如下:
对该属性的不同子集进行上述Gini指标的计算,选择产生最小Gini指标的子集作为该属性的***子集。重复以上过程,直到***停止。此时包含有单棵决策树的决策树模型创建完毕。
在建立决策树后,为防止由训练数据集样本带噪声或者训练数据集样本不充分等原因引起的过拟合现象,需要对建立的决策树进行剪枝。剪枝主要包括预剪枝和后剪枝。
其中,预剪枝是通过提前停止树的构造,如通过决定在给定的节点不再***或划分训练元组的子集,而对树剪枝,一旦停止,该节点即成为叶结点。而后剪是由完全生长的树剪去子树,通过删除节点的分支,并用叶结点替换它而剪掉给定节点的子树,叶结点使用被替换的子树中最频繁的类标记。后剪枝的原则包括最小描述长度原则和最小期望错误率原则。根据统计度量,减去不可靠的分支,提高树独立于测试数据的正确分类能力。
CART算法通常采用后剪枝策略。例如采用CCP(代价-复杂度)方法进行剪枝。首先,自下而上地通过对原始决策树的修剪得到一系列的树{T0,T1,......,Tk},其中T0为未经任何修剪的原始树,Tk为只有一个结点的树,Ti+1是Ti的一个或多个子树被替换所得到的。之后,根据真实误差率来选择最优秀的树作为最后被剪枝的决策树。
上面是作为一次训练得到的决策树。还可以根据训练数据集进行多次训练,选出最优的决策树,从而确定决策树模型。
此外,所采用的决策树算法还可以包括:采用信息增益作为***属性度量的ID3算法或采用信息增益作为***属性度量的C4.5算法。
接下来介绍包含有多棵决策树的决策树模型的创建。图7为根据一示例实施例示出的通过原始训练数据集形成组合决策树模型的示意图。
在上述确定总体训练数据集D后,如图7所示,对训练数据集D进行有放回的随机抽样,可获得l个训练数据集D1,D2,...,Dl,每个训练数据集中都包含与原训练数据集D中的相同数目的输入向量。对这l个训练数据集D1,D2,...,Dl分别建立相应的决策树模型。每棵决策树模型都以采用CART算法为例,但本发明不以此为限。
设前面提取的属性数目为M个。每棵决策树建立时,初始数据都在根结点的位置,之后会对其进行***。指定一个属性数为F,且F≤M。对每次***过程中,在所有的M个属性中随机抽取F个属性作为***属性集。对结点以抽取的F个属性,选择最好的方式进行***。***过程中,以Gini指标作为度量方法。在决策树的建立过程中,F的数目保持不变。
下面以采用Gini指标作为***属性度量方法的CART算法为例进行说明。这里,假设F=1。
首先,Gini指标定义为如下公式:
其中,pi是类别Ci在训练数据集D中出现的概率。
对于训练数据集D中的抽取的某个属性Aj(j=1,…,M)的一个子集A,如果将训练数据集划分为两个部分D1和D2,则给定的D的Gini指标如下:
分别对该属性的不同子集进行上述Gini指标的计算,选择产生最小Gini指标的子集作为该属性的***子集。
每次***都重新从所有的M个属性中随机抽取F个属性(F的数目保持不变)。
重复以上过程,直到所有结点都是叶子结点,***停止。
此时单棵决策树创建完毕,不需要进行剪枝。
对所有训练数据集D1,D2,...,Dl分别进行这样的过程,得到多棵决策树T1,T2,...,Tk。这样就获得了一个由T1,T2,...,Tk构成的多棵决策树组合T(也称为一个随机森林)。
以未被抽到的原始训练集D中的数据作为检测输入,根据每组输入向量对应的分类结果Ci,i=1,2,...,n,以及其通过决策树模型最终分类结果,还可以计算整个决策树模型的分类准确率。
本发明提供的光纤周界入侵信号的识别方法,通过对已知分类信号的入侵信号的相关特征量的提取,获得训练数据集,以建立相应的决策树模型;并根据所创建的决策树模型,确定光纤周界入侵信号的分类规则,以对光纤周界入侵信号进行识别与分类。该方法简单、易于实现,分类能力高并且分类效果较好。
图4为根据一示例实施例示出的光纤周界入侵信号的识别装置的结构图。如图4所示,该识别装置30包括:信号获取模块310、信号预处理模块320、特征量提取模块330以及决策树分类模块340。
其中,信号获取模块310用于从光纤周界监测***的监测信号中获取实时信号y(t)。通常,该实时信号y(t)经以一采样频率采样后获得。
信号预处理模块320用于对实时信号y(t)进行预处理,以去除其噪声,获得去噪后的信号y’(t),并判断去噪后的信号y’(t)是否为入侵信号。
例如,可以采用小波变换对实时信号y(t)进行预处理,以去除其中的背景白噪声等噪声。
通常,光纤周界***中的入侵信号大致被分为攀爬、敲击及环境(例如风、雨、雪及车辆来往等)等几类。在一些实施例中,例如可以采用将去噪后的信号y’(t)与一阈值进行比较的方法来判断其是否为入侵信号。当去噪后的信号y’(t)高于该阈值时,判断该去噪后的信号y’(t)为入侵信号。
特征量提取模块330用于当判断去噪后的信号y’(t)为入侵信号时,对其进行相关特征量的提取。
首先,截取该去噪后的信号y’(t),以获得信号片段{x(ti)},i=1,...,N。
之后,提取信号片段{x(ti)},i=1,...,N的相关特征量。相关特征量例如包括峰均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)及频域特征量中的部分或全部。其中均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)属于时域特征量。上述相关特征向量的定义与计算如前所述,在此不再赘述。
决策树分类模块340模块用于根据预先创建的决策树模型所确定的分类规则与所提取的相关特征量,对入侵信号进行分类。
上述预先创建的决策树模型既可以包括含有单棵决策树的模型,也可以包括含有多棵决策树组合的模型。下面我们首先介绍如何根据包含有单棵决策树的决策树模型所确定的分类规则及相关特征量,对入侵信号进行分类。
当预先创建的决策树模型建立后,相应的分类规则也已经确立。具体地,从该决策树模型确定的决策树中抽取分类规则。图2为根据一示例实施例示出的用于识别光纤周界入侵信号的单棵决策树的示意图。以图2所示的单棵决策树来说明如何根据决策树确定分类规则,及进行分类。
如图2所示,其中A1、A2及A3表示决策树的三个属性,每个属性例如为上述的相关特征量之一;其中A1对应三个不同属性条件a1,1、a1,2及a1,3,A2对应两个不同属性条件a2,1、a2,2,A3对应两个不同属性条件a3,1、a3,2;C1和C2表示入侵信号的两个类别,例如如上所述,包括攀爬、敲击及环境(例如风、雨、雪及车辆来往等)等。从根(如图中A1)到叶的每一条路径创建一个分类规则,分别以IF-THEN形式表示,其中沿着路径上的每个属性条件形成规则前件(即IF部分)的一个合取项,包含分类(Cn)的叶结点,形成规则后件(即THEN部分)。例如,如果(IF)A1的属性条件满足条件a1,2,则(THEN)分类为C1;如果A1的属性条件满足条件a1,1且A2的属性条件满足条件a2,2,则分类为C2。以此类推,不再一一赘述。需要说明的是,上述获得决策树模型所确定的分类规则仅为示例说明,而非限制本发明。
获得分类规则后,将所提取的相关特征量套用于该分类规则,以对该入侵信号进行分类。例如,从入侵信号中所提取的特征向量A1、A2的属性条件分别满足条件为a1,1和a2,1,则将该入侵信号分类为C1。
如上所述,预先创建的决策树模型也可以为一决策树组合模型T,该决策树组合模型T包括多棵决策树T1,T2,...,Tk。下面着重说明如何根据决策树组合模型T,确定分类结果。采用简单投票法,对输入的入侵信号进行分类。对每个输入的入侵信号,决策树组合模型T中的每棵决策树T1,T2,...,Tk都会如上述单棵决策树的方法得到一个分类结果,即相当于对某个类型Ci,i=1,2,...,n投了一票。统计各个类型Ci,i=1,2,...,n的票数,最终选择获得票数最多的分类Cj,1≤j≤n,以此作为对该入侵信号的最终分类结果。或者,对每棵决策树T1,T2,...,Tk的分类结果进行分组,从而获得至少一组分类结果,分别统计各组分类结果中所包含的分类结果的数量,以其中分类结果数量最多的一组中的分类结果作为最终的分类结果。
此外,光纤周界入侵信号的识别装置30还用于在识别入侵信号之前,创建上述的决策树模型,该决策树模型既包括仅具有单棵决策树的决策树模型,也包括参与投票相应的多棵决策树的组合模型。
其中信号获取模块310还用于预先从光纤周界监测信号中分别获取多组已知分类的入侵信号Y(t)。
为了建立用于入侵信号分类的决策树模型,需要预先从光纤周界监测***的监测信号中分别获取多组已知分类的入侵信号Y(t),以及其对应的分类结果。所述已知的分类例如包括上述的攀爬、敲击及环境(例如风、雨、雪及车辆来往等)等,但本发明不以此为限。
信号预处理模块320还用于分别对多组已知分类的入侵Y(t)进行预处理,以去除其噪声,分别获得去噪后的多组信号Y’(t)。
特征量提取模块330还用于分别截取去除噪声后的多组信号Y’(t),以从中获得多组离散的入侵信号片段{X(ti)},i=1,...,N,并分别提取多组离散的入侵信号片段{X(ti)},i=1,...,N的相关特征量。
具体地,相关特征量例如包括峰均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)及频域特征量中的部分或全部。其中均值差(Diff)、方差(D)、偏度(Skew)、峭度(K)、极值点数目(Num)属于时域特征量。上述相关特征向量的定义与计算如前所述,在此不再赘述。
决策树分类模块340还用于根据多组入侵信号片段{X(ti)},i=1,...,N的相关特征量,建立训练数据集,创建决策树模型。
具体地,设每组入侵信号片段{X(ti)},i=1,...,N的相关特征量包括{A1,A2,......,AM},这些特征向量组成了一个输入向量,多组输入向量组成了决策树模型的训练数据集D。
根据总体的训练数据集D,创建决策树模型。首先介绍包含有单棵决策树的决策树模型的创建。下面以采用Gini指标作为***属性度量方法的CART算法为例进行说明。
首先,Gini指标定义为如下公式:
其中,pi是类别Ci在训练数据集D中出现的概率。
对于训练数据集D中的某个属性A,如果将训练数据集D划分为两个部分D1和D2,则给定的D的Gini指标如下:
对该属性的不同子集进行上述Gini指标的计算,选择产生最小Gini指标的子集作为该属性的***子集。重复以上过程,直到***停止。之后,用后剪枝方法对已建立的决策树进行剪枝,形成一次训练的决策树模型。多次反复训练,以获得最佳决策树模型。
接下来介绍包含有多棵决策树的决策树模型的创建。继续参考图7,在上述确定总体训练数据集D后,对训练数据集D进行有放回的随机抽样,可获得l个训练数据集D1,D2,...,Dl,每个训练数据集中都包含与原训练数据集D中的相同数目的输入向量。对这l个训练数据集D1,D2,...,Dl分别建立相应的决策树模型。每棵决策树模型都以采用上述的CART算法为例,但本发明不以此为限。
前面提取的属性总数目为M个,指定一个属性数为F,满足F≤M。在决策树的建立过程中,F的数目保持不变。在每次***过程中,都从M个属性中随机抽取F个属性作为***属性集。以Gini指标作为度量方法,选择最佳***方式,直到***停止为止。
多棵决策树模型中的单棵决策树的具体创建如方法部分所述,在此不再赘述。创建完毕每颗决策树后,不需要进行剪枝。
对所有训练数据集D1,D2,...,Dl分别进行这样的过程,得到多棵决策树T1,T2,...,Tk。这样就获得了一个由T1,T2,...,Tk构成的多棵决策树组合T(也称为一个随机森林)。
以未被抽到的原始训练集D中的数据作为检测输入,根据每组输入向量对应的类别Ci,i=1,2,...,n,以及其通过决策树模型最终分类结果,还可以计算整个决策树模型的分类准确率。
本发明提供的光纤周界入侵信号的识别装置,通过对已知分类信号的入侵信号的相关特征量的提取,获得训练数据集,以建立相应的决策树模型;并根据所创建的决策树模型,确定光纤周界入侵信号的分类规则,以对光纤周界入侵信号进行识别与分类。该装置所采用的识别方法简单、易于实现,分类能力高并且分类效果较好。
下面将介绍一种包括本发明提供的光纤周界入侵信号的识别装置的光纤周界入侵报警***。图5为根据一示例实施例示出的光纤周界入侵报警***的结构图。如图5所示,该光纤周界入侵报警***40包括:光路子***410、光纤周界入侵信号的识别装置30以及报警子***420。
其中光路子***410用于提供光纤周界的监测信号。下面以采用迈克尔逊干涉仪为例,介绍光路***410,但本发明不以此为限。图6为采用迈克尔逊干涉仪的光路子***的结构图。如图6所示,光路子***410包括:激光器4110、耦合器4120、参考臂4130、敏感臂4140、反射端面4150及探测器4160。
其中,激光器4110发出的窄带激光,经过反射端面4150的反射,与参考臂4130反射的光在探测器4160上干涉。如果有入侵事件,则探测信号在敏感臂4140上受扰动信号的调制而发生相位改变,引起干涉条纹变化,从而使探测器4160探测的光强发生变化。探测器4160例如为光电探测器,将探测到的光信号转换为电信号输出,以提供光纤周界的监测信号。
光纤周界入侵信号的识别装置30根据该监测信号,识别入侵信号并进行入侵信号的分类。关于该识别装置30如何进行入侵信号识别与分类以在上文中详细描述,在此不再赘述。
根据识别装置30输出的入侵信号的分类信息,报警子***420相应地进行报警。如图5所示,报警子***420例如可以包括报警输出控制模块(图中未示出),用于输出控制报警外设以进行报警。
以上具体地示出和描述了本发明的示例性实施方式。应该理解,本发明不限于所公开的实施方式,相反,本发明意图涵盖包含在所附权利要求范围内的各种修改和等效置换。