CN113673634A

CN113673634A - 一种输电线路通道吊车隐患误告警的确认方法

Info

Publication number: CN113673634A
Application number: CN202111230260.4A
Authority: CN
Inventors: 胡志坤; 谷加强; 张悦; 王飞; 范开鹏
Original assignee: Zhiyang Innovation Technology Co Ltd
Current assignee: Electric Power Research Institute of State Grid Shandong Electric Power Co Ltd; Zhiyang Innovation Technology Co Ltd
Priority date: 2021-10-22
Filing date: 2021-10-22
Publication date: 2021-11-19
Anticipated expiration: 2041-10-22
Also published as: CN113673634B

Abstract

一种输电线路通道吊车隐患误告警的确认方法，通过计算确定吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性，并根据所述属性训练CART分类树；输入待测吊车告警区域属性到CART分类树模型，输出分类结果及置信率。本发明在输电线路通道隐患识别结果中，确定吊车类型隐患的误告警，采用改进的CART分类树的算法，预测吊车告警是否为误告警。本发明在进行输电线路通道隐患检测识别时，可以快速的预测出吊车真实告警和误告警，为告警结果的效果提升提供技术支撑。

Description

一种输电线路通道吊车隐患误告警的确认方法

技术领域

本发明公开一种输电线路通道吊车隐患误告警的确认方法，属于输电线路隐患检测的技术领域。

背景技术

随着输电线路通道隐患识别的技术不断发展，隐患自动识别并告警的技术被广泛应用在输电线路检测领域，目前已经能够准确地识别出对导线造成威胁的隐患，如吊车、塔吊、山火等。但在识别结果中，存在很多吊车的误告警，由于吊车特殊结构特点，因此现有的图像采集***容易将形似吊车的物体识别成吊车，从而导致大量的人力资源去确认是否是真实的吊车隐患。对此，本领域技术的研究思路是怎样通过设计某种神经网络算法对图像进行检测，通过训练后确定吊车的特征，以此来消除现有检测设备的误告警数据。例如：目前常用的解决办法是将吊车误告警的图像作为负样本继续训练识别模型，对于模糊的吊车图像难以区分真实吊车告警和吊车误告警的细微差别。但是值得注意的是神经网络算法一般有大量参数需要手工设置和调节。

因此，有人开始引用分类树的算法对被检测对象进行诊断，得到对应的诊断结果：例如中国专利文献CN111626329A公开一种基于LDA寻优多尺度纹理特征的绝缘管母故障诊断方法，包括：步骤1：采集绝缘管母局部放电信号，构建PRPD谱图，然后将PRPD谱图构建为Gaussian金字塔谱图空间；步骤2：提取Gaussian金字塔谱图空间的纹理统计量形成多尺度纹理特征；步骤3：通过LDA寻优方法筛选纹理特征；步骤4：根据步骤3筛选出的纹理特征建立CART分类树模型，并对该模型进行训练和测试；步骤5：使用步骤4建立的CART分类树模型进行绝缘管母故障诊断，输出故障诊断结果。但是，怎样实现吊车隐患误告警的判断，一直没有文献公开过相关的技术思路或者技术方案，如果只是简单转用所述CART分类树模型至识别吊车隐患误告警，所述CART分类树模型难以适应输电线路多变的场景，模型极易受图像分辨率及图像质量的影响，导致模型分类效果下降。综上所述，如何提供一种高效、可靠的输电线路通道吊车隐患误告警的确定方法，提高隐患识别结果可信率，是目前本领域技术人员亟待解决的问题之一。

发明内容

针对现有技术的不足，本发明公开一种输电线路通道吊车隐患误告警的确认方法。

本发明的技术方案如下：

一种输电线路通道吊车隐患误告警的确认方法，其特征在于，基于吊车真实告警区域和吊车误告警区域在被测图像中的位置、告警区域面积、告警区域集中趋势的测度，通过计算确定吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性，并根据所述属性训练CART分类树；

输入待测吊车告警区域属性到CART分类树模型，输出分类结果及置信率；

此处所述吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性，训练时可选取多个属性，不限制数量，至少选取四个可达到本发明效果：包括告警区域在被测图像中的位置坐标x、位置坐标y、距离被测图像中心点的距离、告警区域的长宽比、告警区域的面积；所述告警区域是由相关的隐患识别算法对被测图像进行识别后所对应确定的包含目标吊车（包括真实吊车和假吊车）的最小矩形框，所述隐患识别算法属于现有技术，并不属于本发明所要保护的内容。

根据本发明优选的，一种输电线路通道吊车隐患误告警的确认方法，其特征在于，包括详细的步骤如下：

a、计算吊车真实告警区域和吊车误告警区域的属性分布差异；

b、从所有吊车真实告警和吊车误告警属性中选取分布差异较大的属性训练CART分类树；

所述步骤a包含以下详细步骤：

a1：分别寻找步骤a所述的属性中的最大的数值和最小的数值，记作maxValue、minValue；

a2：计算maxValue和minValue的差值d=maxValue-minValue；

a3：将差值平均为k组，每组间隔为l=d/k，则第一组的范围为（minValue，minValue+l），以此类推；

a4：统计第i组的样本数n_i，i为数据组下标，样本总数为t；

a5：计算第i组的相对数x_i = n_i/t；

a6：第i组吊车真实告警区域相对数记为x_i1，吊车误告警区域相对数记为x_i2,，计算第i组吊车真实告警区域和吊车误告警区域的属性分布差异

；

a7：计算吊车真实告警区域和吊车误告警区域的属性分布差异

；

所述步骤b包含以下详细步骤：

b1：选取分布差异值s较大的属性；

b2：指定决策树的最大深度q，决策树节点样本个数阈值r，基尼系数阈值t，q的取值范围为0~20，q取值为0代表不限制树的深度，r的取值范围为1~10，t的取值为0时，代表节点数据纯度最高；

b3：创建节点，对于当前节点的数据集为D：

如果样本个数小于阈值r或没有特征，则返回决策子树；

如果当前节点深度达到指定决策树最大深度，则返回决策子树，当前节点停止划分；

b4：计算当前节点数据集D的基尼系数，基尼系数代表了模型的不纯度，基尼系数越小，不纯度越低，特征越好，如果基尼系数小于阈值t则返回决策子树，当前节点停止划分，对于数据集D，个数为

，假设共有K个类别，第k个类别的数量为

，则数据集D的基尼系数为：

，所述K为样本中类别总数；

b5：计算当前节点所有特征的所有特征值对数据集D的基尼系数，选择基尼系数最小的特征A及特征值a，A为最优特征，根据最优特征及特征值a，将数据集划分为D1、D2，小于等于最优特征a的为D1，大于最优特征a的为D2，并将当前节点切分为两个子节点，在特征A特征值a的条件下，基尼系数为：

；

b6：子节点重复步骤b3，直到生成最终的决策树；

b7：选取在测试集上准确率最高的一棵CART分类树，根据该树训练属性，输入待测吊车区域的对应属性，输出吊车待测区域分类结果及置信率。

本发明与现有技术相比，具有以下优点和有益效果：

（1）本发明能准确地区分待测图像中模糊的吊车告警区域和吊车误告警区域。

（2）本发明基于机器学习，进行有监督学习，能够快速地进行吊车误告警确认，CART分类树模型输入为吊车多个属性做分类，相较于深度学习识别模型输入图像做分类，分类计算速度提升显著，且CART分类树模型不需要依赖图像内容，可进行场景复杂多样的吊车误告警确认。

（3）本发明通过对吊车误告警的确认，使识别模型吊车隐患误报率大大降低。

附图说明

图1是本发明中的确定方法的流程示意图。

图2是本发明中训练CART分类树的流程示意图。

具体实施方式

下面结合实施例和说明书附图对本发明做进一步说明，但不限于此。

实施例1、

如图1、2所示。

一种输电线路通道吊车隐患误告警的确认方法，通过计算确定吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性，并根据所述属性训练CART分类树；输入待测吊车告警区域属性到CART分类树模型，输出分类结果及置信率。

包括详细的步骤如下：

所述步骤a包含以下详细步骤：

a2：计算maxValue和minValue的差值d=maxValue-minValue；

a4：统计第i组的样本数n_i，i为数据组下标，样本总数为t；

a5：计算第i组的相对数x_i = n_i/t；

a6：第i组吊车真实告警区域相对数记为x_i1，吊车误告警区域相对数记为x_i2,，计算第i组吊车真实告警区域和吊车误告警区域的属性分布差异s_i=|x_i1-x_i2|；

a7：计算吊车真实告警区域和吊车误告警区域的属性分布差异s=Σs_i；

所述步骤b包含以下详细步骤：

b1：选取分布差异值s较大的属性；

b3：创建节点，对于当前节点的数据集为D：

如果样本个数小于阈值r或没有特征，则返回决策子树；

b4：计算当前节点数据集D的基尼系数，基尼系数代表了模型的不纯度，基尼系数越小，不纯度越低，特征越好，如果基尼系数小于阈值t则返回决策子树，当前节点停止划分，对于数据集D，个数为|D|，假设共有K个类别，第k个类别的数量为|C_k|，则数据集D的基尼系数为：

，所述K为样本中类别总数；

b5：计算当前节点所有特征的所有特征值对数据集D的基尼系数，选择基尼系数最小的特征A及特征值a，A为最优特征，根据最优特征及特征值a，将数据集划分为D₁、D₂，小于等于最优特征a的为D1，大于最优特征a的为D2，并将当前节点切分为两个子节点，在特征A特征值a的条件下，基尼系数为：

；

b6：子节点重复步骤b3，直到生成最终的决策树；

应用例1、

将实施例1所述的方法应用至某条输电线路通道拍摄的图像，经过隐患识别后共有620个吊车告警，计算吊车真实告警和误告警的坐标x、坐标y、宽、高、面积、长宽比、距中心点距离属性的分布差异，选取分布差异较大的属性训练CART分类树，指定树的深度，选取准确率最高的一棵分类树。

1）获取吊车真实告警和误告警的坐标x、坐标y、宽、高、面积、长宽比、距中心点距离属性：

x, y, width, height, scale, area, distance, result

683,254,16,35,21,560,212,1

271,381,14,17,12,238,336,1

743,502,13,25,19,325,152,1

182,524,13,28,21,364,424,0

181,524,15,29,19,435,425,0

374,369,16,16,10,256,240,0

......

2）计算并选取分布差异最大的几个属性：

x, height, scale, area, distance属性

3）指定树的深度，训练决策树

树的深度取值为0~20,0代表不限制树的深度，得到结果为：

max_depth: [0]; maxscore: [0.6855345911949685]

max_depth: [1]; maxscore: [0.8176100628930818]

max_depth: [2]; maxscore: [0.7987421383647799]

max_depth: [3]; maxscore: [0.8650314465408805]

max_depth: [4]; maxscore: [0.8635849056603774]

max_depth: [5]; maxscore: [0.8913207547169812]

max_depth: [6]; maxscore: [0.7421383647798742]

max_depth: [7]; maxscore: [0.8635849056603774]

max_depth: [8]; maxscore: [0.8672955974842768]

max_depth: [9]; maxscore: [0.9035849056603774]

max_depth: [10]; maxscore: [0.8921383647798742]

4）输出最好的决策树的准确率

选取深度为9的CART分类树，准确率为0.9，测试实例为：

[[341, 485, 28, 32, 11, 896, 261],

[1061, 382, 27, 29, 10, 783, 465],

[223, 732, 13, 30, 23, 390, 470],

[19, 299, 15, 29, 19, 435, 600],

[351, 406, 27, 23, 8, 621, 252]]

结果：

[1 0 0 1 1]

将输电线路620个吊车隐患输入到CART分类树模型，待测集包含415个真实吊车样本及205个吊车误报样本，CART分类树模型输出198个吊车误报，其中确认为误报的吊车有180个，本应用例通过对吊车误告警的确认，使识别模型吊车隐患误报数相交原先未过滤误报降低了0.87。

本发明采用CART分类树的算法，基于有监督学***，减少运维人员确认吊车告警所需的时间成本。

Claims

1.一种输电线路通道吊车隐患误告警的确认方法，其特征在于，通过计算确定吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性，并根据所述属性训练CART分类树；输入待测吊车告警区域属性到CART分类树模型，输出分类结果及置信率。

2.根据权利要求1所述的一种输电线路通道吊车隐患误告警的确认方法，其特征在于，包括详细的步骤如下：

b、从所有吊车真实告警和吊车误告警属性中选取分布差异较大的属性训练CART分类树。

3.根据权利要求2所述的一种输电线路通道吊车隐患误告警的确认方法，其特征在于，所述步骤a包含以下详细步骤：

a2：计算maxValue和minValue的差值d=maxValue-minValue；

a4：统计第i组的样本数n_i，i为数据组下标，样本总数为t；

a5：计算第i组的相对数x_i = n_i/t；

a7：计算吊车真实告警区域和吊车误告警区域的属性分布差异s=Σs_i。

4.根据权利要求2或3所述的一种输电线路通道吊车隐患误告警的确认方法，其特征在于，所述步骤b包含以下详细步骤：

b1：选取分布差异值s较大的属性；

b3：创建节点，对于当前节点的数据集为D：

如果样本个数小于阈值r或没有特征，则返回决策子树；

b4：计算当前节点数据集D的基尼系数，如果基尼系数小于阈值t则返回决策子树，当前节点停止划分，对于数据集D，个数为|D|，假设共有K个类别，第k个类别的数量为|C_k|，则数据集D的基尼系数为：

，所述K为样本中类别总数；

；

b6：子节点重复步骤b3，直到生成最终的决策树；