发明内容
针对现有技术的不足,本发明公开一种输电线路通道吊车隐患误告警的确认方法。
本发明的技术方案如下:
一种输电线路通道吊车隐患误告警的确认方法,其特征在于,基于吊车真实告警区域和吊车误告警区域在被测图像中的位置、告警区域面积、告警区域集中趋势的测度,通过计算确定吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性,并根据所述属性训练CART分类树;
输入待测吊车告警区域属性到CART分类树模型,输出分类结果及置信率;
此处所述吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性,训练时可选取多个属性,不限制数量,至少选取四个可达到本发明效果:包括告警区域在被测图像中的位置坐标x、位置坐标y、距离被测图像中心点的距离、告警区域的长宽比、告警区域的面积;所述告警区域是由相关的隐患识别算法对被测图像进行识别后所对应确定的包含目标吊车(包括真实吊车和假吊车)的最小矩形框,所述隐患识别算法属于现有技术,并不属于本发明所要保护的内容。
根据本发明优选的,一种输电线路通道吊车隐患误告警的确认方法,其特征在于,包括详细的步骤如下:
a、计算吊车真实告警区域和吊车误告警区域的属性分布差异;
b、从所有吊车真实告警和吊车误告警属性中选取分布差异较大的属性训练CART分类树;
所述步骤a包含以下详细步骤:
a1:分别寻找步骤a所述的属性中的最大的数值和最小的数值,记作maxValue、minValue;
a2:计算maxValue和minValue的差值d=maxValue-minValue;
a3:将差值平均为k组,每组间隔为l=d/k,则第一组的范围为(minValue,minValue+l),以此类推;
a4:统计第i组的样本数ni,i为数据组下标,样本总数为t;
a5:计算第i组的相对数xi = ni/t;
a6:第i组吊车真实告警区域相对数记为x
i1,吊车误告警区域相对数记为x
i2,,计算第i组吊车真实告警区域和吊车误告警区域的属性分布差异
;
a7:计算吊车真实告警区域和吊车误告警区域的属性分布差异
;
所述步骤b包含以下详细步骤:
b1:选取分布差异值s较大的属性;
b2:指定决策树的最大深度q,决策树节点样本个数阈值r,基尼系数阈值t,q的取值范围为0~20,q取值为0代表不限制树的深度,r的取值范围为1~10,t的取值为0时,代表节点数据纯度最高;
b3:创建节点,对于当前节点的数据集为D:
如果样本个数小于阈值r或没有特征,则返回决策子树;
如果当前节点深度达到指定决策树最大深度,则返回决策子树,当前节点停止划分;
b4:计算当前节点数据集D的基尼系数,基尼系数代表了模型的不纯度,基尼系数越小,不纯度越低,特征越好,如果基尼系数小于阈值t则返回决策子树,当前节点停止划分,对于数据集D,个数为
,假设共有K个类别,第k个类别的数量为
,则数据集D的基尼系数为:
,所述
K为样本中类别总数;
b5:计算当前节点所有特征的所有特征值对数据集D的基尼系数,选择基尼系数最小的特征A及特征值a,A为最优特征,根据最优特征及特征值a,将数据集划分为D1、D2,小于等于最优特征a的为D1,大于最优特征a的为D2,并将当前节点切分为两个子节点,在特征A特征值a的条件下,基尼系数为:
;
b6:子节点重复步骤b3,直到生成最终的决策树;
b7:选取在测试集上准确率最高的一棵CART分类树,根据该树训练属性,输入待测吊车区域的对应属性,输出吊车待测区域分类结果及置信率。
本发明与现有技术相比,具有以下优点和有益效果:
(1)本发明能准确地区分待测图像中模糊的吊车告警区域和吊车误告警区域。
(2)本发明基于机器学习,进行有监督学习,能够快速地进行吊车误告警确认,CART分类树模型输入为吊车多个属性做分类,相较于深度学习识别模型输入图像做分类,分类计算速度提升显著,且CART分类树模型不需要依赖图像内容,可进行场景复杂多样的吊车误告警确认。
(3)本发明通过对吊车误告警的确认,使识别模型吊车隐患误报率大大降低。
具体实施方式
下面结合实施例和说明书附图对本发明做进一步说明,但不限于此。
实施例1、
如图1、2所示。
一种输电线路通道吊车隐患误告警的确认方法,通过计算确定吊车真实告警区域和吊车误告警区域集中趋势差别较大的属性,并根据所述属性训练CART分类树;输入待测吊车告警区域属性到CART分类树模型,输出分类结果及置信率。
包括详细的步骤如下:
a、计算吊车真实告警区域和吊车误告警区域的属性分布差异;
b、从所有吊车真实告警和吊车误告警属性中选取分布差异较大的属性训练CART分类树;
所述步骤a包含以下详细步骤:
a1:分别寻找步骤a所述的属性中的最大的数值和最小的数值,记作maxValue、minValue;
a2:计算maxValue和minValue的差值d=maxValue-minValue;
a3:将差值平均为k组,每组间隔为l=d/k,则第一组的范围为(minValue,minValue+l),以此类推;
a4:统计第i组的样本数ni,i为数据组下标,样本总数为t;
a5:计算第i组的相对数xi = ni/t;
a6:第i组吊车真实告警区域相对数记为xi1,吊车误告警区域相对数记为xi2,,计算第i组吊车真实告警区域和吊车误告警区域的属性分布差异si=|xi1-xi2|;
a7:计算吊车真实告警区域和吊车误告警区域的属性分布差异s=Σsi;
所述步骤b包含以下详细步骤:
b1:选取分布差异值s较大的属性;
b2:指定决策树的最大深度q,决策树节点样本个数阈值r,基尼系数阈值t,q的取值范围为0~20,q取值为0代表不限制树的深度,r的取值范围为1~10,t的取值为0时,代表节点数据纯度最高;
b3:创建节点,对于当前节点的数据集为D:
如果样本个数小于阈值r或没有特征,则返回决策子树;
如果当前节点深度达到指定决策树最大深度,则返回决策子树,当前节点停止划分;
b4:计算当前节点数据集D的基尼系数,基尼系数代表了模型的不纯度,基尼系数越小,不纯度越低,特征越好,如果基尼系数小于阈值t则返回决策子树,当前节点停止划分,对于数据集D,个数为|D|,假设共有K个类别,第k个类别的数量为|C
k|,则数据集D的基尼系数为:
,所述
K为样本中类别总数;
b5:计算当前节点所有特征的所有特征值对数据集D的基尼系数,选择基尼系数最小的特征A及特征值a,A为最优特征,根据最优特征及特征值a,将数据集划分为D
1、D
2,小于等于最优特征a的为D1,大于最优特征a的为D2,并将当前节点切分为两个子节点,在特征A特征值a的条件下,基尼系数为:
;
b6:子节点重复步骤b3,直到生成最终的决策树;
b7:选取在测试集上准确率最高的一棵CART分类树,根据该树训练属性,输入待测吊车区域的对应属性,输出吊车待测区域分类结果及置信率。
应用例1、
将实施例1所述的方法应用至某条输电线路通道拍摄的图像,经过隐患识别后共有620个吊车告警,计算吊车真实告警和误告警的坐标x、坐标y、宽、高、面积、长宽比、距中心点距离属性的分布差异,选取分布差异较大的属性训练CART分类树,指定树的深度,选取准确率最高的一棵分类树。
1)获取吊车真实告警和误告警的坐标x、坐标y、宽、高、面积、长宽比、距中心点距离属性:
x, y, width, height, scale, area, distance, result
683,254,16,35,21,560,212,1
271,381,14,17,12,238,336,1
743,502,13,25,19,325,152,1
182,524,13,28,21,364,424,0
181,524,15,29,19,435,425,0
374,369,16,16,10,256,240,0
......
2)计算并选取分布差异最大的几个属性:
x, height, scale, area, distance属性
3)指定树的深度,训练决策树
树的深度取值为0~20,0代表不限制树的深度,得到结果为:
max_depth: [0]; maxscore: [0.6855345911949685]
max_depth: [1]; maxscore: [0.8176100628930818]
max_depth: [2]; maxscore: [0.7987421383647799]
max_depth: [3]; maxscore: [0.8650314465408805]
max_depth: [4]; maxscore: [0.8635849056603774]
max_depth: [5]; maxscore: [0.8913207547169812]
max_depth: [6]; maxscore: [0.7421383647798742]
max_depth: [7]; maxscore: [0.8635849056603774]
max_depth: [8]; maxscore: [0.8672955974842768]
max_depth: [9]; maxscore: [0.9035849056603774]
max_depth: [10]; maxscore: [0.8921383647798742]
4)输出最好的决策树的准确率
选取深度为9的CART分类树,准确率为0.9,测试实例为:
[[341, 485, 28, 32, 11, 896, 261],
[1061, 382, 27, 29, 10, 783, 465],
[223, 732, 13, 30, 23, 390, 470],
[19, 299, 15, 29, 19, 435, 600],
[351, 406, 27, 23, 8, 621, 252]]
结果:
[1 0 0 1 1]
将输电线路620个吊车隐患输入到CART分类树模型,待测集包含415个真实吊车样本及205个吊车误报样本,CART分类树模型输出198个吊车误报,其中确认为误报的吊车有180个,本应用例通过对吊车误告警的确认,使识别模型吊车隐患误报数相交原先未过滤误报降低了0.87。
本发明采用CART分类树的算法,基于有监督学***,减少运维人员确认吊车告警所需的时间成本。