CN117351482B

CN117351482B - 一种用于电力视觉识别模型的数据集增广方法、***、电子设备和存储介质

Info

Publication number: CN117351482B
Application number: CN202311655113.0A
Authority: CN
Inventors: 张娜; 胡帆; 江冰; 杨罡; 陈�田; 俞华; 梁基重; 赵金; 孙昌雯; 王海旗; 李国栋; 白洋; 徐思卿
Original assignee: State Grid Electric Power Research Institute Of Sepc; State Grid Shanxi Electric Power Co Ltd
Current assignee: State Grid Electric Power Research Institute Of Sepc; State Grid Shanxi Electric Power Co Ltd
Priority date: 2023-12-05
Filing date: 2023-12-05
Publication date: 2024-02-27
Anticipated expiration: 2043-12-05
Also published as: CN117351482A

Abstract

本发明涉及一种用于电力视觉识别模型的数据集增广方法、***、电子设备和存储介质，其中，方法包括：获取电力设备的三维结构点云，根据三维结构点云确定电力设备顶点和边线的点云；对三维结构点云中非显著性顶点和边线的点云进行分区，通过几何平面基元代替分区，得到基于几何平面基元表示的三维结构；获取电力设备的实拍图像，根据实拍图像确定电力设备的光影信息；通过变换三维结构的角度和尺度，将三维结构与所述实拍图像进行匹配；当三维结构与所述实拍图像匹配后，根据电力设备的光影信息确定电力设备的三维真彩结构；根据三维真彩结构和实拍图像构建数据集。本发明能够有效构建用于电力视觉识别模型鲁棒性测试的数据集。

Description

一种用于电力视觉识别模型的数据集增广方法、***、电子设备和存储介质

技术领域

本发明涉及数据集增广技术领域，尤其是指一种用于电力视觉识别模型的数据集增广方法、***、电子设备和存储介质。

背景技术

当前，电网数字化和智能化转型发展推动了大量电力视觉识别模型的开发和应用，具体包括可见光、红外等视觉数据的识别，针对输电、变电、配电及安全管控等典型场景，识别视觉数据中的特定设备目标或者部件、设备的缺陷故障等。通用领域的识别模型性能测试一般是基于公共大型数据集（ImageNet等）进行测试和验证，根据识别结果对模型的测试能力和性能进行推定和评估。专业领域的识别模型进程也在快速推进，但专业领域的数据不同于通用领域，公开数据集很少，数据通常不易获取或者获取数据的角度不够灵活、标准不统一，模型验证前存在需对验证数据集进行标准化处理等问题，模型的测试和验证经常面临测试数据集的独立性、有效性问题，对模型鲁棒性测试的反映不够客观。

发明内容

为此，本发明所要解决的技术问题在于克服现有技术中专业领域缺少相应的数据集作为支撑，导致后续模型鲁棒性测试结果不够客观的问题。

为解决上述技术问题，本发明提供了一种用于电力视觉识别模型的数据集增广方法，包括：

步骤S1：获取电力设备的初始三维结构点云并进行预处理得到三维结构点云，根据所述三维结构点云确定电力设备顶点和边线的点云；

步骤S2：对所述三维结构点云中非显著性顶点和边线的点云进行分区，通过几何平面基元代替分区，得到基于几何平面基元表示的三维结构，其中，非显著性顶点和边线的点云为特征程度低于预设百分比的点云；

步骤S3：获取电力设备的实拍图像，根据所述实拍图像确定电力设备的光影信息；

通过变换所述三维结构的角度和尺度，将所述三维结构与所述实拍图像进行匹配；

步骤S4：当所述三维结构与所述实拍图像匹配后，根据所述电力设备的光影信息确定电力设备的三维真彩结构；

步骤S5：根据所述三维真彩结构和实拍图像构建数据集。

在本发明的一个实施例中，所述步骤S1中获取电力设备的初始三维结构点云并进行预处理得到三维结构点云，根据所述三维结构点云确定电力设备顶点和边线的点云，方法包括：

获取电力设备的初始三维结构点云，对所述初始三维结构点云进行点云配准和点云滤波得到三维结构点云，同时基于点云体素对所述三维结构点云进行体素梯度求解，计算梯度变化率极大值，得到三维结构点云中电力设备顶点和边线的坐标；

对于三维结构点云中电力设备的边线坐标，将边线坐标所在位置的点云基于聚类算法进行分割，得到若干群落子集，检测若干群落子集中局部空间点集合的曲率变化和法线方向变化情况，结合RANSAC算法得到三维结构点云的边线表示。

在本发明的一个实施例中，所述步骤S2中对所述三维结构点云中非显著性顶点和边线的点云进行分区，通过几何平面基元代替分区，得到基于几何平面基元表示的三维结构，方法包括：

对三维结构点云中非显著性顶点和边线点云的区域，通过聚类算法对其进行分区，分区等效直径小于点云检测线路长度最小值的0.5倍，通过三角形平面基元代替聚类得到的分区，得到基于三角形平面基元表示的三维结构。

在本发明的一个实施例中，所述步骤S3中获取电力设备的实拍图像，根据所述实拍图像确定电力设备的光影信息，方法包括：

获取电力设备的实拍图像，基于表面反射法分离实拍图像中电力设备的光照信息：根据材料特性设置电力设备不同区域为镜面反射或漫反射，其中，所述镜面反射由电力设备的光滑树脂材料产生，所述漫反射由电力设备的涂料或金属表面产生；根据所述镜面反射或漫反射的光照模型获取电力设备在对应区域的光照信息，得到光照-材质键值对；

基于K均值算法对实拍图像中颜色信息进行区域分割，将电力设备的材质和颜色信息进行配对记录，构成材质-颜色键值对，并将相同材质不同颜色区域设置为阴影-颜色键值对；

通过Gabor滤波器检测得到实拍图像的纹理信息，对照电力设备材质分布情况，构建纹理-材质键值对；

所述光照-材质键值对、材质-颜色键值对、阴影-颜色键值对和纹理-材质键值对构成电力设备的光影信息。

在本发明的一个实施例中，所述步骤S3中通过变换所述三维结构的角度和尺度，将所述三维结构与所述实拍图像进行匹配，方法包括：

通过变换基于几何平面基元表示的三维结构的角度和尺度，计算实拍图像中角点和边线特征与三维结构的匹配程度，并通过调优匹配误差，在误差最小时得到该三维结构对应的角度和尺度，此时将实拍图像视为该三维结构在该角度和尺度下的投影，并将实拍图像的光照、颜色、纹理信息作为该三维结构在该角度和尺度下正交投影后的二维图像信息。

在本发明的一个实施例中，所述步骤S4中当所述三维结构与所述实拍图像匹配后，根据所述电力设备的光影信息确定电力设备的三维真彩结构，方法包括：

当所述基于几何平面基元表示的三维结构与所述实拍图像匹配后，利用逆正交投影，并考虑深度信息***影的投影映射，得到该三维结构在该角度和尺度下的光照、颜色、纹理信息；

基于提取到的光照-材质键值对、材质-颜色键值对、阴影-颜色键值对和纹理-材质键值对，在几何平面基元的约束下，对该三维结构的其余部分进行光照、颜色、纹理信息进行拟合和补全，得到带有光照、颜色、纹理信息的三维真彩结构。

在本发明的一个实施例中，所述步骤S5中根据所述三维真彩结构和实拍图像构建数据集，方法包括：

对三维真彩结构在不同角度和尺度下进行正交投影，得到任意方向和大小的二维图像数据；

基于角度的变换得到电力设备在部分遮挡情况下的图像集A；

对光照进行调整得到强光、弱光情况下的图像集B；

针对电力设备指定部件或缺陷所在位置进行预设幅度角度变换得到不同视角目标的图像集C；

针对电力设备指定目标进行尺度放大缩小得到局部图像集D和目标像素小占比图像集E；

以及根据其他具体需求进行的组合变换或者其他变换得到图像集Pi；

将所述实拍图像、图像集A、图像集B、图像集C、图像集D、图像集E和图像集Pi组成数据集。

为解决上述技术问题，本发明提供了一种用于电力视觉识别模型的数据集增广***，包括：

获取与确定模块：用于获取电力设备的初始三维结构点云并进行预处理得到三维结构点云，根据所述三维结构点云确定电力设备顶点和边线的点云；

三维结构构建模块：用于对所述三维结构点云中非显著性顶点和边线的点云进行分区，通过几何平面基元代替分区，得到基于几何平面基元表示的三维结构，其中，非显著性顶点和边线的点云为特征程度低于预设百分比的点云；

获取与匹配模块：用于获取电力设备的实拍图像，根据所述实拍图像确定电力设备的光影信息；

还用于通过变换所述三维结构的角度和尺度，将所述三维结构与所述实拍图像进行匹配；

三维真彩结构构建模块：用于当所述三维结构与所述实拍图像匹配后，根据所述电力设备的光影信息确定电力设备的三维真彩结构；

数据集构建模块：用于根据所述三维真彩结构和实拍图像构建数据集。

在本发明的一个实施例中，本发明提供了一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述用于电力视觉识别模型的数据集增广方法的步骤。

在本发明的一个实施例中，本发明提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现如上述用于电力视觉识别模型的数据集增广方法的步骤。

本发明的上述技术方案相比现有技术具有以下优点：

本发明基于电力设备的三维结构点云和实拍图像构建图像数据集，该图像数据集能够用于电力视觉识别模型的鲁棒性测试；

本发明实现特定电力场景图像数据集地灵活增广，能够为专业领域（电力领域）的电力视觉识别模型鲁棒性测试提供有效的数据支撑。

附图说明

为了使本发明的内容更容易被清楚的理解，下面根据本发明的具体实施例并结合附图，对本发明作进一步详细的说明。

图1是本发明的方法流程图。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明，以使本领域的技术人员可以更好地理解本发明并能予以实施，但所举实施例不作为对本发明的限定。

实施例一

参照图1所示，本发明涉及一种用于电力视觉识别模型的数据集增广方法，包括：

步骤S5：根据所述三维真彩结构和实拍图像构建数据集。

本实施例的数据集增广方法能够实现特定电力场景图像数据集地灵活增广。

以下对本实施例进行详细介绍：

本实施例的方法主要包括六部分：（1）三维结构点云获取、（2）三维结构点云基元化、（3）实拍图像的光影信息提取、（4）三维结构不同角度和尺度变换、（5）通过光影信息映射，得到构建三维真彩结构、（6）数据集获取。

（1）三维结构点云获取

电力设备三维结构获取是基于激光雷达或者结构光，得到电力设备的初始三维结构点云，具体包括电力设备的坐标和外形形状等静态信息，初始三维结构点云经过点云配准和点云滤波处理后得到精度较高的三维结构点云，同时基于点云体素进行体素梯度求解，计算梯度变化率极大值，得到三维结构点云中顶点和边线（即边界线段）的坐标属性，至此，本实施例认为已经得到三维结构点云的顶点表示。边线坐标位置的点云基于聚类算法进行分割后，得到若干群落子集，检测得到若干群落子集中局部空间点集合的法线方向、曲率等，根据检测得到的曲率变化和法线方向变化情况，结合点云线段检测算法RANSAC得到三维结构点云的边线表示。

（2）三维结构点云基元化

对三维结构点云中非显著性顶点和边线部分的区域（基于第（1）部分聚类算法得到的特征程度低于预设百分比的点云），用聚类算法对点云进行分区，基于几何平面基元（本实施例采用三角形平面基元）代替聚类得到的分区，本实施例还对三角形平面基元的大小进行处理，尽可能让三角形变小，使得后续三维结构足够平滑。三角形平面基元的三个点满足在结构上相互之间无重叠无空隙，此时得到基于三角形平面基元表示的三维结构。

进一步地，该三维结构可以基于旋转平移进行不同角度和不同尺度的变换。将三维结构中的顶点按照一定角度进行正交投影变换，得到该角度下的顶点二维投影坐标，与投影平面的法平面相交处的三角形平面基元根据相交线分解为更小的三角形，便于投影处理。

（3）实拍图像的光影信息提取

基于电力设备的实拍图像，特别是电力设备存在缺陷等情况下实际获取的图像数据，这类图像数据一般不具有复现性。本实施例基于表面反射法分离实拍图像中电力设备的光照信息，本实施例默认电力设备各部分的材料已知，根据材料特性设置不同区域为镜面反射（光滑树脂材料）和漫反射（涂料和金属表面等），依据两种反射的光照模型得到设备在对应区域的光照信息，得到光照-材质键值对；本实施例基于K均值算法将实拍图像中颜色信息进行区域分割，将设备材质和颜色信息进行配对记录，构成材质-颜色键值对，将相同材质不同颜色分区设置为阴影-颜色键值对；本实施例使用Gabor滤波器检测得到实拍图像纹理信息，同样对照设备材质分布情况，构建纹理-材质键值对。

光照-材质键值对、材质-颜色键值对、阴影-颜色键值对和纹理-材质键值对构成电力设备的光影信息。

（4）三维结构不同角度和尺度变换

通过变换三维结构的角度和尺度，计算实拍图像设备角点和边线特征与三维结构的匹配程度，并通过调优匹配误差，在误差最小时得到三维结构对应的角度和尺度，此时实拍图像可以视为三维结构在此角度和尺度下的投影，而实拍图像提取出的图像目标（即电力设备）的光照、颜色、纹理等信息即为三维结构在此角度和尺度下正交投影后的二维图像信息。

（5）通过光影信息映射，得到构建三维真彩结构

当三维结构与实拍图像匹配后，利用逆正交投影，并且考虑深度信息***影的投影映射，得到三维结构下该角度和尺度下的光照、颜色、纹理信息，将上述提取得到的光照-材质键值对、材质-颜色键值对、阴影-颜色键值对和纹理-材质键值对，考虑三角形基元约束，对三维结构其余部分进行光照、颜色、纹理信息拟合和补全，此时得到带有光照、颜色、纹理信息的三维真彩结构。

（6）数据集获取

对三维真彩结构进行不同角度和不同尺度的控制，在不同角度和尺度下进行正交投影，可以得到任意方向和大小的二维图像数据。

基于角度的变换可以得到目标部分（即电力设备）遮挡等情况下的图像集A；

对光照进行调整可以得到强光、弱光等情况下的图像集B；

针对特定部件或缺陷所在位置进行小幅度角度变换得到不同视角目标的图像集C；

针对特定目标进行尺度放大缩小得到局部图像集D和目标像素小占比图像集E；

以及其他根据具体需求进行的组合变换或者其他变换得到图像集Pi；

将实拍图像、图像集A、图像集B、图像集C、图像集D、图像集E和图像集Pi组合，得到适用于电力视觉识别模型鲁棒性测试的增广数据集，数据集的鲁棒性测试源于三维结构的灵活变换对数据的增广。将图像集根据测试需求进行批分类处理，以批数据的形式开展对于电力视觉算法模型的验证和检测。

同时增广数据集还可以用于电力视觉算法模型的能力提升，通过识别能力提升情况，反馈实拍图像数据的有效采集。

实施例二

本实施例提供一种用于电力视觉识别模型的数据集增广***，包括：

实施例三

本实施例提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现实施例一所述用于电力视觉识别模型的数据集增广方法的步骤。

实施例四

本实施例提供一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时，实现实施例一所述用于电力视觉识别模型的数据集增广方法的步骤。

本领域内的技术人员应明白，本申请的实施例可提供为方法、***、或计算机程序产品。因此，本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质（包括但不限于磁盘存储器、CD-ROM、光学存储器等）上实施的计算机程序产品的形式。本申请实施例中的方案可以采用各种计算机语言实现，例如，面向对象的程序设计语言Java和直译式脚本语言JavaScript等。

本申请是参照根据本申请实施例的方法、设备（***）、和计算机程序产品的流程图和／或方框图来描述的。应理解可由计算机程序指令实现流程图和／或方框图中的每一流程和／或方框、以及流程图和／或方框图中的流程和／或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和／或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本申请的优选实施例，但本领域内的技术人员一旦得知了基本创造性概念，则可对这些实施例作出另外的变更和修改。所以，所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。

显然，上述实施例仅仅是为清楚地说明所作的举例，并非对实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.一种用于电力视觉识别模型的数据集增广方法，其特征在于：包括：

步骤S5：根据所述三维真彩结构和实拍图像构建数据集。

2.根据权利要求1所述的用于电力视觉识别模型的数据集增广方法，其特征在于：所述步骤S1中获取电力设备的初始三维结构点云并进行预处理得到三维结构点云，根据所述三维结构点云确定电力设备顶点和边线的点云，方法包括：

3.根据权利要求1所述的用于电力视觉识别模型的数据集增广方法，其特征在于：所述步骤S2中对所述三维结构点云中非显著性顶点和边线的点云进行分区，通过几何平面基元代替分区，得到基于几何平面基元表示的三维结构，方法包括：

4.根据权利要求1所述的用于电力视觉识别模型的数据集增广方法，其特征在于：所述步骤S3中获取电力设备的实拍图像，根据所述实拍图像确定电力设备的光影信息，方法包括：

5.根据权利要求4所述的用于电力视觉识别模型的数据集增广方法，其特征在于：所述步骤S3中通过变换所述三维结构的角度和尺度，将所述三维结构与所述实拍图像进行匹配，方法包括：

通过变换三维结构的角度和尺度，计算实拍图像中角点和边线特征与三维结构的匹配程度，并通过调优匹配误差，在误差最小时得到三维结构对应的角度和尺度，此时将实拍图像视为三维结构在该角度和尺度下的投影，并将实拍图像的光照、颜色、纹理信息作为三维结构在该角度和尺度下正交投影后的二维图像信息。

6.根据权利要求5所述的用于电力视觉识别模型的数据集增广方法，其特征在于：所述步骤S4中当所述三维结构与所述实拍图像匹配后，根据所述电力设备的光影信息确定电力设备的三维真彩结构，方法包括：

当所述三维结构与所述实拍图像匹配后，利用逆正交投影，并考虑深度信息***影的投影映射，得到三维结构在该角度和尺度下的光照、颜色、纹理信息；

基于提取到的光照-材质键值对、材质-颜色键值对、阴影-颜色键值对和纹理-材质键值对，在几何平面基元的约束下，对三维结构的其余部分进行光照、颜色、纹理信息进行拟合和补全，得到带有光照、颜色、纹理信息的三维真彩结构。

7.根据权利要求1所述的用于电力视觉识别模型的数据集增广方法，其特征在于：所述步骤S5中根据所述三维真彩结构和实拍图像构建数据集，方法包括：

基于角度的变换得到电力设备在部分遮挡情况下的图像集A；

对光照进行调整得到强光、弱光情况下的图像集B；

将所述实拍图像、图像集A、图像集B、图像集C、图像集D、图像集E组成数据集。

8.一种用于电力视觉识别模型的数据集增广***，其特征在于：包括：

9.一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其特征在于：所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述用于电力视觉识别模型的数据集增广方法的步骤。

10.一种计算机可读存储介质，其上存储有计算机程序，其特征在于：所述计算机程序被处理器执行时，实现如权利要求1至7中任一项所述用于电力视觉识别模型的数据集增广方法的步骤。