CN115941807B - 一种园区安防***数据高效压缩方法 - Google Patents

一种园区安防***数据高效压缩方法 Download PDF

Info

Publication number
CN115941807B
CN115941807B CN202211657753.0A CN202211657753A CN115941807B CN 115941807 B CN115941807 B CN 115941807B CN 202211657753 A CN202211657753 A CN 202211657753A CN 115941807 B CN115941807 B CN 115941807B
Authority
CN
China
Prior art keywords
data
data point
sensor
coordinate system
degree
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211657753.0A
Other languages
English (en)
Other versions
CN115941807A (zh
Inventor
李春荣
吴春
党毅
张育敏
吴珍
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Telecommunications And Designing Institute Co ltd
Original Assignee
Shaanxi Telecommunications And Designing Institute Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Telecommunications And Designing Institute Co ltd filed Critical Shaanxi Telecommunications And Designing Institute Co ltd
Priority to CN202211657753.0A priority Critical patent/CN115941807B/zh
Publication of CN115941807A publication Critical patent/CN115941807A/zh
Application granted granted Critical
Publication of CN115941807B publication Critical patent/CN115941807B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Alarm Systems (AREA)
  • Testing Or Calibration Of Command Recording Devices (AREA)

Abstract

本发明涉及数据压缩技术领域,具体涉及一种园区安防***数据高效压缩方法。方法包括:基于不同类型的传感器获取的园区内的数据构建各类型的传感器对应的三维坐标系,获得各传感器所在的区域的类别;基于所述类别得到各数据点的分布聚集程度,进而确定对应的邻域距离;基于各数据点的数据值和各数据点的邻域距离内数据点的数据值,得到各数据点的异常程度;对异常程度大于异常程度阈值的像素点进行标记,获取待校正数据点,对各待校正数据点的异常程度进行校正,获取正常数据点和异常数据点,基于正常数据点和异常数据点对相对应的数据进行压缩存储。本发明在保证园区安防***的重要数据不丢失的基础上提高了数据压缩的效率。

Description

一种园区安防***数据高效压缩方法
技术领域
本发明涉及数据压缩技术领域,具体涉及一种园区安防***数据高效压缩方法。
背景技术
智慧园区管理的一项重要任务是对园区的安防运营进行管理。园区智慧安防***通过运用物联网技术,使得各个子安防***互联互通,可以实时提取和分析园区的数据,及时对园区进行应急处理,实现实时防范的功能。在园区的智慧安防***运营管理中,园区内布置各种各样的传感器设备,通过物联网技术,将传感器采集的数据传输至智慧园区安防***中,进行科学分析和决策。
然而由于园区内布置的传感器数量较多,并且传感器的数据的是多种多样且在时间序列上不断进行更新,因此传感器采集的数据量较大,进而导致数据的存储量较大。由于网络传输带宽以及存储空间有限,若将获取的所有数据都进行存储,就需要增加设备成本。现有方法通常采用有损压缩的方式对传感器采集的数据进行压缩,这种方法会使得部分信息丢失,无法保证准确地分析园区存在的风险,进而存在较大的安全隐患。因此如何对园区安防***的数据进行高效压缩并保证重要数据不丢失是一个需要解决的问题。
发明内容
为了解决现有技术存在的无法在保证重要数据不丢失的基础上对园区安防***的数据进行高效压缩的问题,本发明的目的在于提供一种园区安防***数据高效压缩方法,所采用的技术方案具体如下:
本发明提供了一种园区安防***数据高效压缩方法,该方法包括以下步骤:
利用不同类型的传感器实时获取园区内的数据;
基于各类型的传感器获取的园区内的数据构建各类型的传感器对应的三维坐标系,三维坐标系中包含不少于两个数据点;基于园区平面图和训练好的神经网络获得各传感器所在的区域对应的类别;根据所述各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,得到各数据点对应的分布聚集程度;
基于所述分布聚集程度和三维坐标系中与各数据点所对应的区域属于同一类别的区域对应的数据点的总数量,确定三维坐标系中各数据点对应的邻域距离;基于各数据点的数据值和各数据点的邻域距离内数据点的数据值,得到各数据点的异常程度;对异常程度大于异常程度阈值的像素点进行标记,根据标记数据点和非标记数据点获取待校正数据点,并对各待校正数据点的异常程度进行校正获得校正后的异常程度;
基于各数据点的异常程度和各待校正数据点校正后的异常程度获取正常数据点和异常数据点,基于所述正常数据点和异常数据点对相对应的数据进行压缩存储。
优选的,所述根据标记数据点和非标记数据点获取待校正数据点,包括:
对于任一类型的传感器:计算该类型的传感器对应的三维坐标系中标记数据点的数量与该类型的传感器对应的三维坐标系中数据点的总个数的比值,作为该类型的传感器对应的三维坐标系中异常数据点的占比;
将三维坐标系中异常数据点的占比最大的类型的传感器记为参考类型的传感器;将除参考类型的传感器外的其它类型的传感器对应的三维坐标系记为待分析坐标系;
对于第q个待分析坐标系:
将该待分析坐标系中的第n个非标记数据点所对应的区域记为目标区域,判断参考类型的传感器对应的三维坐标系中是否存在标记数据点所对应的区域为目标区域,若存在,则将待分析坐标系中的第n个非标记数据点记为待校正数据点。
优选的,对各待校正数据点的异常程度进行校正获得校正后的异常程度,包括:
将参考类型的传感器对应的三维坐标系中所对应的区域为目标区域中的标记数据点记为参考数据点;根据采集待校正数据点的数据值的传感器与采集各参考数据点的数据值的传感器之间的欧式距离以及待校正数据点的数据值,计算待校正数据点校正后的异常程度。
优选的,采用如下公式计算第q个待分析坐标系中的第n个待校正数据点校正后的异常程度:
其中,β qn为第q个待分析坐标系中的第n个待校正数据点校正后的异常程度,W为参考数据点的个数,dn,w为采集第q个待分析坐标系中的第n个待校正数据点的数据值的传感器与采集第w个参考数据点的数据值的传感器之间的欧式距离,exp()为以自然常数为底数的指数函数,βqn为第q个待分析坐标系中的第n个待校正数据点的异常程度。
优选的,所述根据所述各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,得到各数据点对应的分布聚集程度,包括:
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点:
计算第i个数据点和该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的所有数据点之间的欧式距离的均值,记为第一均值;所述第i个数据点所对应的区域为采集第i个数据点的数据值时传感器所在的区域;
以自然常数为底数,以负的所述第一均值为指数的指数函数的值作为第i个数据点对应的分布聚集程度。
优选的,所述基于所述分布聚集程度和三维坐标系中与各数据点所对应的区域属于同一类别的区域对应的数据点的总数量,确定三维坐标系中各数据点对应的邻域距离,包括:
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点:计算该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的数据点的总数量和第i个数据点对应的分布聚集程度的乘积,记为第一乘积;对所述第一乘积进行向下取整,将向下取整的结果记为第一距离;将所述第一距离与初始邻域距离之和作为第i个数据点对应的邻域距离。
优选的,所述基于各数据点的数据值和各数据点的邻域距离内数据点的数据值,得到各数据点的异常程度,包括:
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点:
根据第i个数据点的数据值与其邻域距离内的各数据点的数据值之间的差异以及第i个数据点的数据值,得到第i个数据点的局部分布度;
将第i个数据点的邻域距离内的所有数据点的局部分布度的均值和所述第i个数据点的局部分布度的比值作为第i个数据点的异常程度。
优选的,所述基于各数据点的异常程度和各待校正数据点校正后的异常程度获取正常数据点和异常数据点,基于所述正常数据点和异常数据点对相对应的数据进行压缩存储,包括:
将校正后的异常程度大于异常程度阈值的待校正数据点作为异常数据点,将除待校正数据点外的所有数据点作为异常数据点,将所有三维坐标系中除异常数据点外的所有数据点作为正常数据点;
采用游程编码分别对正常数据点的数据值和异常数据点的数据值进行编码,对编码后的数据进行存储。
本发明至少具有如下有益效果:
1、本发明首先基于各类型的传感器获取的园区内的数据构建了各类型的传感器对应的三维坐标系,考虑到布置于园区内相似区域的同一类型的传感器采集的数据之间存在一定的关联性,本发明利用神经网络获取了园区平面图中每个区域对应的类别,根据园区内各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,计算了各数据点对应的分布聚集程度,用于表征传感器采集的数据之间的关联性,进而确定了每个数据点对应的邻域距离,能够有效地避免后续在计算每个数据点的异常程度时,邻域大小设置的不合适对计算结果的准确性的干扰,进而使得后续数据的筛选结果更加准确,本发明分别对正常数据和异常数据进行不同程度的压缩,在保证园区安防***的重要数据不丢失的基础上提高了数据压缩的效率和可靠性。
2、本发明在计算每个数据点的异常程度时,首先基于每个数据点的数据值和各数据点的邻域距离内数据点的数据值,得到了每个数据点的异常程度,对异常程度大于异常程度阈值的像素点进行标记;考虑到标记数据点和非标记数据点呈现的特征不同,标记像素点的异常程度更大,更应当对其进行关注,因此根据标记数据点和非标记数据点获取了待校正数据点,本发明又对各待校正数据点进行校正,获得各待校正数据点校正后的异常程度,进而将所有数据分为两类,分别为正常数据和异常数据,提高了数据的筛选精度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案和优点,下面将对实施例或现有技术描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它附图。
图1为本发明提供的一种园区安防***数据高效压缩方法的流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种园区安防***数据高效压缩方法进行详细说明如下。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种园区安防***数据高效压缩方法的具体方案。
一种园区安防***数据高效压缩方法实施例:
本实施例提出了一种园区安防***数据高效压缩方法,如图1所示,本实施例的一种园区安防***数据高效压缩方法包括以下步骤:
步骤S1,利用不同类型的传感器实时获取园区内的数据。
在园区安防***在管理过程中,园区内安装多种传感器来采集园区内部的数据信息,并且通过物联网技术将采集的数据传输至管理***中。但是由于采集的数据量较为庞大,并且传感器采集的部分数据不包含或仅包含少量的重要信息,若将传感器采集的所有数据均进行传输及存储,则会占用较大空间,增加设备成本,因此本实施例将对传感器采集的数据进行筛选,选取包含较多信息量且影响园区安防***风险分析的数据,尽可能的减少数据的冗余。
本实施例中在园区内布置多种类型的传感器设备,用于实时对园区内的数据信息进行采集,传感器设备的类型包括:红外线传感器、火灾烟感传感器、煤气泄露传感器、温度传感器、湿度传感器等;设置所有传感器的采样频率和采集时刻相同,本实施例设置所有传感器每秒采集一次数据;每个传感器的安装位置可根据园区内的分布情况来进行规划,传感器的具体型号和类型实施者根据具体情况进行选取。
至此,利用不同类型的传感器获取到了各采集时刻园区内的数据。
步骤S2,基于各类型的传感器获取的园区内的数据构建各类型的传感器对应的三维坐标系,三维坐标系中包含不少于两个数据点;基于园区平面图和训练好的神经网络获得各传感器所在的区域对应的类别;根据所述各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,得到各数据点对应的分布聚集程度。
由于传感器采集的数据中存在不包含或仅包含少量重要信息的数据,这些数据是对园区安防风险分析作用较小的数据,即含有较少的有利于园区安防风险分析的信息。因此本实施例计算每个数据的异常程度,用于表征每个数据包含的有利于园区安防风险分析的信息量的大小,进而对数据进行筛选,尽可能的减少数据的冗余,为数据的压缩提供有利的条件。
为了便于分析传感器采集的每个数据的异常程度,本实施例对传感器采集的数据进行数据点的转化,通过构建三维数据坐标系,将采集的数据转化为三维数据点,通过分析每个三维数据点的异常程度来确定对应的数据的异常程度。本实施例对每个类型的传感器采集的数据构建一个三维坐标系,三维坐标系中的数据随着采集数据的更新而不断进行更新,即随着采集时刻的变化而不断变化,具体的,对于煤气泄露传感器:获取每个煤气泄露传感器在园区平面图中的二维坐标,对于任一采集时刻,根据每个煤气泄露传感器在园区平面图中的二维坐标以及每个煤气泄露传感器在该采集时刻采集到的数据值,构建煤气泄露传感器在该采集时刻对应的三维坐标系,其中,三维坐标系中X轴和Y轴代表数据点的坐标值,Z轴代表数据点的数据值;由于一般情况下同一类型的传感器安装的高度相差不大,因此本实施例不考虑传感器的高度坐标。采用上述方法,能够获得每种类型的传感器在各采集时刻对应的三维坐标系,三维坐标系中的数据点为对应类型的传感器在对应采集时刻采集到的数据值。
由于每个三维数据坐标系中的所有数据点为每种类型的所有传感器在对应的采集时刻采集的园区内的数据,因此本实施例通过分析每种类型的传感器对应的三维坐标系中数据点的分布关系,获取每个数据点的分布特征,进而判断异常数据点对应的异常分布特征,计算异常数据点对应的异常程度。考虑到传感器布置在园区的不同位置,并且在园区内相似的区域中相同类型的传感器采集的数据之间具有关联性,因此本实施例基于此特性,采用LOF算法(自适应的局部异常因子检测算法)对采集的不同类型的数据进行异常程度分析。
对于任一类型的传感器:
由于三维坐标系中数据点的数据值可能会随着采集时间的改变而发生变化,因此本实施例以一个采集时刻为例进行说明,本实施例将基于该类型的传感器对应的三维坐标系中的所有数据点,计算该类型的传感器对应的三维坐标系中的所有数据点对应的分布聚集程度,需要说明的是,数据点对应的分布聚集程度指的是采集数据点的数据值的传感器的位置的分布聚集程度,即对应的三维坐标系中的所有数据点的X轴的坐标和Y轴的坐标,用于后续获取不同分布特征的数据点在LOF算法中对应的邻域距离。
首先需要对园区内设置的所有传感器所在的位置进行分类,进而获取传感器位置之间的关联性,旨在获取园区内同一类型的区域中的传感器之间的分布聚集程度。
由于传感器的安装位置与园区建筑物的分布有关,因此对所有传感器位置进行分类的过程通过对园区平面图分类来实现,具体过程为:首先利用相机采集园区平面图,然后基于神经网络对园区平面图进行分析,本实施例中的神经网络选用的是语义分割网络,语义分割网络的目的为分类,其中语义分割网络的训练过程为:训练数据集为多张园区的样本平面图;采用人工标注的方式对园区的样本平面图中的不同区域进行标注,将草地区域标注为0,建筑区域人工标注为1,道路区域人工标注为2等;语义分割网络的损失函数为交叉熵函数;在具体应用中,园区的样本平面图中各区域的标注情况实施者可根据具体情况进行设置;语义分割网络的训练过程为现有技术,此处不再过多赘述;将园区平面图输入到训练好的语义分割网络中,输出为园区平面图中各区域对应的类别;获取了语义分割后的园区平面图,即对园区平面图进行了连通域分析,获取到了园区平面图中的多个连通域,将每个连通域作为一个区域,园区平面图中每个区域对应一个类别,基于每个传感器的位置以及园区平面图中每个区域对应的类别获得每个传感器所在的区域对应的类别,例如:若某一传感器位于建筑区域中,则该传感器所在的区域对应的类别为建筑区域类别。至此,采用上述方法获得园区内所有传感器所在的区域对应的类别。
在上述步骤中对传感器所在的区域进行了分类,接下来将基于分类结果对每个数据点对应的分布聚集程度进行计算,也即计算传感器的分布聚集程度,进而获取每个数据点的邻域距离。某一类型的传感器对应的三维坐标系中数据点之间的欧式距离能够表征传感器在园区内传感器的分布情况;利用某一类型的传感器在同一类别的区域中采集的数据越多,则该类型的传感器对应的三维坐标系中数据点的数量越多,说明该类型的传感器在园区内同一类别的区域中布置的数量越多;考虑到三维坐标系中数据点的坐标能够表征传感器的分布位置,因此,本实施例将根据各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,来确定各数据点对应的分布聚集程度,也即根据三维坐标系中各数据点所对应的区域的类别和各数据点的位置,计算各数据点对应的分布聚集程度。
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点:
根据该数据点所对应的区域的类别和该数据点的位置,计算该数据点对应的分布聚集程度,即:
其中,αi为该类型的传感器对应的三维坐标系中的第i个数据点对应的分布聚集程度,Ji为该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的数据点的总数量,d(i,j)为该类型的传感器对应的三维坐标系中的第i个数据点和该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的第j个数据点之间的欧式距离,exp()为以自然常数为底数的指数函数;所述第i个数据点所对应的区域为采集第i个数据点的数据值时传感器所在的区域;所述d(i,j)是基于数据点在三维坐标系中X轴的坐标和Y轴的坐标得到的,也即为采集这两个数据点的数据值的两个传感器的位置之间的欧式距离。
若该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的数据点的总数量越多,则说明在园区内对应区域中设置的该类型的传感器的数量越多;若第i个数据点和该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的各数据点之间的欧式距离均较近,则说明三维坐标系中第i个数据点的周围的数据点分布的越密集;表征第i个数据点和该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的所有数据点之间的欧式距离的均值,当该均值越大时,说明第i个数据点的周围的数据点分布的越稀疏,即该类型的传感器对应的三维坐标系中的第i个数据点对应的分布聚集程度越小;当该均值越小时,说明第i个数据点的周围的数据点分布的越密集,即该类型的传感器对应的三维坐标系中的第i个数据点对应的分布聚集程度越大。
采用上述方法,能够得到每个三维坐标系中的每个数据点对应的分布聚集程度。
步骤S3,基于所述分布聚集程度和三维坐标系中与各数据点所对应的区域属于同一类别的区域对应的数据点的总数量,确定三维坐标系中各数据点对应的邻域距离;基于各数据点的数据值和各数据点的邻域距离内数据点的数据值,得到各数据点的异常程度;对异常程度大于异常程度阈值的像素点进行标记,根据标记数据点和非标记数据点获取待校正数据点,并对各待校正数据点的异常程度进行校正获得校正后的异常程度。
本实施例将基于LOF算法的思想来计算每个数据点对应的异常程度,LOF算法的主要思想是通过比较每个点和其邻域内的点的密度来判断每个点是否为异常点,如果某一点的密度越低,越有可能被认为是异常点;本实施例基于位于园区内相似区域中相同类型的传感器采集的数据之间的关联性,来计算每个数据点的异常程度。本实施例采用语义分割以及LOF算法结合的方式进行分析,即利用语义分割网络获取了园区平面图中每个区域对应的类别,并对布置于同一类别的区域内的传感器采集的数据进行分析,计算每个数据点对应的分布聚集程度,用于表征同一类型的传感器在同一类别的区域中采集的数据之间的关联性,进而获取三维坐标系中每个数据点在LOF算法中的邻域大小,排除后续基于LOF算法计算数据点的异常程度时不同类型的传感器采集数据对数据点的异常程度的判断的干扰,使得计算的数据点的异常程度更加准确,进而保证后续数据筛选结果更加准确。
考虑到在计算每个数据点的异常程度时,需要对每个数据点的邻域数据点进行分析,若邻域距离设置的不合适会直接影响结果的准确性,邻域距离设置的过小或过大都会使得异常程度的计算结果不准确,因此本实施例将先确定每个数据点对应的邻域距离,进而基于邻域距离内的数据点对每个数据的异常程度进行分析。当三维坐标系中数据点对应的分布密集程度越大时,说明该数据点周围的数据点分布的越密集,在对该数据点进行分析时,为了提高准确度,应当将邻域距离设置的越大;基于此,根据三维坐标系中各数据点对应的分布聚集程度和三维坐标系中与各数据点所对应的区域属于同一类别的区域对应的数据点的总数量,来确定各数据点对应的邻域距离。
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点,其对应的邻域距离为:
其中,ki为该类型的传感器对应的三维坐标系中的第i个数据点对应的邻域距离,αi为该类型的传感器对应的三维坐标系中的第i个数据点对应的分布聚集程度,k0为初始邻域距离,为向下取整。本实施例设置初始邻域距离k0的值为2,单位为像素点,在具体应用中,实施者可根据具体情况进行设置。
当三维坐标系中的第i个数据点对应的分布聚集程度越大、三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的数据点的数量越多时,说明第i个数据点周围的同类别的数据点越多,在计算该数据点的异常程度时参考的邻域数据点的数量应当越多,即该数据点对应的邻域距离应当设置的越大。
采用上述方法,能够得到不同类型的传感器对应的三维坐标系中所有数据点对应的邻域距离,将每个数据点对应邻域距离内的所有数据点作为每个数据点的邻域数据点,本实施例对每个数据点的分布情况进行了分析,获取了每个数据点的邻域数据点,能够有效地避免后续在计算每个数据点的异常程度时,邻域大小设置的不合适对计算结果的准确性的干扰,进而使得后续数据的筛选结果更加准确。本实施例接下来将以三维坐标系中每个数据点的数据值作为LOF算法中的分布度量,参考每个数据点对应的邻域距离内的邻域数据点的数据值,计算每个数据点的异常程度;基于每个数据点和邻域距离内的其它数据点的数值差异来获取数据点的局部分布度,用于对数据点数据值的分布度量,LOF算法的主要思想是通过比较每个数据点的密度和其邻域的密度的均值来判断每个数据点是否为异常点,本实施例将每个数据点的邻域距离内的其它数据点的局部分布度的均值和每个数据点的局部分布度的比值作为每个数据点的异常程度,进而判断每个数据点是否为异常点。因此对于任意一个类型的传感器对应的三维坐标系中的第i个数据点,其对应的异常程度的表达式为:
其中,εi为该类型的传感器对应的三维坐标系中的第i个数据点的局部分布度,βi为该类型的传感器对应的三维坐标系中的第i个数据点的异常程度,M(i)为该类型的传感器对应的三维坐标系中的第i个数据点的邻域距离内的数据点的个数,m为该类型的传感器对应的三维坐标系中的第i个数据点的邻域距离内的第m个数据点,Δf(i,m)为该类型的传感器对应的三维坐标系中的第i个数据点的数据值与其邻域距离内的第m个数据点的数据值之间的差异,εm为该类型的传感器对应的三维坐标系中的第i个数据点的邻域距离内的第m个数据点的局部分布度;所述该类型的传感器对应的三维坐标系中的第i个数据点的数据值与其邻域距离内的第m个数据点的数据值之间的差异的获取过程为:将该类型的传感器对应的三维坐标系中的第i个数据点的数据值与该类型的传感器对应的三维坐标系中的第i个数据点的邻域距离内的第m个数据点的数据值的差值的绝对值作为该类型的传感器对应的三维坐标系中的第i个数据点的数据值与其邻域距离内的第m个数据点的数据值之间的差异。
表征第i个数据点的邻域内数据点的局部分布度的均值,即反映第i个数据点的邻域的数据点的密度的大小,通过比较第i个数据点的密度和其邻域的密度来判断第i个数据点是否为异常点;第i个数据点的密度越低,第i个数据点的局部分布度越小,第i个数据点的异常程度越大,第i个数据点越可能是异常点;第i个数据点的密度越高,第i个数据点的局部分布度越大,第i个数据点的异常程度的值越接近1或者小于1,第i个数据点越可能是正常的样本点。
采用上述方法,能够得到每个类型的传感器对应的三维坐标系中的每个数据点的异常程度。本实施例结合LOF算法的思想,利用每个数据点和邻域内其它数据点的数值的差异来对数据点的分布情况进行度量,利用每个数据点局部分布度和邻域内其它数据点的局部分布度均值之间的差异来表征每个数据点的异常程度,即基于每个数据点与周围数据点的关联性对数据点的异常程度进行了判断,避免了传统的异常检测算法中仅根据数据值与人工设置的阈值之间的差异来判断数据点是否异常时判断结果不准确的问题的出现,本实施例提供的方法使得数据的筛选结果更加准确。
当某个时刻园区内的某个区域的数据发生异常情况时,为了保证园区的安全,需要获取该时刻内该区域及其周围区域的数据值,因此,为了对某些关键时刻(即发生数据异常时的时刻)出现异常的区域的周围区域的数据变化情况进行准确分析,本实施例将对获取的部分数据点的异常程度进行校正。由于在分析数据的异常程度时,分别对每个时刻采集的数据进行分析,三维坐标系中数据点的数据值会随着时间的变化而发生改变,本实施例是以t时刻为例进行说明,对于其它时刻,均可采用本实施例提供的方法进行分析;设置异常程度阈值βT,以第u个类型的传感器为例,分别判断该类型的传感器对应的三维坐标系中每个数据点的数据值与异常程度阈值βT的大小关系,若该类型中的第p个数据点的异常程度大于βT,则将该数据点标记为1;若该类型中的第p个数据点的异常程度小于等于βT,则不对该数据点进行标记;需要说明的是,此处是以t时刻为例进行说明的,因此将t时刻第u个类型的传感器中的所有传感器采集的数据分为了两类,一类为异常程度大于βT的数据,即该类中的数据为异常数据,另一类为异常程度小于等于βT的数据;由于异常程度的值越接近1或者小于1,说明对应数据点越可能是正常的样本点,因此βT的值需要大于1,本实施例中设置βT的值为1.2,在具体应用中,实施者可根据具体情况进行设置。
本实施例接下来将以一个类型的传感器对应的三维坐标系中的数据点的异常程度对其它类型的数据点的异常程度进行校正,具体的,对于任一类型的传感器:统计该类型的传感器对应的三维坐标系中数据点的总个数,也即为整个园区内的该类型的传感器的数量;对于t时刻,统计该类型的传感器对应的三维坐标系中标记数据点的数量,也即获取了t时刻该类型的传感器采集的所有异常数据点的数量;计算该类型的传感器对应的三维坐标系中标记数据点的数量与该类型的传感器对应的三维坐标系中数据点的总个数的比值,作为该类型的传感器对应的三维坐标系中异常数据点的占比;采用上述方法,能够得到每个类型的传感器对应的三维坐标系中异常数据点的占比;将三维坐标系中异常数据点的占比最大的类型的传感器记为参考类型的传感器,用于对除参考类型的传感器外的其它类型的传感器对应的三维坐标系中的数据点的异常程度的修正;将除参考类型的传感器外的其它类型的传感器对应的三维坐标系记为待分析坐标系,对于第q个待分析坐标系:以该待分析坐标系中的第n个非标记数据点为例进行说明,将该待分析坐标系中的第n个非标记数据点所对应的区域记为目标区域,判断参考类型的传感器对应的三维坐标系中是否存在标记数据点所对应的区域为目标区域,若存在,则说明目标区域内的数据存在异常,需要对该待分析坐标系中的第n个非标记数据点的异常程度进行校正,将待分析坐标系中的第n个非标记数据点记为待校正数据点,将参考类型的传感器对应的三维坐标系中所对应的区域为目标区域的标记数据点记为参考数据点;若不存在,则说明目标区域内的数据不存在异常,无需对该待分析坐标系中的第n个非标记数据点的异常程度进行校正;接下来将基于参考数据点的异常程度对待校正数据点的异常程度进行校正,考虑到距离采集异常数据点的传感器位置越近的传感器采集的数据越应当被关注,因此,根据采集待校正数据点的数据值的传感器与采集各参考数据点的数据值的传感器之间的欧式距离以及待校正数据点的数据值,计算待校正数据点校正后的异常程度,第q个待分析坐标系中的第n个待校正数据点校正后的异常程度为:
其中,β qn为第q个待分析坐标系中的第n个待校正数据点校正后的异常程度,W为参考数据点的个数,dn,w为采集第q个待分析坐标系中的第n个待校正数据点的数据值的传感器与采集第w个参考数据点的数据值的传感器之间的欧式距离,exp()为以自然常数为底数的指数函数,βqn为第q个待分析坐标系中的第n个待校正数据点的异常程度;所述采集第q个待分析坐标系中的第n个待校正数据点的数据值的传感器与采集第w个参考数据点的数据值的传感器之间的欧式距离即为采集第n个待校正数据点的数据值和第w个参考数据点的数据值的两个传感器在园区的位置距离,也即为这两个数据点在三维坐标系中的X坐标和Y坐标之间的欧式距离。
待分析坐标系中的数据点离参考数据点的距离越近,则表明该类型的传感器与参考类型的传感器的距离越近,该类型的传感器对应的三维坐标系中的数据点的关注度应当越大,即该类型的传感器对应的三维坐标系中的数据点的异常程度的校正权重越大。
类比上述方法,能够对所有待分析坐标系中的待校正数据点的异常程度进行校正,获得所有待校正数据点校正后的异常程度。本实施例考虑了同一时刻的不同类型的传感器之间的距离分布的关联性,根据不同类型传感器采集数据时位置的关联性,来对预先获取的异常程度进行校正,使得满足园区安防的安全管理要求,能够有效保证后续数据的筛选精度。
步骤S4,基于各数据点的异常程度和各待校正数据点校正后的异常程度获取正常数据点和异常数据点,基于所述正常数据点和异常数据点对相对应的数据进行压缩存储。
在步骤S3中对待校正数据点的异常程度进行了校正,获得了每个待校正数据点校正后的异常程度,将除待校正数据点外的所有数据点记为非校正数据点,也获得了每个非待校正数据点的异常程度;异常程度越大的数据点越应当被关注,非待校正数据点的异常程度均大于异常程度阈值βT,将每个非待校正数据点作为一个异常数据点,比较待校正数据点校正后的异常程度与异常程度阈值βT的大小关系,将校正后的异常程度大于异常程度阈值βT的待校正数据点也作为异常数据点,也即获得了所有三维坐标系中的异常数据点,将所有三维坐标系中除异常数据点外的所有数据点作为正常数据点,由于在对数据点进行异常分析时,是基于单个采集时刻进行分析的,因此采用上述方法能够将每个采集时刻获取的数据点分为两类,分别为正常数据点和异常数据点。
接下来将对采集的数据进行压缩,为了保证数据的完整性,本实施例不仅要对异常数据点的数据值进行编码存储,同样也要对正常数据点的数据值进行编码存储。具体的,本实施例分别对每个时间段内采集的数据进行编码,采用游程编码数据进行编码,对于任一时间段:该时间段中可能有正常数据点和异常数据点,对于正常数据点的数据值,将该时间段内正常数据点的数据值的均值作为待编码数据,采用游程编码进行编码;对于异常数据点的数据值,将异常数据点的数据值直接作为待编码数据,采用游程编码进行编码。本实施例设置每个时间段的时长均为1分钟,在具体应用中,实施者可根据具体情况进行设置;将编码后的数据传输至园区安防***服务器中,进行存储,便于后续工作人员的查看。游程编码为公知技术,此处不再过多赘述。
本实施例首先基于各类型的传感器获取的园区内的数据构建了各类型的传感器对应的三维坐标系,考虑到布置于园区内相似区域的同一类型的传感器采集的数据之间存在一定的关联性,本实施例利用神经网络获取了园区平面图中每个区域对应的类别,根据园区内各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,计算了各数据点对应的分布聚集程度,用于表征传感器采集的数据之间的关联性,进而确定了每个数据点对应的邻域距离,能够有效地避免后续在计算每个数据点的异常程度时,邻域大小设置的不合适对计算结果的准确性的干扰,进而使得后续数据的筛选结果更加准确,本实施例分别对正常数据和异常数据进行不同程度的压缩,在保证园区安防***的重要数据不丢失的基础上提高了数据压缩的效率和可靠性。本实施例在计算每个数据点的异常程度时,首先基于每个数据点的数据值和各数据点的邻域距离内数据点的数据值,得到了每个数据点的异常程度,对异常程度大于异常程度阈值的像素点进行标记;考虑到标记数据点和非标记数据点呈现的特征不同,标记像素点的异常程度更大,更应当对其进行关注,因此根据标记数据点和非标记数据点获取了待校正数据点,本实施例又对各待校正数据点进行校正,获得各待校正数据点校正后的异常程度,进而将所有数据分为两类,分别为正常数据和异常数据,提高了数据的筛选精度。

Claims (8)

1.一种园区安防***数据高效压缩方法,其特征在于,该方法包括以下步骤:
利用不同类型的传感器实时获取园区内的数据;
基于各类型的传感器获取的园区内的数据构建各类型的传感器对应的三维坐标系,三维坐标系中包含不少于两个数据点;基于园区平面图和训练好的神经网络获得各传感器所在的区域对应的类别;根据所述各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,得到各数据点对应的分布聚集程度;
基于所述分布聚集程度和三维坐标系中与各数据点所对应的区域属于同一类别的区域对应的数据点的总数量,确定三维坐标系中各数据点对应的邻域距离;基于各数据点的数据值和各数据点的邻域距离内数据点的数据值,得到各数据点的异常程度;对异常程度大于异常程度阈值的像素点进行标记,根据标记数据点和非标记数据点获取待校正数据点,并对各待校正数据点的异常程度进行校正获得校正后的异常程度;
基于各数据点的异常程度和各待校正数据点校正后的异常程度获取正常数据点和异常数据点,基于所述正常数据点和异常数据点对相对应的数据进行压缩存储;
所述基于各类型的传感器获取的园区内的数据构建各类型的传感器对应的三维坐标系,包括:
对于任一类型的传感器:获取该类型的每个传感器在园区平面图中的二维坐标,对于任一采集时刻,根据该类型的每个传感器在园区平面图中的二维坐标以及该类型的每个传感器在该采集时刻采集到的数据值,构建该类型的传感器在该采集时刻对应的三维坐标系,其中,三维坐标系中X轴和Y轴代表数据点的坐标值,Z轴代表数据点的数据值。
2.根据权利要求1所述的一种园区安防***数据高效压缩方法,其特征在于,所述根据标记数据点和非标记数据点获取待校正数据点,包括:
对于任一类型的传感器:计算该类型的传感器对应的三维坐标系中标记数据点的数量与该类型的传感器对应的三维坐标系中数据点的总个数的比值,作为该类型的传感器对应的三维坐标系中异常数据点的占比;
将三维坐标系中异常数据点的占比最大的类型的传感器记为参考类型的传感器;将除参考类型的传感器外的其它类型的传感器对应的三维坐标系记为待分析坐标系;
对于第q个待分析坐标系:
将该待分析坐标系中的第n个非标记数据点所对应的区域记为目标区域,判断参考类型的传感器对应的三维坐标系中是否存在标记数据点所对应的区域为目标区域,若存在,则将待分析坐标系中的第n个非标记数据点记为待校正数据点。
3.根据权利要求2所述的一种园区安防***数据高效压缩方法,其特征在于,对各待校正数据点的异常程度进行校正获得校正后的异常程度,包括:
将参考类型的传感器对应的三维坐标系中所对应的区域为目标区域中的标记数据点记为参考数据点;根据采集待校正数据点的数据值的传感器与采集各参考数据点的数据值的传感器之间的欧式距离以及待校正数据点的数据值,计算待校正数据点校正后的异常程度。
4.根据权利要求3所述的一种园区安防***数据高效压缩方法,其特征在于,采用如下公式计算第q个待分析坐标系中的第n个待校正数据点校正后的异常程度:
其中,β qn为第q个待分析坐标系中的第n个待校正数据点校正后的异常程度,W为参考数据点的个数,dn,w为采集第q个待分析坐标系中的第n个待校正数据点的数据值的传感器与采集第w个参考数据点的数据值的传感器之间的欧式距离,exp()为以自然常数为底数的指数函数,βqn为第q个待分析坐标系中的第n个待校正数据点的异常程度。
5.根据权利要求1所述的一种园区安防***数据高效压缩方法,其特征在于,所述根据所述各传感器所在的区域对应的类别和三维坐标系中各数据点的位置,得到各数据点对应的分布聚集程度,包括:
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点:
计算第i个数据点和该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的所有数据点之间的欧式距离的均值,记为第一均值;所述第i个数据点所对应的区域为采集第i个数据点的数据值时传感器所在的区域;
以自然常数为底数,以负的所述第一均值为指数的指数函数的值作为第i个数据点对应的分布聚集程度。
6.根据权利要求1所述的一种园区安防***数据高效压缩方法,其特征在于,所述基于所述分布聚集程度和三维坐标系中与各数据点所对应的区域属于同一类别的区域对应的数据点的总数量,确定三维坐标系中各数据点对应的邻域距离,包括:
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点:计算该类型的传感器对应的三维坐标系中与第i个数据点所对应的区域属于同一类别的区域对应的数据点的总数量和第i个数据点对应的分布聚集程度的乘积,记为第一乘积;对所述第一乘积进行向下取整,将向下取整的结果记为第一距离;将所述第一距离与初始邻域距离之和作为第i个数据点对应的邻域距离。
7.根据权利要求1所述的一种园区安防***数据高效压缩方法,其特征在于,所述基于各数据点的数据值和各数据点的邻域距离内数据点的数据值,得到各数据点的异常程度,包括:
对于任意一个类型的传感器对应的三维坐标系中的第i个数据点:
根据第i个数据点的数据值与其邻域距离内的各数据点的数据值之间的差异以及第i个数据点的数据值,得到第i个数据点的局部分布度;
将第i个数据点的邻域距离内的所有数据点的局部分布度的均值和所述第i个数据点的局部分布度的比值作为第i个数据点的异常程度。
8.根据权利要求1所述的一种园区安防***数据高效压缩方法,其特征在于,所述基于各数据点的异常程度和各待校正数据点校正后的异常程度获取正常数据点和异常数据点,基于所述正常数据点和异常数据点对相对应的数据进行压缩存储,包括:
将校正后的异常程度大于异常程度阈值的待校正数据点作为异常数据点,将除待校正数据点外的所有数据点作为异常数据点,将所有三维坐标系中除异常数据点外的所有数据点作为正常数据点;
采用游程编码分别对正常数据点的数据值和异常数据点的数据值进行编码,对编码后的数据进行存储。
CN202211657753.0A 2022-12-22 2022-12-22 一种园区安防***数据高效压缩方法 Active CN115941807B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211657753.0A CN115941807B (zh) 2022-12-22 2022-12-22 一种园区安防***数据高效压缩方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211657753.0A CN115941807B (zh) 2022-12-22 2022-12-22 一种园区安防***数据高效压缩方法

Publications (2)

Publication Number Publication Date
CN115941807A CN115941807A (zh) 2023-04-07
CN115941807B true CN115941807B (zh) 2024-02-23

Family

ID=86652214

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211657753.0A Active CN115941807B (zh) 2022-12-22 2022-12-22 一种园区安防***数据高效压缩方法

Country Status (1)

Country Link
CN (1) CN115941807B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117078048B (zh) * 2023-10-17 2024-01-26 深圳市福山自动化科技有限公司 基于数字孪生的智慧城市资源管理方法及***

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106878995A (zh) * 2017-04-27 2017-06-20 重庆邮电大学 一种基于感知数据的无线传感器网络异常类型鉴别方法
CN110631624A (zh) * 2019-09-04 2019-12-31 精英数智科技股份有限公司 一种识别矿井传感器运行数据异常的方法、装置及***
CN112256686A (zh) * 2020-11-12 2021-01-22 北京理工大学 一种基于mes的故障数据压缩与预测方法及***
KR102321440B1 (ko) * 2020-09-10 2021-11-02 연세대학교 산학협력단 이질적 다변량 시변 데이터를 이용한 이상 감지 장치 및 방법
CN114020811A (zh) * 2021-11-09 2022-02-08 中国工商银行股份有限公司 数据异常检测方法及其装置、电子设备
CN114492629A (zh) * 2022-01-25 2022-05-13 京东城市(北京)数字科技有限公司 异常检测方法、装置、电子设备及存储介质
CN114970621A (zh) * 2022-05-20 2022-08-30 京东城市(北京)数字科技有限公司 异常聚集事件的检测方法、装置、电子设备和存储介质
CN115294409A (zh) * 2022-10-08 2022-11-04 南通商翼信息科技有限公司 一种用于安防监控的视频压缩方法、***及介质

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE102005030031B4 (de) * 2005-06-27 2007-08-02 Nec Europe Ltd. Verfahren zum Datenmanagement in einem Sensornetzwerk
DE102020209163A1 (de) * 2020-07-21 2022-01-27 Robert Bosch Gesellschaft mit beschränkter Haftung Verfahren und Vorrichtung zum Detektieren von Anomalien in Sensoraufzeichnungen eines technischen Systems

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106878995A (zh) * 2017-04-27 2017-06-20 重庆邮电大学 一种基于感知数据的无线传感器网络异常类型鉴别方法
CN110631624A (zh) * 2019-09-04 2019-12-31 精英数智科技股份有限公司 一种识别矿井传感器运行数据异常的方法、装置及***
KR102321440B1 (ko) * 2020-09-10 2021-11-02 연세대학교 산학협력단 이질적 다변량 시변 데이터를 이용한 이상 감지 장치 및 방법
CN112256686A (zh) * 2020-11-12 2021-01-22 北京理工大学 一种基于mes的故障数据压缩与预测方法及***
CN114020811A (zh) * 2021-11-09 2022-02-08 中国工商银行股份有限公司 数据异常检测方法及其装置、电子设备
CN114492629A (zh) * 2022-01-25 2022-05-13 京东城市(北京)数字科技有限公司 异常检测方法、装置、电子设备及存储介质
CN114970621A (zh) * 2022-05-20 2022-08-30 京东城市(北京)数字科技有限公司 异常聚集事件的检测方法、装置、电子设备和存储介质
CN115294409A (zh) * 2022-10-08 2022-11-04 南通商翼信息科技有限公司 一种用于安防监控的视频压缩方法、***及介质

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
无线传感器网络中异常读数检测算法研究;薛安荣;李明;;计算机应用研究(第09期);3452-3455 *
萤火虫优化和随机森林的WSN异常数据检测;许欧阳;李光辉;;计算机科学与探索(第10期);107-118 *

Also Published As

Publication number Publication date
CN115941807A (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN110263846B (zh) 基于故障数据深度挖掘及学习的故障诊断方法
CN111209434A (zh) 一种基于多源异构数据融合的变电站设备巡检***及方法
CN115941807B (zh) 一种园区安防***数据高效压缩方法
CN117611015B (zh) 一种建筑工程质量实时监测***
CN115600513B (zh) 一种岩溶塌陷监测预警及防控一体化信息化模拟研判***
CN113391239A (zh) 一种基于边缘计算的互感器异常监测方法与***
CN115022187B (zh) 一种电-气综合能源***态势感知方法与装置
CN116684878A (zh) 一种5g信息传输数据安全监测***
CN116861331A (zh) 一种融合专家模型决策的数据识别方法及***
CN117114913A (zh) 一种基于大数据的智能化农业数据采集***
CN116644284A (zh) 一种地层分类特征因子确定方法、***、电子设备及介质
CN111855653B (zh) 一种植物干旱监测方法、监测模块和监测装置
CN117630611B (zh) 全带宽高频局放prpd谱图捕获生成方法及***
CN117435997B (zh) 一种基于Transformer和时序压缩机制的电梯预警及按需维保方法
CN117473351B (zh) 基于物联网的电源信息远程传输***
CN117142009B (zh) 一种基于图卷积网络的刮板输送机健康状态评估方法
CN116977807A (zh) 基于多传感器融合的冷库智能监控***及方法
CN117009900A (zh) 一种基于图神经网络的物联网信号异常检测方法和***
CN116660761A (zh) 一种锂离子电池检测方法及***
CN114580472B (zh) 工业互联网中因果与注意力并重的大型设备故障预测方法
CN113408816B (zh) 一种基于深度神经网络的电网灾情评估方法
CN108802845A (zh) 一种基于红外阵列传感器的室内人员占有率估计方法
CN115062686A (zh) 基于多角度特征的多元kpi时序异常检测方法和***
CN114003638A (zh) 一种智能互联大数据处理***
Cuan et al. Research on TV imaging casing damage detection and classification method based on C4. 5 decision tree

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant