CN116709392B - 一种大规模无线传感器网络数据融合方法 - Google Patents
一种大规模无线传感器网络数据融合方法 Download PDFInfo
- Publication number
- CN116709392B CN116709392B CN202310991312.2A CN202310991312A CN116709392B CN 116709392 B CN116709392 B CN 116709392B CN 202310991312 A CN202310991312 A CN 202310991312A CN 116709392 B CN116709392 B CN 116709392B
- Authority
- CN
- China
- Prior art keywords
- data
- sensor
- variable
- sub
- sensors
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000007500 overflow downdraw method Methods 0.000 title claims abstract description 9
- 238000000034 method Methods 0.000 claims abstract description 42
- 230000004927 fusion Effects 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 13
- 238000004140 cleaning Methods 0.000 claims abstract description 11
- 238000005065 mining Methods 0.000 claims abstract description 9
- 238000006243 chemical reaction Methods 0.000 claims abstract description 8
- 238000003860 storage Methods 0.000 claims abstract description 7
- 238000012098 association analyses Methods 0.000 claims abstract description 4
- 238000005259 measurement Methods 0.000 claims description 36
- 238000004891 communication Methods 0.000 claims description 28
- 230000006870 function Effects 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 13
- 230000000694 effects Effects 0.000 claims description 13
- 238000009826 distribution Methods 0.000 claims description 9
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000005457 optimization Methods 0.000 claims description 7
- 230000002159 abnormal effect Effects 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 6
- 230000000737 periodic effect Effects 0.000 claims description 6
- 238000010219 correlation analysis Methods 0.000 claims description 4
- 238000005265 energy consumption Methods 0.000 claims description 4
- 238000012545 processing Methods 0.000 claims description 4
- 230000008859 change Effects 0.000 claims description 3
- 238000013480 data collection Methods 0.000 claims description 3
- 238000001514 detection method Methods 0.000 claims description 3
- 238000010801 machine learning Methods 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 3
- 238000007619 statistical method Methods 0.000 claims description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000007499 fusion processing Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 238000011426 transformation method Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W24/00—Supervisory, monitoring or testing arrangements
- H04W24/02—Arrangements for optimising operational condition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/56—Provisioning of proxy services
- H04L67/565—Conversion or adaptation of application format or content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L9/00—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
- H04L9/008—Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/03—Protecting confidentiality, e.g. by encryption
- H04W12/033—Protecting confidentiality, e.g. by encryption of the user plane, e.g. user's traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/18—Self-organising networks, e.g. ad-hoc networks or sensor networks
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Computer Security & Cryptography (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Arrangements For Transmission Of Measured Signals (AREA)
Abstract
本发明公开了一种大规模无线传感器网络数据融合方法,所述方法包括:设计包含各种异构传感器的无线传感器网络,优化各个传感器节点的部署位置;将各个传感器采集到的原始数据通过无线网络传输到数据中心上进行存储;在数据中心上实施数据清洗和转换流程,将所有的原始数据标准化为统一的数据格式;对数据中心上对存储的数据进行关联性分析和模式挖掘的融合操作。本发明方法在实际应用中证明了其准确性和可靠性。无论是在单个传感器级别还是在整个网络级别,都可以得到准确和可靠的结果。
Description
技术领域
本发明涉及传感器及物联网技术领域,尤其涉及一种大规模无线传感器网络数据融合方法。
背景技术
无线传感器网络(WSN)是一个广泛应用于环境监测、智能交通、智能家居、健康监测等领域的技术。无线传感器网络由一组小型、低成本的传感器节点组成,这些节点能够感知环境信息,例如温度、湿度、光照强度等,并通过无线通信将数据发送到数据中心。然而,由于传感器的异构性和数据的异质性,如何有效地进行大规模无线传感器网络数据融合是一个重要且具有挑战性的问题。
通常无线传感器的能量通常有限,因此在设计无线传感器网络时,通常需要考虑如何优化传感器的位置和工作时间,以最小化能源消耗并最大化覆盖率。此外,由于传感器的通信距离有限,因此还需要考虑传感器之间的通信问题。由于无线传感器网络通常由多种类型的传感器组成,因此收集的数据具有异构性和异质性。例如,温度传感器收集的数据和湿度传感器收集的数据在数据类型、单位和范围上可能都不同。因此,数据清洗和转换是无线传感器网络数据融合的重要步骤。无线传感器网络收集的数据通常具有时空关联性。例如,同一地点在不同时间收集的数据,或者不同地点在相同时间收集的数据之间可能存在某种关联性。因此,时序知识图谱等技术可以被用来对这种关联性进行分析,从而挖掘出有价值的模式。在进行大规模无线传感器网络数据融合时,数据的隐私安全是一个重要的问题。因此,如何在保证数据隐私的同时,还能进行有效的数据融合,是一个具有挑战性的问题。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明公开了一种大规模无线传感器网络数据融合方法。所述方法提供了一种无线携能传感器网络的数据融合方法,能够有效处理异构和异质性数据,为安全隐私的大规模无线传感器网络的数据处理提供了新的可能性。
本发明的目的是通过如下技术方案实现的,一种大规模无线传感器网络数据融合方法,所述方法包括:
步骤1,设计包含各种异构传感器的无线传感器网络,优化各个传感器节点的部署位置;
步骤2,将各个传感器采集到的原始数据通过无线网络传输到数据中心上进行存储;
步骤3,在数据中心上实施数据清洗和转换流程,将所有的原始数据标准化为统一的数据格式;
步骤4,对数据中心上对存储的数据进行关联性分析和模式挖掘的融合操作。
所述的优化各个传感器节点的部署位置,包括以下步骤:
设传感器集合为, 每个传感器/>有一个预设的总能量/>、单位时间能量消耗/>,总工作时间/>,工作时间/>,定义/>为传感器/>和/>之间的距离,/>为能够覆盖到的区域集合,/>为通信范围,如果传感器/>可以覆盖区域/>,/>,否则;
建立部署位置优化模型,设置目标函数为:在满足数据采集需求的前提下,使用最少的传感器,即,最小化使用的传感器数量,表示为:;设置约束条件表示如下:
;
;
;
;
;
;
所有的功能区域都需要被覆盖;每个传感器的能量不能超过其预设的能量级;每个传感器的工作时间不得超过其预设的工作时间;每一对传感器之间的通信距离不能超过最大通信距离C只有当传感器被选中并且至少存在一个其他的传感器/>与/>直接通信时,/>的数据才能够被收集;
其中,是一个二元传感器变量,当传感器/>被选中时,/>,否则/>,/>是一个二元变量,当传感器/>与/>之间存在直接的通信链路时,/>,否则/>。
所述的部署位置优化模型的求解的过程包括如下步骤:
步骤101,初始化:将上界UB设置为一个较大的值+∞;将下界LB初始化为无约束问题的最优解;
步骤102,创建搜索树:初始化搜索树的根节点,将整个问题作为根节点的子问题;创建变量集合,包括传感器变量和通信变量 />;创建约束条件集合,包括区域覆盖约束、能量约束、工作时间约束、通信限制约束和传感器选择与中介传感器约束,定义目标函数,即最小化传感器数量;
步骤103,选择分支变量:在当前子问题中,选择一个未被分支的变量进行分支,采用启发式方法选择具有最大活动约束数的传感器变量进行分支;对于当前的子问题,计算每个传感器变量/>的活动约束数,活动约束数表示该传感器变量在当前子问题中所涉及的约束条件数目;选择具有最大活动约束数的传感器变量/>作为分支变量,这意味着选择具有最大影响力或关联性的传感器变量进行分支,有助于更快地收敛到最优解;如果存在多个传感器变量具有相同的最大活动约束数,使用其预计计算时间最短的变量进行分支;对于每个传感器变量/>通过累加传感器变量涉及的操作的计算时间来得到预计计算时间;
步骤104,对于选定的分支变量,创建两个子问题:子问题一:将/>设置为 1,并根据约束条件更新问题;子问题二:将/> 设置为 0,并根据约束条件更新问题;
步骤105,对于每个子问题,求解混合整数规划问题,得到一个下界LB和一个可行解,如果下界LB大于当前的上界UB,则舍弃该子问题;
步骤106,如果某个子问题的最优解小于当前的上界UB,则更新上界UB为该最优解;
步骤107,对于每个子问题,如果最优解大于当前的上界UB,则舍弃该子问题;
步骤108,如果搜索树中的所有子问题都被舍弃,或者搜索树中的所有子问题已经被求解且找到最优解,则终止搜索;
步骤109,如果终止条件不满足,返回步骤103,选择下一个未被分支的变量进行分支操作;
步骤110,返回搜索树中找到的最优传感器选择方案,满足数据采集需求和通信限制,并最小化传感器数量。
所述的原始数据通过无线网络传输,包括以下步骤:
每个传感器采集到原始数据/>;
在每个传感器的数据/>上添加满足Laplace分布或者高斯分布的噪声/>,得到带噪声的数据/>,对于Laplace分布的噪声,概率密度函数为:
;
其中,是位置参数,/>是尺度参数,在满足/>差分隐私的情况下,尺度参数,其中/>是函数/>在邻近数据库上的敏感度,/>是隐私预算;
将带噪声的数据进行同态加密,得到加密数据/>;
每个传感器将加密数据发送到数据中心。
数据中心收集到所有的加密数据后,在加密数据上进行各种形式的数据融合,设为融合函数,/>为所有加密数据的集合,融合后的加密数据为/>;
数据中心在需要对数据进行深入分析时,使用密钥对融合后的加密数据进行解密,设解密函数为,解密结果为/>,由于同态加密和差分隐私的性质,故。
具体地,所述的加密采用Paillier加密算法,对于明文和对应/>的密文,加密和解密函数定义如下:
加密函数:,其中/>和/>为公钥,/>为随机数;
解密函数:,其中/>为私钥,。
具体地,所述的数据清洗和转换流程包括以下步骤:
从不同类型的传感器中收集原始数据;
在数据收集完成后,是清洗数据,包括删除冗余数据、识别并处理缺失值和异常值等;
由于异构传感器可能具有不同的数据采集频率和时间戳,需要对齐数据;
由于传感器之间可能存在数据格式和单位的不一致性,需要对数据进行转换,以达到一致性;
最后,将处理好的所有传感器数据进行融合,形成统一的数据格式的数据集。
所述的统一的数据格式包括以下元素:
时间戳:表示数据采集的时间;
传感器标识:表示数据的来源,即哪一个传感器采集的这份数据;
地点:表示传感器的地理位置;
测量值:表示传感器采集的实际数据;
单位:表示测量值的单位;
数据质量:表示这份数据的质量,是一个信号强度或者其他指标。
所述的对存储的数据进行关联性分析的步骤如下:
构建时序知识图谱:基于收集到的传感器数据构建时序知识图谱,其中,每个传感器看作是一个实体,每个测量值看作是另一个实体,传感器与测量值之间的“测量”关系,以及测量值与时间戳之间的“发生在”关系,看作是边;
识别关联性:对于任意两个传感器,分析它们在不同时间的测量值,以识别它们之间的关联性,通过计算它们的测量值的相关系数来实现,定义为:
;
其中,表示协方差,/>表示标准差,/>和/>表示传感器/>和/>的测量值序列;
添加关联性边:对于相关系数大于某个阈值的传感器对,在它们之间添加一个关联边,并将相关系数作为关联边的权重;
关联性分析:通过分析属性值和关联性边来找出传感器网络中的重要模式。
所述的重要模式包括:使用社区检测算法来发现密切关联的传感器群体,或者使用路径分析方法来识别影响某个传感器测量值的关键因素。
所述的模式挖掘的模式包括:
周期性模式:许多传感器数据会展现出周期性变化,分析步骤:对于某一传感器,利用傅立叶变换方法,将其测量序列/>转换到频率域,识别主要频率分量,数学公式:,其中,/>是序列的长度,/>从/>到/>,/>从/>到;
异常模式:传感器数据可能包含一些异常值,分析步骤:对于某一传感器,利用统计方法或者机器学习方法,来检测其测量序列/>的异常值;
簇群模式:传感器网络中存在一些密切关联的传感器群体,它们的测量数据具有相似的变化模式;分析步骤:使用聚类算法对所有传感器的测量序列进行聚类,然后识别出簇群。
与现有方法相比,本发明方法的优点在于:本技术方案提供了一种大规模无线传感器网络数据融合方法,借助优化模型,有效地管理和分配传感器资源。该模型可以根据传感器的能源、通信能力和工作时间进行优化,从而实现对传感器的最大化利用,并尽可能减少总体数量;本发明方法针对传感器网络的异构性和传感数据的异质性进行数据清洗和转换,能够处理各种类型和格式的数据,使得数据统一和规范化;通过使用时序知识图谱技术,更好地理解数据之间的关联性。这使得我们能够从不同的角度和层次理解数据,从而挖掘出更深层次的模式和趋势;增强了数据的安全性,有效地保护传感器数据在传输和融合过程中的安全。本发明方法在实际应用中证明了其准确性和可靠性。无论是在单个传感器级别还是在整个网络级别,都可以得到准确和可靠的结果。
附图说明
图1示出了本发明实施例的流程示意图。
具体实施方式
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
本实施例中,假设我们正在运行一个大型农场,并且使用无线传感器网络来收集数据以优化种植效果。在农场中,我们可能会使用多种类型的传感器,包括温度传感器、湿度传感器、光照传感器和土壤pH值传感器等。
所有的传感器按照设定的时间和位置开始工作,采集各类数据。由于传感器的异构性,数据采集完成后,需要对原始数据进行清洗和转换,将所有数据标准化为一个统一的数据格式。
数据标准化后,使用时序知识图谱来对各类数据进行关联性分析。例如,通过对温度、湿度、光照和pH值的联合分布进行分析,可以发现某些模式,如在特定的湿度和温度条件下,光照对植物生长的影响更大。然后,我们可以使用这些模式来优化农场的管理决策。
为了保护数据的隐私,我们在传感器上传数据之前,将使用同态加密对数据进行加密,并使用差分隐私方法在数据上添加噪声。这样可以在保证数据隐私的同时,允许我们在数据上进行数据融合和分析。
由此,一种大规模无线传感器网络数据融合方法,所述方法包括:
步骤1,设计包含各种异构传感器的无线传感器网络,优化各个传感器节点的部署位置;
步骤2,将各个传感器采集到的原始数据通过无线网络传输到数据中心上进行存储;
步骤3,在数据中心上实施数据清洗和转换流程,将所有的原始数据标准化为统一的数据格式;
步骤4,对数据中心上对存储的数据进行关联性分析和模式挖掘的融合操作。
所述的优化各个传感器节点的部署位置,包括以下步骤:
设传感器集合为:, 每个传感器/>有一个预设的总能量/>、单位时间能量消耗/>,总工作时间/>,工作时间/>,定义/>为传感器/>和/>之间的距离,/>为能够覆盖到的区域集合,/>为通信范围,如果传感器/>可以覆盖区域/>,/>,否则;
建立部署位置优化模型,设置目标函数为:在满足数据采集需求的前提下,使用最少的传感器,即,最小化使用的传感器数量,表示为:设置约束条件表示如下:
;
;
;
;
;
;
所有的功能区域都需要被覆盖;每个传感器的能量不能超过其预设的能量级;每个传感器的工作时间不得超过其预设的工作时间;每一对传感器之间的通信距离不能超过最大通信距离C;只有当传感器被选中并且至少存在一个其他的传感器/>与/>直接通信时,/>的数据才能够被收集;
其中,是一个二元传感器变量,当传感器/>被选中时,/>,否则/>,/>是一个二元变量,当传感器/>与/>之间存在直接的通信链路时,/>,否则/>。
所述的部署位置优化模型的求解的过程包括如下步骤:
步骤101,初始化:将上界UB设置为一个较大的值+∞;将下界LB初始化为无约束问题的最优解;
步骤102,创建搜索树:初始化搜索树的根节点,将整个问题作为根节点的子问题;创建变量集合,包括传感器变量和通信变量 />;创建约束条件集合,包括区域覆盖约束、能量约束、工作时间约束、通信限制约束和传感器选择与中介传感器约束,定义目标函数,即最小化传感器数量;
步骤103,选择分支变量:在当前子问题中,选择一个未被分支的变量进行分支,采用启发式方法选择具有最大活动约束数的传感器变量进行分支;对于当前的子问题,计算每个传感器变量/>的活动约束数,活动约束数表示该传感器变量在当前子问题中所涉及的约束条件数目;选择具有最大活动约束数的传感器变量/>作为分支变量,这意味着选择具有最大影响力或关联性的传感器变量进行分支,有助于更快地收敛到最优解;如果存在多个传感器变量具有相同的最大活动约束数,使用其预计计算时间最短的变量进行分支;对于每个传感器变量 />,通过累加传感器变量涉及的操作的计算时间来得到预计计算时间;
步骤104,对于选定的分支变量,创建两个子问题:子问题一:将/>设置为 1,并根据约束条件更新问题;子问题二:将/> 设置为 0,并根据约束条件更新问题;
步骤105,对于每个子问题,求解混合整数规划问题,得到一个下界LB和一个可行解,如果下界LB大于当前的上界UB,则舍弃该子问题;
步骤106,如果某个子问题的最优解小于当前的上界UB,则更新上界UB为该最优解;
步骤107,对于每个子问题,如果最优解大于当前的上界UB,则舍弃该子问题;
步骤108,如果搜索树中的所有子问题都被舍弃,或者搜索树中的所有子问题已经被求解且找到最优解,则终止搜索;
步骤109,如果终止条件不满足,返回步骤103,选择下一个未被分支的变量进行分支操作;
步骤110,返回搜索树中找到的最优传感器选择方案,满足数据采集需求和通信限制,并最小化传感器数量。
所述的原始数据通过无线网络传输,包括以下步骤:
每个传感器采集到原始数据/>;
在每个传感器的数据/>上添加满足Laplace分布或者高斯分布的噪声/>,得到带噪声的数据/>,对于Laplace分布的噪声,概率密度函数为:
;
其中,是位置参数,/>是尺度参数,在满足/>差分隐私的情况下,尺度参数其中/>是函数/>在邻近数据库上的敏感度,/>是隐私预算;
将带噪声的数据进行同态加密,得到加密数据/>,每个传感器将加密数据/>发送到数据中心。
数据中心收集到所有的加密数据后,在加密数据上进行各种形式的数据融合,设为融合函数,/>为所有加密数据的集合,融合后的加密数据为/>,数据中心在需要对数据进行深入分析时,使用密钥对融合后的加密数据进行解密,设解密函数为/>,解密结果为/>由于同态加密和差分隐私的性质,故/>。
具体地,所述的加密采用Paillier加密算法,对于明文和对应/>的密文,加密和解密函数定义如下:
加密函数:,其中/>和/>为公钥,/>为随机数;
解密函数:,其中/>为私钥,。
具体地,所述的数据清洗和转换流程包括以下步骤:
从不同类型的传感器中收集原始数据;
在数据收集完成后,是清洗数据,包括删除冗余数据、识别并处理缺失值和异常值等;
由于异构传感器可能具有不同的数据采集频率和时间戳,需要对齐数据;
由于传感器之间可能存在数据格式和单位的不一致性,需要对数据进行转换,以达到一致性;
最后,将处理好的所有传感器数据进行融合,形成统一的数据格式的数据集。
所述的统一的数据格式包括以下元素:
时间戳:表示数据采集的时间;
传感器标识:表示数据的来源,即哪一个传感器采集的这份数据;
地点:表示传感器的地理位置;
测量值:表示传感器采集的实际数据;
单位:表示测量值的单位;
数据质量:表示这份数据的质量,是一个信号强度或者其他指标。
所述的对存储的数据进行关联性分析的步骤如下:
构建时序知识图谱:基于收集到的传感器数据构建时序知识图谱,其中,每个传感器看作是一个实体,每个测量值看作是另一个实体,传感器与测量值之间的“测量”关系,以及测量值与时间戳之间的“发生在”关系,看作是边;
识别关联性:对于任意两个传感器,分析它们在不同时间的测量值,以识别它们之间的关联性,通过计算它们的测量值的相关系数来实现,定义为:
;
其中,表示协方差,/>表示标准差,/>和/>表示传感器/>和/>的测量值序列;添加关联性边:对于相关系数大于某个阈值的传感器对,在它们之间添加一个关联边,并将相关系数作为关联边的权重;
关联性分析:通过分析属性值和关联性边来找出传感器网络中的重要模式。
所述的重要模式包括:使用社区检测算法来发现密切关联的传感器群体,或者使用路径分析方法来识别影响某个传感器测量值的关键因素。
所述的模式挖掘的模式包括:
周期性模式:许多传感器数据会展现出周期性变化,分析步骤:对于某一传感器,利用傅立叶变换方法,将其测量序列/>转换到频率域,识别主要频率分量,数学公式:,其中,/>是序列的长度,/>从/>到/>,/>从/>到;
异常模式:传感器数据可能包含一些异常值,分析步骤:对于某一传感器,利用统计方法或者机器学习方法,来检测其测量序列/>的异常值;
簇群模式:传感器网络中存在一些密切关联的传感器群体,它们的测量数据具有相似的变化模式;分析步骤:使用聚类算法对所有传感器的测量序列进行聚类,然后识别出簇群。
本领域技术人员应明白,本申请的实施例可提供为方法、***或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
Claims (8)
1.一种大规模无线传感器网络数据融合方法,其特征在于,所述方法包括:
步骤1,设计包含各种异构传感器的无线传感器网络,优化各个传感器节点的部署位置;
步骤2,将各个传感器采集到的原始数据通过无线网络传输到数据中心上进行存储;
步骤3,在数据中心上实施数据清洗和转换流程,将所有的原始数据标准化为统一的数据格式;
步骤4,在数据中心上对存储的数据进行关联性分析和模式挖掘的融合操作;
其中,所述的优化各个传感器节点的部署位置,包括以下步骤:
设传感器集合为S={s1,s2,...,sn},每个传感器si有一个预设的总能量Ei、单位时间能量消耗ei,总工作时间Ti,工作时间ti,定义dij为传感器si和sj之间的距离,Sd为能够覆盖到的区域集合,D为通信范围,如果传感器si可以覆盖区域j,aij=1,否则aij=0;
建立部署位置优化模型,设置目标函数为:在满足数据采集需求的前提下,使用最少的传感器,即,最小化使用的传感器数量,表示为:设置约束条件表示如下:
上述约束条件表示:所有的功能区域都需要被覆盖;每个传感器的能量不能超过其预设的总能量;每个传感器的工作时间不得超过其预设的总工作时间;每一对传感器之间的通信距离不能超过最大通信距离C;只有当传感器si被选中并且至少存在一个其他的传感器sj与si直接通信时,si的数据才能够被收集;xi是一个二元传感器变量,当传感器si被选中时,xi=1,否则xi=0,yij是一个二元变量,当传感器si与sj之间存在直接的通信链路时,yij=1,否则yij=0;
其中,所述的原始数据通过无线网络传输,包括以下步骤:
每个传感器si采集到原始数据di;
在每个传感器si的数据di上添加满足Laplace分布或者高斯分布的噪声ni,得到带噪声的数据d′i=di+ni,对于Laplace分布的噪声,概率密度函数为:
P(x|μ,b)=1/(2b)*exp(-|x-μ|/b);
其中,μ是位置参数,b是尺度参数,在满足ε-差分隐私的情况下,尺度参数b=Δf/ε,其中Δf是函数f在邻近数据库上的敏感度,ε是隐私预算;将带噪声的数据d′i进行同态加密,得到加密数据ci=Enc(d′i);
每个传感器将加密数据ci发送到数据中心;
数据中心收集到所有的加密数据后,在加密数据上进行各种形式的数据融合,设F为融合函数,C为所有加密数据的集合,融合后的加密数据为c′=F(C);数据中心在需要对数据进行深入分析时,使用密钥对融合后的加密数据进行解密,设解密函数为Dec,解密结果为x′=Dec(c′)。
2.根据权利要求1所述的一种大规模无线传感器网络数据融合方法,其特征在于,所述部署位置优化模型的求解的过程包括如下步骤:
步骤101,初始化:将上界UB设置为+∞;将下界LB初始化为无约束问题的最优解;
步骤102,创建搜索树:初始化搜索树的根节点,将整个问题作为根节点的子问题;创建变量集合,包括传感器变量xi和通信变量yij;创建约束条件集合,包括区域覆盖约束、能量约束、工作时间约束、通信限制约束和传感器选择与中介传感器约束,定义目标函数,即最小化传感器数量;
步骤103,选择分支变量:在当前子问题中,选择一个未被分支的变量进行分支,采用启发式方法选择具有最大活动约束数的传感器变量xi进行分支;对于当前的子问题,计算每个传感器变量xi的活动约束数,活动约束数表示该传感器变量在当前子问题中所涉及的约束条件数目;选择具有最大活动约束数的传感器变量xi作为分支变量,这意味着选择具有最大影响力或关联性的传感器变量进行分支,有助于更快地收敛到最优解;如果存在多个传感器变量具有相同的最大活动约束数,使用其预计计算时间最短的变量进行分支;对于每个传感器变量xi,通过累加传感器变量涉及的操作的计算时间来得到预计计算时间;
步骤104,对于选定的分支变量xi,创建两个子问题:子问题一:将xi设置为1,并根据约束条件更新问题;子问题二:将xi设置为0,并根据约束条件更新问题;
步骤105,对于每个子问题,求解混合整数规划问题,得到一个下界LB和一个可行解,如果下界LB大于当前的上界UB,则舍弃该子问题;
步骤106,如果某个子问题的最优解小于当前的上界UB,则更新上界UB为该最优解;
步骤107,对于每个子问题,如果最优解大于当前的上界UB,则舍弃该子问题;步骤108,如果搜索树中的所有子问题都被舍弃,或者搜索树中的所有子问题已经被求解且找到最优解,则终止搜索;
步骤109,如果终止条件不满足,返回步骤103,选择下一个未被分支的变量进行分支操作;
步骤110,返回搜索树中找到的最优传感器选择方案,满足数据采集需求和通信限制,并最小化传感器数量。
3.根据权利要求2所述的一种大规模无线传感器网络数据融合方法,其特征在于,所述的加密的过程中,对于明文x和对应的密文C,加密和解密函数定义如下:
加密函数:Enc(x)=gx*rn(mod n2),其中g和n为公钥,r为随机数;
解密函数:Dec(c)=L(cλmodn2)/L(gλmodn2),其中λ为私钥,L(u)=(u-1)/n。
4.根据权利要求1所述的一种大规模无线传感器网络数据融合方法,其特征在于,所述的数据清洗和转换流程包括以下步骤:
从不同类型的传感器中收集原始数据;
在数据收集完成后清洗数据,包括删除冗余数据、识别并处理缺失值和异常值;异构传感器对齐数据;
对传感器数据进行转换;
最后,将处理好的所有传感器数据进行融合,形成统一的数据格式的数据集。
5.根据权利要求4所述的一种大规模无线传感器网络数据融合方法,其特征在于,所述的统一的数据格式包括以下元素:
时间戳:表示数据采集的时间;
传感器标识:表示数据的来源,即哪一个传感器采集的这份数据;
地点:表示传感器的地理位置;
测量值:表示传感器采集的实际数据;
单位:表示测量值的单位;
数据质量:表示这份数据的质量,是一个信号强度或者其他指标。
6.根据权利要求1所述的一种大规模无线传感器网络数据融合方法,其特征在于,所述的对存储的数据进行关联性分析的步骤如下:
构建时序知识图谱:基于收集到的传感器数据构建时序知识图谱,其中,每个传感器看作是一个实体,每个测量值看作是另一个实体,传感器与测量值之间的“测量”关系,以及测量值与时间戳之间的“发生在”关系,看作是边;
识别关联性:对于任意两个传感器,分析它们在不同时间的测量值,以识别它们之间的关联性,通过计算它们的测量值的相关系数来实现,定义为:
rij=cov(Di,Dj)/(σi*σj);
其中,cov表示协方差,σ表示标准差,Di和Dj表示传感器i和j的测量值序列;
添加关联性边:对于相关系数大于某个阈值的传感器对,在它们之间添加一个关联边,并将相关系数作为关联边的权重;
关联性分析:通过分析属性值和关联性边来找出传感器网络中的重要模式。
7.根据权利要求6所述的一种大规模无线传感器网络数据融合方法,其特征在于,所述的重要模式包括:使用社区检测算法来发现密切关联的传感器群体,或者使用路径分析方法来识别影响某个传感器测量值的关键因素。
8.根据权利要求1所述的一种大规模无线传感器网络数据融合方法,其特征在于,所述的模式挖掘的模式包括:
周期性模式:许多传感器数据会展现出周期性变化,分析步骤:对于某一传感器si,利用傅立叶变换方法,将其测量序列Di转换到频率域,识别主要频率分量,数学公式:其中,N是序列的长度,j从0到N-1,k从0到N-1;
异常模式:传感器数据包含一些异常值,分析步骤:对于某一传感器si,利用统计方法或者机器学习方法,来检测其测量序列Di的异常值;
簇群模式:传感器网络中存在一些密切关联的传感器群体,它们的测量数据具有相似的变化模式;分析步骤:使用聚类算法对所有传感器的测量序列进行聚类,然后识别出簇群。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310991312.2A CN116709392B (zh) | 2023-08-08 | 2023-08-08 | 一种大规模无线传感器网络数据融合方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310991312.2A CN116709392B (zh) | 2023-08-08 | 2023-08-08 | 一种大规模无线传感器网络数据融合方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116709392A CN116709392A (zh) | 2023-09-05 |
CN116709392B true CN116709392B (zh) | 2023-11-14 |
Family
ID=87837953
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310991312.2A Active CN116709392B (zh) | 2023-08-08 | 2023-08-08 | 一种大规模无线传感器网络数据融合方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116709392B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117575123B (zh) * | 2024-01-15 | 2024-03-29 | 成都电科星拓科技有限公司 | 播种路径规划方法、装置、电子设备和可读存储介质 |
Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008131787A1 (en) * | 2007-04-25 | 2008-11-06 | Nec Europe Ltd. | Method for aggregating data in a network |
CN102196429A (zh) * | 2011-04-27 | 2011-09-21 | 暨南大学 | 一种无线传感器网络中加密数据的融合方法 |
CN102299792A (zh) * | 2011-09-30 | 2011-12-28 | 北京理工大学 | 一种安全高效的数据融合方法 |
WO2012143931A2 (en) * | 2011-04-21 | 2012-10-26 | Tata Consultancy Services Limited | A method and system for preserving privacy during data aggregation in a wireless sensor network |
CN103476040A (zh) * | 2013-09-24 | 2013-12-25 | 重庆邮电大学 | 带有隐私保护的分布式压缩感知数据融合方法 |
US9491060B1 (en) * | 2014-06-30 | 2016-11-08 | EMC IP Holding Company LLC | Integrated wireless sensor network (WSN) and massively parallel processing database management system (MPP DBMS) |
CN106255038A (zh) * | 2016-08-04 | 2016-12-21 | 南京邮电大学 | 一种无线传感器网络安全数据融合方法 |
CN109478057A (zh) * | 2016-05-09 | 2019-03-15 | 强力物联网投资组合2016有限公司 | 用于工业物联网的方法和*** |
CN110134675A (zh) * | 2019-05-23 | 2019-08-16 | 大连海事大学 | 一种面向海洋数据流的数据清洗方法和*** |
CN111553469A (zh) * | 2020-05-18 | 2020-08-18 | 国网江苏省电力有限公司电力科学研究院 | 一种无线传感器网络数据融合方法、装置和存储介质 |
CN114071631A (zh) * | 2020-11-10 | 2022-02-18 | 北京市天元网络技术股份有限公司 | 一种分布式传感器网络数据融合方法及*** |
CN114745689A (zh) * | 2022-04-07 | 2022-07-12 | 江西师范大学 | 一种无线传感器网络多时段数据融合方法和*** |
CN115243273A (zh) * | 2022-09-23 | 2022-10-25 | 昆明理工大学 | 一种无线传感器网络覆盖优化方法及装置、设备、介质 |
CN116456296A (zh) * | 2023-04-07 | 2023-07-18 | 南京航空航天大学 | 基于模糊逻辑的异构无线传感器网络数据融合控制方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11599806B2 (en) * | 2020-06-22 | 2023-03-07 | International Business Machines Corporation | Depth-constrained knowledge distillation for inference on encrypted data |
-
2023
- 2023-08-08 CN CN202310991312.2A patent/CN116709392B/zh active Active
Patent Citations (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2008131787A1 (en) * | 2007-04-25 | 2008-11-06 | Nec Europe Ltd. | Method for aggregating data in a network |
WO2012143931A2 (en) * | 2011-04-21 | 2012-10-26 | Tata Consultancy Services Limited | A method and system for preserving privacy during data aggregation in a wireless sensor network |
CN102196429A (zh) * | 2011-04-27 | 2011-09-21 | 暨南大学 | 一种无线传感器网络中加密数据的融合方法 |
CN102299792A (zh) * | 2011-09-30 | 2011-12-28 | 北京理工大学 | 一种安全高效的数据融合方法 |
CN103476040A (zh) * | 2013-09-24 | 2013-12-25 | 重庆邮电大学 | 带有隐私保护的分布式压缩感知数据融合方法 |
US9491060B1 (en) * | 2014-06-30 | 2016-11-08 | EMC IP Holding Company LLC | Integrated wireless sensor network (WSN) and massively parallel processing database management system (MPP DBMS) |
CN109478057A (zh) * | 2016-05-09 | 2019-03-15 | 强力物联网投资组合2016有限公司 | 用于工业物联网的方法和*** |
CN106255038A (zh) * | 2016-08-04 | 2016-12-21 | 南京邮电大学 | 一种无线传感器网络安全数据融合方法 |
CN110134675A (zh) * | 2019-05-23 | 2019-08-16 | 大连海事大学 | 一种面向海洋数据流的数据清洗方法和*** |
CN111553469A (zh) * | 2020-05-18 | 2020-08-18 | 国网江苏省电力有限公司电力科学研究院 | 一种无线传感器网络数据融合方法、装置和存储介质 |
CN114071631A (zh) * | 2020-11-10 | 2022-02-18 | 北京市天元网络技术股份有限公司 | 一种分布式传感器网络数据融合方法及*** |
CN114745689A (zh) * | 2022-04-07 | 2022-07-12 | 江西师范大学 | 一种无线传感器网络多时段数据融合方法和*** |
CN115243273A (zh) * | 2022-09-23 | 2022-10-25 | 昆明理工大学 | 一种无线传感器网络覆盖优化方法及装置、设备、介质 |
CN116456296A (zh) * | 2023-04-07 | 2023-07-18 | 南京航空航天大学 | 基于模糊逻辑的异构无线传感器网络数据融合控制方法 |
Also Published As
Publication number | Publication date |
---|---|
CN116709392A (zh) | 2023-09-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fawzy et al. | Outliers detection and classification in wireless sensor networks | |
JP6184270B2 (ja) | 将来のネットワーク攻撃を検知及び予測するために、様々な指標と過去の攻撃事例を相関させ、攻撃に関する指標のプロファイルを作成するシステム及び方法 | |
Jha et al. | Intrusion detection system using support vector machine | |
CN109887242B (zh) | 向用户终端发送告警信息方法、装置、*** | |
CN116709392B (zh) | 一种大规模无线传感器网络数据融合方法 | |
KR101538709B1 (ko) | 산업제어 네트워크를 위한 비정상 행위 탐지 시스템 및 방법 | |
US20150096026A1 (en) | Cyber security | |
US20090106174A1 (en) | Methods, systems, and computer program products extracting network behavioral metrics and tracking network behavioral changes | |
Yang et al. | Deep network analyzer (DNA): A big data analytics platform for cellular networks | |
Sugiarto et al. | Data classification for air quality on wireless sensor network monitoring system using decision tree algorithm | |
Xie et al. | Histogram-based online anomaly detection in hierarchical wireless sensor networks | |
Coluccia et al. | Distribution-based anomaly detection via generalized likelihood ratio test: A general maximum entropy approach | |
Burgess | Probabilistic anomaly detection in distributed computer networks | |
Iturbe et al. | Towards Large‐Scale, Heterogeneous Anomaly Detection Systems in Industrial Networks: A Survey of Current Trends | |
CN117118849B (zh) | 一种物联网网关***及实现方法 | |
Banik et al. | Anomaly detection techniques in smart grid systems: A review | |
Suthaharan et al. | Sensor data boundary estimation for anomaly detection in wireless sensor networks | |
CN115310499B (zh) | 一种基于数据融合的工业设备故障诊断***及方法 | |
CN116528226A (zh) | 一种基于远程模块无线通信的安全监控方法及*** | |
Shia et al. | High rate outlier detection in wireless sensor networks: a comparative study | |
Leyba et al. | Cutting through the noise to infer autonomous system topology | |
Hoang | A Study on Anomaly Data Traffic Detection Method for Wireless Sensor Networks | |
Kumar | A Big Data Analytical Framework for Intrusion Detection Based On Novel Elephant Herding Optimized Finite Dirichlet Mixture Models | |
Chitradevi et al. | Efficient density based techniques for anomalous data detection in wireless sensor networks | |
Mulinka et al. | HUMAN-Hierarchical Clustering for Unsupervised Anomaly Detection & Interpretation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
PE01 | Entry into force of the registration of the contract for pledge of patent right |
Denomination of invention: A Large scale Wireless Sensor Network Data Fusion Method Granted publication date: 20231114 Pledgee: Changsha Lixiang Road Sub Branch of China Everbright Bank Co.,Ltd. Pledgor: HUNAN TIANLIAN CITY DATA CONTROL Co.,Ltd. Registration number: Y2024980019060 |
|
PE01 | Entry into force of the registration of the contract for pledge of patent right |