CN104394580A - 基于模式统计的时间冗余数据消除方法 - Google Patents

基于模式统计的时间冗余数据消除方法 Download PDF

Info

Publication number
CN104394580A
CN104394580A CN201410366167.XA CN201410366167A CN104394580A CN 104394580 A CN104394580 A CN 104394580A CN 201410366167 A CN201410366167 A CN 201410366167A CN 104394580 A CN104394580 A CN 104394580A
Authority
CN
China
Prior art keywords
forecast model
slope
sigma
data
model
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201410366167.XA
Other languages
English (en)
Other versions
CN104394580B (zh
Inventor
罗娟
宋艳超
贺赞贻
金鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hunan University
Original Assignee
Hunan University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hunan University filed Critical Hunan University
Priority to CN201410366167.XA priority Critical patent/CN104394580B/zh
Publication of CN104394580A publication Critical patent/CN104394580A/zh
Application granted granted Critical
Publication of CN104394580B publication Critical patent/CN104394580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W52/00Power management, e.g. TPC [Transmission Power Control], power saving or power classes
    • H04W52/02Power saving arrangements
    • H04W52/0209Power saving arrangements in terminal devices
    • H04W52/0251Power saving arrangements in terminal devices using monitoring of local events, e.g. events related to user activity
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W28/00Network traffic management; Network resource management
    • H04W28/02Traffic management, e.g. flow control or congestion control
    • H04W28/08Load balancing or load distribution
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于模式统计的时间冗余数据消除方法。本发明设计一种基于周期相关性和线性相关性的时间冗余数据消除方法,该方法利用物理现象中经常出现的周期相关性和线性相关性,通过分析传感节点采集的物理数据,统计得到物理现象的变化模式,以及每种变化模式的出现概率,然后利用得到的统计信息,来对未来的数据进行预测,进而抑制可预测数据的发送,以消除时间冗余数据,减少传感节点发送的数据量,降低发送频次,达到节省节点能量,降低网络负载,延长网络生存期的目的。本发明所采用的技术方案是:基于模式统计的时间冗余数据消除方法,该方法包括双预测模型冗余消除框架,基于最小二乘法的预测模型选择算法和基于模式统计的预测模型选择算法等三部分。

Description

基于模式统计的时间冗余数据消除方法
技术领域
本发明通常涉及无线传感器能量节省和冗余消除等领域,具体是指基于模式统计的时间冗余数据消除方法。 
背景技术
无线传感器网络被广泛的应用于气候及环境监测等应用。这些应用中,传感节点一般依赖电池供电且很难二次供电,并被随机的部署在无人值守的观测区域,周期性的采集数据,并将数据以无线的形式发送给Sink节点。依赖电池供电这一特征,导致了传感节点的能量非常有限。通信开销则是节点能量消耗的主要因素,例如TelosB节点,发送和接收的能量消耗分别是每比特720nJ和810nJ,而其每比特的运算开销是1.2nJ。但是,在环境监测中,物理现象的连续性导致单个节点采集的数据在一定时间范围内存在很高的时间相关性。例如采集的数据相似或者具有某种线性增长趋势,以至于我们可以利用节点的历史信息预测得到未来一段时间内的采集值。发送这些可预测的数据(我们称为时间冗余数据),显然会导致能量的极大浪费。因此如何利用物理现象的局部线性相关性,来减少数据的发送量,对于节省传感节点的能量,提高能量的使用效率,延长网络的生存期有着重要的影响。 
发明内容
本发明要解决的技术问题是,提供一种基于模式统计的冗余消除方法的设计和实现。该方法通过设计一种通用的基于双预测模型的冗余消除框架,来提供一种减少数据发送量,降低节点能耗的机制,然后提出两种不同的预 测模型选择算法,以提高预测模型的预测准确率,延长预测模型的持续时间,以尽可能多的消除冗余数据,减少数据的发送量。 
为了实现上述技术目的,本发明的技术方案是,一种基于模式统计的时间冗余数据消除方法,包括以下步骤: 
步骤一:在Sink节点和传感节点分别预设一个相同的预测模型,在初始时,Sink节点初始化缓存并将预测模型初始化为预设的模型,传感节点将预测模型初始化为预设的模型; 
步骤二:传感节点周期性采集数据,并计算采集数据与通过预测模型预测得到的数据的误差,如果误差小于预定义的误差,则不向Sink节点发送实际值,Sink节点通过自身所储存的预测模型得到预测数据,并作为采集数据发送至用户;否则传感节点将采集数据发送至Sink节点,Sink节点将收到的传感节点的采集数据发送至用户;若Sink节点连续m次接收到传感节点的采集数据,则进入步骤三; 
步骤三:Sink节点对预测模型进行更新,利用传感节点所采集的物理数据在一段时间内呈现线性变化的特点,并利用周期性现象计算各种线性模式的出现概率,选择能够拟合最近接收的m个采集数据,且出现概率最大的线性函数作为新的预测模型,否则通过最小二乘法,对最近接收的m个采集数据进行线性拟合,并并将此线性函数作为新的预测模型; 
步骤四:Sink节点将新的预测模型发送至传感节点,并返回步骤二直至采集过程结束。 
所述的方法,步骤三中所述的通过最小二乘法对数据进行拟合的步骤为: 
将Sink节点所收到最新的m个实际的采集数据S={(t1,d1),(t2,d2),…,(tm,dm)}视为平面中的m个点,其中di为m个采集值中 第i个被采集的数据,ti为采集di的时间;并使用一条直线d=α*t+β对这m个点进行拟合,则(α,β)应使最小均方差最小,即使得下式 
s ( a , β ) = Σ i = 1 m ( d i - a - βt i ) 2
取得极小值,故(α,β)应满足式(1) 
∂ s ∂ a = - 2 Σ i = 1 m ( d i - a - βt i ) = 0 ∂ s ∂ β = - 2 Σ i = 1 m ( d i - a - βt i ) t i = 0 - - - ( 1 )
根据式(1)则求得 
a = m Σ i = 1 m t i d i - Σ i = 1 m t i Σ i = 1 m d i m Σ i = 1 m t i 2 - ( Σ i = 1 m t i ) 2 β = Σ i = 1 m t i 2 Σ i = 1 m d i - Σ i = 1 m t i Σ i = 1 m t i d i m Σ i = 1 m t i 2 - ( Σ i = 1 m t i ) 2 - - - ( 2 )
由此得到预测模型M(α,β),其中α,β分别是拟合直线的斜率和截距。 
所述的方法,步骤三中所述的利用周期性现象计算各种线性模式的出现概率,出现概率使用加权频率表示,加权频率越大,则出现概率越高,加权频率越小,则出现概率越低,加权频率计算方法如下: 
设传感节点所使用的所有预测模型的斜率按时间顺序构成了模式序列(α12,…,αn),其中αi是整个采集过程中使用的第i个预测模型的斜率;每种预测模型的持续时间按时间顺序构成了持续时间序列(T1,T2,…,Tn),其中Ti是整个采集过程中使用的第i个预测模型预测的持续时间;线性模式α在i时刻的加权频率f计算方法如下: 
f a ( i ) = r * f a ( i - 1 ) + T i a = a i r * f a ( i - 1 ) a ≠ a i - - - ( 3 )
其中f(0)=0,r为衰老因子(0<r<1)。 
所述的方法,步骤三中所述的选择能够拟合最近接收的m个采集数据且出现概率最大的线性函数作为新的预测模型,其步骤为: 
当Sink节点接收到某个传感节点的m个连续的采集值后,记失效的预测模型为M(αprepre);指定的预测误差为e;m个采集值为D={(t1,d1),(t2,d2),…,(tm,dm)},其中di为m个采集值中第i个被采集的数据,ti为采集di的时间;此时预测模型的斜率构成模式序列A={α12,…,αn},其中αi是整个采集过程中使用的第i个预测模型的斜率;根据权利要求2中所述方法计算得到的结果为(αlsls),其中αlsls其中分别是权利要求2中拟合结果的斜率和截距; 
则模型选择过程如下: 
步骤1:首先检查模式序列A中是否存在能够拟合D的斜率,即斜率是否满足下式(4),如果存在则转步骤2,否则转步骤5; 
- e < d 1 - a - &beta;t 1 < e - e < d 2 - a - &beta;t 2 < e . . . . . . . - e < d m - a - &beta;t m < e a &Element; ( a ls , a pre ) or a &Element; ( a pre , a ls ) - - - ( 4 )
步骤2:假设满足式(4)的斜率集为Af={αi1i2,…,αik},根据权利要求3中计算加权频率的方法分别计算此时Af中每种斜率的加权频率,选择其中加权频率最大的斜率α作为新预测模型的斜率; 
步骤3:根据斜率α从式(4)中解得截距lower<β<upper,为了使得拟合误差最小,选择(lower+upper)/2作为预测模型的截距; 
步骤4:将α加入模式序列A,令M=(α,(lower+upper)/2),转步骤6; 
步骤5:将αls加入模式序列A,并令M=(αlsls); 
步骤6:将M作为新预测模型。 
所述的方法,m的取值为3-7。 
本发明提出了一种基于模式统计(Pattern-Statistic-Based PSB)的时间冗余数据消除方法,来更大程度的消除无线传感器网络中的时间冗余数据。目前已有的时间冗余消除算法仅仅利用了时间序列的局部线性相关性来达到冗余消除的目的。而很多环境数据还存在周期相关性,例如某一物理现象在相邻的时间内可能再次出现。在夏天,某天8:00到9:00,气温以每分钟0.1度的线性模式进行变化,那么在第二天也很有可能在某一时间段以相同的线性模式变化。利用物理现象的这种周期相关性,通过统计各种线性模式出现的次数,时间以及持续时间,我们可以得到每种线性模式在未来出现的可能性。当预测模型失效后,我们可以利用统计信息,基于少量的实测值,选择出现可能性较大的线性模式,来对未来数据进行预测。相对于传统的基于线性相关性的冗余消除算法,提高预测的精度和持续时间,减少预测模型的更新频率,进而降低了节点的能量消耗和网络负载,延长了网络生存期。 
有益效果 
基于模式统计的时间冗余消除方法,综合利用物理现象的周期相关和线性相关特性,基于节点采集的历史信息,统计各种线性模式在未来出现的概率,并使用这种概率指导预测模型的选择,提高了预测模型的预测准确度和预测精度。然后结合双预测机制,达到消除时间冗余数据的目的,有效的减少了节点的发包频率,降低了网络负载,延长了网络生存期,相比于仅利用 线性相关特性的相关方法,在预测精度、预测准确度和数据包减少量等方面具有明显的优势。 
下面结合附图对本发明作进一步说明。 
附图说明
图1是本发明中Sink节点的工作流程; 
图2是本发明中传感节点的工作流程。 
具体实施方式
本发明采用了基于双预测模型的冗余消除框架设计: 
由于物理现象一般在短期内呈现象变化,因此,我们采用线性预测模型M(α,β),来对数据进行预测。它允许Sink节点采用分段线性函数的方法来近似的重构真实数据。对于给定时刻t,可以通过dp=α*t+β很容易的计算得到预测值。当预测误差Δ小于误差阈值e时,传感节点抑制本次数据发送,从而减少了一次通信。当预测误差Δ大于e时,则将实测值发送给sink节点。如果在连续m次预测失败,则需要根据采集的实际值,更新模型M(α,β),并将其发送给Sink节点(或传感器节点),保持两端预测模型的同步。其中模型的计算更新工作,可以由Sink节点完成,也可以由传感器节点完成,本方法使用Sink节点完成此工作,Sink节点和传感节点的工作流程如图1图2所示。 
Sink节点和传感节点协同工作,共同完成对时间冗余数据的消除,构成了一个完整的冗余消除方法。 
本发明基于最小二乘法的模型选择方法为: 
当Sink节点的接收缓存满的时候,说明之前的模型已经失效,并接收到 了连续m个实际的采集数据。这m个采集数据构成了一个时间序列中,即S={(t1,d1),(t2,d2),…,(tm,dm)}。为了从这m个采集数据中计算得到一个线性预测模型,LS(即最小二乘法)将这m个采集值视为平面中的m个点,并使用一条直线对这m个点进行拟合。为了使拟合的误差最小,LS要求拟合结果的残差平方和最小。设采集数据d与采集时间t成线性关系,即dp=α*t+β。现在已知S的情况下,求两个未知参数(α,β)。由最小二乘法原理,参数(α,β)应使 
s ( a , &beta; ) = &Sigma; i = 1 m ( d i - a - &beta;t i ) 2
取得极小值。根据极小值的计算方法,(α,β)应满足式(1) 
&PartialD; s &PartialD; a = - 2 &Sigma; i = 1 m ( d i - a - &beta;t i ) = 0 &PartialD; s &PartialD; &beta; = - 2 &Sigma; i = 1 m ( d i - a - &beta;t i ) t i = 0 - - - ( 1 )
式(1)上式构成了关于(α,β)二元方程中。从中可以解得(α,β),如式(2)所示。 
a = m &Sigma; i = 1 m t i d i - &Sigma; i = 1 m t i &Sigma; i = 1 m d i m &Sigma; i = 1 m t i 2 - ( &Sigma; i = 1 m t i ) 2 &beta; = &Sigma; i = 1 m t i 2 &Sigma; i = 1 m d i - &Sigma; i = 1 m t i &Sigma; i = 1 m t i d i m &Sigma; i = 1 m t i 2 - ( &Sigma; i = 1 m t i ) 2 - - - ( 2 )
利用式(2),并根据Sink节点可以很容易的计算得到新的线性预测模型M(α,β)。 
本发明基于模式统计的模型选择方法: 
对于小范围内的时间序列数据,可能存在多种线性拟合结果,LS的拟合结果仅仅使这一小范围残差平方和最小,但并不一定能够很好的用于数据预 测。对于Intel Berkeley Lab数据集中的31号节点,使用LS拟合其采集的第10-30个数据,拟合误差较小。但是对于接下来第30-60个数据的预测误差就很大。而对于另外一种拟合,在10-30之间的拟合误差虽然不是最小的,但误差仍然在e内,并且能够很好的预测30-60之间的数据。 
为了获得更好的预测模型,我们分析发现基于线性预测的双预测机制中,随着时间的演化,传感节点使用过的所有的线性预测模型的斜率α构成了一个模式序列,在这个序列中,存在很多重复的模式。重复的模式就代表了一种重复的自然现象,从中我们可以看到,温度呈现一种大致的周期现象。并且最近多次出现的变化模式,在未来的一段时间内很可能再次出现。基于这一现象,我们根据预测模型的斜率构成的模式序列,综合考虑每种斜率的出现次数、出现时间、每次的持续时间,计算各种斜率在未来出现的可能性。本文使用加权频率f来描述这种可能性。当选择新的预测模型时,首先查看曾经出现过的线性模式是否存在能够拟合已知数据;如果存在这样的线性模式,则选择其中加权频率最高的作为新模型。否则采用最小二乘法拟合已知数据来获得新模型。 
上文中所提及的加权频率为:假设传感节点所使用的预测模型的斜率按时间顺序构成了模式序列(α12,…,αn),每种预测模型的持续时间按时间顺序构成了持续时间序列(T1,T2,…,Tn),线性模式α在i时刻的加权频率f定义如下: 
f a ( i ) = r * f a ( i - 1 ) + T i a = a i r * f a ( i - 1 ) a &NotEqual; a i - - - ( 3 )
其中f(0)=0。r为衰老因子(0<r<1)。上述定义综合考虑了斜率的出现次数,出现时间,和每次的持续时间,使得最近出现的、持续时间长的、多 次出现的斜率的权值较大,较好的符合了自然现象的变化模式。 
当Sink节点接收到某个传感节点的m个连续的采集值后,说明已有的线性预测模型已经失效,我们记失效的预测模型为M(αprepre),m个采集值为D={(t1,d1),(t2,d2),…,(tm,dm)},此时预测模型的斜率构成模式序列A={α12,…,αn},则模型选择过程如下: 
(1)首先检查模式序列A中是否存在能够拟合D的斜率,即斜率是否满足式(4),如果存在则转(2),否则转(5); 
(2)假设满足式(4)的斜率集为{αi1i2,…,αik},分别计算此时他们的加权频率f。选择其中加权频率最大的斜率α作为新预测模型的斜率; 
(3)根据斜率α从式(4)中解得截距lower<β<upper,为了使得拟合误差最小,选择(lower+upper)/2作为预测模型的截距; 
(4)将α加入模式序列A,令M=(α,(lower+upper)/2),转(6); 
(5)根据D,采用LS得到M(αlsls),将αls加入模式序列A,并令M=(αlsls); 
(6)将M作为新预测模型,并返回。 
- e < d 1 - a - &beta;t 1 < e - e < d 2 - a - &beta;t 2 < e . . . . . . . - e < d m - a - &beta;t m < e a &Element; ( a ls , a pre ) or a &Element; ( a pre , a ls ) - - - ( 4 ) 以上的过程在m较小的时候会产生一些问题。当m较小时,采集的数据间变化不大,其中的最大值和最小值之差小于误差阈值e,这样就使得任何一个斜率都能够拟合这m个已知数据。这会导致如下现象:在***初始阶段,不存在任何已知的斜率,此时我们使用最小二乘法计算得到预测模型M(α11);经过一段时间后,M(α11)失效,我们根据采集的m个值重新选择预测模型,由于m较小,那么α1就能够拟合这m个数据,因 此我们计算的到新预测模型M(α12);接着,第三次更新模型时得到预测模型M(α13),……,如此不断重复,预测模型的斜率始终是α1。这也就是 
说所观测的物理量始终以斜率α1进行变化,这是不符合实际的。 
为了解决以上问题,考虑到自然现象的渐变特性,我们认为线性模式的变化也应在一个合理的范围内。即新预测模型的斜率,应该在前一个预测模型的斜率的临近范围之内。同时LS拟合的结果(αlsls)代表了真实数据的一种趋势,因此新的预测模型的斜率也应该在αls的附近。为此我们限定新的预测模型的斜率在αpre和αls之间,由此得到式(5)。 
- e < d 1 - a - &beta;t 1 < e - e < d 2 - a - &beta;t 2 < e . . . . . . . - e < d m - a - &beta;t m < e a &Element; ( a ls , a pre ) or a &Element; ( a pre , a ls ) - - - ( 5 )
当我们检查模式序列中是否存在斜率能够拟合已知数据时,我们选择式(5)作为验证条件,而非式(4),这样就有效的消除了以上的现象。 
本发明的核心在于通过双预测框架抑制可预测数据的发送,并综合利用物理现象的周期性和局部线性变化特征,计算节点数据的预测模型,提高数据的预测准确度和预测精度,降低节点的数据的发送量: 
1)双预测框架主要维持传感节点和Sink节点预测模型的同步。其特征是在传感节点和Sink节点(或数据中心),维持相同的预测模型,对未来数据进行同步预测。传感节点周期性采集数据,并计算采集数据和预测数据的误差,如果误差小于预定义的误差,则不发送实际值,Sink节点通过预测模型预测得到采集数据。如果大于误差,则将采集值发送给Sink节点,Sink节点接收到到采集数据。Sink节点在连续多次接收到传感节点的采集数据时,说明预 测模型多次预测失败,此时Sink节点根据接收到的历史数据,重新计算得到预测模型,并将预测模型发送给传感节点,保持两端预测模型的同步。双预测框架中传感节点和Sink节点的工作流程如图所示。 
2)预测模型选择:在过程1中,当Sink节点接收到某个传感节点的m个连续的采集值后,说明已有的线性预测模型已经失效,我们记失效的预测模型为M(αprepre),m个采集值为D={(t1,d1),(t2,d2),…,(tm,dm)},此时预测模型的斜率构成模式序列A={α12,…,αn},利用最小二乘法对m个采集值的拟合结果为(αlsls),则模型选择过程如下: 
(1)首先检查模式序列A中是否存在能够拟合D的斜率,即斜率是否满足式(4),如果存在则转(2),否则转(5); 
(2)假设满足式(4)的斜率集为{αi1i2,…,αik},分别计算此时他们的加权频率f。选择其中加权频率最大的斜率α作为新预测模型的斜率; 
(3)根据斜率α从式(4)中解得截距lower<β<upper,为了使得拟合误差最小,选择(lower+upper)/2作为预测模型的截距; 
(4)将α加入模式序列A,令M=(α,(lower+upper)/2),转(6); 
(5)根据D,采用LS得到M(αlsls),将αls加入模式序列A,并令M=(αlsls); 
(6)将M作为新预测模型,并返回。 
- e < d 1 - a - &beta;t 1 < e - e < d 2 - a - &beta;t 2 < e . . . . . . . - e < d m - a - &beta;t m < e a &Element; ( a ls , a pre ) or a &Element; ( a pre , a ls ) - - - ( 5 )
图1图2为传感节点和Sink节点的工作流程。传感节点周期性采集数 据,并计算采集数据和预测数据的误差,如果误差小于预定义的误差,则不发送实际值,Sink节点通过预测模型预测得到采集数据。如果大于误差,则将采集值发送给Sink节点,Sink节点接收到到采集数据。Sink节点周期性检测是否接收到传感节点的采集值,如果未收到,则使用预测模型预测得到采集值并返回给用户;如果收到采集值,则将接收到的采集值返回给用户。如果连续多次接收到传感节点的采集数据时,根据本文中提出的预测模型选择方法,重新计算得到预测模型,并将预测模型发送给传感节点,保持两端预测模型的同步。 

Claims (5)

1.一种基于模式统计的时间冗余数据消除方法,其特征在于,包括以下步骤:
步骤一:在Sink节点和传感节点分别预设一个相同的预测模型,在初始时,Sink节点初始化缓存并将预测模型初始化为预设的模型,传感节点将预测模型初始化为预设的模型;
步骤二:传感节点周期性采集数据,并计算采集数据与通过预测模型预测得到的数据的误差,如果误差小于预定义的误差,则不向Sink节点发送实际值,Sink节点通过自身所储存的预测模型得到预测数据,并作为采集数据发送至用户;否则传感节点将采集数据发送至Sink节点,Sink节点将收到的传感节点的采集数据发送至用户;若Sink节点连续m次接收到传感节点的采集数据,则进入步骤三;
步骤三:Sink节点对预测模型进行更新,利用传感节点所采集的物理数据在一段时间内呈现线性变化的特点,并利用周期性现象计算各种线性模式的出现概率,选择能够拟合最近接收的m个采集数据,且出现概率最大的线性函数作为新的预测模型,否则通过最小二乘法,对最近接收的m个采集数据进行线性拟合,并并将此线性函数作为新的预测模型;
步骤四:Sink节点将新的预测模型发送至传感节点,并返回步骤二直至采集过程结束。
2.根据权利要求1所述的方法,其特征在于,步骤三中所述的通过最小二乘法对数据进行拟合的步骤为:
将Sink节点所收到最新的m个实际的采集数据S={(t1,d1),(t2,d2),…,(tm,dm)}视为平面中的m个点,其中di为m个采集值中第i个被采集的数据,ti为采集di的时间;并使用一条直线d=α*t+β对这m个点进行拟合,则(α,β)应使最小均方差最小,即使得下式
s ( a , &beta; ) = &Sigma; i = 1 m ( d i - a - &beta;t i ) 2
取得极小值,故(α,β)应满足式(1)
&PartialD; s &PartialD; a = - 2 &Sigma; i = 1 m ( d i - a - &beta;t i ) = 0 &PartialD; s &PartialD; &beta; = - 2 &Sigma; i = 1 m ( d i - a - &beta;t i ) t i = 0 - - - ( 1 )
根据式(1)则求得
a = m &Sigma; i = 1 m t i d i - &Sigma; i = 1 m t i &Sigma; i = 1 m d i m &Sigma; i = 1 m t i 2 - ( &Sigma; i = 1 m t i ) 2 &beta; = &Sigma; i = 1 m t i 2 &Sigma; i = 1 m d i - &Sigma; i = 1 m t i &Sigma; i = 1 m t i d i m &Sigma; i = 1 m t i 2 - ( &Sigma; i = 1 m t i ) 2 - - - ( 2 )
由此得到预测模型M(α,β),其中α,β分别是拟合直线的斜率和截距。
3.根据权利要求1所述的方法,其特征在于,步骤三中所述的利用周期性现象计算各种线性模式的出现概率,出现概率使用加权频率表示,加权频率越大,则出现概率越高,加权频率越小,则出现概率越低,加权频率计算方法如下:
设传感节点所使用的所有预测模型的斜率按时间顺序构成了模式序列(α12,…,αn),其中αi是整个采集过程中使用的第i个预测模型的斜率;每种预测模型的持续时间按时间顺序构成了持续时间序列(T1,T2,…,Tn),其中Ti是整个采集过程中使用的第i个预测模型预测的持续时间;线性模式α在i时刻的加权频率f计算方法如下:
f a ( i ) = r * f a ( i - 1 ) + T i a = a i r * f a ( i - 1 ) a &NotEqual; a i - - - ( 3 )
其中f(0)=0,r为衰老因子(0<r<1)。
4.根据权利要求1所述的方法,其特征在于,步骤三中所述的选择能够拟合最近接收的m个采集数据且出现概率最大的线性函数作为新的预测模型,其步骤为:
当Sink节点接收到某个传感节点的m个连续的采集值后,记失效的预测模型为M(αprepre);指定的预测误差为e;m个采集值为D={(t1,d1),(t2,d2),…,(tm,dm)},其中di为m个采集值中第i个被采集的数据,ti为采集di的时间;此时预测模型的斜率构成模式序列A={α12,…,αn},其中αi是整个采集过程中使用的第i个预测模型的斜率;根据权利要求2中所述方法计算得到的结果为(αlsls),其中αlsls其中分别是权利要求2中拟合结果的斜率和截距;
则模型选择过程如下:
步骤1:首先检查模式序列A中是否存在能够拟合D的斜率,即斜率是否满足下式(4),如果存在则转步骤2,否则转步骤5;
- e < d 1 - a - &beta;t 1 < e - e < d 2 - a - &beta;t 2 < e . . . . . . . - e < d m - a - &beta;t m < e a &Element; ( a 1 s , a pre ) or a &Element; ( a pre , a ls ) - - - ( 4 )
步骤2:假设满足式(4)的斜率集为Af={αi1i2,…,αik},根据权力要求3中计算加权频率的方法分别计算此时Af中每种斜率的加权频率,选择其中加权频率最大的斜率α作为新预测模型的斜率;
步骤3:根据斜率α从式(4)中解得截距lower<β<upper,为了使得拟合误差最小,选择(lower+upper)/2作为预测模型的截距;
步骤4:将α加入模式序列A,令M=(α,(lower+upper)/2),转步骤6;
步骤5:将αls加入模式序列A,并令M=(αlsls);
步骤6:将M作为新预测模型。
5.根据权利要求1所述的方法,其特征在于,m的取值为3-7。
CN201410366167.XA 2014-07-29 2014-07-29 基于模式统计的时间冗余数据消除方法 Active CN104394580B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201410366167.XA CN104394580B (zh) 2014-07-29 2014-07-29 基于模式统计的时间冗余数据消除方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201410366167.XA CN104394580B (zh) 2014-07-29 2014-07-29 基于模式统计的时间冗余数据消除方法

Publications (2)

Publication Number Publication Date
CN104394580A true CN104394580A (zh) 2015-03-04
CN104394580B CN104394580B (zh) 2019-01-04

Family

ID=52612397

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410366167.XA Active CN104394580B (zh) 2014-07-29 2014-07-29 基于模式统计的时间冗余数据消除方法

Country Status (1)

Country Link
CN (1) CN104394580B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104955068A (zh) * 2015-06-18 2015-09-30 湖南大学 一种基于关联模式的数据聚合传输方法
CN114761760A (zh) * 2019-12-09 2022-07-15 恩德莱斯和豪瑟尔欧洲两合公司 用于优化现场设备的测量速率的方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101511099A (zh) * 2009-04-01 2009-08-19 南京邮电大学 基于时间序列预测模型的无线传感器网络数据采集方法
CN101765226A (zh) * 2008-12-25 2010-06-30 财团法人工业技术研究院 无线传感器网络与其数据感测方法
US20130282149A1 (en) * 2012-04-03 2013-10-24 Accenture Global Services Limited Adaptive sensor data selection and sampling based on current and future context
CN103581939A (zh) * 2012-07-27 2014-02-12 诺基亚公司 用于参与式感知数据采集的方法和设备

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101765226A (zh) * 2008-12-25 2010-06-30 财团法人工业技术研究院 无线传感器网络与其数据感测方法
CN101511099A (zh) * 2009-04-01 2009-08-19 南京邮电大学 基于时间序列预测模型的无线传感器网络数据采集方法
US20130282149A1 (en) * 2012-04-03 2013-10-24 Accenture Global Services Limited Adaptive sensor data selection and sampling based on current and future context
CN103581939A (zh) * 2012-07-27 2014-02-12 诺基亚公司 用于参与式感知数据采集的方法和设备

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
T.B.MATOS,A.BRAYNER AND J.E.B.MAIA: "towards in-network data prediction in wireless sensor networks", 《PROCEEDINGS OF THE 2010 ACM SYMPOSIUM ON APPLIED COMPUTING》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104955068A (zh) * 2015-06-18 2015-09-30 湖南大学 一种基于关联模式的数据聚合传输方法
CN104955068B (zh) * 2015-06-18 2018-04-13 湖南大学 一种基于关联模式的数据聚合传输方法
CN114761760A (zh) * 2019-12-09 2022-07-15 恩德莱斯和豪瑟尔欧洲两合公司 用于优化现场设备的测量速率的方法

Also Published As

Publication number Publication date
CN104394580B (zh) 2019-01-04

Similar Documents

Publication Publication Date Title
Tayeh et al. A distributed real-time data prediction and adaptive sensing approach for wireless sensor networks
CN101511099B (zh) 基于时间序列预测模型的无线传感器网络数据采集方法
Lu et al. Optimized data aggregation in wsns using adaptive arma
CN101848529B (zh) 一种无线传感器网络的多重主成分分析数据压缩方法
CN101267446A (zh) 无线传感器网络的时域数据融合方法
CN109525956A (zh) 无线传感网中基于数据驱动的分簇的节能的数据收集方法
CN104507096B (zh) 无线传感网中模型驱动的数据传输方法及***
CN112954707B (zh) 基站的节能方法、装置、基站和计算机可读存储介质
Zhang et al. Cooperative data reduction in wireless sensor network
CN102185731B (zh) 网络健康度测试方法及***
CN105120477A (zh) 一种移动网络优化方法及***
CN103957582A (zh) 无线传感器网络自适应压缩方法
CN105050095A (zh) 一种基于能量预测的异构无线传感网的拓扑构建方法
CN104168131A (zh) 一种基于组播通信的电力调度交换网的流量生成方法
CN104394580A (zh) 基于模式统计的时间冗余数据消除方法
Wang et al. An ecologically oriented operation strategy for a multi-reservoir system: A case study of the middle and lower Han River Basin, China
Yuan et al. An adaptive and compressive data gathering scheme in vehicular sensor networks
Choi et al. Regional clustering scheme in densely deployed wireless sensor networks for weather monitoring systems
Yang Data aggregation algorithm for wireless sensor network based on time prediction
Yang et al. Probabilistic short-term wind power forecast using componential sparse Bayesian learning
CN104812036A (zh) 一种能量获取传感器网络的休眠调度方法和***
CN103037422A (zh) 移动自组网的动态自适应业务恢复方法及装置
CN113783179B (zh) 一种电网负荷预测及优化方法
CN103544362A (zh) 一种基于二维曲线预测的谐波中长期预测方法
CN103581048A (zh) 一种电力通信网络的分布式资源过载控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant