CN111654874A - 一种无线传感网异常检测方法 - Google Patents

一种无线传感网异常检测方法 Download PDF

Info

Publication number
CN111654874A
CN111654874A CN202010497988.2A CN202010497988A CN111654874A CN 111654874 A CN111654874 A CN 111654874A CN 202010497988 A CN202010497988 A CN 202010497988A CN 111654874 A CN111654874 A CN 111654874A
Authority
CN
China
Prior art keywords
data
data set
sensor network
wireless sensor
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010497988.2A
Other languages
English (en)
Other versions
CN111654874B (zh
Inventor
屈洪春
姜振凤
贾丽娜
曹旨昊
徐丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zaozhuang University
Original Assignee
Zaozhuang University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zaozhuang University filed Critical Zaozhuang University
Priority to CN202010497988.2A priority Critical patent/CN111654874B/zh
Priority to PCT/CN2020/108778 priority patent/WO2021243848A1/zh
Publication of CN111654874A publication Critical patent/CN111654874A/zh
Application granted granted Critical
Publication of CN111654874B publication Critical patent/CN111654874B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/02Arrangements for optimising operational condition
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W24/00Supervisory, monitoring or testing arrangements
    • H04W24/06Testing, supervising or monitoring using simulated traffic
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W84/00Network topologies
    • H04W84/18Self-organising networks, e.g. ad-hoc networks or sensor networks
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Testing And Monitoring For Control Systems (AREA)

Abstract

本发明公开一种无线传感器网异常检测方法,本方法基于融合理论,融合模糊孪生支持向量机和自适应迭代寻优的无线传感网异常检测***,主要目的是解决当前无线传感网异常检测效率不高、精度不高、泛化能力较弱的问题。该***经过测试,展示出强大的检测能力、更高的分类准确率和更广泛的应用场景,其泛化能力较强,可广泛的应用于诸多无线传感网络异常检测环境中,更提高了检测的准确性和高效性。

Description

一种无线传感网异常检测方法
技术领域
本发明涉及一种融合模糊孪生支持向量机和自适应迭代寻优的无线传感网异常检测方法,属于传感器网数据处理技术领域。
背景技术
无线传感网络(Wireless Sensor Networks,WSN)是一种分布式传感网络,它的末梢是可以感知和检查外部世界的传感器。无线传感网部署方便、价格低廉、可以大规模自组织网络,并且传感器具备微型化、智能化、多功能化等特点。因此无线传感网被广泛应用于农业生产、环境检测、智能交通、智能家居等领域。例如在农业生产过程中,通过建立WSN农业环境自动检测***,实时采集和控制大棚种植室内及土壤的温度、湿度,光照强度,珍贵经济作物的生长规律等影响农作物生长的因素,可以有效的提高农业集约化生产程度,提高农业生产种植的科学性。为了及时的监测出各种可能发生的突发事件(森林火灾、交通堵塞、室内空气污染),必须准确、迅速的判断出传感器采集到的异常数据,这对于应对突发事件,迅速采取有效措施,这对于避免事件的发生或者降低影响具有十分重要的意义。
近年来,在学术以及工业等领域的共同推进下,无线传感网络异常检测领域取得了许多成果。目前主要的无线传感网络异常检测方法和***如下:
一种是基于人工免疫和K均值聚类的无线传感网异常检测方法。该方法将传感网监测节点采集到的数据进行压缩存储,然后采取K均值聚类的方法,将正常数据和异常数据聚集到不同的类簇,从而完成异常数据检测。
另一种方法是基于变宽直方图的全局异常数据的检测方法,它将动态感知数据以数据融合的方式聚合成为变宽的直方图并执行检测过程。
但是,上述利用人工免疫和K均值聚类的方法,缺点在于对监测数据进行压缩存储时,若数据没有呈现一定的规律性,并不能有效的节约资源和提高检测效率;并且单纯的利用传统的K均值聚类方法也不能有效的提高监测精度。另一种基于变宽直方图的全局异常数据的检测方法并没有有效的提升异常数据监测精度。当前无线传感网异常检测存在效率不高、精度不高、泛化能力较弱的问题。
技术方案
为了解决现有技术存在的问题,本发明提出了一种无线传感网异常检测方法,融合模糊孪生支持向量机和自适应迭代寻优,解决当前无线传感网异常检测效率不高、精度不高、泛化能力较弱的问题。
为了解决所述技术问题,本发明采用的技术方案是:1、一种无线传感网异常检测方法,其特征在于:包括以下步骤;
S1、传感器监测节点实时汇集来自各个传感器监测的数据,形式原始数据集x={x1,x2,...,xi,...,xn},xi∈Rn,i=1,2,...,n,xi表示传感器采集的数据,并以无线通信的方式进行传输和存储;
S2、对传感器采集到的数据集进行数据预处理,所述数据预处理包括数据归一化处理、类不平衡处理以及训练数据集、检测数据集的划分,归一化处理后的数据集为X={X1,X2,...,Xi,...,Xn};
S3:建立无线传感网异常检测模型,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C,将训练数据集作为数据输入,建立无线传感网异常检测模型;
S4:利用已经建立的无线传感网异常检测模型,将检测数据集作为模型的输入,根据模型的输出结果,判断检测数据集中正常数据和异常数据,完成无线传感网异常数据检测。
进一步的,无线传感网异常检测模型为模糊孪生支持向量机异常检测模型,建立该模型的步骤为:
S31)、为了避免无线传感网数据在低维空间不能线性可分的情况,引入核函数K(x,z)将低维空间的输入值映射到高维空间进行内积运算,从而实现非线性变换后的线性可分;
S32)、将训练数据集作为模糊孪生支持向量机异常检测模型训练输入数据集;
Figure BDA0002522449870000021
s.t.yi(w·xi+b)≥1-ξi
S33)、设置目标优化函数:ξi≥0,i=1,2,...,n,其中,C为惩罚系数,ξi为松弛变量,w表示权重,b表示偏置,yi(w·xi+b)表示xi对应的模糊孪生支持向量机异常检测模型输出;
S34)、引入拉格朗日函数将目标优化函数转换为对偶问题:
Figure BDA0002522449870000022
Figure BDA0002522449870000023
得到最优解
Figure BDA0002522449870000024
S35)、选择
Figure BDA0002522449870000029
的一个分量
Figure BDA0002522449870000025
满足
Figure BDA0002522449870000026
计算:
Figure BDA0002522449870000027
S36)、得到分类决策函数:
Figure BDA0002522449870000028
S37)、惩罚系数C是求解目标优化函数的前提条件,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C。
进一步的,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C具体步骤为:
S38)、初始化寻优数据集M={(X1,Y1),(X2,Y2),...,(Xi,Yi)},i=1,2,...,L,L代表数据集M的大小,根据训练数据集的大小动态选择;数据集M中的数据(Xi,Yi)包含两个特征,分别是当前位置(Xaxisc,Yaxisc)和历史位置(Xaxis,Yaxis),它们的取值范围是[0,100],初始化最大迭代次数maxgen,maxgen的取值与训练数据集的数据量呈反比;
S39)、将数据集M随机划分为三个子集groupA、groupB、groupC,分别执行本地目标搜索和全局目标搜索;目标搜索行进距离DS=θ*((maxgen-k)/maxgen)α,θ∈[5,10],
Figure BDA0002522449870000031
K是当前迭代次数,k=1,2,...,maxgen
S310)、各个子集搜索策略按照如下方式执行:
如果k<maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure BDA0002522449870000032
groupB根据公式(2)执行全局目标搜索:
Figure BDA0002522449870000033
groupC根据公式(3)执行全局目标搜索:
Figure BDA0002522449870000034
如果k>=maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure BDA0002522449870000035
groupB根据公式(2)执行全局目标搜索:
Figure BDA0002522449870000036
groupC根据公式(4)执行全局目标搜索:
Figure BDA0002522449870000041
RandomValue表示区间[5,20]范围内的随机数;
S311)、计算惩罚系数判定值S:计算数据集M中所有数据点与原点距离D,取距离D的和的倒数为惩罚系数判定值S,惩罚系数C=M*Si,M的取值根据C的定义域进行修正,对于数据集M中每一个数据点,都能确定一个当前迭代次数中惩罚系数C,
Figure BDA0002522449870000042
S312)、适应度函数计算:求出由每一个惩罚系数C所建立的异常检测模型的分类准确率accuracyi
适应度函数Function(Si)=accuracyi×η×Si
η是权值;
S313)、惩罚系数确定值计算:
Figure BDA0002522449870000043
根据
Figure BDA0002522449870000044
的最大值找出表现最佳数据点,表现最佳数据点就是惩罚系数确定值;
S314)、表现最佳数据点处理:根据公式(5)计算出当前和历史迭代中表现最佳数据点的惩罚系数确定值和位置,
Figure BDA0002522449870000045
Figure BDA0002522449870000046
分别是当前迭代和历史迭代中表现最佳数据点的惩罚系数确定值;
如果
Figure BDA0002522449870000047
大于
Figure BDA0002522449870000048
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为当前迭代中表现最佳数据点惩罚系数确定值和位置,
如果
Figure BDA0002522449870000049
小于
Figure BDA00025224498700000410
只更新当前迭代中表现最佳数据点的位置,
得到当前迭代和历史迭代表现最佳数据点的惩罚系数确定值以及位置,
Figure BDA00025224498700000411
S315)、为了平衡数据点的全局搜索能力和本地搜索能力,每个数据点位置利用公式(7)更新:
Figure BDA00025224498700000412
此时,(Xaxis,Yaxis)和(Xaxisc,Yaxisc)代表当前迭代和历史迭代表现最佳数据点的位置;
S316)、根据公式(5)计算出每个数据点的惩罚系数确定值,
Figure BDA0002522449870000051
是步骤S315)搜索条件下最佳数据点的惩罚系数确定值,
如果
Figure BDA0002522449870000052
大于
Figure BDA0002522449870000053
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为步骤S315)搜索条件下表现最佳数据点惩罚系数确定值和位置,
如果
Figure BDA0002522449870000054
小于
Figure BDA0002522449870000055
只更新步骤S315)搜索条件下表现最佳数据点的位置;
S317)、选择
Figure BDA0002522449870000056
作为当前迭代次数惩罚系数最终确定值,根据公式(5)的逆运算求出由
Figure BDA0002522449870000057
确定的惩罚系数判定值S,由公式C=M*S求出当前迭代次数中最终确定的惩罚系数C;
S318)异常检测模型的最优惩罚系数:所有迭代寻优执行结束,得到每次迭代确定的惩罚系数C。
进一步的,步骤S2中,利用合成少数类过采样技术对检测数据集进行类不平衡处理,具体步骤为:
S21)、异常数据比例一般低于正常数据,故将异常数据作为少数类,对于异常数据中每一个样本x,以欧氏距离为标准计算它到少数类样本集S中所有样本的距离,得到其K近邻,S={(xi,yi)|yi=-1},i=1,2,...,n,yi表示对训练数据集仍添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据;
S22)、根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其K近邻中随机选择3个样本,假设选择的近邻为xn
S23)、对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本:
xnew=x+rand(0,1)*|x-xn|;
S24)、将构建的新的样本添加到训练数据集中。
进一步的,步骤S2中,对检测数据集进行归一化的处理公式为:
Figure BDA0002522449870000058
其中,xi表示原始数据集中的数据,Xi表示归一化处理后的数据,Xi∈[0,1],min是原始数据集中的最小值,max是原始数据集的最大值。
进一步的,步骤S318)中,选择最小的C值作为异常检测模型的最优惩罚系数。
进一步的,步骤S31)中,选取训练数据集数据量的
Figure BDA0002522449870000059
作为寻优数据集M的大小。
进一步的,随机选取归一化后数据集X的2/5构成训练数据集Xtrain,对训练数据集Xtrain人为添加标签信息,Xtrain={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{+1,-1},i=1,2,...,n,yi为人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据,数据集X中,剩下3/5的数据作为检测数据集Xtest
进一步的,步骤S31中,选择径向基核函数,
Figure BDA0002522449870000061
σ为核参数。
本发明的有益效果:本发明所述检测方法基于融合理论,融合模糊孪生支持向量机和自适应迭代寻优的无线传感网异常检测***,主要目的是解决当前无线传感网异常检测效率不高、精度不高、泛化能力较弱的问题。该***经过测试,展示出强大的检测能力、更高的分类准确率和更广泛的应用场景,其泛化能力较强,可广泛的应用于诸多无线传感网络异常检测环境中,更提高了检测的准确性和高效性。
附图说明
图1为实施例所述方法的流程图;
图2为模糊孪生支持向量机的惩罚系数C迭代寻优的流程图。
具体实施方式
下面结合附图和具体实施例对本发明作进一步的说明。
实施例1
本实施例公开一种无线传感器网异常检测方法,如图1所示,包括以下步骤:
S1:数据采集,无线传感网络监测节点每隔一个固定时间间隔Δt收集一组监测数据,并以无线多跳的方式将其发送给基站,基站将收到原始数据集X;
S2:数据预处理,对原始数据集X进行数值变量的归一化和训练数据集、检测数据集的划分以及数据不平衡的处理;
S3:建立异常检测模型,利用训练数据集构造并求解带凸约束的二次规划问题,构建模糊孪生支持向量机异常检测模型;
S4:异常数据检测,将检测数据集作为模糊孪生支持向量机异常检测模型输入,根据每组数据的标签值判断该数据是否为异常数据。
在步骤S1中,原始数据集X={x1,x2,...,xn},其中xi∈Rn,i=1,2,...,n,xi表示传感器检测到的数据。
在步骤S2中,本方法采用最大-最小值方法对原始数据集X中的每一组数据xi进行归一化处理,公式为:
Figure BDA0002522449870000071
归一化处理后得到数据集X={X1,X2,...,Xn},每组数据Xi∈[0,1],min和max分别是每组监测数据的最小值和最大值。
本实施例中,随机选取数据集X的2/5构成训练数据集Xtrain,对训练数据集Xtrain人为添加标签信息。Xtrain={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{+1,-1},i=1,2,...,n。当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据。数据集X中,剩下3/5的数据作为检测数据集Xtest
为了克服样本的不平衡性问题,使用合成少数类过采样技术(SMOTE)进行类不平衡处理。SMOTE算法的基本思想是对少数类样本进行分析并根据少数类样本人工合成新样本添加到数据集中。所述SMOTE算法包括以下步骤:
S21:异常数据比例一般低于正常数据,故将异常数据作为少数类,对于异常数据中每一个样本x,以欧氏距离为标准计算它到少数类样本集S中所有样本的距离,得到其K近邻。S={(xi,yi)|yi=-1},i=1,2,...,n。
S22:根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其K近邻中随机选择3个样本,假设选择的近邻为xn
S23:对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本:
xnew=x+rand(0,1)*|x-xn|,
S24:将构建的新的样本添加到数据集Xtrain中。
进一步,在步骤S3中,建立模糊孪生支持向量机异常检测模型包括以下步骤:
S31:为了避免无线传感网数据在低维空间不能线性可分的情况,特此引入核函数K(x,z)将低维空间的输入值映射到高维空间进行内积运算,从而实现非线性变换后的线性可分。本发明选择径向基核函数:
Figure BDA0002522449870000072
σ为核参数。
(1)将训练数据集Xtrain作为模糊孪生支持向量机异常检测模型训练输入数据集。
(2)目标优化函数:
Figure BDA0002522449870000081
s.t.yi(w·xi+b)≥1-ξi
ξi≥0,i=1,2,...,n,
其中,C为惩罚系数,ξi为松弛变量,w表示权重,b表示偏置,yi(w·xi+b)表示xi对应的模糊孪生支持向量机异常检测模型输出;
引入拉格朗日函数将目标优化函数转换为对偶问题:
Figure BDA0002522449870000082
Figure BDA0002522449870000083
得到最优解
Figure BDA0002522449870000084
选择
Figure BDA0002522449870000085
的一个分量
Figure BDA0002522449870000086
满足
Figure BDA0002522449870000087
计算:
(4)得到分类决策函数:
Figure BDA0002522449870000089
S32:根据步骤S31可知,惩罚系数C是求解目标优化函数的前提条件,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C包括以下步骤:
S32.1:初始化寻优数据集M={(X1,Y1),(X2,Y2),...,(Xi,Yi)},i=1,2,...,L,L代表数据集M的大小,根据训练数据集的大小动态选择,一般选取训练数据集数据量的
Figure BDA00025224498700000811
数据集M中的数据(Xi,Yi)包含两个特征,分别是当前位置(Xaxisc,Yaxisc)和历史位置(Xaxis,Yaxis),它们的取值范围是[0,100]。初始化最大迭代次数maxgen,maxgen的取值与训练数据集的数据量呈反比。
S32.2:将数据集M随机划分为三个子集groupA、groupB、groupC,分别执行本地目标搜索和全局目标搜索;本地目标搜索是指目标搜索只在本数据集合内执行,全局搜索是指目标搜索在整个空间内执行。目标搜索行进距离DS=θ*((maxgen-k)/maxgen)α,θ∈[5,10],
Figure BDA00025224498700000810
K是当前迭代次数,k=1,2,...,maxgen,本实施例中,maxgen=100。
S32.3:判断当前迭代次数和最大迭代次数的大小关系
如果k<maxgen/20:
groupA根据公式(1)执行本地目标搜索:
Figure BDA0002522449870000091
groupB根据公式(2)执行全局目标搜索:
Figure BDA0002522449870000092
groupC根据公式(3)执行全局目标搜索:
Figure BDA0002522449870000093
如果k>=maxgen/20:
groupA根据公式(1)执行本地目标搜索:
Figure BDA0002522449870000094
groupB根据公式(2)执行全局目标搜索:
Figure BDA0002522449870000095
groupC根据公式(4)执行全局目标搜索:
Figure BDA0002522449870000096
其中RandomValue表示区间[5,20]范围内的随机数;
S32.4:计算数据集M中所有数据点与原点距离D,取距离D的和的倒数为惩罚系数判定值S。惩罚系数C=M*Si,M的取值需要根据C的定义域进行修正。本发明取C∈[0,1000],将S的范围限制在[0,100],因此M=10。对于数据集M中每一个数据点,都能确定一个当前迭代次数中惩罚系数C。
Figure BDA0002522449870000101
S32.5:对所有确定的惩罚系数C,回到步骤S31中,将训练数据集作为数据输入,得到分类决策函数,求出由每一个惩罚系数C所建立的异常检测模型的分类准确率accuracyi。根据分类准确率得到适应度函数:
Function(Si)=accuracyi×η×Si
η是权值。
S32.6:根据公式(5)计算出每个数据点的惩罚系数确定值
Figure BDA0002522449870000102
根据
Figure BDA0002522449870000103
的最大值找出表现最佳数据点。
Figure BDA0002522449870000104
S32.7:对于表现最佳的数据点,根据公式(6)计算出当前和历史迭代中表现最佳数据点的惩罚系数确定值和位置,
Figure BDA0002522449870000105
Figure BDA0002522449870000106
分别是当前迭代和历史迭代中表现最佳数据点的惩罚系数确定值。
如果
Figure BDA0002522449870000107
大于
Figure BDA0002522449870000108
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为当前迭代中表现最佳数据点惩罚系数确定值和位置。
如果
Figure BDA0002522449870000109
小于
Figure BDA00025224498700001010
只更新当前迭代中表现最佳数据点的位置。
得到当前迭代和历史迭代表现最佳数据点的惩罚系数确定值以及位置。
Figure BDA00025224498700001011
S32.8:为了平衡数据点的全局搜索能力和本地搜索能力,每个数据点位置利用公式(7)更新:
Figure BDA00025224498700001012
此时,(Xaxis,Yaxis)和(Xaxisc,Yaxisc)代表当前迭代和历史迭代表现最佳数据点的位置。
S32.9:根据公式(5)计算出每个数据点的惩罚系数确定值,
Figure BDA00025224498700001013
是步骤S32.8搜索条件下最佳数据点的惩罚系数确定值。
如果
Figure BDA00025224498700001014
大于
Figure BDA00025224498700001015
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为步骤S32.8搜索条件下表现最佳数据点惩罚系数确定值和位置。
如果
Figure BDA00025224498700001016
小于
Figure BDA00025224498700001017
只更新步骤S32.8搜索条件下表现最佳数据点的位置。
S32.10:选择
Figure BDA0002522449870000111
作为当前迭代次数惩罚系数最终确定值,根据公式(5)的逆运算求出由
Figure BDA0002522449870000112
确定的惩罚系数判定值S,由公式C=M*S求出当前迭代次数中最终确定的惩罚系数C。
S32.11:回到步骤S32.3进行下一次迭代寻优,直到当前迭代次数满足最大迭代次数,终止搜索。此时,得到每次迭代确定的惩罚系数C。根据经验表明,惩罚系数C越大,分类误差往往会越大,因此选择最小的C值作为最终异常检测模型的惩罚系数。将最终确定的惩罚系数C作为返回值,回到步骤S31中,建立异常检测模型。
在步骤S4中,将检测数据集输入到已经建立的模糊孪生支持向量机异常检测模型中,模型输出值为-1的数据即为原始数据集中的异常数据,模型输出值为1的数据即为原始数据集中的正常数据。
最后说明的是,以上优选实施例仅用以说明本发明的技术方案而非限制,尽管通过上述优选实施例已经对本发明进行了详细的描述,但本领域技术人员应当理解,可以在形式上和细节上对其作出各种各样的改变,而不偏离本发明权利要求书所限定的范围。

Claims (9)

1.一种无线传感网异常检测方法,其特征在于:包括以下步骤;
S1、传感器监测节点实时汇集来自各个传感器监测的数据,形成原始数据集x={x1,x2,...,xi,...,xn},xi∈Rn,i=1,2,...,n,xi表示传感器采集的数据,并以无线通信的方式进行传输和存储;
S2、对传感器采集到的数据集进行数据预处理,所述数据预处理包括数据归一化处理、类不平衡处理以及训练数据集、检测数据集的划分,归一化处理后的数据集为X={X1,X2,...,Xi,...,Xn};
S3:建立无线传感网异常检测模型,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C,将训练数据集作为数据输入,建立无线传感网异常检测模型;
S4:利用已经建立的无线传感网异常检测模型,将检测数据集作为模型的输入,根据模型的输出结果,判断检测数据集中正常数据和异常数据,完成无线传感网异常数据检测。
2.根据权利要求1所述的无线传感网异常检测方法,其特征在于:无线传感网异常检测模型为模糊孪生支持向量机异常检测模型,建立该模型的步骤为:
S31)、为了避免无线传感网数据在低维空间不能线性可分的情况,引入核函数K(x,z)将低维空间的输入值映射到高维空间进行内积运算,从而实现非线性变换后的线性可分;
S32)、将训练数据集作为模糊孪生支持向量机异常检测模型训练输入数据集;
S33)、设置目标优化函数:
Figure FDA0002522449860000011
其中,C为惩罚系数,ξi为松弛变量,w表示权重,b表示偏置,yi(w·xi+b)表示xi对应的模糊孪生支持向量机异常检测模型输出;
S34)、引入拉格朗日函数将目标优化函数转换为对偶问题:
Figure FDA0002522449860000012
Figure FDA0002522449860000013
得到最优解
Figure FDA0002522449860000014
S35)、选择
Figure FDA0002522449860000015
的一个分量
Figure FDA0002522449860000016
满足
Figure FDA0002522449860000017
计算:
Figure FDA0002522449860000018
S36)、得到分类决策函数:
Figure FDA0002522449860000019
S37)、惩罚系数C是求解目标优化函数的前提条件,利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C。
3.根据权利要求1或2所述的无线传感网异常检测方法,其特征在于:利用自适应迭代寻优搜索模糊孪生支持向量机的惩罚系数C具体步骤为:
S38)、初始化寻优数据集M={(X1,Y1),(X2,Y2),...,(Xi,Yi)},i=1,2,...,L,其中L代表数据集M的大小,根据训练数据集的大小动态选择,;数据集M中的数据(Xi,Yi)包含两个特征,分别是当前位置(Xaxisc,Yaxisc)和历史位置(Xaxis,Yaxis),它们的取值范围是[0,100],初始化最大迭代次数maxgen,maxgen的取值与训练数据集的数据量呈反比;
S39)、将数据集M随机划分为三个子集groupA、groupB、groupC,分别执行本地目标搜索和全局目标搜索;目标搜索行进距离
Figure FDA0002522449860000021
K是当前迭代次数,k=1,2,...,maxgen
S310)、各个子集搜索策略按照如下方式执行:
如果k<maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure FDA0002522449860000022
groupB根据公式(2)执行全局目标搜索:
Figure FDA0002522449860000023
groupC根据公式(3)执行全局目标搜索:
Figure FDA0002522449860000024
如果k>=maxgen/20,
groupA根据公式(1)执行本地目标搜索:
Figure FDA0002522449860000031
groupB根据公式(2)执行全局目标搜索:
Figure FDA0002522449860000032
groupC根据公式(4)执行全局目标搜索:
Figure FDA0002522449860000033
RandomValue表示区间[5,20]范围内的随机数;
S311)、计算惩罚系数判定值S:计算数据集M中所有数据点与原点距离D,取距离D的和的倒数为惩罚系数判定值S,惩罚系数C=M*Si,M的取值根据C的定义域进行修正,对于数据集M中每一个数据点,都能确定一个当前迭代次数中惩罚系数C,
Figure FDA0002522449860000034
S312)、适应度函数计算:求出由每一个惩罚系数C所建立的异常检测模型的分类准确率accuracyi
适应度函数Function(Si)=accuracyi×η×Si
η是权值;
S313)、惩罚系数确定值计算:
Figure FDA0002522449860000035
根据
Figure FDA0002522449860000036
的最大值找出表现最佳数据点,表现最佳数据点就是惩罚系数确定值;
S314)、表现最佳数据点处理:根据公式(5)计算出当前和历史迭代中表现最佳数据点的惩罚系数确定值和位置,
Figure FDA0002522449860000037
Figure FDA0002522449860000038
分别是当前迭代和历史迭代中表现最佳数据点的惩罚系数确定值;
如果
Figure FDA0002522449860000039
大于
Figure FDA00025224498600000310
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为当前迭代中表现最佳数据点惩罚系数确定值和位置,
如果
Figure FDA00025224498600000311
小于
Figure FDA00025224498600000312
只更新当前迭代中表现最佳数据点的位置,
得到当前迭代和历史迭代表现最佳数据点的惩罚系数确定值以及位置,
Figure FDA0002522449860000041
S315)、为了平衡数据点的全局搜索能力和本地搜索能力,每个数据点位置利用公式(7)更新:
Figure FDA0002522449860000042
此时,(Xaxis,Yaxis)和(Xaxisc,Yaxisc)代表当前迭代和历史迭代表现最佳数据点的位置;
S316)、根据公式(5)计算出每个数据点的惩罚系数确定值,
Figure FDA0002522449860000043
是步骤S315)搜索条件下最佳数据点的惩罚系数确定值,
如果
Figure FDA0002522449860000044
大于
Figure FDA0002522449860000045
将历史迭代中表现最佳数据点惩罚系数确定值和位置更新为步骤S315)搜索条件下表现最佳数据点惩罚系数确定值和位置,
如果
Figure FDA0002522449860000046
小于
Figure FDA0002522449860000047
只更新步骤S315)搜索条件下表现最佳数据点的位置;
S317)、选择
Figure FDA0002522449860000048
作为当前迭代次数惩罚系数最终确定值,根据公式(5)的逆运算求出由
Figure FDA0002522449860000049
确定的惩罚系数判定值S,由公式C=M*S求出当前迭代次数中最终确定的惩罚系数C;
S318)异常检测模型的最优惩罚系数:所有迭代寻优执行结束,得到每次迭代确定的惩罚系数C。
4.根据权利要求1所述的无线传感网异常检测方法,其特征在于:步骤S2中,利用合成少数类过采样技术对检测数据集进行类不平衡处理,具体步骤为:
S21)、异常数据比例一般低于正常数据,故将异常数据作为少数类,对于异常数据中每一个样本x,以欧氏距离为标准计算它到少数类样本集S中所有样本的距离,得到其K近邻,S={(xi,yi)|yi=-1},i=1,2,...,n,yi表示对训练数据集仍添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据;
S22)、根据样本不平衡比例设置一个采样比例以确定采样倍率N,对于每一个少数类样本x,从其K近邻中随机选择3个样本,假设选择的近邻为xn
S23)、对于每一个随机选出的近邻xn,分别与原样本按照如下的公式构建新的样本:
xnew=x+rand(0,1)*|x-xn|;
S24)、将构建的新的样本添加到训练数据集中。
5.根据权利要求1所述的无线传感网异常检测方法,其特征在于:步骤S2中,对检测数据集进行归一化的处理公式为:
Figure FDA0002522449860000051
其中,xi表示原始数据集中的数据,Xi表示归一化处理后的数据,Xi∈[0,1],min是原始数据集中的最小值,max是原始数据集的最大值。
6.根据权利要求3所述的无线传感网异常检测方法,其特征在于:步骤S318)中,选择最小的C值作为异常检测模型的最优惩罚系数。
7.根据权利要求3所述的无线传感网异常检测方法,其特征在于:步骤S31)中,选取训练数据集数据量的
Figure FDA0002522449860000052
作为寻优数据集M的大小。
8.根据权利要求1所述的无线传感网异常检测方法,其特征在于:随机选取归一化后数据集X的2/5构成训练数据集Xtrain,对训练数据集Xtrain人为添加标签信息,Xtrain={(x1,y1),(x2,y2),...,(xn,yn)},其中xi∈Rn,yi∈{+1,-1},i=1,2,...,n,yi为人为添加的标签信息,当yi=1时,代表该数据是正常数据,当yi=-1时,代表该数据是异常数据,数据集X中,剩下3/5的数据作为检测数据集Xtest
9.根据权利要求2所述的无线传感网异常检测方法,其特征在于:步骤S31中,选择径向基核函数,
Figure FDA0002522449860000053
σ为核参数。
CN202010497988.2A 2020-06-03 2020-06-03 一种无线传感网异常检测方法 Active CN111654874B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202010497988.2A CN111654874B (zh) 2020-06-03 2020-06-03 一种无线传感网异常检测方法
PCT/CN2020/108778 WO2021243848A1 (zh) 2020-06-03 2020-08-13 一种无线传感网异常检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010497988.2A CN111654874B (zh) 2020-06-03 2020-06-03 一种无线传感网异常检测方法

Publications (2)

Publication Number Publication Date
CN111654874A true CN111654874A (zh) 2020-09-11
CN111654874B CN111654874B (zh) 2023-02-24

Family

ID=72348442

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010497988.2A Active CN111654874B (zh) 2020-06-03 2020-06-03 一种无线传感网异常检测方法

Country Status (2)

Country Link
CN (1) CN111654874B (zh)
WO (1) WO2021243848A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112421772A (zh) * 2020-10-23 2021-02-26 国网福建省电力有限公司 多跳d2d组网下数据驱动的配电网在线异常检测装置及方法
CN113364652A (zh) * 2021-06-30 2021-09-07 脸萌有限公司 网卡流量测试方法、装置、网络设备、***及可读介质
CN113420825A (zh) * 2021-07-07 2021-09-21 国能龙源蓝天节能技术有限公司 一种基于支持向量机的异常数据检测方法及电子设备
CN113992718A (zh) * 2021-10-28 2022-01-28 安徽农业大学 一种基于动态宽度图神经网络的群体传感器异常数据检测方法和***

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114219157B (zh) * 2021-12-17 2023-10-17 西南石油大学 一种基于最优决策和动态分析的烷烃气体红外光谱测量方法
CN114240913B (zh) * 2021-12-21 2024-07-02 歌尔股份有限公司 半导体的异常分析方法、装置、终端设备以及存储介质
CN114354654B (zh) * 2022-01-07 2023-03-21 中国矿业大学 基于dw-knn的煤炭水分含量快速无损检测方法
CN114637620B (zh) * 2022-03-10 2024-04-16 南京开特信息科技有限公司 一种基于svm算法的数据库***异常分类预测方法
CN115019510B (zh) * 2022-06-29 2024-01-30 华南理工大学 一种基于动态自适应生成对抗网络的交通数据修复方法
CN114969669B (zh) * 2022-07-27 2022-11-15 深圳前海环融联易信息科技服务有限公司 数据平衡度处理方法、联合建模***、设备和介质
CN116436819B (zh) * 2023-02-22 2024-06-21 深圳市昆腾电源科技有限公司 并机ups通信异常检测方法、装置及并机ups***
CN116723034B (zh) * 2023-07-03 2024-05-28 深圳市奥晏科技发展有限公司 一种用于互联网信息安全的智能数据监测***及方法
CN117100293B (zh) * 2023-10-25 2024-02-06 武汉理工大学 一种基于多维特征融合网络的肌肉疲劳检测方法和***
CN117332359B (zh) * 2023-12-01 2024-02-09 国网江苏省电力有限公司南通供电分公司 一种电力数据传输异常检测方法及***
CN118054552A (zh) * 2024-01-19 2024-05-17 淮阴工学院 一种配电室状态智能监测方法与报警***
CN118115822B (zh) * 2024-04-29 2024-07-02 江西师范大学 一种基于图像块特征级联检索模型的异常检测方法及***

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791051A (zh) * 2016-03-25 2016-07-20 中国地质大学(武汉) 基于人工免疫和k均值聚类的无线传感网异常检测方法及***
CN106482967A (zh) * 2016-10-09 2017-03-08 湖南工业大学 一种代价敏感支持向量机机车车轮检测***及方法
CN107379899A (zh) * 2017-07-07 2017-11-24 淮阴工学院 一种基于无线传感器网络的轮胎状态智能监测***
CN108052968A (zh) * 2017-12-08 2018-05-18 哈尔滨工程大学 一种qsfla-svm的感知入侵检测方法
WO2018126984A2 (zh) * 2017-01-06 2018-07-12 江南大学 一种基于mea-bp神经网络wsn异常检测方法
CN108876001A (zh) * 2018-05-03 2018-11-23 东北大学 一种基于孪生支持向量机的短期电力负荷预测方法
CN109143848A (zh) * 2017-06-27 2019-01-04 中国科学院沈阳自动化研究所 基于fcm-gasvm的工业控制***入侵检测方法
CN109816119A (zh) * 2019-02-02 2019-05-28 南京邮电大学 一种基于无监督学习的无线传感器异常数据检测方法
CN110072205A (zh) * 2019-03-25 2019-07-30 南京邮电大学 一种用于无线传感网异常数据检测的分层聚合方法
CN110287896A (zh) * 2019-06-27 2019-09-27 北京理工大学 一种基于异质分层pso和svm的人体行为识别方法
CN110309886A (zh) * 2019-07-08 2019-10-08 安徽农业大学 基于深度学习的无线传感器高维数据实时异常检测方法
CN110516733A (zh) * 2019-08-23 2019-11-29 西南石油大学 一种基于改进多分类孪生支持向量机的测井岩性识别方法
CN110568127A (zh) * 2019-09-09 2019-12-13 北京工业大学 一种基于时域加权的空气污染物浓度监测方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105791051A (zh) * 2016-03-25 2016-07-20 中国地质大学(武汉) 基于人工免疫和k均值聚类的无线传感网异常检测方法及***
CN106482967A (zh) * 2016-10-09 2017-03-08 湖南工业大学 一种代价敏感支持向量机机车车轮检测***及方法
WO2018126984A2 (zh) * 2017-01-06 2018-07-12 江南大学 一种基于mea-bp神经网络wsn异常检测方法
CN109143848A (zh) * 2017-06-27 2019-01-04 中国科学院沈阳自动化研究所 基于fcm-gasvm的工业控制***入侵检测方法
CN107379899A (zh) * 2017-07-07 2017-11-24 淮阴工学院 一种基于无线传感器网络的轮胎状态智能监测***
CN108052968A (zh) * 2017-12-08 2018-05-18 哈尔滨工程大学 一种qsfla-svm的感知入侵检测方法
CN108876001A (zh) * 2018-05-03 2018-11-23 东北大学 一种基于孪生支持向量机的短期电力负荷预测方法
CN109816119A (zh) * 2019-02-02 2019-05-28 南京邮电大学 一种基于无监督学习的无线传感器异常数据检测方法
CN110072205A (zh) * 2019-03-25 2019-07-30 南京邮电大学 一种用于无线传感网异常数据检测的分层聚合方法
CN110287896A (zh) * 2019-06-27 2019-09-27 北京理工大学 一种基于异质分层pso和svm的人体行为识别方法
CN110309886A (zh) * 2019-07-08 2019-10-08 安徽农业大学 基于深度学习的无线传感器高维数据实时异常检测方法
CN110516733A (zh) * 2019-08-23 2019-11-29 西南石油大学 一种基于改进多分类孪生支持向量机的测井岩性识别方法
CN110568127A (zh) * 2019-09-09 2019-12-13 北京工业大学 一种基于时域加权的空气污染物浓度监测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
周素青: "基于布谷鸟搜索算法的多数据流融合异常检测方法", 《内蒙古民族大学学报(自然科学版)》 *
姜鹏飞: "双重支持向量机的改进及其应用", 《中国优秀硕士学位论文全文数据库》 *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112421772A (zh) * 2020-10-23 2021-02-26 国网福建省电力有限公司 多跳d2d组网下数据驱动的配电网在线异常检测装置及方法
CN112421772B (zh) * 2020-10-23 2022-05-13 国网福建省电力有限公司 多跳d2d组网下数据驱动的配电网在线异常检测装置及方法
CN113364652A (zh) * 2021-06-30 2021-09-07 脸萌有限公司 网卡流量测试方法、装置、网络设备、***及可读介质
CN113364652B (zh) * 2021-06-30 2023-07-25 脸萌有限公司 网卡流量测试方法、装置、网络设备、***及可读介质
CN113420825A (zh) * 2021-07-07 2021-09-21 国能龙源蓝天节能技术有限公司 一种基于支持向量机的异常数据检测方法及电子设备
CN113992718A (zh) * 2021-10-28 2022-01-28 安徽农业大学 一种基于动态宽度图神经网络的群体传感器异常数据检测方法和***

Also Published As

Publication number Publication date
CN111654874B (zh) 2023-02-24
WO2021243848A1 (zh) 2021-12-09

Similar Documents

Publication Publication Date Title
CN111654874B (zh) 一种无线传感网异常检测方法
CN116186634B (zh) 一种建筑工程施工数据智能管理***
CN105791051B (zh) 基于人工免疫和k均值聚类的无线传感网异常检测方法及***
CN107463898A (zh) 基于视觉传感网络的舞台表演行为异常监控方法
CN109818798A (zh) 一种融合kpca和elm的无线传感器网络入侵检测***及方法
CN108052968B (zh) 一种qsfla-svm的感知入侵检测方法
Vijayakumar et al. RETRACTED ARTICLE: Artificial intelligence-based agriculture automated monitoring systems using WSN
CN110119766A (zh) 一种多组合智能化模型的青椒温室温度智能化预警装置
CN110083190A (zh) 一种基于减法聚类分类器的青椒温室环境智能监测***
CN110119767A (zh) 一种基于lvq神经网络的黄瓜温室温度智能化检测装置
CN109271427A (zh) 一种基于近邻密度和流形距离的聚类方法
CN117495205B (zh) 一种工业互联网实验***及方法
CN110427063A (zh) 一种基于物联网的番茄生长监控管理平台
CN115856204B (zh) 基于三维回声状态网络的掘进工作面瓦斯浓度预测方法
CN116557787A (zh) 管网状态智能评估***及其方法
CN113703506B (zh) 一种建筑材料生产车间环境控制调节方法及***
Li et al. Prediction of grain yield in Henan Province based on grey BP neural network model
CN105677565B (zh) 一种缺陷关联系数的度量方法
CN110119778A (zh) 一种改进鸡群优化rbf神经网络的设备健康状态检测方法
CN115619605A (zh) 一种基于语义信息的传统民居环境质量评估方法
Huan et al. A dissolved oxygen prediction method based on k-means clustering and the elm neural network: a case study of the Changdang Lake, China
Tipwong et al. A novel determination of an appropriate clustering quantity of a water-soluble NPK nutrient measuring system based on K-means and SOM methods
Shenoy et al. Anamoly detection in wireless sensor networks
Wedashwara et al. Parallel evolutionary association rule mining for efficient summarization of wireless sensor network data pattern
CN111914430A (zh) 基于聚类及粒子群优化的有资料地区水文参数率定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant