CN115795548A - 一种基于联邦学习的隐蔽通信检测方法 - Google Patents

一种基于联邦学习的隐蔽通信检测方法 Download PDF

Info

Publication number
CN115795548A
CN115795548A CN202211590792.3A CN202211590792A CN115795548A CN 115795548 A CN115795548 A CN 115795548A CN 202211590792 A CN202211590792 A CN 202211590792A CN 115795548 A CN115795548 A CN 115795548A
Authority
CN
China
Prior art keywords
model
global model
local
central server
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211590792.3A
Other languages
English (en)
Inventor
陈立文
钱玉文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing University of Science and Technology
Original Assignee
Nanjing University of Science and Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing University of Science and Technology filed Critical Nanjing University of Science and Technology
Priority to CN202211590792.3A priority Critical patent/CN115795548A/zh
Publication of CN115795548A publication Critical patent/CN115795548A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于联邦学习的隐蔽通信检测方法,包括如下步骤:将若干时隙天线发射的样本数据以矩阵的形式存储;确定全局模型,中心服务器初始化全局模型;中心服务器将初始化的全局模型发放给用户;参与节点从中心服务器下载全局模型,并将下载的全局模型作为本地模型,使用本地数据训练和更新本地模型;参与节点将本地模型上传至中心服务器,中心服务器收到所有的局部模型后进行模型聚合更新,形成新的全局模型;中心服务器将新的全局模型下发给所有的训练节点,进行迭代训练;用户以最终更新的全局模型对本地数据进行检测,判断物理层信号中是否包含隐蔽通信数据,完成分类检测任务。本发明节约了通信资源,保护了数据安全。

Description

一种基于联邦学习的隐蔽通信检测方法
技术领域
本发明属于无线通信技术领域,具体为一种基于联邦学习的隐蔽通信检测方法。
背景技术
隐蔽通信又称为隐蔽通信又被称为低检测(Low Probability of Detection,LPD)、低截获(Low Probability of Interception,LPI)通信,往往被应用在安全通信上。针对隐私保护领域,隐蔽通信作为一种泄露隐私信息、机密信息的手段,有必要对可能存在的隐蔽通信进行检测,从而保护个人和组织的信息安全。在军事对抗领域,隐蔽通信作为安全通信的一种,具有低检测、低截获的特点,被用于传输具有重要价值的信息,作为对抗方,检测破解敌方安全通信的手段,对己方具有重大的战略价值。
作为专门对抗检测手段而发展的技术,常规安全领域的检测手段难以有效检测隐蔽通信。机器学习的进步发展使得利用机器学习检测隐蔽通信成为可能。电子硬件的发展解决了曾困扰机器学习的数据量过大难以处理的问题。现如今与大数据结合后,机器学习综合应用了心理学、生物学、神经生理学、数学、自动化和计算机科学成为了一门广泛应用的学科。在通信领域,信号的时频域特征、数据包、特征帧结构等数据为机器学习提供了丰富的标签信息。
针对网络层隐蔽信道的检测,本质上是对一些异常的网络层报文段的标志位进行模式匹配。检测的思路是首先对张量化的网络时间隐蔽信道的报文段信息进行奇异值分解(Singular value decomposition,SVD)和主成分分析(Principal component analysis,PCA)处理,实现样本降维与重构,然后采用改进的支持向量机(Support vector machine,SVM)和K临近算法(K-nearest neighbor,KNN)这类有监督学习进行多分类,最终实现对网络层的可疑的报文序列和检测。论文Timing Covert Channels Detection Cases viaMachine Learning针对物理层隐蔽信道无法权衡检测查全率和检测复杂度这对矛盾的问题,进而提出了基于随机森林的网络时间隐蔽信道检测方法,并且扩充了统计特征指标,最终在提升了分类器分类性能的前提下也降低了整体算法的复杂度。
但是现有的针对隐蔽通信的机器学习检测方法都采用集中式训练模式,都需要在训练前大量收集用户数据,在这个过程中存在数据泄露以及用户数据被滥用的风险,在高对抗环境下这种缺陷尤为突出。同时,隐蔽通信的原始数据集会面临数据不均衡的现实问题。
发明内容
为了解决现有技术中的上述技术缺陷,本发明提出了一种基于联邦学习的隐蔽通信检测方法。
实现本发明目的的技术方案为:一种基于联邦学习的隐蔽通信检测方法,包括如下步骤:
(10)用户数据处理:将若干时隙天线发射的携带隐蔽信息的物理层比特流信号样本数据以矩阵的形式存储;
(20)训练参数初始化:确定全局模型,中心服务器初始化全局模型;
(30)初始模型发放:中心服务器将初始化的全局模型发放给用户;
(40)模型本地训练:参与节点从中心服务器下载全局模型,并将下载的全局模型作为本地模型,使用本地数据训练和更新本地模型;
(50)全局模型聚合:参与节点将本地模型上传至中心服务器,中心服务器收到所有的局部模型后进行模型聚合更新,形成新的全局模型;
(60)全局模型发放:中心服务器将新的全局模型下发给所有的训练节点,判断全局模型训练更新次数是否达到次,若达到则进行步骤(70),否则返回步骤(40);
(70)隐蔽通信检测:用户以最终更新的全局模型对本地数据进行检测,判断物理层信号中是否包含隐蔽通信数据,完成分类检测任务。
优选地,所述全局模型采用二分类FNN神经元网络。
优选地,所述二分类FNN神经元网络的激活函数采用Tanh激活函数:
Figure BDA0003994197870000021
式中,x为神经元网络中神经元的输出,y表示最终的判断结果。
优选地,将中心服务器下发的全局模型作为本地模型,使用本地数据训练和更新本地模型设定轮的具体方法为:
(41)将步骤(10)存储数据作为的训练样本{{x(1),y(1)}…{x(n),y(n)}};
式中,x为样本数据,y是对应样本数据的分类标签;
(42)前向传递训练网络权重:
zl=wlal-1+bl,al=σ(zl)
式中,l和l-1表示神经元所在的层数,a表示神经元连接的输入,w是神经元对应输入的权重,z表示改神经元的输出,b是对应的偏置,σ(z)表示激活函数,al表示本层神经元传递给下一层神经元的输入。
(43)计算模型输出层的误差:
Figure BDA0003994197870000031
式中,J表示模型的损失函数,
Figure BDA0003994197870000032
表示损失函数的梯度,⊙是矩阵的Hadamard积,σ'(zL)表示输出层神经元的激活函数输出排列成的矩阵;
(44)使用反向传播算法计算各层神经元的误差:
δl=((wl+1)Tδl+1)⊙σ′(zl)
式中,l,l+1表示神经元所在层数,σ′(zl)是将本层神经元的激活函数输出排列成的矩阵,δl+1是l+1层神经元的激活值,(wl+1)T是l+1层神经元输入权重的转置矩阵,⊙是矩阵的Hadamard积,δl是最终得到的l层神经元的激活值;
(45)梯度下降神经网络权重参数:
Figure BDA0003994197870000033
Figure BDA0003994197870000034
式中,η表示学习率,m是用户本地数据的数量;
判断迭代次数是否达到设置的总次数E,若达到则进行步骤(50),否则返回步骤(41)。
优选地,全局模型聚合的具体公式为:
Figure BDA0003994197870000035
式中,K表示用户数量,
Figure BDA0003994197870000036
表示用户的本地模型,
Figure BDA0003994197870000037
表示第k个用户的本地数据集占所有用户总的数据集的权重,
Figure BDA0003994197870000038
表示加权平均得到的新的全局模型。
本发明与现有技术相比,其显著优点为:
1、节约通信资源:参与训练的节点不需要传输大量原始数据至中心服务器,节省了大量通信传输资源,在通信资源受限的环境下优势突出。
2、保护数据安全:参与训练的节点使用本地数据在本地训练模型,不需要将自身的数据上传至中心节点,避免了数据泄露以及数据被滥用的风险。
3、适应性更好:训练好的模型能够在没有先验信息的条件下对物理层隐蔽通信进行检测。
本发明的其他特征和优点将在随后的说明书中阐述,并且,部分的从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
附图仅用于示出具体实施例的目的,而并不认为是对本发明的限制,在整个附图中,相同的参考符号表示相同的部件。
图1是本发明基于联邦学习的隐蔽通信检测的***模型。
图2是基于联邦学习的隐蔽通信检测方法流程图
图3是参与训练的节点本地训练的方法流程图。
图4是联邦学习全局模型更新的方法流程图。
图5是对比联邦学习框架下FNN网络结构与其他网络结构检测精度对比图。
具体实施方式
容易理解,依据本发明的技术方案,在不变更本发明的实质精神的情况下,本领域的一般技术人员可以想象出本发明的多种实施方式。因此,以下具体实施方式和附图仅是对本发明的技术方案的示例性说明,而不应当视为本发明的全部或者视为对本发明技术方案的限制或限定。相反,提供这些实施例的目的是为了使本领域的技术人员更透彻地理解本发明。下面结合附图来具体描述本发明的优选实施例,其中,附图构成本申请一部分,并与本发明的实施例一起用于阐释本发明的创新构思。
如图1所示,本发明基于联邦学习的隐蔽通信检测方法,包括以下步骤:
(10)用户通信时通信参数获取:参与训练的节点准备若干时隙天线发射的携带隐蔽信息的物理层比特流信号样本数据,以矩阵形式存储。
(11)训练参数确认:确定训练节点每轮训练过程中每次迭代的数量T和每个批次送入训练的样本数量m。
(20)训练模型初始化:中心服务器下发初始训练模型给各个参与节点。
(21)确定模型输入层神经元数量i,确定隐藏层数量k,确定隐藏层神经元数量n1,n1,...nk,输出层为单神经元,模型为二分类FNN神经元网络。
(22)激活函数采用Tanh激活函数:
Figure BDA0003994197870000051
(23)确定初始化模型权重参数w0,b0
(24)设置全局模型训练伦次T,本地用户训练更新伦次E,设置全局用户数M,每次随机参与聚合的用户数N,迭代次数K,学习率η。
(30)初始模型发放:中心服务器将初始的模型w0发放给所有用户。
(40)被选中的用户i∈N在本地各自执行如下训练和更新的过程:
(41)将步骤(10)存储数据作为的训练样本{{x(1),y(1)}…{x(n),y(n)}};
式中,x为样本数据,y是对应样本数据的分类标签;
(42)前向传递训练网络权重:
zl=wlal-1+bl,al=σ(zl)
式中,l和l-1表示神经元所在的层数,a表示神经元连接的输入,w是神经元对应输入的权重,z表示改神经元的输出,b是对应的偏置,σ(z)表示激活函数,al表示本层神经元传递给下一层神经元的输入。
(43)计算模型输出层的误差:
Figure BDA0003994197870000052
式中,J表示模型的损失函数,
Figure BDA0003994197870000053
表示损失函数的梯度,⊙是矩阵的Hadamard积,σ'(zL)表示输出层神经元的激活函数输出排列成的矩阵;
(44)使用反向传播算法计算各层神经元的误差:
δl=((wl+1)Tδl+1)⊙σ′(zl)
式中,l,l+1表示神经元所在层数,σ′(zl)是将本层神经元的激活函数输出排列成的矩阵,δl+1是l+1层神经元的激活值,(wl+1)T是l+1层神经元输入权重的转置矩阵,⊙是矩阵的Hadamard积,δl是最终得到的l层神经元的激活值;
(45)梯度下降神经网络权重参数:
Figure BDA0003994197870000061
Figure BDA0003994197870000062
式中,η表示学习率,m是用户本地数据的数量;
判断迭代次数是否达到设置的总次数E,若达到则进行步骤(50),否则返回步骤(41)。
(50)全局模型聚合:参与训练的节点将更新的模型参数发送至中心服务器,中心服务器收集模型参数后更新全局模型,
Figure BDA0003994197870000063
(60)全局模型发放:中心服务器将更新后的全局模型wt+1发放给所有用户。
判断迭代次数是否达到设置的迭代总次数T,若达到则进行步骤(70),否则返回步骤(40)。
(70)隐蔽通信检测:中心服务器将训练好的模型发放给所有节点,参与训练的节点使用该模型对本地需要检测的数据进行分类,完成物理层隐蔽通信检测任务。
本发明允许用户将数据保留在本地,在保证用户数据在不公开的前提下进行联合训练得到全局模型,共同分享训练结果,从而有效解决数据隐私和安全保护问题。
下面结合实施例进行具体描述:
实施例
首先准备模型输入的训练样本,训练集选取了800帧,每帧300包的发射端配备16根发射天线携带隐蔽信息的无线信号。无线信号经过独立的均值为0,方差为1的复高斯分布慢衰落信道增益,信道矩阵在一帧信号传输过程中保持恒定,每帧信号之间独立变化。发送信号经过Covert QAM调制,携带隐蔽的时隙数占总时隙的20%,携带隐蔽信息的时隙内调制星座偏移的发射天线占总天线数的25%。
所提模型中,FNN输入层为16个神经元,共有3层隐含层,每层隐含层神经元个数分别为32,64,和32,输出层为单神经元,模型为二分类FNN神经网络。
仿真设置总的用户数目M=50,在每一轮通信过程中,将会随机选择其中的30个用户上传量化压缩模型到参数服务器进行聚合。同时设置本地更新次数为5次,学习率为0.01。
利用上述数据的设置,将FNN网络结构与其他网络结构的交叉验证集精度,召回率,模型精度进行对比。交叉验证集精度准确率反映的是训练好的分类模型检测检测到隐蔽信息占总天线阵样本信息的比例,精确率又称查准率,在本问题中定义为被检测出来的天线阵信息有多少比例是携带隐蔽信息的,召回率又称查全率,在本问题中定义为隐蔽信息有多少比例被检测网络检测出来,是本模型关注的重点内容。最终实验结果如图5所示。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。
应当理解,为了精简本发明并帮助本领域的技术人员理解本发明的各个方面,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时在单个实施例中进行描述,或者参照单个图进行描述。但是,不应将本发明解释成示例性实施例中包括的特征均为本专利权利要求的必要技术特征。
应当理解,可以对本发明的一个实施例的设备中包括的模块、单元、组件等进行自适应性地改变以把它们设置在与该实施例不同的设备中。可以把实施例的设备包括的不同模块、单元或组件组合成一个模块、单元或组件,也可以把它们分成多个子模块、子单元或子组件。

Claims (5)

1.一种基于联邦学习的隐蔽通信检测方法,其特征在于,包括如下步骤:
(10)用户数据处理:将若干时隙天线发射的携带隐蔽信息的物理层比特流信号样本数据以矩阵的形式存储;
(20)训练参数初始化:确定全局模型,中心服务器初始化全局模型;
(30)初始模型发放:中心服务器将初始化的全局模型发放给用户;
(40)模型本地训练:参与节点从中心服务器下载全局模型,并将下载的全局模型作为本地模型,使用本地数据训练和更新本地模型;
(50)全局模型聚合:参与节点将本地模型上传至中心服务器,中心服务器收到所有的局部模型后进行模型聚合更新,形成新的全局模型;
(60)全局模型发放:中心服务器将新的全局模型下发给所有的训练节点,判断全局模型训练更新次数是否达到次,若达到则进行步骤(70),否则返回步骤(40);
(70)隐蔽通信检测:用户以最终更新的全局模型对本地数据进行检测,判断物理层信号中是否包含隐蔽通信数据,完成分类检测任务。
2.根据权利要求1所述的基于联邦学习的隐蔽通信检测方法,其特征在于,所述全局模型采用二分类FNN神经元网络。
3.根据权利要求2所述的基于联邦学习的隐蔽通信检测方法,其特征在于,所述二分类FNN神经元网络的激活函数采用Tanh激活函数:
Figure FDA0003994197860000011
式中,x为神经元网络中神经元的输出,y表示最终的判断结果。
4.根据权利要求1所述的基于联邦学习的隐蔽通信检测方法,其特征在于,将中心服务器下发的全局模型作为本地模型,使用本地数据训练和更新本地模型设定轮的具体方法为:
(41)将步骤(10)存储数据作为的训练样本{{x(1),y(1)}...{x(n),y(n)}};
式中,x为样本数据,y是对应样本数据的分类标签;
(42)前向传递训练网络权重:
zl=wlal-1+bl,al=σ(zl)
式中,l和l-1表示神经元所在的层数,a表示神经元连接的输入,w是神经元对应输入的权重,z表示改神经元的输出,b是对应的偏置,σ(z)表示激活函数,al表示本层神经元传递给下一层神经元的输入。
(43)计算模型输出层的误差:
Figure FDA0003994197860000021
式中,J表示模型的损失函数,
Figure FDA0003994197860000022
表示损失函数的梯度,⊙是矩阵的Hadamard积,σ'(zL)表示输出层神经元的激活函数输出排列成的矩阵;
(44)使用反向传播算法计算各层神经元的误差:
δl=((wl+1)Tδl+1)⊙σ′(zl)
式中,l,l+1表示神经元所在层数,σ′(zl)是将本层神经元的激活函数输出排列成的矩阵,δl+1是l+1层神经元的激活值,(wl+1)T是l+1层神经元输入权重的转置矩阵,⊙是矩阵的Hadamard积,δl是最终得到的l层神经元的激活值;
(45)梯度下降神经网络权重参数:
Figure FDA0003994197860000023
Figure FDA0003994197860000024
式中,η表示学习率,m是用户本地数据的数量;
判断迭代次数是否达到设置的总次数E,若达到则进行步骤(50),否则返回步骤(41)。
5.根据权利要求1所述的基于联邦学习的隐蔽通信检测方法,其特征在于,全局模型聚合的具体公式为:
Figure FDA0003994197860000025
式中,K表示用户数量,
Figure FDA0003994197860000026
表示用户的本地模型,
Figure FDA0003994197860000027
表示第k个用户的本地数据集占所有用户总的数据集的权重,
Figure FDA0003994197860000028
表示加权平均得到的新的全局模型。
CN202211590792.3A 2022-12-12 2022-12-12 一种基于联邦学习的隐蔽通信检测方法 Pending CN115795548A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211590792.3A CN115795548A (zh) 2022-12-12 2022-12-12 一种基于联邦学习的隐蔽通信检测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211590792.3A CN115795548A (zh) 2022-12-12 2022-12-12 一种基于联邦学习的隐蔽通信检测方法

Publications (1)

Publication Number Publication Date
CN115795548A true CN115795548A (zh) 2023-03-14

Family

ID=85418747

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211590792.3A Pending CN115795548A (zh) 2022-12-12 2022-12-12 一种基于联邦学习的隐蔽通信检测方法

Country Status (1)

Country Link
CN (1) CN115795548A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116506072A (zh) * 2023-06-19 2023-07-28 华中师范大学 基于多任务联邦学习的mimo-noma***的信号检测方法
CN116797829A (zh) * 2023-06-13 2023-09-22 北京百度网讯科技有限公司 一种模型生成方法、图像分类方法、装置、设备及介质

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116797829A (zh) * 2023-06-13 2023-09-22 北京百度网讯科技有限公司 一种模型生成方法、图像分类方法、装置、设备及介质
CN116506072A (zh) * 2023-06-19 2023-07-28 华中师范大学 基于多任务联邦学习的mimo-noma***的信号检测方法
CN116506072B (zh) * 2023-06-19 2023-09-12 华中师范大学 基于多任务联邦学习的mimo-noma***的信号检测方法

Similar Documents

Publication Publication Date Title
Zhang et al. Deep learning based attack detection for cyber-physical system cybersecurity: A survey
Gu et al. Blind channel identification aided generalized automatic modulation recognition based on deep learning
Jagannath et al. A comprehensive survey on radio frequency (RF) fingerprinting: Traditional approaches, deep learning, and open challenges
CN115795548A (zh) 一种基于联邦学习的隐蔽通信检测方法
CN110113288B (zh) 一种基于机器学习的ofdm解调器的设计和解调方法
CN113645197B (zh) 一种去中心化的联邦学习方法、装置及***
Liao et al. A novel physical layer authentication method with convolutional neural network
CN104036780A (zh) 一种人机识别方法及***
Usama et al. Examining machine learning for 5G and beyond through an adversarial lens
CN114363043B (zh) 一种对等网络中基于可验证聚合和差分隐私的异步联邦学习方法
Elsaeidy et al. A smart city cyber security platform for narrowband networks
Wang et al. MsmcNet: A modular few-shot learning framework for signal modulation classification
Wu et al. DSLN: Securing Internet of Things through RF fingerprint recognition in low-SNR settings
KR20220046408A (ko) 의사 정상 데이터를 이용한 자가 감독 학습 기반의 차량 이상징후 탐지 장치 및 방법
Huang et al. Design of learning engine based on support vector machine in cognitive radio
Zhang et al. Adaptive RF fingerprints fusion via dual attention convolutions
Azar et al. Deep learning based hybrid intrusion detection systems to protect satellite networks
Shi et al. Fedrfid: Federated learning for radio frequency fingerprint identification of wifi signals
Fadul et al. Improving rf-dna fingerprinting performance in an indoor multipath environment using semi-supervised learning
Zhang et al. Spectrum focused frequency adversarial attacks for automatic modulation classification
Aminanto et al. Multi-class intrusion detection using two-channel color mapping in ieee 802.11 wireless network
CN113037668B (zh) 一种毫米波点对点通信信道均衡方法
CN114423011A (zh) 开放集wifi设备识别方法和装置
Abdulla et al. Identify features and parameters to devise an accurate intrusion detection system using artificial neural network
Liu Misbehavior detection based on deep learning for vanets

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination