CN114840873A - 一种基于联邦遗传编程的符号回归方法 - Google Patents

一种基于联邦遗传编程的符号回归方法 Download PDF

Info

Publication number
CN114840873A
CN114840873A CN202210366425.9A CN202210366425A CN114840873A CN 114840873 A CN114840873 A CN 114840873A CN 202210366425 A CN202210366425 A CN 202210366425A CN 114840873 A CN114840873 A CN 114840873A
Authority
CN
China
Prior art keywords
population
fitness
server
chromosome
client
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210366425.9A
Other languages
English (en)
Inventor
钟竞辉
董俊兰
陈伟能
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
South China University of Technology SCUT
Original Assignee
South China University of Technology SCUT
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by South China University of Technology SCUT filed Critical South China University of Technology SCUT
Priority to CN202210366425.9A priority Critical patent/CN114840873A/zh
Publication of CN114840873A publication Critical patent/CN114840873A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/12Computing arrangements based on biological models using genetic models
    • G06N3/126Evolutionary algorithms, e.g. genetic algorithms or genetic programming
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Biology (AREA)
  • Mathematical Physics (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • Computational Linguistics (AREA)
  • Biomedical Technology (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Physiology (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于联邦遗传编程的符号回归方法。所述方法包括以下步骤:创建多线程,确定接入服务器的客户端数量,确保客户端访问服务器成功;随机初始化种群;多个客户端并行的进行种群的适应度计算,判断适应值是否达到终止条件,是则退出,否则执行服务器适应度聚合;根据均值漂移聚合机制进行适应度聚合,得到聚合的适应度值F;根据聚合的适应度值F选择个体的过程,被选择的个体在之后会作为父系,通过遗传算子繁育下一代程序个体;基因以一定的概率随机改变为新值;每个基因与突变载体交叉,生成一个种群,返回判断适应值是否达到终止条件。本发明的符号回归方法能够充分利用数据信息,与传统的基因编程算法相比,效果更好。

Description

一种基于联邦遗传编程的符号回归方法
技术领域
本发明涉及的具体技术领域为智能计算和高性能计算,特别涉及基于联邦遗传编程的符号回归方法。
背景技术
随着智能化的普及,各种各样的边缘设备成为了生活必不可少的组成部分,例如智能手机,智能电脑,智能电器等。各种数据被分散的存储在各个设备中,如果将数据集中放置服务器存储起来,在传输的过程中会带来很大的安全隐患,并且通信开销巨大。目前网络空间的安全对个人甚至整个国家都有着很大的影响,如何在满足保护数据隐私且安全的前提下,利用这些边缘设备的数据设计出一个机器学习框架是当前研究的重点。
近年来,基于深度学习模型可解释性差且对硬件要求高,越来越多的研究者开始把目光放在了可解释机器学习上,使得符号回归成为热门话题。遗传编程(GP)算法是目前研究符号回归问题的主流方法。遗传编程的原理是对非线性的树状结构程序即遗传算法中的染色体进行优化,同时还需要对染色体进行解析。目前,遗传编程广泛运用在模式识别,图像分析,符号回归等领域。
然而,现有的遗传编程算法存在以下不足之处:一方面,当前技术都没有从数据的维度去考虑数据隐私和数据安全问题。另一方面,目前的遗传编程搜索纯粹由训练数据样本上观察到的预测误差驱动,当数据样本不能充分覆盖输入空间时,预测误差不能为期望的模型提供足够的指导(基于自适应并行遗传算法的大规模符号回归方法及***)。
发明内容
从保护数据的隐私性和安全性出发,解决分布式遗传编程没有考虑到的技术问题。本发明提出了一种基于联邦遗传编程的符号回归方法,该方法能够在不集中数据的情况下训练全局模型。每个客户端可以在本地并行地处理本地数据,而不需要将原始数据发送到服务器。这种方法既保护了数据的私密性和安全性,又减少了数据采集的时间。此外,还提出了一种均值漂移(Mean Shift)聚合机制来聚合局部适应度。考虑到样本的相对重要性,该机制研究了通过将权值纳入适应度函数来改善对真实数据的符号回归的可能性。
本发明的目的至少通过如下技术方案之一实现。
一种基于联邦遗传编程的符号回归方法,包括以下步骤:
S1:初始化:创建多线程,确定接入服务器的客户端数量,确保客户端访问服务器成功;随机初始化种群,种群大小为NP;
S2:客户端适应度计算:多个客户端并行的进行种群的适应度计算,判断适应值是否达到终止条件,是则退出,否则执行步骤S3;
S3:服务器适应度聚合:根据均值漂移(Mean shift)聚合机制进行适应度聚合,得到聚合的种群适应度F;
S4:基因选择:根据聚合的种群适应度F选择个体的过程,被选择的个体在之后会作为父系,通过遗传算子繁育下一代程序个体;
S5:基因突变:基因以一定的概率随机改变为新值;
S6:基因交叉:每个基因与突变载体交叉,生成一个种群,返回步骤S2。
进一步地,步骤S1中,构建一个用于符号回归的符号回归***,符号回归***包括多个客户端和一个中心服务器即服务端,服务端发送种群给客户端,客户端根据自身的数据计算出适应度返回给服务端,双方传递的都不是原始数据,解决了隐私环境下数据不共享的问题。
进一步地,步骤S1中,启动服务器和多个客户端;服务器实时监控是否有申请接入的服务器端或者需要断开的已连接的客户端,当一个新的客户端请求访问时,服务器立即响应客户端的接入;当所有客户端成功连接后,在服务器上进行种群初始化;服务器中,服务器确认连接的客户端的IP和端口,然后统一将初始种群发送给客户端;
服务器中的种群初始化是指生成NP个随机染色体,形成初始种群,具体表示如下:
X={Xi|Xi=[xi,1,xi,2,...,xi,L],i=1,2,...,NP} (1)
其中,Xi是代表第i个染色体的向量,i是种群中染色体的索引,xi,j是第i个染色体Xi的第j个元素,L是染色体的长度,NP代表种群大小;每个染色体包括一个主程序和多个子函数,主程序和子函数都由头部和尾部的基因表达式组成;
客户端中,在启动前确认需要连接的服务器的IP地址和端口号,在成功连接服务器后,等待服务器发送种群进行适应度计算。
进一步地,步骤S2中,客户端获取种群后,种群中的每条染色体编码为与染色体长度相等的表达式;假定所有客户端的数据集如下表示:
D={D1,...,Dk,...,DK} (2)
其中,Dk表示连接服务器的第k台客户端的数据,k=1~K,K为连接服务器的客户端的数量;经过染色体编码和计算得到整个种群适应度f,表示如下:
Figure BDA0003587306330000031
其中,NP表示种群大小,fk(Xi)表示种群中第i条染色体在第k台客户端计算出来的适应度值,i=1~NP。
进一步地,步骤S3中,采用均值漂移聚合机制,每个染色体根据每个客户端的重要性聚合多个适应度,均值漂移聚合机制算法具体如下:
S3.1:初始化聚合的种群适应度F=0,获取随机中心点x;
S3.2:输入核带宽h、聚合终止距离sd,、整个种群适应度f和客户端权重W=[w1,w2,...,wk];
S3.3:计算整个种群适应度f到随机中心点x的所有距离,然后找到核带宽h范围内的所有点,称为集合M;
S3.4:计算随机中心点x到集合M中每一点的向量,将所有向量相加得到Mh(x);
S3.5:随机中心点x沿着Mh(x)的方向移动,中心点变成x'=x+||Mh(x)||;
S3.6:循环步骤S3.3-步骤S3.5,直到满足|Mh(x)||<sd,执行步骤S3.7;
S3.7:输出聚合的种群适应度F;
均值漂移聚合机制算法中的核带宽h是高斯核函数的重要参数,取值不同聚合效果不一样;客户端的权重W根据客户端数据量占所有客户端数据总量的百分比计算。
进一步地,Mh(x)具体计算公式如下:
Figure BDA0003587306330000041
其中,xi表示种群中第i条染色体,wk表示第k台客户端的权重,
Figure BDA0003587306330000042
表示高斯核函数。
进一步地,步骤S4中,基于步骤S3中获得的聚合的种群适应度F={fc(X1),...,fc(Xi),...,fc(XNP)},选择后代来替代父代的染色体,形成一个新的群体,具体如下:
Figure BDA0003587306330000043
其中,f(Ui)表示父代染色体Ui的适应度,父代染色体表示上一轮训练的染色体,fc(Xi)表示第i条染色体Xi聚合的适应度值。
进一步地,步骤S5中,基于传统DE突变方案“DE/current-to-best/1”,染色体中的基因以某个概率随机改变为新值,具体如下:
Yi=Xi+β(Xbest-Xi)+β{Xr1-Xr2} (5)
其中,Yi表示种群中第i条染色体Xi的突变载体,Xbest是种群中最好的个体,Xr1、Xr2和Xi分别为三个不同的个体,Xr1和Xr2从种群中随机选取;β为缩放因子,取值为rand(0,1)。
进一步地,步骤S6中,种群中第i条染色体Xi中的每个元素与突变载体Yi的每个元素交叉,创建一个新的试验载体,使种群能够在解空间中寻找更好的解;种群中第i条染色体Xi中的每一条基因通过突变载体Yi创建一个新的试验向量Zi,具体表示如下:
Figure BDA0003587306330000051
其中,zi,j、yi,j和xi,j分别表示试验向量Zi、突变载体Yi和染色体Xi的第j个元素;CR表示交叉概率,取值为rand(0,1);l是1和L之间的随机整数,L染色体的长度;
交叉操作完成后,生成一个新的种群;将新种群发送至客户端,返回步骤S2。
进一步地,步骤S2中,适应度计算采用符号回归中的均方根误差(RMSE),给定均方根误差(RMSE)的设定值,当种群适应度f小于设定值时,即为达到终止条件,完成符号回归。
相比与现有技术,本发明的优点在于:
(1)本发明针对现有的分布式GP技术而言,通过联邦学习训练全局模型,可以保护数据的隐私性和安全性。同时,本发明中的客户端拥有绝对的自由权,可以随时进入整个***也可以同时退出,更加符合现实环境下的应用场景。
(2)本发明采用基于均值漂移聚合方法进一步提高了遗传编程算法的搜索性能,同时还考虑了数据样本的重要程度不一致赋予不同的权重,从而有效地解决真实环境下的符号回归问题。
(3)本发明的符号回归方法能够充分利用数据信息,与传统的基因编程算法相比,效果更好。
附图说明
图1本发明实施例中一种基于联邦遗传编程的符号回归方法的算法框架图;
图2本发明实施例中染色体编码示意图;
图3本发明实施例中解决的符号回归示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合附图并举实施例,对本发明的具体实施进行详细说明。
实施例1:
这项工作的主要目的是解决符号回归问题,当数据分散在不同的本地机器上,不允许被传输到中央服务器。同时,每个客户端的数据分布并没有覆盖整个样本空间,每个客户端的数据量是不同的。客户端单独训练模型时,每台客户端都能训练出多个不同的函数表达式,离近似函数相差甚远。如图3所示,本发明提出一种联邦训练的方式,联合多台客户端的数据进行训练,最终可以得到想要的目标函数。
一种基于联邦遗传编程的符号回归方法,如图1所示,包括以下步骤:
S1:初始化:创建多线程,确定接入服务器的客户端数量,确保客户端访问服务器成功;随机初始化种群,种群大小为NP;
构建一个用于符号回归的符号回归***,符号回归***包括多个客户端和一个中心服务器即服务端,服务端发送种群给客户端,客户端根据自身的数据计算出适应度返回给服务端,双方传递的都不是原始数据,解决了隐私环境下数据不共享的问题。
启动服务器和多个客户端;服务器实时监控是否有申请接入的服务器端或者需要断开的已连接的客户端,当一个新的客户端请求访问时,服务器立即响应客户端的接入;当所有客户端成功连接后,在服务器上进行种群初始化;服务器中,服务器确认连接的客户端的IP和端口,然后统一将初始种群发送给客户端;
服务器中的种群初始化是指生成NP个随机染色体,形成初始种群,具体表示如下:
X={Xi|Xi=[xi,1,xi,2,...,xi,L],i=1,2,...,NP} (1)
其中,Xi是代表第i个染色体的向量,i是种群中染色体的索引,xi,j是第i个染色体Xi的第j个元素,L是染色体的长度,NP代表种群大小;每个染色体包括一个主程序和多个子函数,主程序和子函数都由头部和尾部的基因表达式组成,如图2所示;
客户端中,在启动前确认需要连接的服务器的IP地址和端口号,在成功连接服务器后,等待服务器发送种群进行适应度计算。
S2:客户端适应度计算:多个客户端并行的进行种群的适应度计算,判断适应值是否达到终止条件,是则退出,否则执行步骤S3;
客户端获取种群后,种群中的每条染色体编码为与染色体长度相等的表达式;假定所有客户端的数据集如下表示:
D={D1,...,Dk,...,DK} (2)
其中,Dk表示连接服务器的第k台客户端的数据,k=1~K,K为连接服务器的客户端的数量;经过染色体编码和计算得到整个种群适应度f,表示如下:
Figure BDA0003587306330000071
其中,NP表示种群大小,fk(Xi)表示种群中第i条染色体在第k台客户端计算出来的适应度值,i=1~NP。
适应度计算采用符号回归中的均方根误差(RMSE),给定均方根误差(RMSE)的设定值,当种群适应度f小于设定值时,即为达到终止条件,完成符号回归。
S3:服务器适应度聚合:根据均值漂移(Mean shift)聚合机制进行适应度聚合,得到聚合的种群适应度F;
采用均值漂移聚合机制,每个染色体根据每个客户端的重要性聚合多个适应度,均值漂移聚合机制算法具体如下:
S3.1:初始化聚合的种群适应度F=0,获取随机中心点x;
S3.2:输入核带宽h、聚合终止距离sd,、整个种群适应度f和客户端权重W=[w1,w2,...,wk];
S3.3:计算整个种群适应度f到随机中心点x的所有距离,然后找到核带宽h范围内的所有点,称为集合M;
S3.4:计算随机中心点x到集合M中每一点的向量,将所有向量相加得到Mh(x);
S3.5:随机中心点x沿着Mh(x)的方向移动,中心点变成x'=x+||Mh(x)||;
S3.6:循环步骤S3.3-步骤S3.5,直到满足|Mh(x)||<sd,执行步骤S3.7;
S3.7:输出聚合的种群适应度F;
均值漂移聚合机制算法中的核带宽h是高斯核函数的重要参数,取值不同聚合效果不一样;客户端的权重W根据客户端数据量占所有客户端数据总量的百分比计算。
Mh(x)具体计算公式如下:
Figure BDA0003587306330000081
其中,xi表示种群中第i条染色体,wk表示第k台客户端的权重,
Figure BDA0003587306330000082
表示高斯核函数。
S4:基因选择:
基于步骤S3中获得的聚合的种群适应度F={fc(X1),...,fc(Xi),...,fc(XNP)},选择后代来替代父代的染色体,形成一个新的群体,具体如下:
Figure BDA0003587306330000083
其中,f(Ui)表示父代染色体Ui的适应度,父代染色体表示上一轮训练的染色体,fc(Xi)表示第i条染色体Xi聚合的适应度值。
S5:基因突变:
基于传统DE突变方案“DE/current-to-best/1”,染色体中的基因以某个概率随机改变为新值,具体如下:
Yi=Xi+β(Xbest-Xi)+β{Xr1-Xr2} (5)
其中,Yi表示种群中第i条染色体Xi的突变载体,Xbest是种群中最好的个体,Xr1、Xr2和Xi分别为三个不同的个体,Xr1和Xr2从种群中随机选取;β为缩放因子,取值为rand(0,1)。
S6:基因交叉:
种群中第i条染色体Xi中的每个元素与突变载体Yi的每个元素交叉,创建一个新的试验载体,使种群能够在解空间中寻找更好的解;种群中第i条染色体Xi中的每一条基因通过突变载体Yi创建一个新的试验向量Zi,具体表示如下:
Figure BDA0003587306330000091
其中,zi,j、yi,j和xi,j分别表示试验向量Zi、突变载体Yi和染色体Xi的第j个元素;CR表示交叉概率,取值为rand(0,1);l是1和L之间的随机整数,L染色体的长度;
交叉操作完成后,生成一个新的种群;将新种群发送至客户端,返回步骤S2。
本实施例中,为了验证本发明的算法框架的性能,首先在5个人为工定制的标准数据集上进行验证。本发明的算法的参数设置为:种群大小为NP=30,最大迭代次数R=20000,sd=0.5,核带宽h=3,适应度值终止值为RMSE<10-4
实施例2:
本实施例中,为了进一步验证本发明的有效性,在5个噪声数据集上进行了验证。本发明的算法的参数设置为:种群大小为NP=50,最大迭代次数R=20000,sd=0.5,核带宽h=3,适应度值终止值为RMSE<10-4
实施例3:
本实施例中,最后,本发明在2个真实场景数据集上进行了验证。本发明的算法的参数设置为:种群大小为NP=50,最大迭代次数R=20000,sd=0.5,核带宽h=3,适应度值终止值为RMSE<10-4
三个实施案例的最终的结果都表明,本发明在不同环境下数据集的RMSE、收敛速度上都要明显优于现有的遗传编程算法。这说明采用本发明不仅能够保护数据信息,同时提高了遗传编程算法的搜索能力。

Claims (10)

1.一种基于联邦遗传编程的符号回归方法,其特征在于,包括以下步骤:
S1:初始化:创建多线程,确定接入服务器的客户端数量,确保客户端访问服务器成功;随机初始化种群,种群大小为NP;
S2:客户端适应度计算:多个客户端并行的进行种群的适应度计算,判断适应值是否达到终止条件,是则退出,否则执行步骤S3;
S3:服务器适应度聚合:根据均值漂移(Mean shift)聚合机制进行适应度聚合,得到聚合的种群适应度F;
S4:基因选择:根据聚合的种群适应度F选择个体的过程,被选择的个体在之后会作为父系,通过遗传算子繁育下一代程序个体;
S5:基因突变:基因以一定的概率随机改变为新值;
S6:基因交叉:每个基因与突变载体交叉,生成一个种群,返回步骤S2。
2.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S1中,构建一个用于符号回归的符号回归***,符号回归***包括多个客户端和一个中心服务器即服务端,服务端发送种群给客户端,客户端根据自身的数据计算出适应度返回给服务端,双方传递的都不是原始数据,解决了隐私环境下数据不共享的问题。
3.根据权利要求2所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S1中,启动服务器和多个客户端;服务器实时监控是否有申请接入的服务器端或者需要断开的已连接的客户端,当一个新的客户端请求访问时,服务器立即响应客户端的接入;当所有客户端成功连接后,在服务器上进行种群初始化;服务器中,服务器确认连接的客户端的IP和端口,然后统一将初始种群发送给客户端;
服务器中的种群初始化是指生成NP个随机染色体,形成初始种群,具体表示如下:
X={Xi|Xi=[xi,1,xi,2,...,xi,L],i=1,2,...,NP} (1)
其中,Xi是代表第i个染色体的向量,i是种群中染色体的索引,xi,j是第i个染色体Xi的第j个元素,L是染色体的长度,NP代表种群大小;每个染色体包括一个主程序和多个子函数,主程序和子函数都由头部和尾部的基因表达式组成;
客户端中,在启动前确认需要连接的服务器的IP地址和端口号,在成功连接服务器后,等待服务器发送种群进行适应度计算。
4.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S2中,客户端获取种群后,种群中的每条染色体编码为与染色体长度相等的表达式;假定所有客户端的数据集如下表示:
D={D1,...,Dk,...,DK} (2)
其中,Dk表示连接服务器的第k台客户端的数据,k=1~K,K为连接服务器的客户端的数量;经过染色体编码和计算得到整个种群适应度f,表示如下:
Figure FDA0003587306320000021
其中,NP表示种群大小,fk(Xi)表示种群中第i条染色体在第k台客户端计算出来的适应度值,i=1~NP。
5.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S3中,采用均值漂移聚合机制,每个染色体根据每个客户端的重要性聚合多个适应度,均值漂移聚合机制算法具体如下:
S3.1:初始化聚合的种群适应度F=0,获取随机中心点x;
S3.2:输入核带宽h、聚合终止距离sd,、整个种群适应度f和客户端权重W=[w1,w2,...,wk];
S3.3:计算整个种群适应度f到随机中心点x的所有距离,然后找到核带宽h范围内的所有点,称为集合M;
S3.4:计算随机中心点x到集合M中每一点的向量,将所有向量相加得到Mh(x);
S3.5:随机中心点x沿着Mh(x)的方向移动,中心点变成x'=x+||Mh(x)||;
S3.6:循环步骤S3.3-步骤S3.5,直到满足|Mh(x)||<sd,执行步骤S3.7;
S3.7:输出聚合的种群适应度F;
均值漂移聚合机制算法中的核带宽h是高斯核函数的重要参数,取值不同聚合效果不一样;客户端的权重W根据客户端数据量占所有客户端数据总量的百分比计算。
6.根据权利要求5所述的一种基于联邦遗传编程的符号回归方法,其特征在于,Mh(x)具体计算公式如下:
Figure FDA0003587306320000031
其中,xi表示种群中第i条染色体,wk表示第k台客户端的权重,
Figure FDA0003587306320000032
表示高斯核函数。
7.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S4中,基于步骤S3中获得的聚合的种群适应度F={fc(X1),...,fc(Xi),...,fc(XNP)},选择后代来替代父代的染色体,形成一个新的群体,具体如下:
Figure FDA0003587306320000033
其中,f(Ui)表示父代染色体Ui的适应度,父代染色体表示上一轮训练的染色体,fc(Xi)表示第i条染色体Xi聚合的适应度值。
8.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S5中,基于传统DE突变方案“DE/current-to-best/1”,染色体中的基因以某个概率随机改变为新值,具体如下:
Yi=Xi+β(Xbest-Xi)+β{Xr1-Xr2} (5)
其中,Yi表示种群中第i条染色体Xi的突变载体,Xbest是种群中最好的个体,Xr1、Xr2和Xi分别为三个不同的个体,Xr1和Xr2从种群中随机选取;β为缩放因子,取值为rand(0,1)。
9.根据权利要求1所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S6中,种群中第i条染色体Xi中的每个元素与突变载体Yi的每个元素交叉,创建一个新的试验载体,使种群能够在解空间中寻找更好的解;种群中第i条染色体Xi中的每一条基因通过突变载体Yi创建一个新的试验向量Zi,具体表示如下:
Figure FDA0003587306320000041
其中,zi,j、yi,j和xi,j分别表示试验向量Zi、突变载体Yi和染色体Xi的第j个元素;CR表示交叉概率,取值为rand(0,1);l是1和L之间的随机整数,L染色体的长度;
交叉操作完成后,生成一个新的种群;将新种群发送至客户端,返回步骤S2。
10.根据权利要求1~9任一项所述的一种基于联邦遗传编程的符号回归方法,其特征在于,步骤S2中,适应度计算采用符号回归中的均方根误差(RMSE),给定均方根误差(RMSE)的设定值,当种群适应度f小于设定值时,即为达到终止条件,完成符号回归。
CN202210366425.9A 2022-04-08 2022-04-08 一种基于联邦遗传编程的符号回归方法 Pending CN114840873A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210366425.9A CN114840873A (zh) 2022-04-08 2022-04-08 一种基于联邦遗传编程的符号回归方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210366425.9A CN114840873A (zh) 2022-04-08 2022-04-08 一种基于联邦遗传编程的符号回归方法

Publications (1)

Publication Number Publication Date
CN114840873A true CN114840873A (zh) 2022-08-02

Family

ID=82563596

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210366425.9A Pending CN114840873A (zh) 2022-04-08 2022-04-08 一种基于联邦遗传编程的符号回归方法

Country Status (1)

Country Link
CN (1) CN114840873A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117217150A (zh) * 2023-09-13 2023-12-12 华南理工大学 一种基于遗传算法符号回归的dtco公式建模方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117217150A (zh) * 2023-09-13 2023-12-12 华南理工大学 一种基于遗传算法符号回归的dtco公式建模方法
CN117217150B (zh) * 2023-09-13 2024-05-17 华南理工大学 一种基于遗传算法符号回归的dtco公式建模方法

Similar Documents

Publication Publication Date Title
CN111797321B (zh) 一种面向不同场景的个性化知识推荐方法及***
CN110084365A (zh) 一种基于深度学习的服务提供***及方法
US20220130496A1 (en) Method of training prediction model for determining molecular binding force
CN111091247A (zh) 基于深度神经网络模型融合的电力负荷预测方法、装置
CN112561039A (zh) 一种改进的基于超网络的进化神经网络架构搜索方法
CN114585006B (zh) 基于深度学习的边缘计算任务卸载和资源分配方法
CN115374853A (zh) 基于T-Step聚合算法的异步联邦学习方法及***
CN110858226A (zh) 对话管理方法和装置
CN114840873A (zh) 一种基于联邦遗传编程的符号回归方法
CN106803092B (zh) 一种标准问题数据的确定方法及装置
CN115525038A (zh) 一种基于联邦分层优化学习的设备故障诊断方法
CN117290721A (zh) 数字孪生建模方法、装置、设备及介质
Zhou et al. Big data and knowledge graph based fault diagnosis for electric power systems
CN111814044A (zh) 一种推荐方法、装置、终端设备及存储介质
Tao et al. DNA double helix based hybrid GA for the gasoline blending recipe optimization problem
CN106953820A (zh) 基于双Sigmoid复数连续神经网络的信号盲检测方法
CN117033997A (zh) 数据切分方法、装置、电子设备和介质
Qian et al. SVM Multi-Classification Optimization Research based on Multi-Chromosome Genetic Algorithm
US20240006017A1 (en) Protein Structure Prediction
Ping et al. FL-TAC: Enhanced Fine-Tuning in Federated Learning via Low-Rank, Task-Specific Adapter Clustering
CN112529637B (zh) 基于情景感知的服务需求动态预测方法及***
Morell et al. A multi-objective approach for communication reduction in federated learning under devices heterogeneity constraints
CN108830422A (zh) 智能驾驶的优化方法、装置及***
Singhal et al. Greedy Shapley Client Selection for Communication-Efficient Federated Learning
CN114186168A (zh) 面向智能城市网络资源的相关性分析方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination