CN113315978B - 一种基于联邦学习的协作式在线视频边缘缓存方法 - Google Patents
一种基于联邦学习的协作式在线视频边缘缓存方法 Download PDFInfo
- Publication number
- CN113315978B CN113315978B CN202110521197.3A CN202110521197A CN113315978B CN 113315978 B CN113315978 B CN 113315978B CN 202110521197 A CN202110521197 A CN 202110521197A CN 113315978 B CN113315978 B CN 113315978B
- Authority
- CN
- China
- Prior art keywords
- user
- users
- online video
- edge
- prediction model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 89
- 238000012549 training Methods 0.000 claims abstract description 62
- 230000004044 response Effects 0.000 claims description 22
- 238000012545 processing Methods 0.000 claims description 9
- 230000001419 dependent effect Effects 0.000 claims description 4
- 230000002238 attenuated effect Effects 0.000 claims description 3
- 230000001413 cellular effect Effects 0.000 claims description 3
- 230000008569 process Effects 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 239000011159 matrix material Substances 0.000 description 4
- 230000007423 decrease Effects 0.000 description 3
- 238000013135 deep learning Methods 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000013136 deep learning model Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 238000012952 Resampling Methods 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002035 prolonged effect Effects 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/21—Server components or server architectures
- H04N21/218—Source of audio or video content, e.g. local disk arrays
- H04N21/2181—Source of audio or video content, e.g. local disk arrays comprising remotely distributed storage units, e.g. when movies are replicated over a plurality of video servers
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/70—Information retrieval; Database structures therefor; File system structures therefor of video data
- G06F16/73—Querying
- G06F16/735—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/957—Browsing optimisation, e.g. caching or content distillation
- G06F16/9574—Browsing optimisation, e.g. caching or content distillation of access to content, e.g. by caching
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/231—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion
- H04N21/23106—Content storage operation, e.g. caching movies for short term storage, replicating data over plural servers, prioritizing data for deletion involving caching operations
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/234—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs
- H04N21/23406—Processing of video elementary streams, e.g. splicing of video streams or manipulating encoded video stream scene graphs involving management of server-side video buffer
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Multimedia (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Signal Processing (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
- Information Transfer Between Computers (AREA)
Abstract
本发明公开了一种基于联邦学习的协作式在线视频边缘缓存方法,参与对象包括多个用户、多个边缘节点及中心服务器,多个边缘节点为其覆盖区域内的可移动的多个用户提供服务,并且连接到中心服务器,每个边缘节点配置边缘服务器,所述方法包括如下步骤:步骤一,根据参与对象的多个用户、多个边缘节点及中心服务器建立网络模型;步骤二,采用改进的联邦学习方法建立预测模型并对预测模型进行训练,得到用户在线视频请求预测模型;步骤三,根据用户在线视频请求预测模型得到用户在线视频请求预测列表,多个边缘节点分析其区域覆盖范围内的用户请求预测列表,并采用协作式缓存决策进行边缘缓存。根据本发明的方法,训练之后的预测模型能够自动更新。
Description
技术领域
本发明涉及一种基于联邦学习的协作式视频边缘缓存方法,属于云边协同的边缘缓存技术领域。
背景技术
随着移动互联网社交平台的发展和智能终端设备的普及,人们对高质量实时数据的需求急剧上升,特别是短视频、直播等视频业务。常见的获取用户需求的方式对用户在线视频请求的预测模型的训练是在云计算中心进行的,传统的云计算模式要求云中心拥有很强的计算和存储能力,并且训练过程需要将大量用户请求信息的传输至云中心,这个传输过程不仅会占用网络流量,还可能造成用户的隐私泄露。如果为了减少与云中心的通信而选择延长预测模型的使用周期,则可能导致预测模型过时,出现预测结果不准确的问题。进一步,随着 5G时代的到来,传统的云计算模式已无法满足用户低时延的要求,5G网络也加剧了回程链路的负载。
为了弥补云计算模式的缺点,研究者们提出了边缘计算、云边协同的概念,并考虑使用边缘缓存的模式来缓存视频,从而满足用户低时延要求,降低回程流量。边缘缓存技术的核心是如何充分利用各边缘节点的存储资源,将具有一定需求度的内容放置在靠近用户的边缘节点上。由于边缘节点通常存储能力有限,因此在有限的存储空间下,在海量的内容中选择用户需求更高的内容进行缓存成为难点。
现有技术大多是通过各种不同深度学习的方法建立预测模型,对用户的在线视频请求进行预测并排序,然后顺次选择缓存的内容。然而,这些利用深度学习的方法也需要将用户的历史请求数据发送给云中心,然后才能对预测模型进行训练。而将数据发送至云中心的过程中存在泄露用户隐私数据的风险,也会占用大量宽带浪费资源;并且,由于用户的偏好具有时效性,训练好的模型会过时,需要不断收集用户请求数据重新训练失效的预测模型。
Saputra等人提出了基于分布式深度学习框架来预测内容流行度,将用户产生的计算任务分配给多台服务器进行计算处理,进行深度学习的具体方式依赖其提出的深度学习模型,例如卷积。分布式学习模型需要不同计算节点上的数据划分是独立同分布的,但为了保护隐私,用户请求数据通常不希望离开本地,从而每个用户应用产生的数据集更具有个性化,不是独立同分布的。因此,基于分布式的深度学习模型这种理想化的数据需求无法满足实际应用的场景。
发明内容
对于在线视频的边缘缓存,为了建立更准确的用户在线视频请求预测模型,选择用户需求度更高的内容进行缓存,从而提高在线视频缓存的命中率,并降低用户等待时延,减少回程流量,同时降低通信成本和缓存成本,本发明结合边缘缓存场景本身部署多个边缘节点的特性,提出了基于联邦学习的协作式在线视频边缘缓存方法,该方法能够使多个边缘节点协作学习并共享模型,无需将用户请求信息上传至云中心,并通过模型预测值和真实值的反馈自动判断模型是否过时,从而对模型进行自动更新。同时,本发明还提出多个边缘节点之间具有协作意识的缓存决策和服务响应的方案,减少邻近区域内大量重复内容的存储,节约缓存成本,并进一步减少时延和回程流量。
根据本发明的基于联邦学习的协作式视频边缘缓存方法,其具体技术方案如下:
一种基于联邦学习的协作式在线视频边缘缓存方法,参与对象包括多个用户、多个边缘节点及中心服务器,多个边缘节点通过无线蜂窝网络为其覆盖区域内的不同地理位置的可移动的多个用户提供服务,并且通过回程链路连接到中心服务器,并且每个边缘节点配置具备计算能力和存储能力的边缘服务器,所述方法包括如下步骤:
步骤一,根据参与对象的多个用户、多个边缘节点及中心服务器建立网络模型;
步骤二,采用改进的联邦学习方法建立预测模型并对预测模型进行训练,得到用户在线视频请求预测模型,然后对用户的在线视频请求进行预测;
步骤三,根据用户在线视频请求预测模型得到用户在线视频请求预测列表,多个边缘节点分析其区域覆盖范围内的用户请求预测列表,并采用协作式缓存决策进行边缘缓存。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法还包括,在所述步骤二中训练之后的预测模型进行自动更新。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,可选地,预测模型进行自动更新的方法为:边缘节点记录用户在线视频请求的服务响应情况,并计算边缘缓存的命中率和协作缓存命中率,并将计算得到的结果与设定阈值进行比较,如果低于阈值,则模型重新进行训练,实现自动更新。
在一种实施方式中,为方便描述,为接受到的在线视频请求, xf∈{0,1}表示缓存状态,xf=1表示有缓存,否则没有缓存。边缘节点记录用户请求的服务响应情况,计算缓存命中率和协作缓存命中率并将计算指标与设定阈值进行比较,如果低于阈值,则模型已过时,需要重新进行训练。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,可选地,中心服务器还能够与多个用户之间直接通信,并且步骤二中采用改进的联邦学习方法对用户的在线视频请求建立预测模型的具体步骤为:
S1.中心服务器向用户分发预测模型训练指令,包括对用户的请求数据进行数据处理的方法及预测模型的选择;
S2.各用户对自己本地请求数据中的用户信息和视频信息进行嵌入处理,并把经嵌入处理的用户信息发送至中心服务器;
S3.中心服务器将嵌入处理的用户信息进行聚类,形成p类用户集;从p类用户集中抽取m个用户参与模型训练,保证在每类用户集合中随机抽取的用户数量相等,并指令这m个用户进行预测模型的训练;
S4.中心服务器初始化全局的预测模型参数并分发给抽取的m个用户,各用户利用本地的请求数据对预测模型进行本地训练,并将训练后的局部模型参数发送至中心服务器;
S5.中心服务器聚合m个用户在本地训练后的局部模型参数,得到更新的全局模型参数,并将更新的全局模型参数发送至所有用户,进行新一轮的参数更新;
S6.重复S2-S5的步骤直至模型收敛,得到用户在线视频请求的预测模型,并进行请求预测获得预测列表。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,可选地,在预测模型进行参数更新时,采用改进的联邦学习参数更新方法对用户预测模型进行参数更新。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,可选地,在改进的联邦学习参数更新方法中,将聚类后的同类用户集中,被抽取参与模型训练的用户作为代表用户,其他未被抽取的用户作为从属用户;利用聚类后同类用户的相似性,在代表用户完成本地训练且中心服务器完成预测模型的全局参数更新之后,需要进行下一轮模型训练时,将从属用户的预测模型的参数进行更新。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,将用户预测模型中需要更新的参数分为用户信息嵌入参数、视频信息嵌入参数和非嵌入的参数,并采用如下规则进行参数更新:
针对用户信息嵌入参数,在同类用户中,代表用户采用其本地训练后更新的嵌入参数值,从属用户采用该从属用户上一轮次的嵌入参数值加上随轮次增加而衰减的同类用户集中所有代表用户的用户信息嵌入参数的变化量均值;
针对视频信息嵌入参数,与代表用户直接关联的视频信息的嵌入参数被更新,更新为代表用户对视频的影响因子乘以对应代表用户的视频信息嵌入参数再除以每个代表用户对该视频影响因子的和;
针对非嵌入参数,采用传统的联邦学习的参数更新方法。
在一种实施方式中,改进的联邦学习参数更新方法采用如下参数更新规则:
nk表示用户k的训练数据的数目;C表示用户组的集合;Ck表示用户k所在用户组的用户集合;S表示被抽取参与本轮训练的用户集合;w表示参数矩阵,w[J]表示索引J对应的部分参数矩阵;U表示用户嵌入参数的索引,I表示在线视频嵌入参数的索引;Uk表示用户k嵌入参数的索引;Ik表示中由用户k所关联到的在线视频的嵌入参数的索引;N表示非嵌入参数的索引。
在同类用户集中,将被抽取参与本轮训练的用户作为代表用户,其余未被抽取的用户作为从属用户,则关于模型参数的更新方式如下:
对于代表用户的用户信息嵌入参数,令代表用户k∈S,嵌入参数更新规则采用其本地训练后更新的嵌入参数值,即:
wt+1[Uk]=wt[Uk]
对于从属用户的用户信息嵌入参数,由于经过聚类操作后,同一用户组内的用户具有一定的相似性,所以其他从属用户的嵌入参数与该用户组中被抽取参与训练的代表用户的嵌入参数的更新有关,令代表用户k∈S,从属用户c∈Ck-S,该用户组所有代表用户的用户嵌入参数的变化量的和为δ[Uc]=Σk∈S(wt[Uk]-wt-1[Uk]),该用户组的代表用户总数为|Ck∩S|,γ为折扣率,随训练轮次增加而减小,则从属用户嵌入参数更新规则采用其原来的嵌入参数加上随轮次增加而衰减的该用户组所有代表用户的用户信息嵌入参数的变化量均值,即:
对于视频信息的嵌入参数,视频请求与用户也是有关的,与代表用户直接关联的视频信息嵌入参数可以进行相应更新,令代表用户kεS,用户k对其所有关联到的视频的影响因子为由其嵌入参数更新前后的变化量的和来决定,每个视频 iεUkεSIk,则视频信息嵌入参数更新规则采用代表用户k对视频i的影响因子乘以对应代表用户的视频信息嵌入参数再除以每个代表用户对该视频影响因子的和,即:
对于非嵌入参数,采用传统联邦学***均,即
根据本发明的联邦学习的协作式在线视频边缘缓存方法,优选地,多个边缘节点进行协作式缓存决策的方法为:
A1获取每个边缘节点覆盖区域范围内的多个用户在线视频请求的预测列表;
A2根据不同在线视频在多个用户的预测列表中出现的频率以及用户的参与性,计算得到在线视频的缓存价值;
A3根据在线视频缓存价值,各个边缘节点的边缘服务器协作进行缓存,直至没有多余的存储空间。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,可选地,多个边缘节点对用户的在线视频请求进行协作式服务响应。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,可选地,协作式服务响应包括:当每个边缘节点接收到其覆盖区域内的用户在线视频请求时,该边缘节点判断该在线视频是否存在于当前节点的缓存列表中:若存在,则该边缘节点进行本地服务响应,否则,该边缘节点其邻居节点的缓存列表;并判断该在线视频是否存在于其邻居节点的缓存列表中:若存在,则由该邻居节点进行服务相应,否则由中心服务器进行服务响应。
本发明有益效果是:
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,在建立用户在线视频请求的预测模型的过程中,采用改进的联邦学习方法,先对用户进行聚类,再对用户请求数据进行采样,可以极大程度提升预测模型的训练速度和模型收敛速度,减少通信成本。
由于传统的联邦学***均),即这之后再进行用户聚类的操作就是无效的了,因此,本发明根据聚类后同类用户的相似性,还提出针对性的改进的联邦学习参数更新方法,将同类用户集中没有被抽取到的从属用户也根据被抽取的代表用户的参数也进行了更新,保持聚类操作的有效性。
进一步,由于时间变化,用户在线视频请求的需求也会随之变化,因此训练好的关于用户请求的预测模型会过时,导致预测准确性下降,无法保证边缘缓存的在线视频的高命中率,还会增加用户等待时延,浪费存储资源,因此本发明提出自动更新模型,保证预测模型能够自动更新,使预测模型不会过时,从而保证用户在线视频的请求预测列表具有时效性,保证边缘缓存的在线视频的高命中率。
根据本发明的基于联邦学习的协作式在线视频边缘缓存方法,通过改进的联邦学习方法训练得到用户在线视频请求的预测模型,并根据反馈自动检测预测模型的有效性,并进行自动更新,不仅能够保护用户隐私,还在保证预测准确性的前提下降低了训练预测模型过程中需要传输海量用户请求信息的通信成本。进一步,通过协作式缓存决策和服务响应方案,本发明可以显著提高缓存命中率,减少用户等待时延和回程流量,还能降低缓存成本。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据本发明的边缘缓存方法的网络模型结构图;
图2是根据本发明的边缘缓存方法中改进的联邦学习参数更新方法的流程示意图;
图3是根据本发明的边缘缓存方法的流程示意图;
图4是根据本发明的边缘缓存方法中进行预测模型训练的示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
实施例一:
本实施例提供一种基于联邦学习的协作式视频边缘缓存方法,根据本实施例的基于联邦学习的协作式视频边缘缓存方法,其具体技术方案如下:
一种基于联邦学习的协作式在线视频边缘缓存方法,参与对象包括多个用户、多个边缘节点及中心服务器,多个边缘节点通过无线蜂窝网络为其覆盖区域内的不同地理位置的可移动的多个用户提供服务,并且通过回程链路连接到中心服务器,并且每个边缘节点配置具备计算能力和存储能力的边缘服务器,所述方法包括如下步骤:
步骤一,根据参与对象的多个用户、多个边缘节点及中心服务器建立网络模型,参见图 1;
步骤二,采用改进的联邦学习方法建立预测模型并对预测模型进行训练,得到用户在线视频请求预测模型,然后对用户的在线视频请求进行预测;
步骤三,根据用户在线视频请求预测模型得到用户在线视频请求预测列表,多个边缘节点分析其区域覆盖范围内的用户请求预测列表,并采用协作式缓存决策进行边缘缓存。
根据本实施例的基于联邦学习的协作式在线视频边缘缓存方法还包括,在所述步骤二中训练之后的预测模型进行自动更新。
根据本实施例的基于联邦学习的协作式在线视频边缘缓存方法,预测模型进行自动更新的方法为:边缘节点记录用户在线视频请求的服务响应情况,并计算边缘缓存的命中率和协作缓存命中率,并将计算得到的结果与设定阈值进行比较,如果低于阈值,则模型重新进行训练,实现自动更新。
在本实施方式中,为方便描述,为边缘节点接受到的在线视频请求, xf∈{0,1}表示边缘节点的缓存状态,xf=1表示有缓存,否则没有缓存。边缘节点记录用户请求的服务响应情况,计算缓存命中率和协作缓存命中率 并将计算指标与设定阈值进行比较,如果低于阈值,则模型已过时,需要重新进行训练。
根据本实施例的基于联邦学习的协作式在线视频边缘缓存方法,在网络模型中,中心服务器还能够与多个用户之间直接通信,并且步骤二中采用改进的联邦学习方法对用户的在线视频请求建立预测模型的具体步骤为:
S1.中心服务器向用户分发预测模型训练指令,包括对用户的请求数据进行数据处理的方法及预测模型的选择;
S2.各用户对自己本地请求数据中的用户信息和视频信息进行嵌入处理,并把经嵌入处理的用户信息发送至中心服务器;
S3.中心服务器对嵌入处理后的用户信息进行聚类,形成p类用户集;从p类用户集中抽取m个用户参与模型训练,保证在每类用户集合中随机抽取的用户数量相等,并指令这m个用户进行预测模型的训练;
S4.中心服务器初始化全局的预测模型参数并分发给抽取的m个用户,各用户利用本地的请求数据对预测模型进行本地训练,并将训练后的局部模型参数发送至中心服务器;
S5.中心服务器聚合m个用户在本地训练后的局部模型参数,得到更新的全局模型参数,并将更新的全局模型参数发送至所有用户,进行新一轮的参数更新;
S6.重复S2-S5的步骤直至模型收敛,得到用户在线视频请求的预测模型,并进行请求预测获得预测列表。
参考附图4,为便于具体描述,在本实施例中选择神经协同过滤,一种公知的推荐算法作为需要进行训练的网络模型进行解释,但本发明的方法过程不限于网络模型的选择,本领域的技术人员可以在领会本发明的精神后做出任何网络模型上的选择和修改。
根据所选用的算法,本实施例的预测模型的训练过程如下:
S1.中心服务器向用户分发预测模型训练指令,包括对用户的请求数据进行数据处理的方法及预测模型的选择;
S2.各用户对自己本地请求数据中的用户信息和视频信息进行嵌入处理,并把经嵌入处理的用户信息嵌入参数发送至中心服务器;
S3.中心服务器通过用户信息嵌入参数进行聚类,形成p类用户集;从p类用户集中抽取m个用户参与模型训练,保证在每类用户集合中随机抽取的用户数量相等,并指令这m个用户进行预测模型的训练;
S4.中心服务器初始化全局的预测模型参数并分发给抽取的m个用户,被抽取的m个用户利用该用户自己的数据进行本地训练并将训练后的局部参数发送至中心服务器,其中以神经过滤协同网络模型为例,用户进行训练的第一层神经协同过滤层定义为φ1(pu,qi)=pu⊙ qi,⊙表示向量内积,输出层表示为aout是输出层激活函数,h是输出层权重,通过损失函数的计算进行参数更新;
S5.中心服务器整合这m个用户训练后的局部模型参数,得到更新的全局模型参数,并将更新的全局模型参数发送至所有用户,进行新一轮的参数更新,如图2所示,在预测模型进行参数更新时,采用改进的联邦学习参数更新方法对用户请求数据进行更新。
在改进的联邦学习参数更新方法中,将聚类后的同类用户集中,被抽取参与模型训练的用户作为代表用户,其他未被抽取的用户作为从属用户;利用聚类后同类用户的相似性,在代表用户完成每一轮本地训练并完成模型全局参数更新之后,需要进行下一轮模型训练时,将从属用户的预测模型的参数进行更新。
根据本实施例的基于联邦学习的协作式在线视频边缘缓存方法,将用户预测模型中需要更新的参数分为用户信息嵌入参数、视频信息嵌入参数和非嵌入的参数,并采用如下规则进行参数更新:
针对用户信息嵌入参数,在同类用户集中,代表用户采用其本地训练后更新的嵌入参数值,从属用户采用该从属用户上一轮次的嵌入参数值加上随轮次增加而衰减的同类用户集中所有代表用户的用户信息嵌入参数的变化量均值;
针对视频信息嵌入参数,与代表用户直接关联的视频信息的嵌入参数被更新,更新为代表用户对视频的影响因子乘以对应代表用户的视频信息嵌入参数再除以每个代表用户对该视频影响因子的和;
针对非嵌入参数,采用传统的联邦学习的参数更新方法。
在本实施方式中,改进的联邦学习参数更新方法采用如下参数更新规则:
nk表示用户k的训练数据的数目;C表示用户组的集合;Ck表示用户k所在用户组的用户集合;S表示被抽取参与本轮训练的用户集合;w表示参数矩阵,w[J]表示索引J对应的部分参数矩阵;U表示用户嵌入参数的索引,I表示在线视频嵌入参数的索引;Uk表示用户k嵌入参数的索引;Ik表示中由用户k所关联到的在线视频的嵌入参数的索引;N表示非嵌入参数的索引。
在同类用户集中,将被抽取参与本轮训练的用户作为代表用户,其余未被抽取的用户作为从属用户,则关于模型参数的更新方式如下:
对于代表用户的嵌入参数,令代表用户k∈S,嵌入参数更新规则采用其本地训练后更新的嵌入参数值,即:
wt+1[Uk]=wt[Uk]
对于从属用户的嵌入参数,由于经过聚类操作后,同一用户组内的用户具有一定的相似性,所以其他从属用户的嵌入参数与该用户组中被抽取参与训练的代表用户的嵌入参数的更新有关,令代表用户k∈S,从属用户c∈Ck-S,该用户组所有代表用户的用户嵌入参数的变化量的和为δ[Uc]=Σk∈S(wt[Uk]-wt-1[Uk]),该用户组的代表用户总数为|Ck∩S|,γ为折扣率,随训练轮次增加而减小,则从属用户嵌入参数更新规则采用其原来的嵌入参数加上随轮次增加而衰减的该用户组所有代表用户的用户嵌入参数的变化量均值,即:
对于视频信息的嵌入参数,视频请求与用户也是有关的,与代表用户直接关联的视频的嵌入参数可以进行相应的更新,令代表用户k∈S,用户k对其所有关联到的视频的影响因子为由其嵌入参数更新前后的变化量的和来决定,每个视频 i∈∪k∈SIk,则视频嵌入参数更新规则采用代表用户k对视频i的影响因子乘以对应代表用户的视频信息嵌入参数再除以每个代表用户对该视频影响因子的和,即:
对于非嵌入的参数部分,采用传统联邦学***均,即
根据本实施例的联邦学习的协作式在线视频边缘缓存方法,其中多个边缘节点进行协作式缓存决策的方法为:
A1获取每个边缘节点覆盖区域范围内的多个用户在线视频请求的预测列表;
A2根据不同在线视频在多个用户的预测列表中出现的频率以及用户的参与性,计算得到在线视频的缓存价值;
A3根据在线视频缓存价值,各个边缘节点的边缘服务器协作进行缓存,直至没有多余的存储空间。
参考附图3,根据本实施例的基于联邦学习的协作式在线视频边缘缓存方法,多个边缘节点对用户的在线视频请求进行协作式服务响应。
根据本实施例的基于联邦学习的协作式在线视频边缘缓存方法,协作式服务响应包括:当每个边缘节点接收到其覆盖区域内的用户在线视频请求时,该边缘节点判断该在线视频是否存在于当前节点的缓存列表中:若存在,则该边缘节点进行本地服务响应,否则,该边缘节点其邻居节点的缓存列表;并判断该在线视频是否存在于其邻居节点的缓存列表中:若存在,则由该邻居节点进行服务相应,否则由中心服务器进行服务响应。
本发明实施例中的部分步骤,可以利用软件实现,相应的软件程序可以存储在可读取的存储介质中,如光盘或硬盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (6)
1.一种基于联邦学习的协作式在线视频边缘缓存方法,参与对象包括多个用户、多个边缘节点及中心服务器,所述多个边缘节点通过无线蜂窝网络为其覆盖区域内的不同地理位置的可移动的所述多个用户提供服务,并且通过回程链路连接到所述中心服务器,并且每个边缘节点配置具备计算能力和存储能力的边缘服务器,其特征在于:所述方法包括:
步骤一,根据参与对象的所述多个用户、所述多个边缘节点及所述中心服务器建立网络模型;
步骤二,采用改进的联邦学习方法建立预测模型并对所述预测模型进行训练,得到用户在线视频请求预测模型,然后对用户的在线视频请求进行预测;其中,采用所述改进的联邦学习方法对用户的在线视频请求建立所述预测模型的步骤为:
S1.所述中心服务器向所述多个用户分发预测模型训练指令,包括对所述多个用户的请求数据进行数据处理的方法及所述预测模型的选择;
S2.所述多个用户对自己本地请求数据中的用户信息和视频信息进行嵌入处理,并把嵌入处理的用户信息发送至所述中心服务器;
S3.所述中心服务器将嵌入处理的用户信息进行聚类,形成p类用户集;从p类用户集中抽取m个用户参与所述预测模型的训练,保证在每类用户集中随机抽取的用户数量相等,并指令所述m个用户进行所述预测模型的本地训练;
S4.所述中心服务器初始化所述预测模型的全局模型参数并分发给抽取的m个用户,各用户利用本地的请求数据对所述预测模型进行本地训练,并将训练后得到的局部模型参数发送至所述中心服务器;
S5.所述中心服务器聚合所述m个用户在本地训练后的局部模型参数,得到更新的全局模型参数,并将更新的全局模型参数发送至所述多个用户,进行新一轮的模型参数更新;
S6.重复S2-S5的步骤直至所述预测模型收敛,得到所述用户在线视频请求的预测模型,并进行请求预测获得用户在线视频请求的预测列表;
并且,训练之后的所述预测模型进行自动更新;自动更新的方法为:所述多个边缘节点记录用户在线视频请求的服务响应情况,并计算边缘缓存的命中率和协作缓存命中率,将计算得到的结果与设定阈值进行比较,如果低于阈值,则模型重新进行训练,实现自动更新;
步骤三,根据所述用户在线视频请求预测模型得到用户在线视频请求预测列表,所述多个边缘节点分析其区域覆盖范围内的所述用户在线视频请求预测列表,并采用协作式缓存决策进行边缘缓存;其中,所述多个边缘节点进行所述协作式缓存决策的方法为:
A1获取每个边缘节点覆盖区域范围内的用户在线视频请求的预测列表;
A2根据不同在线视频在所述多个用户的预测列表中出现的频率以及用户的参与性,计算得到在线视频的缓存价值;
A3根据在线视频缓存价值,所述多个边缘节点的边缘服务器协作进行缓存,直至没有多余的存储空间。
2.根据权利要求1所述的一种基于联邦学习的协作式在线视频边缘缓存方法,其特征在于,在所述预测模型进行参数更新时,采用改进的联邦学习参数更新方法对用户的预测模型进行参数更新。
3.根据权利要求2所述的一种基于联邦学习的协作式在线视频边缘缓存方法,其特征在于,在改进的联邦学习参数更新方法中,将聚类后的同类用户集中,被抽取参与模型训练的用户作为代表用户,其他未被抽取的用户作为从属用户;
利用聚类后同类用户的相似性,在代表用户完成本地训练并且所述中心服务器完成所述预测模型的全局参数更新之后,需要进行下一轮模型训练时,将从属用户的预测模型的参数进行更新。
4.根据权利要求3所述的一种基于联邦学习的协作式在线视频边缘缓存方法,将用户预测模型中需要更新的参数分为用户信息嵌入参数、视频信息嵌入参数和非嵌入的参数,并采用如下规则进行参数更新:
针对用户信息嵌入参数,所述代表用户采用其本地训练后更新的嵌入参数值,从属用户采用该从属用户上一轮次的嵌入参数值加上随轮次增加而衰减的同类用户集中所有代表用户的用户信息嵌入参数的变化量均值;
针对视频信息嵌入参数,与代表用户直接关联的视频信息的嵌入参数被更新,更新为代表用户对视频的影响因子乘以对应代表用户的视频信息嵌入参数再除以每个代表用户对该视频影响因子的和;
针对非嵌入参数,采用传统的联邦学习的参数更新方法。
5.根据权利要求1所述的一种基于联邦学习的协作式在线视频边缘缓存方法,其特征在于,所述多个边缘节点对所述多个用户的在线视频请求进行协作式服务响应。
6.根据权利要求5所述的一种基于联邦学习的协作式在线视频边缘缓存方法,其特征在于,所述协作式服务响应包括:当每个边缘节点接收到其覆盖区域内的用户在线视频请求时,该边缘节点判断该用户请求的在线视频是否存在于当前节点的缓存列表中:若存在,则该边缘节点进行本地服务响应,否则,该边缘节点获取其邻居节点的缓存列表;并判断该在线视频是否存在于其邻居节点的缓存列表中:若存在,则由该邻居节点进行服务相应,否则由所述中心服务器进行服务响应。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110521197.3A CN113315978B (zh) | 2021-05-13 | 2021-05-13 | 一种基于联邦学习的协作式在线视频边缘缓存方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110521197.3A CN113315978B (zh) | 2021-05-13 | 2021-05-13 | 一种基于联邦学习的协作式在线视频边缘缓存方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113315978A CN113315978A (zh) | 2021-08-27 |
CN113315978B true CN113315978B (zh) | 2022-03-15 |
Family
ID=77373187
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110521197.3A Active CN113315978B (zh) | 2021-05-13 | 2021-05-13 | 一种基于联邦学习的协作式在线视频边缘缓存方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113315978B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113965937B (zh) * | 2021-10-27 | 2024-02-13 | 东南大学 | 一种雾无线接入网中基于聚类联邦学习的内容流行度预测方法 |
CN114302236B (zh) * | 2021-12-22 | 2024-04-26 | 江苏号百科技有限公司 | 一种基于联邦学习的视频分发方法和*** |
CN114584801B (zh) * | 2022-01-13 | 2022-12-09 | 北京理工大学 | 一种基于图神经网络推荐算法的视频资源缓存方法 |
CN114595632A (zh) * | 2022-03-07 | 2022-06-07 | 北京工业大学 | 一种基于联邦学习的移动边缘缓存优化方法 |
CN115696296B (zh) | 2022-10-25 | 2023-07-07 | 山东大学 | 一种基于社区发现和加权联邦学习的主动边缘缓存方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112565331A (zh) * | 2020-11-02 | 2021-03-26 | 中山大学 | 一种基于边缘计算的端-边协同联邦学习优化方法 |
CN112752308A (zh) * | 2020-12-31 | 2021-05-04 | 厦门越人健康技术研发有限公司 | 一种基于深度强化学习的移动预测无线边缘缓存方法 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107909108B (zh) * | 2017-11-15 | 2021-06-11 | 东南大学 | 基于内容流行度预测的边缘缓存***及其方法 |
WO2020115273A1 (en) * | 2018-12-07 | 2020-06-11 | Telefonaktiebolaget Lm Ericsson (Publ) | Predicting network communication performance using federated learning |
US11323514B2 (en) * | 2019-04-30 | 2022-05-03 | EMC IP Holding Company LLC | Data tiering for edge computers, hubs and central systems |
CN110263921B (zh) * | 2019-06-28 | 2021-06-04 | 深圳前海微众银行股份有限公司 | 一种联邦学习模型的训练方法及装置 |
CN110929880A (zh) * | 2019-11-12 | 2020-03-27 | 深圳前海微众银行股份有限公司 | 一种联邦学习方法、装置及计算机可读存储介质 |
CN111277860B (zh) * | 2020-01-23 | 2021-04-06 | 北京邮电大学 | 移动边缘网络中视频缓存的方法、装置、设备及可读介质 |
CN111865826B (zh) * | 2020-07-02 | 2022-01-04 | 大连理工大学 | 一种基于联邦学习的主动内容缓存方法 |
CN111935784B (zh) * | 2020-08-12 | 2022-04-22 | 重庆邮电大学 | 一种雾计算网络中基于联邦学习的内容缓存方法 |
CN112118295A (zh) * | 2020-08-21 | 2020-12-22 | 深圳大学 | 文件缓存方法、装置、边缘节点以及计算机可读存储介质 |
-
2021
- 2021-05-13 CN CN202110521197.3A patent/CN113315978B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112565331A (zh) * | 2020-11-02 | 2021-03-26 | 中山大学 | 一种基于边缘计算的端-边协同联邦学习优化方法 |
CN112752308A (zh) * | 2020-12-31 | 2021-05-04 | 厦门越人健康技术研发有限公司 | 一种基于深度强化学习的移动预测无线边缘缓存方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113315978A (zh) | 2021-08-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113315978B (zh) | 一种基于联邦学习的协作式在线视频边缘缓存方法 | |
CN111835827B (zh) | 物联网边缘计算任务卸载方法及*** | |
CN111901392B (zh) | 一种面向移动边缘计算的内容部署与分发方法及*** | |
Wang et al. | A novel reputation-aware client selection scheme for federated learning within mobile environments | |
CN114357455B (zh) | 一种基于多维属性信任评估的信任方法 | |
CN115633380B (zh) | 一种考虑动态拓扑的多边缘服务缓存调度方法和*** | |
CN115941790A (zh) | 边缘协同内容缓存方法、装置、设备及存储介质 | |
CN116346837A (zh) | 一种基于深度强化学习的物联网边缘协同缓存方法 | |
CN114281718A (zh) | 一种工业互联网边缘服务缓存决策方法及*** | |
Li et al. | Human in the loop: distributed deep model for mobile crowdsensing | |
CN114374949B (zh) | 一种车联网中基于信息新鲜度优化的功率控制机制 | |
CN111770152B (zh) | 一种边缘数据管理方法、介质、边缘服务器和*** | |
CN111885551B (zh) | 基于边云协同模式的多移动社交网络中高影响力用户的选择和分配机制 | |
CN117459112A (zh) | 基于图卷积网络的leo卫星网络中的移动边缘缓存方法及设备 | |
CN115587266A (zh) | 一种空天地一体化互联网智能边缘缓存方法 | |
CN111901394B (zh) | 一种联合考虑用户偏好及活跃程度的移动边缘缓存的方法及*** | |
CN115129888A (zh) | 一种基于网络边缘知识图谱的主动内容缓存方法 | |
Khodaparas et al. | An Intelligent Caching Scheme Considering the Spatio-Temporal Characteristics of Data in Internet of Vehicles | |
CN114519150A (zh) | 物联网网络的互信评价方法及*** | |
CN107609039B (zh) | 基于cdn的热门影片在近端缓存服务器的空间分配方法 | |
CN114285748B (zh) | 基于物联网的信誉评价方法及*** | |
CN106941451B (zh) | 一种基于网络感知和覆盖率阈值矩阵的文件智能缓存方法 | |
CN116016514B (zh) | 一种边缘计算服务的智能自适应编排方法 | |
CN111372096B (zh) | 一种基于d2d辅助的视频质量自适应缓存方法和设备 | |
Liu et al. | Social-aware D2MD user grouping based on game theory and deep Q-learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |