CN111224806A - 一种资源分配方法及服务器 - Google Patents
一种资源分配方法及服务器 Download PDFInfo
- Publication number
- CN111224806A CN111224806A CN201811422859.6A CN201811422859A CN111224806A CN 111224806 A CN111224806 A CN 111224806A CN 201811422859 A CN201811422859 A CN 201811422859A CN 111224806 A CN111224806 A CN 111224806A
- Authority
- CN
- China
- Prior art keywords
- terminal
- server
- time period
- resource
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0893—Assignment of logical groups to network elements
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/46—Multiprogramming arrangements
- G06F9/50—Allocation of resources, e.g. of the central processing unit [CPU]
- G06F9/5005—Allocation of resources, e.g. of the central processing unit [CPU] to service a request
- G06F9/5027—Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/004—Artificial life, i.e. computing arrangements simulating life
- G06N3/006—Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/14—Network analysis or design
- H04L41/147—Network analysis or design for predicting network behaviour
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5041—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/50—Network service management, e.g. ensuring proper service fulfilment according to agreements
- H04L41/5041—Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
- H04L41/5051—Service on demand, e.g. definition and deployment of services in real time
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/23—Processing of content or additional data; Elementary server operations; Server middleware
- H04N21/239—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests
- H04N21/2393—Interfacing the upstream path of the transmission network, e.g. prioritizing client content requests involving handling client requests
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N21/00—Selective content distribution, e.g. interactive television or video on demand [VOD]
- H04N21/20—Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
- H04N21/25—Management operations performed by the server for facilitating the content distribution or administrating data related to end-users or client devices, e.g. end-user or client device authentication, learning user preferences for recommending movies
- H04N21/258—Client or end-user data management, e.g. managing client capabilities, user preferences or demographics, processing of multiple end-users preferences to derive collaborative data
- H04N21/25866—Management of end-user data
- H04N21/25891—Management of end-user data being end-user preferences
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Computer Graphics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请公开了一种资源分配方法及服务器,其中,该方法包括:服务器根据终端的历史信息预测终端在未来一段时间内的资源需求值,历史信息包括服务器为终端预测的历史时间段内的资源需求值、服务器为终端分配的历史时间段内的资源分配值、终端在历史时间段内向服务器发送的请求的信息以及终端在历史时间段内的实际资源占用值中的一项或多项;服务器根据为终端预测的未来一段时间内的资源需求值以及服务器当前的剩余总资源确定终端在未来一段时间内的资源分配值,其中,为终端分配的未来一段时间内的资源用于供服务器在未来一段时间内处理来自终端的请求。实施本申请,能够对资源进行合理分配,提高服务器的并发能力,避免媒体焦点中断。
Description
技术领域
本发明涉及通信技术领域,尤其涉及一种资源分配方法及服务器。
背景技术
在虚拟机顶盒及其类似的提供远程动态媒体服务的场景中(例如智能电视的电子菜单(electronic program guide,EPG)浏览等),用户向远程服务端发送操作指令,远程服务端对用户的操作进行响应,完成媒体内容处理,然后推送到用户端呈现媒体信息。
处理海量用户媒体请求(高并发)的能力是远程服务端的核心竞争力,提高并发能力,同时保证用户体验,是远程动态媒体服务的核心诉求。
有限的资源和海量用户并发是一对trade off,并发优化的问题其实是有限资源合理分配的问题,服务端对于每个用户的资源需求没有预估机制,因此对处理用户请求的资源占用无法进行有效管理,高并发情况下,易出现浪涌现象,***总资源可能受限,无法满足所有用户的资源需求,无管控的资源分配容易导致媒体焦点中断。因此,如何对内容资源进行合理分配以提高服务端的并发能力,保证用户体验的前提下避免媒体焦点中断是目前亟需解决的技术问题。
发明内容
本发明实施例提供了一种资源分配方法及服务器,能够对服务器的资源进行合理分配,提高服务器的并发能力,保证用户体验的前提下避免媒体焦点中断。
第一方面,本发明实施例提供了一种资源分配方法,包括:服务器根据终端的历史信息预测终端在第一时间段内的资源需求值,历史信息包括服务器为终端预测的第二时间段内的资源需求值、服务器为终端分配的第二时间段内的资源分配值、终端在第二时间段内向服务器发送的请求的信息以及终端在第二时间段内的实际资源占用值中的一项或多项,第二时间段位于第一时间段之前,第二时间段包括一个或多个;服务器根据为终端预测的第一时间段内的资源需求值以及服务器当前的剩余总资源确定终端在第一时间段内的资源分配值,其中,为终端分配的第一时间段内的资源用于供服务器在第一时间段内处理来自终端的请求。
实施本发明实施例,服务器能够提前预估各个终端的资源需求,能够对处理终端请求的资源进行有效管理,在高并发情况下,仍然能够根据各个终端的资源需求合理分配资源以提高服务端的并发能力,保证用户体验的前提下避免媒体焦点中断。
在一种可能的设计中,服务器根据终端的历史信息预测终端在第一时间段内的资源需求值,包括:服务器根据终端的历史信息构建时间序列模型;服务器根据时间序列模型预测终端在第一时间段内的资源需求值。
实施本发明实施例,通过终端的历史信息构建时间序列模型,能够实时地预测各个终端在未来时间段对资源的需求值。
在一种可能的设计中,时间序列模型包括长短期记忆网络LSTM模型或者RRN模型。
在一种可能的设计中,服务器根据为终端预测的第一时间段内的资源需求值以及服务器当前的剩余总资源确定终端在第一时间段内的资源分配值之后,还包括:若终端之前已配置类沙箱,则服务器重新为终端配置与终端在第一时间段内的资源分配值相匹配的类沙箱;若终端之前未配置类沙箱,则服务器为终端配置与终端在第一时间段内的资源分配值相匹配的类沙箱;其中,类沙箱用于表征服务器为终端分配的资源值。
实施本发明实施例,依托类沙箱机制能够实现轻量化的资源分配的统一管理。
在一种可能的设计中,服务器根据为终端预测的第一时间段内的资源需求值以及服务器当前的剩余总资源确定终端在第一时间段内的资源分配值,包括:服务器根据为终端预测的第一时间段内的资源需求值、服务器当前的剩余总资源以及资源分配算法确定终端在第一时间段内的资源分配值。
在一种可能的设计中,资源分配算法包括ACO算法、Min-Min算法或者Max-min算法。
第二方面,本发明实施例提供了一种服务器,该服务器可包括多个功能模块或单元,用于相应的执行第一方面所提供的资源分配方法。
第三方面,本发明实施例提供了一种服务器,用于执行第一方面所提供的资源分配方法。服务器可包括:存储器、处理器、通信接口,其中:通信接口用于与其他通信设备(如终端等)通信。存储器用于存储第一方面所提供的资源分配方法的实现代码,处理器用于执行存储器中存储的程序代码,即执行第一方面所提供的资源分配方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,该可读存储介质上存储有指令,当其在处理器上运行时,使得处理器执行上述第一方面描述的资源分配方法。
第五方面,本发明实施例提供了一种包含指令的计算机程序产品,当其在处理器上运行时,使得处理器执行上述第一方面描述的资源分配方法。
附图说明
为了更清楚地说明本申请实施例或背景技术中的技术方案,下面将对本申请实施例或背景技术中所需要使用的附图进行说明。
图1是本发明实施例提供的一种资源分配***的架构示意图;
图2是本发明实施例提供的服务器的逻辑结构示意图;
图3是本发明实施例提供的基于资源分配表的生命周期管理的逻辑示意图;
图4是本发明实施例提供的基于终端的历史信息对终端的资源需求进行时序建模的逻辑示意图;
图5是本发明实施例提供的资源分配方法的流程图;
图6是本发明实施例提供的服务器的逻辑结构示意图;
图7是本发明实施例提供的服务器的硬件结构示意图。
具体实施方式
本申请的实施方式部分使用的术语仅用于对本申请的具体实施例进行解释,而非旨在限定本申请。
首先对本申请涉及的应用场景进行介绍。参见图1,为本发明实施例提供的一种资源分配***的架构示意图。资源分配***100包括:服务器101、终端102以及网络103。终端102通过网络103与服务器101通信。
终端102例如可以是手机、平板电脑、有线电视等,但不限于此。在资源分配***100中,终端102可以通过服务器101获取媒体内容,该媒体内容可以是图片、视频、音频等。具体来说,终端102可以向服务器101发送媒体请求,服务器101根据该媒体请求向终端101向终端102推送相应的媒体内容。该媒体请求的格式可以是超文本传输协议(hyper texttransfer protocol,HTTP)格式,文件传输协议(file transfer protocol,FTP)格式等。
图1所示的资源分配***100中仅示出了一个服务器和一个终端,但是本领域技术人员应当意识到,为了保证服务器的响应速度和运行的稳定性,资源分配***100中也可以配置多台服务器,当然,资源分配***100中也可以有多个终端,本发明对资源分配***100中的服务器和终端的数量均无限制。通过本资源分配***100,服务器可以根据终端的历史信息实时预测(或周期性预测)各个终端在未来一段时间内的资源需求,进而基于预测的资源需求以及服务器当前的剩余总资源分别为每个终端合理分配资源。这里,终端的历史信息包括服务器在历史时间(或时间段)为终端预测的资源需求值、服务器历史时间(或时间段)为终端分配的资源值、终端在历史时间(或时间段)向服务器发送的请求的信息(例如发送请求的频率等,发送请求的频率例如可以是15个请求/s)以及终端在历史时间(或时间段)实际占用的资源值中的一项或多项。服务器可以实时地预测终端在下一阶段的资源需求并合理为终端分配资源,进而提前为可能出现的高并发场景做准备,避免因无管控的资源分配导致媒体焦点中断的情况。本申请中所涉及的资源可以包括中央处理器(centralprocessing unit,CPU)、随机存取存储器(random access memory,RAM)、磁盘等。资源的数量或者资源值可以表征为CPU数量、存储器数量、磁盘数量等等。
用户可以利用终端通过有线网络或者是无线网络向服务器发起请求,服务器接收到该请求后则响应该请求向终端反馈相应的媒体内容,最终,终端对反馈的媒体内容进解析,并为用户呈现媒体效果。
本发明实施例中的网络架构包括但不仅限于以上网络架构,只要能够实现本发明中的资源分配方法的网络架构均属于本发明所保护和涵盖的范围。
以下结合服务器的逻辑结构对本申请的发明构思进行介绍。参见图2,服务器200包括五大模块,包括资源监控模块201、资源需求预测模块202、资源自适应分配模块203、资源生命周期管理模块204和用户管理模块205。
其中,资源监控模块201,负责对服务器200的总资源利用情况和每终端的资源使用情况进行监控和输出。
资源需求预测模块202,用于存储终端的历史信息,对终端的资源使用情况进行学习,构建时间序列模型,并根据时间序列模型预测终端在下一时间段内对资源的需求。该资源需求预测模块202还可以布局在终端侧。其中,终端的历史信息包括服务器历史为终端预测的资源需求值、在历史时间(或时间段)为终端分配的资源值、终端历史发送给服务器的请求的信息(例如发送的请求的频率等)、终端历史的实际资源占用值等等。其中,时间序列模型例如可以是长短期记忆网络(long short-term memory,LSTM)、循环神经网络(recurrent neural networks,RRN)等。
资源自适应分配模块203,负责根据服务器200的总资源情况和资源需求预测模块202预测的终端在下一时间段对资源的需求为终端自适应分配资源,具备受限均衡分配能力,避免高并发时的终端焦点中断。例如,可以基于蚁群算法(ant colony optimization,ACO)、最小-最小Min-Min算法或者最大-最小Max-min算法为终端自适应分配资源。这些算法可以根据服务器剩余的总资源以及为各个终端预测的下一时间段的资源需求值计算各个终端的资源分配值。资源分配的目的是为每个终端分配够用的资源,同时满足约束所消耗资源小于剩余总资源。当在***总资源紧张的情况下,可以按照优先级顺序为各个终端分配资源。例如,对优先级高的终端优先分配资源,对优先级低的终端暂缓分配或者分配略微少的资源。
资源生命周期管理模块204,负责维护用户资源的生命周期管理,具体可以参见图3。具体的,资源生命周期管理模块204可以维护一资源分配表,基于该资源分配表实现对用户资源进行添加、更改和移除,实现轻量化的用户资源生命周期管理。该资源分配列表用于记录各个终端的历史信息以及各个终端当前的资源使用情况。例如,资源分配表的格式可以参见如下表1所示。
表1
其中,在t0-t1时间段为终端0分配的资源为:CPU数量:2个、Memory数量:20个,这些资源能够处理的终端0的请求数量的上限为20个/s,处理的终端0的请求数量的下限为10个/s。在t0-t1时间段终端0实际发送的请求的数量为15个/s。
用户管理模块205,实时获取终端接入/断开信息。若有新终端接入,则通知资源生命周期管理模块204将该终端相关的信息添加到资源分配列表中。若有终端断开与服务器的连接,则通知资源生命周期管理模块204将该终端的信息从资源分配列表中移除。
具体的,资源需求预测模块202根据单个终端(或称单个用户、每个用户、每个终端等)的历史信息进行时序建模,基于历史信息预测单终端在未来一段时间内的资源需求。其中,可以周期性的对单个终端的资源需求进行预测。参见图4,是本发明实施例提供的基于终端的历史信息对终端的资源需求进行时序建模的逻辑示意图。其中,t0-tp分别是指各个预测的时刻点。资源需求预测模块202周期性的对终端的资源需求进行预测。例如,预测周期为1秒。该时序模型的输入包括终端历史发送的请求、服务器历史为终端预测的资源需求值、终端历史实际占用的资源值等。如图4所示,X0、X1、…Xp分别是指某个终端(假设为终端1)在某时间(或时间段)向服务器发送的请求的信息,该信息可以包括请求的具体内容或者请求的总数量。例如,X1是指t0-t1这一段时间内终端1发送给服务器的请求。X2是指t1-t2这一段时间内终端1发送给服务器的请求。A0、A1、…Ap分别是指循环神经网络的处理单元,处理单元用于存储终端在当前时刻之前的历史时间段的资源预测值、资源实际占用值等。例如,A2存储的历史信息包括终端在t0-t1这一时间段的请求信息、服务器在t0时刻为终端1预测的t0-t1这一时间段的资源需求值h0、终端1在t0-t1这一时间段的资源实际占用值、服务器在t1时刻为终端1预测的t1-t2这一时间段的资源需求值h1以及终端1在t1-t2这一时间段的资源实际占用值。处理单元A2需要根据自身存储的历史信息以及X2来预测终端1在下一时间段,即t2-t3这一时间段的资源需求值h2。
资源需求预测模块202在为终端预测了下一阶段的资源需求值后,资源自适应分配模块203根据服务器当前的剩余总资源以及资源需求预测模块202为终端预测的资源需求值为终端计算资源分配值。例如,可以根据ACO算法决策出为终端分配的资源值。
资源自适应分配模块203在确定了为终端分配的资源值之后,资源生命周期管理模块204可以采用类沙箱机制来直观表征资源自适应分配模块203对终端分配的资源值。其中,沙箱可以是***预定义的沙箱,也可以是用户自定义的沙箱。每个沙箱均对应一种资源值的配置。资源值的配置例如可以是CPU的数量、存储器的数量、磁盘的数量等等。例如,服务器配置3个沙箱,其中沙箱1对应的资源配置为:CPU数量为2个、Memory数量为20个,每秒钟对多处理20个用户请求、每秒钟最少处理10个用户请求。沙箱2对应的资源配置为:CPU数量为2个、Memory数量为10个,每秒钟对多处理15个用户请求、每秒钟最少处理5个用户请求。沙箱3对应的资源配置为:CPU数量为3个、Memory数量为20个,每秒钟对多处理20个用户请求、每秒钟最少处理15个用户请求。假设服务器为终端1分配的t0-t1这一时间段的资源值为:CPU数量为2个、Memory数量为20个,则可以表征为服务器为终端1分配的沙箱为沙箱1。若服务器为终端1分配的t1-t2这一时间段的资源值为:CPU数量为2个、Memory数量为10个,则可以表征为服务器为终端1分配的沙箱由沙箱1调整为沙箱2。若有新用户加入(即有新的客户端接入服务器,例如机顶盒开机后连接到服务器),则资源生命周期管理模块204将该用户对应的终端ID等信息添加到上述资源分配表,并为该用户分配相应的沙箱。若有用户移除,则资源生命周期管理模块204需要将该用户的信息从上述资源分配表中删除,并取消为其分配沙箱,释放相应的资源。
本申请可以利用邻阶矩阵表征所有用户的资源分配信息。该邻阶矩阵的表现形式可以是:
上述矩阵是以用户数为m,沙箱数为n为例进行的说明。
若资源自适应分配模块203为终端0分配的沙箱为沙箱0,则上述矩阵为 若资源自适应分配模块203为终端0分配的沙箱由沙箱0调整为沙箱1,则上述矩阵调整为若有新用户加入,则需要将该用户对应的沙箱信息添加到上述矩阵。若有用户移除,则需要将该用户对应的沙箱信息从上述矩阵中删除。
如无特殊说明,本申请中所提及的用户的资源等同于终端的资源,用户的请求等同于终端的请求。
以下针对本发明实施例提供的资源分配方法进行详细介绍。
参见图5,是本发明实施例提供的一种资源分配方法的流程图,包括如下步骤。
S501:服务器根据终端的历史信息预测终端在第一时间段内的资源需求值,历史信息包括服务器为终端预测的第二时间段内的资源需求值、服务器为终端分配的第二时间段内的资源分配值、终端在第二时间段内向服务器发送的请求的信息以及终端在第二时间段内的实际资源占用值中的一项或多项,第二时间段位于第一时间段之前,第二时间段包括一个或多个。
S502:服务器根据为终端预测的第一时间段内的资源需求值以及服务器当前的剩余总资源确定终端在第一时间段内的资源分配值,其中,为终端分配的第一时间段内的资源用于供服务器在第一时间段内处理来自终端的请求。
其中,服务器可以根据终端的历史信息构建时间序列模型,根据该时间序列模型预测终端在未来第一时间段的资源需求值。其中,该时间序列模型例如可以是长短期记忆网络(long short-term memory,LSTM)、RRN等。
服务器可以基于ACO算法、Min-Min算法或者Max-min算法为终端自适应分配资源。这些算法可以根据服务器剩余的总资源以及为各个终端预测的下一时间段的资源需求值计算各个终端的资源分配值。资源分配的目的是为每个终端分配够用的资源,同时满足约束所消耗资源小于剩余总资源。当在***总资源紧张的情况下,可以按照优先级顺序为各个终端分配资源。例如,对优先级高的终端优先分配资源,对优先级低的终端暂缓分配或者分配略微少的资源。
服务器可以采用类沙箱来直观表征为终端分配的资源值。关于类沙箱的相关介绍可以参考前述描述,此次不再赘述。如果终端之前已配置类沙箱,则服务器重新为该终端配置与终端在第一时间段内的资源分配值相匹配的类沙箱;如果终端之前未配置类沙箱,则服务器为终端配置与终端在第一时间段内的资源分配值相匹配的类沙箱。
本方面实施例中,服务器基于终端的历史信息构建时间序列模型,并获取终端发送的请求,以对模型进行学习。通过构建的时间序列模型可以预测终端在未来一段时间内的资源需求值,并根据该资源需求值以及服务器当前剩余的总资源为终端合理分配资源值。通过实施本发明实施例,可以提高服务器的并发能力和资源利用率。基于类沙箱和资源分配表,能够实现对资源分配的高效管理和维护。
本申请实施例可以根据上述方法示例对服务器进行功能模块的划分,例如,可以对应各个功能划分各个功能模块,也可以将两个或两个以上的功能集成在一个处理模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。需要说明的是,本申请实施例中对模块的划分是示意性的,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
在采用对应各个功能划分各个功能模块的情况下,图6示出了上述实施例中所涉及的服务器的一种可能的逻辑结构示意图,服务器600包括:预测单元601和分配单元602。其中,预测单元601用于根据终端的历史信息预测所述终端在第一时间段内的资源需求值,所述历史信息包括所述服务器为所述终端预测的第二时间段内的资源需求值、所述服务器为所述终端分配的所述第二时间段内的资源分配值、所述终端在所述第二时间段内向所述服务器发送的请求的信息以及所述终端在所述第二时间段内的实际资源占用值中的一项或多项,所述第二时间段位于所述第一时间段之前,所述第二时间段包括一个或多个。分配单元602用于根据为所述终端预测的所述第一时间段内的资源需求值以及所述服务器当前的剩余总资源确定所述终端在所述第一时间段内的资源分配值,其中,为所述终端分配的第一时间段内的资源用于供所述服务器在所述第一时间段内处理来自所述终端的请求。
在硬件实现上,上述预测单元601和分配单元602可以为处理器等。
图7所示,为本申请的实施例提供的上述实施例中所涉及的服务器的一种可能的硬件结构示意图。服务器700包括:处理器701、存储器702和通信接口703。在本申请的实施例中,处理器701用于对该服务器的动作进行控制管理,例如,处理器701用于支持实施例中根据终端的历史信息预测所述终端在第一时间段内的资源需求值,以及根据为所述终端预测的所述第一时间段内的资源需求值以及所述服务器当前的剩余总资源确定所述终端在所述第一时间段内的资源分配值等步骤等。处理器701、通信接口703以及存储器702可以相互连接或通过总线704相互连接。其中,该存储器702,该存储器用于存储服务器的代码和数据。通信接口703用于支持该服务器进行通信。总线704可以是外设部件互连标准PCI总线或扩展工业标准结构EISA总线等。
其中,处理器701可以是中央处理器单元,通用处理器,数字信号处理器,专用集成电路,现场可编程门阵列或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本申请公开内容所描述的各种示例性的逻辑方框,模块和电路。所述处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,数字信号处理器和微处理器的组合等等。
在本申请的另一实施例中,还提供一种计算机存储介质,计算机存储介质中存储有计算机执行指令,当一个设备(可以是单片机,芯片等)或者处理器可以调用可读存储介质中存储有计算机执行指令来执行图5所提供的资源分配方法中服务器的步骤。前述的计算机存储介质可以包括:U盘、移动硬盘、只读存储器、随机存取存储器、磁碟或者光盘等各种可以存储程序代码的介质。
在本申请的另一实施例中,还提供一种计算机程序产品,该计算机程序产品包括计算机执行指令,该计算机执行指令存储在计算机可读存储介质中;设备的至少一个处理器可以从计算机可读存储介质读取该计算机执行指令,至少一个处理器执行该计算机执行指令使得设备实施图5所提供的资源分配方法中服务器的步骤。
在本申请的另一实施例中,还提供一种资源分配***,该资源分配***包括多个设备,该多个设备包括服务器和终端。其中,服务器可以为图6或图7所提供的服务器,且用于执行图5所提供的资源分配方法中服务器的步骤。
最后应说明的是:以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何在本申请揭露的技术范围内的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。
本申请的又一方面提了一种设备,所述设备包括所述处理器运行存储器中的代码使得所述设备执行前述的各种方法。该存储器中存储代码和数据。该存储器位于所述设备中,该所述存储器所述处理器耦合。该存储器也可以位于所述设备之外。
在上述实施例中,可以全部或部分地通过软件、硬件、固件或者其任意组合来实现。当使用软件实现时,可以全部或部分地以计算机程序产品的形式实现。所述计算机程序产品包括一个或多个计算机指令。在计算机上加载和执行所述计算机程序指令时,全部或部分地产生按照本发明实施例所述的流程或功能。所述计算机可以是通用计算机、专用计算机、计算机网络、或者其他可编程装置。所述计算机指令可以存储在计算机可读存储介质中,或者从一个计算机可读存储介质向另一个计算机可读存储介质传输,例如,所述计算机指令可以从一个网站站点、计算机、服务器或数据中心通过有线(例如同轴电缆、光纤、数字用户线(DSL))或无线(例如红外、无线、微波等)方式向另一个网站站点、计算机、服务器或数据中心进行传输。所述计算机可读存储介质可以是计算机能够存取的任何可用介质或者是包含一个或多个可用介质集成的服务器、数据中心等数据存储设备。所述可用介质可以是磁性介质,(例如,软盘、硬盘、磁带)、光介质(例如,DVD)、或者半导体介质(例如固态硬盘solid state disk(SSD))等。
综上所述,以上仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (12)
1.一种资源分配方法,其特征在于,包括:
服务器根据终端的历史信息预测所述终端在第一时间段内的资源需求值,所述历史信息包括所述服务器为所述终端预测的第二时间段内的资源需求值、所述服务器为所述终端分配的所述第二时间段内的资源分配值、所述终端在所述第二时间段内向所述服务器发送的请求的信息以及所述终端在所述第二时间段内的实际资源占用值中的一项或多项,所述第二时间段位于所述第一时间段之前,所述第二时间段包括一个或多个;
所述服务器根据为所述终端预测的所述第一时间段内的资源需求值以及所述服务器当前的剩余总资源确定所述终端在所述第一时间段内的资源分配值,其中,为所述终端分配的第一时间段内的资源用于供所述服务器在所述第一时间段内处理来自所述终端的请求。
2.根据权利要求1所述的方法,其特征在于,所述服务器根据终端的历史信息预测所述终端在第一时间段内的资源需求值,包括:
所述服务器根据所述终端的历史信息构建时间序列模型;
所述服务器根据所述时间序列模型预测所述终端在所述第一时间段内的资源需求值。
3.根据权利要求2所述的方法,其特征在于,所述时间序列模型包括长短期记忆网络LSTM模型或者循环神经网络RRN模型。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述服务器根据为所述终端预测的所述第一时间段内的资源需求值以及所述服务器当前的剩余总资源确定所述终端在所述第一时间段内的资源分配值之后,还包括:
若所述终端之前已配置类沙箱,则所述服务器重新为所述终端配置与所述终端在所述第一时间段内的资源分配值相匹配的类沙箱;
若所述终端之前未配置类沙箱,则所述服务器为所述终端配置与所述终端在所述第一时间段内的资源分配值相匹配的类沙箱;
其中,所述类沙箱用于表征所述服务器为所述终端分配的资源值。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述服务器根据为所述终端预测的所述第一时间段内的资源需求值以及所述服务器当前的剩余总资源确定所述终端在所述第一时间段内的资源分配值,包括:
所述服务器根据为所述终端预测的所述第一时间段内的资源需求值、所述服务器当前的剩余总资源以及资源分配算法确定所述终端在所述第一时间段内的资源分配值。
6.根据权利要求5所述的方法,其特征在于,所述资源分配算法包括ACO算法、Min-Min算法或者Max-min算法。
7.一种服务器,其特征在于,包括:
预测单元,用于根据终端的历史信息预测所述终端在第一时间段内的资源需求值,所述历史信息包括所述服务器为所述终端预测的第二时间段内的资源需求值、所述服务器为所述终端分配的所述第二时间段内的资源分配值、所述终端在所述第二时间段内向所述服务器发送的请求的信息以及所述终端在所述第二时间段内的实际资源占用值中的一项或多项,所述第二时间段位于所述第一时间段之前,所述第二时间段包括一个或多个;
分配单元,用于根据为所述终端预测的所述第一时间段内的资源需求值以及所述服务器当前的剩余总资源确定所述终端在所述第一时间段内的资源分配值,其中,为所述终端分配的第一时间段内的资源用于供所述服务器在所述第一时间段内处理来自所述终端的请求。
8.根据权利要求7所述的服务器,其特征在于,所述预测单元包括:
建模单元,用于根据所述终端的历史信息构建时间序列模型;
确定单元,用于根据所述时间序列模型预测所述终端在所述第一时间段内的资源需求值。
9.根据权利要求8所述的服务器,其特征在于,所述时间序列模型包括长短期记忆网络LSTM模型或者循环神经网络RRN模型。
10.根据权利要求7至9任一项所述的服务器,其特征在于,所述服务器还包括:
配置单元,用于在所述分配单元根据为所述终端预测的所述第一时间段内的资源需求值以及所述服务器当前的剩余总资源确定所述终端在所述第一时间段内的资源分配值之后,若所述终端之前已配置类沙箱,则重新为所述终端配置与所述终端在所述第一时间段内的资源分配值相匹配的类沙箱;若所述终端之前未配置类沙箱,则为所述终端配置与所述终端在所述第一时间段内的资源分配值相匹配的类沙箱;其中,所述类沙箱用于表征所述服务器为所述终端分配的资源值。
11.根据权利要求7至10任一项所述的服务器,其特征在于,所述分配单元具体用于:
根据为所述终端预测的所述第一时间段内的资源需求值、所述服务器当前的剩余总资源以及资源分配算法确定所述终端在所述第一时间段内的资源分配值。
12.根据权利要求11所述的服务器,其特征在于,所述资源分配算法包括ACO算法、Min-Min算法或者Max-min算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811422859.6A CN111224806A (zh) | 2018-11-27 | 2018-11-27 | 一种资源分配方法及服务器 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811422859.6A CN111224806A (zh) | 2018-11-27 | 2018-11-27 | 一种资源分配方法及服务器 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111224806A true CN111224806A (zh) | 2020-06-02 |
Family
ID=70828922
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811422859.6A Pending CN111224806A (zh) | 2018-11-27 | 2018-11-27 | 一种资源分配方法及服务器 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111224806A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724067A (zh) * | 2020-06-22 | 2020-09-29 | 中国银行股份有限公司 | 一种资源调度方法及装置 |
CN111866111A (zh) * | 2020-07-13 | 2020-10-30 | 郑州轻工业大学 | 一种感知用户需求增长趋势的边缘部署方法 |
CN111985726A (zh) * | 2020-08-31 | 2020-11-24 | 重庆紫光华山智安科技有限公司 | 资源数量预测方法、装置、电子设备及存储介质 |
CN112130989A (zh) * | 2020-08-18 | 2020-12-25 | 贝壳技术有限公司 | 二维码申请方法及装置 |
CN113220452A (zh) * | 2021-05-10 | 2021-08-06 | 北京百度网讯科技有限公司 | 资源分配方法、模型训练方法、装置和电子设备 |
CN113315945A (zh) * | 2021-07-29 | 2021-08-27 | 江苏怀业信息技术股份有限公司 | 分布式视频会议***的终端接入方法 |
CN113378498A (zh) * | 2021-08-12 | 2021-09-10 | 新华三半导体技术有限公司 | 一种任务分配方法及装置 |
CN114327915A (zh) * | 2022-03-08 | 2022-04-12 | 北京蚂蚁云金融信息服务有限公司 | 用于在线资源分配的方法及装置 |
CN114884900A (zh) * | 2022-06-09 | 2022-08-09 | 中国联合网络通信集团有限公司 | 资源分配方法、装置、设备及存储介质 |
CN115086331A (zh) * | 2022-07-20 | 2022-09-20 | 阿里巴巴(中国)有限公司 | 云设备调度方法、装置及***、电子设备及存储介质 |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102075944A (zh) * | 2010-12-07 | 2011-05-25 | 南京邮电大学 | 认知网络中基于多Agent协作的可用资源管理***及方法 |
CN102724231A (zh) * | 2011-03-31 | 2012-10-10 | 腾讯科技(深圳)有限公司 | 一种资源下载的方法、服务器及用户终端 |
CN103595756A (zh) * | 2012-08-17 | 2014-02-19 | 三星电子株式会社 | 产生和利用基于云服务的内容快捷方式对象的方法和设备 |
US20160224554A1 (en) * | 2013-09-12 | 2016-08-04 | Beijing Zhigu Rui Tuo Tech Co., Ltd | Search methods, servers, and systems |
CN105897616A (zh) * | 2016-05-17 | 2016-08-24 | 腾讯科技(深圳)有限公司 | 一种资源分配的方法及服务器 |
CN106097044A (zh) * | 2016-06-01 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种数据推荐处理方法以及装置 |
CN108170529A (zh) * | 2017-12-26 | 2018-06-15 | 北京工业大学 | 一种基于长短期记忆网络的云数据中心负载预测方法 |
-
2018
- 2018-11-27 CN CN201811422859.6A patent/CN111224806A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102075944A (zh) * | 2010-12-07 | 2011-05-25 | 南京邮电大学 | 认知网络中基于多Agent协作的可用资源管理***及方法 |
CN102724231A (zh) * | 2011-03-31 | 2012-10-10 | 腾讯科技(深圳)有限公司 | 一种资源下载的方法、服务器及用户终端 |
CN103595756A (zh) * | 2012-08-17 | 2014-02-19 | 三星电子株式会社 | 产生和利用基于云服务的内容快捷方式对象的方法和设备 |
US20160224554A1 (en) * | 2013-09-12 | 2016-08-04 | Beijing Zhigu Rui Tuo Tech Co., Ltd | Search methods, servers, and systems |
CN105897616A (zh) * | 2016-05-17 | 2016-08-24 | 腾讯科技(深圳)有限公司 | 一种资源分配的方法及服务器 |
CN106097044A (zh) * | 2016-06-01 | 2016-11-09 | 腾讯科技(深圳)有限公司 | 一种数据推荐处理方法以及装置 |
CN108170529A (zh) * | 2017-12-26 | 2018-06-15 | 北京工业大学 | 一种基于长短期记忆网络的云数据中心负载预测方法 |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111724067A (zh) * | 2020-06-22 | 2020-09-29 | 中国银行股份有限公司 | 一种资源调度方法及装置 |
CN111866111A (zh) * | 2020-07-13 | 2020-10-30 | 郑州轻工业大学 | 一种感知用户需求增长趋势的边缘部署方法 |
CN111866111B (zh) * | 2020-07-13 | 2021-03-30 | 郑州轻工业大学 | 一种感知用户需求增长趋势的边缘部署方法 |
CN112130989A (zh) * | 2020-08-18 | 2020-12-25 | 贝壳技术有限公司 | 二维码申请方法及装置 |
CN111985726B (zh) * | 2020-08-31 | 2023-04-18 | 重庆紫光华山智安科技有限公司 | 资源数量预测方法、装置、电子设备及存储介质 |
CN111985726A (zh) * | 2020-08-31 | 2020-11-24 | 重庆紫光华山智安科技有限公司 | 资源数量预测方法、装置、电子设备及存储介质 |
CN113220452A (zh) * | 2021-05-10 | 2021-08-06 | 北京百度网讯科技有限公司 | 资源分配方法、模型训练方法、装置和电子设备 |
CN113315945A (zh) * | 2021-07-29 | 2021-08-27 | 江苏怀业信息技术股份有限公司 | 分布式视频会议***的终端接入方法 |
CN113315945B (zh) * | 2021-07-29 | 2021-11-09 | 江苏怀业信息技术股份有限公司 | 分布式视频会议***的终端接入方法 |
CN113378498A (zh) * | 2021-08-12 | 2021-09-10 | 新华三半导体技术有限公司 | 一种任务分配方法及装置 |
CN114327915A (zh) * | 2022-03-08 | 2022-04-12 | 北京蚂蚁云金融信息服务有限公司 | 用于在线资源分配的方法及装置 |
CN114884900A (zh) * | 2022-06-09 | 2022-08-09 | 中国联合网络通信集团有限公司 | 资源分配方法、装置、设备及存储介质 |
CN114884900B (zh) * | 2022-06-09 | 2023-10-31 | 中国联合网络通信集团有限公司 | 资源分配方法、装置、设备及存储介质 |
CN115086331A (zh) * | 2022-07-20 | 2022-09-20 | 阿里巴巴(中国)有限公司 | 云设备调度方法、装置及***、电子设备及存储介质 |
CN115086331B (zh) * | 2022-07-20 | 2024-06-07 | 阿里巴巴(中国)有限公司 | 云设备调度方法、装置及***、电子设备及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111224806A (zh) | 一种资源分配方法及服务器 | |
CN109684358B (zh) | 数据查询的方法和装置 | |
US11146502B2 (en) | Method and apparatus for allocating resource | |
CN112445857A (zh) | 一种基于数据库的资源配额管理方法和装置 | |
CN104102693A (zh) | 对象处理方法和装置 | |
CN110008050B (zh) | 用于处理信息的方法和装置 | |
CN108924203B (zh) | 数据副本自适应分布方法、分布式计算***及相关设备 | |
CN112600761A (zh) | 一种资源分配的方法、装置及存储介质 | |
CN109428926B (zh) | 一种调度任务节点的方法和装置 | |
CN107659509B (zh) | 控制应用流量使用方法、装置、可读存储介质及终端设备 | |
CN104202305A (zh) | 一种转码处理方法、装置及服务器 | |
CN111190719B (zh) | 优化集群资源分配的方法、装置、介质及电子设备 | |
CN111371848A (zh) | 一种请求处理方法、装置、设备及存储介质 | |
CN113268329B (zh) | 一种请求调度方法、装置及存储介质 | |
CN116069493A (zh) | 一种数据处理方法、装置、设备以及可读存储介质 | |
WO2024082770A1 (zh) | 视频转码方法、装置、设备、存储介质及视频点播*** | |
CN117407159A (zh) | 内存空间的管理方法及装置、设备、存储介质 | |
CN115941794A (zh) | 一种文件存储方法、***、装置及电子设备 | |
CN113779412B (zh) | 一种基于区块链网络的消息触达方法、节点和*** | |
CN114374657A (zh) | 一种数据处理方法和装置 | |
CN114116203A (zh) | 一种资源调用控制方法、资源调用控制装置及存储介质 | |
CN114422565A (zh) | 一种基于连接池的网络连接管理方法以及相关装置 | |
CN111694670A (zh) | 资源分配方法、装置、设备和计算机可读介质 | |
CN111092817A (zh) | 一种数据传输方法及装置 | |
CN112422613B (zh) | 数据处理方法、数据处理平台和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200602 |
|
RJ01 | Rejection of invention patent application after publication |