CN110990138B - 资源调度方法、装置、服务器及存储介质 - Google Patents

资源调度方法、装置、服务器及存储介质 Download PDF

Info

Publication number
CN110990138B
CN110990138B CN201911224422.6A CN201911224422A CN110990138B CN 110990138 B CN110990138 B CN 110990138B CN 201911224422 A CN201911224422 A CN 201911224422A CN 110990138 B CN110990138 B CN 110990138B
Authority
CN
China
Prior art keywords
service
calling
type
historical
instances
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201911224422.6A
Other languages
English (en)
Other versions
CN110990138A (zh
Inventor
陈凯鑫
龙佳文
张健
田泱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Sankuai Online Technology Co Ltd
Original Assignee
Beijing Sankuai Online Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Sankuai Online Technology Co Ltd filed Critical Beijing Sankuai Online Technology Co Ltd
Priority to CN201911224422.6A priority Critical patent/CN110990138B/zh
Publication of CN110990138A publication Critical patent/CN110990138A/zh
Application granted granted Critical
Publication of CN110990138B publication Critical patent/CN110990138B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5061Partitioning or combining of resources
    • G06F9/5072Grid computing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请提供了一种资源调度方法、装置、服务器及存储介质,属于云服务技术领域。该方法包括:对于云服务架构中的任一类型的多个服务实例,获取多个服务实例的第一历史时间调用特征,以及,获取多个服务实例的第一历史运行数据;将多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测该类型的服务实例在未来第一预设时长内的第一调用数量;主服务器根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量,调整云服务架构中该类型在线的服务实例的数量,使云服务架构中该类型在线的服务实例的数量与该类型服务请求的数量相对应,提高了在线的服务实例的利用率。

Description

资源调度方法、装置、服务器及存储介质
技术领域
本申请涉及云服务技术领域,特别涉及一种资源调度方法、装置、服务器及存储介质。
背景技术
随着云服务技术的发展,越来越多的网络服务都可以通过Node serverless(节点云服务)进行处理。Node serverless包括多个执行节点,每个执行节点内包括多种类型的服务实例。其中,每个类型的服务实例可以处理对应类型的网络服务请求。并且,对于每个类型的网络服务请求,Node serverless内在线的服务实例越多,Node serverless返回网络服务请求对应的结果的时间越短。然而每个类型的服务实例都会占用Node serverless一定的资源,因此,如何对Node serverless内每个类型的服务实例的资源进行调度是业界关注的重点。
发明内容
本申请实施例提供了一种资源调度方法、装置、服务器及存储介质,能够解决云服务架构中资源利用率低的问题。所述技术方案如下:
根据本申请实施例的一方面,提供了一种资源调度方法,所述方法包括:
对于云服务架构中的任一类型的多个服务实例,获取所述多个服务实例的第一历史时间调用特征,以及,获取所述多个服务实例的第一历史运行数据;
将所述多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测所述类型的服务实例在未来第一预设时长内的第一调用数量;
根据所述类型的服务实例的第一调用数量和所述类型的服务实例当前的第二调用数量,调整所述云服务架构中所述类型在线的服务实例;
根据调整后的所述类型在线的服务实例,为所述类型在线的服务实例分配资源。
在另一种可能的实现方式中,所述方法还包括:
获取所述云服务架构中的多个类型的服务实例的第二历史时间调用特征和第二历史运行数据;
根据所述第二历史时间调用特征和所述第二历史运行数据,通过机器学习算法和统计学分析算法,训练第二服务调用特征模型,得到所述第一服务调用特征模型。
在另一种可能的实现方式中,所述第二历史运行数据包括至少一个运行指标;所述根据所述第二历史时间调用特征和所述第二历史运行数据,通过机器学习算法和统计学分析算法,训练第二服务调用特征模型,得到所述第一服务调用特征模型,包括:
通过所述统计学分析算法,确定所述每个运行指标的权重;
根据所述每个运行指标的权重、所述第二历史时间调用特征和所述第二历史运行数据中的每个运行指标,通过所述机器学习算法训练所述第二服务调用特征模型,得到所述第一服务调用特征模型。
在另一种可能的实现方式中,所述根据所述每个运行指标的权重、所述第二历史时间调用特征和所述第二历史运行数据中的每个运行指标,通过所述机器学习算法训练所述第二服务调用特征模型,得到所述第一服务调用特征模型,包括:
通过所述统计学分析算法,预测所述每个类型的服务实例在未来第二预设时长内的第三调用数量;
根据所述每个运行指标的权重、所述第二历史时间调用特征和所述第二历史运行数据中的每个运行指标,通过所述第二服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第四调用数量;
根据所述第三调用数量与所述第四调用数量之间的差值,通过所述机器学习算法训练所述第二服务调用特征模型中每个运行指标的第一权重,得到所述第一服务调用特征模型。
在另一种可能的实现方式中,所述通过所述第三调用数量与所述第四调用数量之间的差值,通过所述机器学习算法训练所述第二服务调用特征模型中每个运行指标的权重,得到所述第一服务调用特征模型,包括:
若所述第三调用数量与所述第四调用数量之间的差值大于第一数量阈值时,对所述第二服务调用特征模型中每个运行指标的权重进行调整,得到第三服务调用特征模型;
通过所述第三服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第五调用数量;
若所述第三调用数量与所述第五调用数量之间的差值大于第一数量阈值,对所述权重再次进行调整,至到所述第三调用数量与所述第五调用数量之间的差值小于第一数量阈值,确定最后一次调整得到的第三服务调用特征模型为所述第一服务调用特征模型。
在另一种可能的实现方式中,所述获取所述多个服务实例的第一历史时间调用特征,包括:
根据所述类型,获取已记录的所述云服务架构中所述类型的多个服务实例的历史调用信息,所述历史调用信息包括调用时间和调用数量;
根据所述历史调用信息,确定所述多个服务实例的第一历史时间调用特征。
根据本申请实施例的另一方面,提供了一种资源调度装置,所述装置包括:
获取模块,用于对于云服务架构中的任一类型的多个服务实例,获取所述多个服务实例的第一历史时间调用特征,以及,获取所述多个服务实例的第一历史运行数据;
预测模块,将所述多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,用于预测所述类型的服务实例在未来第一预设时长内的第一调用数量;
调整模块,用于根据所述类型的服务实例的第一调用数量和所述类型的服务实例当前的第二调用数量,调整所述云服务架构中类型在线的服务实例;
分配模块,用于根据调整后的所述类型在线的服务实例,为类型在线的服务实例分配资源。
在另一种可能的实现方式中,所述装置还包括:
所述获取模块,还用于获取所述云服务架构中的多个类型的服务实例的第二历史时间调用特征和第二历史运行数据;
训练模块,用于根据所述第二历史时间调用特征和所述第二历史运行数据,通过机器学习算法和统计学分析算法,训练第二服务调用特征模型,得到所述第一服务调用特征模型。
在另一种可能的实现方式中,所述训练模块,还用于通过所述统计学分析算法,确定所述每个运行指标的权重;根据所述每个运行指标的权重、所述第二历史时间调用特征和所述第二历史运行数据中的每个运行指标,通过所述机器学习算法训练所述第二服务调用特征模型,得到所述第一服务调用特征模型。
在另一种可能的实现方式中,所述训练模块,还用于通过所述统计学分析算法,预测所述每个类型的服务实例在未来第二预设时长内的第三调用数量;根据所述每个运行指标的权重、所述第二历史时间调用特征和所述第二历史运行数据中的每个运行指标,通过所述第二服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第四调用数量;根据所述第三调用数量与所述第四调用数量之间的差值,通过所述机器学习算法训练所述第二服务调用特征模型中每个运行指标的第一权重,得到所述第一服务调用特征模型。
在另一种可能的实现方式中,所述训练模块,还用于若所述第三调用数量与所述第四调用数量之间的差值大于第一数量阈值时,对所述第二服务调用特征模型中每个运行指标的权重进行调整,得到第三服务调用特征模型;通过所述第三服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第五调用数量;若所述第三调用数量与所述第五调用数量之间的差值大于第一数量阈值,对所述权重再次进行调整,至到所述第三调用数量与所述第五调用数量之间的差值小于第一数量阈值,确定最后一次调整得到的第三服务调用特征模型为所述第一服务调用特征模型。
在另一种可能的实现方式中,所述获取模块,还用于根据所述类型,获取已记录的所述云服务架构中所述类型的多个服务实例的历史调用信息,所述历史调用信息包括调用时间和调用数量;根据所述历史调用信息,确定所述多个服务实例的第一历史时间调用特征。
根据本申请实施例的另一方面,提供了一种服务器,所述服务器包括:处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现上述任一可能实现方式所述的资源调度方法中的操作。
根据本申请实施例的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并具有以实现如所述资源调度方法中所执行的操作。
在本申请实施例中,对于云服务架构中的任一类型的多个服务实例,获取多个服务实例的第一历史时间调用特征和第一历史运行数据;将多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测类型的服务实例在未来第一预设时长内的第一调用数量;根据类型的服务实例的第一调用数量和类型的服务实例当前的第二调用数量,调整云服务架构中类型在线的服务实例;根据调整后的类型在线的服务实例,为类型在线的服务实例分配资源。由于根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量,调整云服务架构中该类型在线的服务实例的数量,使云服务架构中该类型在线的服务实例的数量与该类型服务请求的数量相对应,因此,提高了在线的服务实例的利用率。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种实施环境的示意图;
图2是本申请实施例提供的一种资源调度方案的示意图;
图3是本申请实施例提供的一种资源调度方法的流程图;
图4是本申请实施例提供的一种第一服务调用特征模型训练方法的流程图;
图5是本申请实施例提供的一种获取数据库方法的流程图;
图6是本申请实施例提供的一种资源调度装置的结构示意图;
图7是本申请实施例提供的一种服务器的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
图1是本申请实施例提供的一种实施环境的示意图。参见图1,该实施环境中包括终端101和云服务架构102。
终端101和云服务架构102之间通过无线或者有线网络连接。并且,终端101上可以安装有云服务架构102提供服务的客户端,终端101对应的用户可以通过该客户端与云服务架构102之间实现例如数据传输、消息交互等功能。客户端可以为终端101上安装的包括上网功能的客户端。例如,该客户端可以为浏览器、社交应用、游戏应用或者外卖应用等。
终端101可以为电脑、手机、平板电脑或者其他电子设备。云服务架构102可以是一台服务器,或者由若干台服务器组成的服务器集群,或者是一个云计算服务中心。
在本申请实施例中,该云服务架构102包括API(Application ProgrammingInterface,应用程序编程接口)网关、一个主服务器和多个从服务器。每个服务器上包括多个执行节点,每个执行节点内包括多种类型的服务实例,每个执行节点中的服务实例类型可以相同,也可以不同,每个类型的服务实例数量可以是1个、2个或者多个;并且主服务器可以对从服务器进行控制。例如,主服务器可以调整每个从服务器内的服务实例的数量。
其中,API网关对服务请求按照服务类型的不同进行分类,将服务请求分配给服务器处理。服务类型可以是外卖服务、语音服务、视频服务、上网搜索服务等,相应的,服务实例可以为外卖服务实例、语音服务实例、视频服务实例、上网搜索服务实例等。
为了便于说明,将服务实例的类型命名为服务实例A、服务实例B、服务实例C、服务实例D等。参见图2,该云服务架构102包括API网关、一个主服务器和多个从服务器。每个服务器上包括执行节点A、执行节点B等;执行节点A和执行节点B中包括多种类型的服务实例。例如,执行节点A中包括服务实例A、服务实例B、服务实例C和服务实例D;执行节点B中包括服务实例A、服务实例B和服务实例C和服务实例D。
当用户使用终端101向云服务架构102发送服务请求时,该云服务架构102通过API网关向服务器中包含有该类型服务实例的执行节点分配服务请求,随后执行节点中的服务实例对服务请求进行处理,最后云服务架构102将处理结果返回终端。例如,在终端101使用外卖应用时,终端101向云服务架构102发送外卖订单的服务请求。云服务架构102通过API网关将外卖订单的服务分配给执行节点中外卖服务实例进行处理;最后云服务架构102将处理结果返回给第一终端101。
其中,对于每个类型的网络服务请求,云服务器架构内对应的该类型的在线服务实例的资源越多,云服务器架构返回网络服务请求对应的结果的时间越短。在本申请实施例中,继续参见图2,主服务器对云服务架构102中的每个类型的服务实例的时间调用特征和运行数据进行监控并记录形成数据库。主服务器根据数据库存储的数据,通过机器学习算法和统计学算法训练得到第一服务调用特征模型。主服务器通过第一服务调用特征模型对云服务架构102中的服务实例在未来第一预设时长内的第一调用数量进行预测,根据预测结果动态调整云服务架构102中类型在线的服务实例。主服务器对云服务架构102中服务实例的资源进行调度,使云服务架构102中服务实例的数量与服务请求的数量相对应,提高了云服务架构102中服务实例的利用率。
图3是本申请实施例提供的一种资源调度方法的流程图。参见图3,该资源调度方法包括以下步骤:
301、对于云服务架构中的任一类型的多个服务实例,主服务器获取多个服务实例的第一历史时间调用特征,以及,获取多个服务实例的第一历史运行数据。
在本申请实施例中,在云服务架构运行过程中,主服务器对云服务架构中每个时间段的每种类型服务实例的调用数量以及每种类型服务实例的运行数据进行监控,得到监控数据,并将监控数据存储在数据库中。
在一种可能实现的方式中,主服务器可以从数据库中获取多个服务实例的第一历史时间调用特征。相应的,本步骤可以包括:主服务器根据类型,获取已记录的云服务架构中该类型的多个服务实例的历史调用信息,历史调用信息包括调用时间和调用数量。主服务器根据历史调用信息,确定多个服务实例的第一历史时间调用特征。
在一种可能的实现方式中,主服务器中包含每种类型服务实例的调用时间和调用数量之间的关系。相应的,主服务器确定每种类型服务实例的调用时间,从每种类型服务实例的调用时间和调用数量之间的关系中,确定每种类型服务实例的第一历史时间调用特征。例如,主服务器中包含周一至周日每个时间段内服务实例A的调用数量。主服务器确定服务实例A的调用时间为周一中午12:00,主服务器根据周一中午12:00服务实例A的调用数量的关系,确定服务实例A周一中午12:00的调用数量。
在一种可能实现的方式中,主服务器可以从数据库中获取多个服务实例的第一历史运行数据。相应的,本步骤可以包括:主服务器根据类型,获取已记录的云服务架构中该类型的多个服务实例的历史运行数据,历史运行数据包括调用时间和运行数据。主服务器根据历史运行数据,确定多个服务实例的第一历史运行数据。其中,运行数据包括该类型服务实例的CPU占用率、内存使用、调用分布、执行节点压力、事件循环时间、调用耗时分布中的至少一个。
在一种可能的实现方式中,主服务器中包含每种类型服务实例的调用时间和运行数据之间的关系。相应的,主服务器确定每种类型服务实例的调用时间,从每种类型服务实例的调用时间和运行数据之间的关系中,确定每种类型服务实例的第一历史运行数据。例如,主服务器中包含周一至周日每个时间段内服务实例A的运行数据。主服务器确定服务实例A的调用时间为周一中午12:00,主服务器根据周一中午12:00服务实例A的运行数据的关系,确定服务实例A的周一中午12:00的运行数据。
需要说明的另一点是,主服务器可以定时从数据库中获取多个服务实例的第一历史时间调用特征和第一历史运行数据。设定的时间可以是第三预设时长的时间。其中,第三预设时长可以是30min、1h、1.5h等,在本申请实施例中,对第三预设时长不作具体限定,可以根据需要进行设置并更改。
302、主服务器将多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测该类型的服务实例在未来第一预设时长内的第一调用数量。
在本申请实施例中,将任一类型的多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,第一服务调用特征模型预测该类型的服务实例在未来第一预设时长内的第一调用数量。其中,第一预设时长可以是30min、1h、1.5h等,在本申请实施例中,对第一预设时长不作具体限定,可以根据需要进行设置并更改。
在一种可能的实现方式中,主服务器中包含每种类型服务实例的调用时间和调用数量之间的关系。相应的,主服务器确定每种类型服务实例的未来第一预设时长的调用时间,从每种类型服务实例的多次调用时间和调用数量之间的关系中,确定未来第一预设时长内的第一调用数量。
在一种可能的实现方式中,主服务器根据多次调用时间对应的调用数量的平均值,确定未来第一预设时长内的第一调用数量。例如,主服务器中包含多个周一至周日每个时间段内服务实例A的调用数量的关系。主服务器确定服务实例A的未来第一预设时长的调用时间为下周一中午12:00,主服务器根据多次周一中午12:00服务实例A的调用数量Q1、Q2、Q3等的平均值为Q,确定服务实例A下周一中午12:00的第一调用数量为Q。
在另一种可能的实现方式中,主服务器中包含每种类型服务实例的调用时间和运行数据、以及运行数据与调用数量之间的关系。相应的,主服务器确定每种类型服务实例的未来第一预设时长的调用时间,从每种类型服务实例的调用时间和运行数据之间的关系中,确定每种类型服务实例的未来第一预设时长的运行数据;根据运行数据与调用数量之间的关系,确定第一调用数量。
在另一种可能的实现方式中,第一服务调用特征模型中包含有每个运作指标的权重。第一服务调用特征模型通过每个运行指标和每个运行指标的权重,预测该类型的服务实例在未来第一预设时长内的第一调用数量。例如,主服务器将服务实例A的CPU占用率和内存使用输入第一服务调用特征模型,第一服务调用特征模型通过服务实例A的CPU占用率和内存使用以及CPU占用率的权重、内存使用的权重,预测服务实例A在未来第一预设时长内的第一调用数量。
303、主服务器根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量,调整云服务架构中类型在线的服务实例。
在本申请实施例中,该类型的服务实例的第一调用数量可以是服务实例A的第一调用数量、服务实例B的第一调用数量、服务实例C的第一调用数量和服务实例D的第一调用数量。
在一种可能的实现方式中,主服务器根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量之间的差值,调整云服务架构中该类型在线的服务实例。当该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量之间的差值大于第二数量阈值时,主服务器调整云服务架构中该类型在线的服务实例;当该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量之间的差值小于第二数量阈值时,主服务器不调整云服务架构中该类型在线的服务实例。其中,第二数量阈值可以是0、10、20、30、40等,在本申请实施例中,对第二数量阈值不作具体限定,可以根据需要进行设置并更改。
需要说明的一点是,对于每个类型服务实例,对应的第二数量阈值可以相同,也可以不同。例如,设置类型服务A的第二数量阈值为20,设置类型服务B的第二数量阈值为20,设置类型服务C的第二数量阈值为30,设置类型服务D的第二数量阈值为40。当类型服务A的的第一调用数量和服务实例A当前的第二调用数量之间的差值大于20时,主服务器调整云服务架构中在线的服务实例A;当服务实例A的第一调用数量和服务实例A当前的第二调用数量之间的差值小于20时,主服务器不调整云服务架构中在线的服务实例A。
在另一种可能的实现方式中,主服务器根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量之间的变化率,调整云服务架构中该类型在线的服务实例。
当该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量之间的变化率大于第一变化率阈值时,主服务器调整云服务架构中该类型在线的服务实例;当该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量之间的变化率小于第一变化率阈值时,主服务器不调整云服务架构中该类型在线的服务实例。其中,第一变化率阈值可以是0%、5%、10%、15%等,在本申请实施例中,对第一变化率阈值不作具体限定,可以根据需要进行设置并更改。
需要说明的一点是,对于每个类型服务实例,对应的第一变化率阈值可以相同,也可以不同。例如,设置类型服务A的第一变化率阈值为10%,设置类型服务B的第一变化率阈值为10%,设置类型服务C的第一变化率阈值为15%,设置类型服务D的第一变化率阈值为5%。当类型服务A的的第一调用数量和服务实例A当前的第二调用数量之间的变化率大于10%时,主服务器调整云服务架构中在线的服务实例A;当服务实例A的第一调用数量和服务实例A当前的第二调用数量之间的变化率小于10%时,主服务器不调整云服务架构中在线的服务实例A。
调整云服务架构中类型在线的服务实例可以将该类型在线的服务实例调整为该类型的服务实例的第一调用数量。例如,服务实例A的第一调用数量为1000,则调整云服务架构中在线服务实例A的数量为1000。
在本申请实施例中,主服务器通过在云服务架构中下载该类型服务实例来增加该类型在线的服务实例的数量,主服务器通过关闭云服务架构中该类型在线的服务实例来减少该类型在线的服务实例的数量。
在一种可能的实现方式中,主服务器通过在云服务架构中的执行节点内下载该类型服务实例来增加该类型在线的服务实例的数量。在一种可能的实现方式中,下载该类型在线的服务实例时可以在多个执行节点中同时下载。相应的,主服务器根据需要增加的在线的服务实例的数量确定下载该类型的服务实例的执行节点的数量。主服务器在多个执行节点中平均分配需要下载的该类型的服务实例。例如,服务实例A的数量为需要增加200个,主服务器确定下载该类型的服务实例的执行节点的数量为10个,确定每个执行节点下载服务实例A的数量为20个。
在本申请实施例中,通过多个执行节点中同时下载类型服务实例增加云服务架构中该类型在线服务实例的数量,可以快速的调整该类型在线服务实例的数量,提高了云服务架构的调整效率。
在另一种可能的实现方式中,主服务器也可以只在一个执行节点中下载该类型的服务实例,当该执行节点的CPU占用率达到第一CPU占用率阈值时,另一个执行节点继续下载该类型服务实例,一直到该类型在线的服务实例达到第一调用数量时停止。其中,第一CPU占用率阈值可以50%、60%、70%等,在本申请实施例中,对第一CPU占用率阈值不作具体限定,可以根据需要进行设置并更改。例如,执行节点的第一CPU占用率阈值为60%,在执行节点A下载服务实例A时,当执行节点A的CPU占用率达到60%时,主服务器启动执行节点B继续下载服务实例A,当执行节点B的CPU占用率达到60%时,主服务器启动执行节点C继续下载服务实例A,一直到在线的服务实例A达到第一调用数量时停止。
在本申请实施例中,根据执行节点的CPU占用率来增加云服务架构中该类型在线服务实例的数量,防止执行节点的CPU占用率过高,提高了云服务架构的稳定性。
304、主服务器根据调整后的该类型在线的服务实例,为该类型在线的服务实例分配资源。
在一种可能的实现方式中,主服务器根据调整后的该类型在线的服务实例的数量,为该类型的服务实例分配资源。相应的,该类型在线的服务实例的数量越多,主服务器分配给该类型的服务实例的资源越多,主服务器处理该类型的服务请求的数量就越多。
在本申请实施例中,对于云服务架构中的任一类型的多个服务实例,主服务器获取多个服务实例的第一历史时间调用特征和第一历史运行数据。主服务器将多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测该类型的服务实例在未来第一预设时长内的第一调用数量。主服务器根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量,调整云服务架构中该类型在线的服务实例。主服务器根据调整后的该类型在线的服务实例,为该类型在线的服务实例分配资源。由于主服务器根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量,调整云服务架构中该类型在线的服务实例的数量,使云服务架构中该类型在线的服务实例的数量与该类型服务请求的数量相对应,因此,提高了在线的服务实例的利用率。
图4是本申请实施例提供的一种第一服务调用特征模型训练方法的流程图,在本申请实施例中,以主服务器训练第一服务调用特征模型为例进行说明。参见图4,该方法包括:
401、主服务器获取云服务架构中的多个类型的服务实例的第二历史时间调用特征和第二历史运行数据。
在本申请实施例中,在主服务器运行过程中,主服务器对云服务架构中每个时间段的每种类型服务实例的调用数量以及每种类型服务实例的运行数据进行监控,得到监控数据,并将监控数据存储在数据库中。
在一种可能实现的方式中,主服务器可以从数据库中获取多个服务实例的第二历史时间调用特征。相应的,本步骤可以包括:主服务器根据类型,获取已记录的云服务架构中该类型的多个服务实例的历史调用信息,历史调用信息包括调用时间和调用数量。主服务器根据历史调用信息,确定多个服务实例的第二历史时间调用特征。
在一种可能的实现方式中,主服务器中包含每种类型服务实例的调用时间和调用数量之间的关系。相应的,主服务器确定每种类型服务实例的调用时间,从每种类型服务实例的调用时间和调用数量之间的关系中,确定每种类型服务实例的第二历史时间调用特征。
在另一种可能实现的方式中,主服务器可以从数据库中获取多个服务实例的第二历史运行数据。相应的,本步骤可以包括:主服务器根据类型,获取已记录的云服务架构中该类型的多个服务实例的历史运行数据,历史运行数据包括调用时间和运行数据。主服务器根据历史运行数据,确定多个服务实例的第二历史运行数据。其中,运行数据包括该类型服务实例的CPU占用率、内存使用、调用分布、执行节点压力、事件循环时间、调用耗时分布中的至少一个。
在另一种可能的实现方式中,主服务器中包含每种类型服务实例的调用时间和运行数据之间的关系。相应的,主服务器确定每种类型服务实例的调用时间,从每种类型服务实例的调用时间和运行数据之间的关系中,确定每种类型服务实例的第二历史运行数据。
在一种可能的实现方式中,多个类型的服务实例指当前云服务架构中在线的每个类型的服务实例。相应的,主服务器确定当前云服务架构中在线的每个类型的服务实例,获取在线的每个类型的服务实例的第二历史时间调用特征和第二历史运行数据。例如,当前云服务架构中在线的服务实例有服务实例A、服务实例B和服务实例C,则主服务器获取服务实例A、服务实例B和服务实例C的第二历史时间调用特征和第二历史运行数据。
在另一种可能实现的方式中,多个类型的服务实例指当前云服务架构中存储的全部类型的服务实例。相应的,主服务器确定当前云服务架构中存储的全部类型的服务实例,获取当前云服务架构中存储的每个类型的服务实例的第二历史时间调用特征和第二历史运行数据。例如,当前云服务架构中存储的全部服务实例为服务实例A、服务实例B、服务实例C、服务实例D和服务实例E,则主服务器获取服务实例A、服务实例B、服务实例C、服务实例D和服务实例E的第二历史时间调用特征和第二历史运行数据。
402、主服务器根据第二历史时间调用特征和第二历史运行数据,通过机器学习算法和统计学分析算法,训练第二服务调用特征模型,得到第一服务调用特征模型。
在本申请实施例中,主服务器通过机器学习算法和统计学分析算法,训练第二服务调用特征模型,得到第一服务调用特征模型。相应的本步骤可以通过以下步骤(1)至(2)实现,包括:
(1)主服务器通过统计学分析算法,确定每个运行指标的权重。
在本申请实施例中,主服务器可以对该类型的服务实例的历史调用特征以及每个运行指标进行统计。相应的,主服务器根据统计学分析算法,确定该类型的服务实例历史调用特征与每个运行指标之间的相关性。主服务器根据每个运行指标与历史调用特征之间的相关性,确定相关性强的运行指标的权重大。
在一种可能的实现方式中,历史调用特征可以是历史调用量。相关性可以是运行指标与历史调用量之间的正相关性。相应的,主服务器根据统计学分析算法,确定该类型的服务实例的运行指标与历史调用量之间的正相关性,确定正相关性强的运行指标的权重大。例如,在服务实例A的历史调用数量在100、200、300进行变化时,主服务器对每个运行指标的变化进行统计,根据统计学分析算法,确定服务实例A历史调用数量在100、200、300进行变化时,每个运行指标之间的正相关性。主服务器确定正相关性强的运行指标的权重大。
(2)主服务器根据每个运行指标的权重、第二历史时间调用特征和第二历史运行数据中的每个运行指标,通过机器学习算法训练第二服务调用特征模型,得到第一服务调用特征模型。
在本申请实施例中,每个类型的服务实例分别对应一个服务调用特征模型。其中,每个服务调用特征模型中的参数与该类型的服务实例的时间调用特征和运行数据相互对应。所以,每个类型的服务实例对应的第一服务调用特征模型中每个运行指标的权重不同,在机器学习算法训练第二服务调用特征模型过程中,主服务器需要对个运行指标的权重进行调整,得到第一服务调用特征模型。
相应的,本步骤可以包括通过以下步骤(a)至(c)实现:
(a)主服务器通过统计学分析算法,预测每个类型的服务实例在未来第二预设时长内的第三调用数量。
在一种可能的实现方式中,主服务器通过该类型的服务实例的历史调用特征的统计学分析算法,预测该类型的服务实例在未来第二预设时长内的第三调用数量。相应的,主服务器对该类型的服务实例的调用时间和调用数量进行统计学分析算法。主服务器通过调用时间和调用数量进行统计学分析算法的结果,预测该类型的服务实例在未来第二预设时长内的第三调用数量。其中,主服务器在统计分析过程中,统计周期可以是一天,也可以是一周,还可以是一个月;在本申请实施例中,对统计周期不作具体限定,可以根据需要进行设置并更改。
例如,设置服务实例A的统计周期为一天,若未来第二预设时长为中午12:00,则对服务实例A每天中午12:00的历史调用特征进行统计学分析,预测服务实例A在未来中午12:00的第三调用数量。
(b)主服务器根据每个运行指标的权重、第二历史时间调用特征和第二历史运行数据中的每个运行指标,通过第二服务调用特征模型,预测每个类型的服务实例在未来第二预设时长内的第四调用数量。
(c)主服务器根据第三调用数量与第四调用数量之间的差值,通过机器学习算法训练第二服务调用特征模型中每个运行指标的权重,得到第一服务调用特征模型。
在一种可能的实现方式中,若第三调用数量与第四调用数量之间的差值大于第一数量阈值时,主服务器对第二服务调用特征模型中每个运行指标的权重进行调整,得到第三服务调用特征模型。其中,第一数量阈值可以是5、10、15、20等;在本申请实施例中,对第一数量阈值不作具体限定,可以根据需要进行设置并更改。
主服务器通过第三服务调用特征模型,预测每个类型的服务实例在未来第二预设时长内的第五调用数量。若第三调用数量与第五调用数量之间的差值大于第一数量阈值,主服务器对权重再次进行调整,至到第三调用数量与第五调用数量之间的差值小于第一数量阈值,确定最后一次调整得到的第三服务调用特征模型为第一服务调用特征模型。
例如,设定服务实例A第一数量阈值为15,主服务器通过统计学分析算法,确定服务实例A在未来第二预设时长内的第三调用数量为100。主服务器通过第二服务调用特征模型,确定服务实例A在未来第二预设时长内的第四调用数量为80。此时,第三调用数量与第四调用数量之间的差值为20大于第一数量阈值15,主服务器对服务实例A的每个运行指标的权重进行调整,得到第三服务调用特征模型。
主服务器通过第三服务调用特征模型,预测服务实例A在未来第二预设时长内的第五调用数量为90,此时,第三调用数量与第五调用数量之间的差值为10小于第一数量阈值15,主服务器确定最后一次调整得到的第三服务调用特征模型为第一服务调用特征模型。
在本申请实施例中,由于主服务器根据多个类型的服务实例的第二历史时间调用特征和第二历史运行数据,通过机器学习算法和统计学分析算法,训练第二服务调用特征模型中每个运行指标的权重,且通过机器学习算法和统计学分析算法交叉验证得到该类型服务实例的第一服务调用特征模型。因此,第一服务调用特征模型可以精确预测该类型的服务实例的第一调用数量,根据预测结果调整云服务架构中该类型在线的服务实例的数量,使云服务架构中该类型在线的服务实例的数量与该类型服务请求的数量相对应,所以,提高了在线的服务实例的利用率。
图5是本申请实施例提供的一种获取数据库方法的流程图。参见图5,该方法包括以下步骤:
501、主服务器接收终端发起的服务请求,确定每个类型的服务请求的数量。
在本申请实施例中,服务请求指在当前所有终端向主服务器发起的服务请求。其中,终端发起的服务请求中可以包括服务请求A、服务请求B、服务请求C、服务请求D等。
在一种可能的实现方式中,主服务器根据服务请求的类型,确定每个类型的服务请求的数量。相应的,主服务器接收终端发起的服务请求,确定服务请求的类型。主服务器根据每个服务请求的类型,确定每个类型的服务请求的数量。例如,主服务器接收终端发起5个服务请求,主服务器确定5个服务请求的类型为服务请求A、服务请求A、服务请求B、服务请求B和服务请求B,则主服务器确定服务请求A的数量为2,服务请求B的数量为3。
在另一种可能的实现方式中,每个类型的服务请求包含的请求函数不同,主服务器通过服务请求的请求函数确定服务请求的类型。相应的,主服务器接收终端发起的服务请求,确定服务请求的请求函数。主服务器根据该服务请求的请求函数,确定该服务请求类型。例如,服务请求A中包含的服务A的函数,主服务器通过服务A的函数确定该服务请求为服务请求A。
502、主服务器根据每个类型的服务请求的数量,确定当前云服务内每个类型的服务实例的时间调用特征和运行数据。
在本申请实施例中,对于每个类型的服务请求,主服务器需调用该类型的在线服务实例进行处理。相应的,主服务器根据每个类型的服务请求的数量,确定该类型的在线服务实例的调用数量。主服务器根据该类型的在线服务实例的调用数量,确定每个类型的服务实例的时间调用特征和运行数据。
在一种可能的实现方式中,主服务器中存储有每个类型的在线服务实例的调用数量与该类型服务实例的运行数据之间的关系。相应的,主服务器确定该类型的在线服务实例的调用数量,从该类型的在线服务实例的调用数量与该类型的运行数据之间的关系中,确定该类型服务实例的运行数据。
需要说明的一点是,当前云服务架构中存在该类型的在线服务实例时,对于每个类型的服务请求,主服务器之间调用该类型的在线服务实例进行处理。主服务器将该在线服务实例对该服务请求的处理结果返回。
在另一种可能的实现方式中,当前云服务架构中不存在该类型的在线服务实例时,处理器可以根据该服务请求的请求函数,下载特定函数包,通过下载的函数包生成该类型在线服务实例,然后在通过该在线服务实例对服务请求进行处理。例如,服务请求的服务类型为服务请求E,当前云服务架构中不存在相应的在线服务实例E,则处理器根据服务请求E下载特定函数包,通过下载的特定函数包生成对应的在线服务实例E,然后通过在线服务实例E对服务请求E进行处理。
503、主服务器对当前云服务架构中每个类型的服务实例的时间调用特征和运行数据进行存储。
主服务器可以对当前云服务架构中每个类型的服务实例的时间调用特征和运行数据进行实时监控并存储,得到数据库。
在本申请实施例中,主服务器对当前云服务架构中每个类型的服务实例的时间调用特征和运行数据进行监控并存储得到数据库。所以,数据库中存储了每个类型的服务实例的历史时间调用特征和历史运行数据。主服务器可以根据数据库内存储的每个类型的服务实例的第二历史时间调用特征和第二历史运行数据,通过机器学习算法和统计学分析算法,训练第二服务调用特征模型,得到每个类型的服务实例的第一服务调用特征模型。并且,主服务器可以根据数据库内存储的该类型的服务实例的第一历史时间调用特征和第一历史运行数据,通过该类型的第一服务调用特征模型预测该类型的服务实例的第一调用数量。
图6是本申请实施例提供的一种资源调度装置的结构示意图。参见图6,该装置包括:
获取模块601,用于对于云服务架构中的任一类型的多个服务实例,获取多个服务实例的第一历史时间调用特征和第一历史运行数据;
预测模块602,将多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,用于预测类型的服务实例在未来第一预设时长内的第一调用数量;
调整模块603,用于根据该类型的服务实例的第一调用数量和类型的服务实例当前的第二调用数量,调整云服务架构中类型在线的服务实例;
分配模块604,用于根据调整后的类型在线的服务实例,为类型在线的服务实例分配资源。
在另一种可能的实现方式中,该装置还包括:
该获取模块601,还用于获取云服务架构中的多个类型的服务实例的第二历史时间调用特征和第二历史运行数据;
训练模块,用于根据第二历史时间调用特征和第二历史运行数据,通过机器学习算法和统计学分析算法,训练第二服务调用特征模型,得到第一服务调用特征模型。
在另一种可能的实现方式中,训练模块,还用于通过统计学分析算法,确定每个运行指标的权重;根据每个运行指标的权重、第二历史时间调用特征和第二历史运行数据中的每个运行指标,通过机器学习算法训练第二服务调用特征模型,得到第一服务调用特征模型。
在另一种可能的实现方式中,训练模块,还用于通过统计学分析算法,预测每个类型的服务实例在未来第二预设时长内的第三调用数量;根据每个运行指标的权重、第二历史时间调用特征和第二历史运行数据中的每个运行指标,通过第二服务调用特征模型,预测每个类型的服务实例在未来第二预设时长内的第四调用数量;根据第三调用数量与第四调用数量之间的差值,通过机器学习算法训练第二服务调用特征模型中每个运行指标的第一权重,得到第一服务调用特征模型。
在另一种可能的实现方式中,训练模块,还用于若第三调用数量与第四调用数量之间的差值大于第一数量阈值时,对第二服务调用特征模型中每个运行指标的权重进行调整,得到第三服务调用特征模型;通过第三服务调用特征模型,预测每个类型的服务实例在未来第二预设时长内的第五调用数量;若第三调用数量与第五调用数量之间的差值大于第一数量阈值,对权重再次进行调整,至到第三调用数量与第五调用数量之间的差值小于第一数量阈值,确定最后一次调整得到的第三服务调用特征模型为第一服务调用特征模型。
在另一种可能的实现方式中,获取模块601,还用于根据类型,获取已记录的云服务架构中类型的多个服务实例的历史调用信息,历史调用信息包括调用时间和调用数量;根据历史调用信息,确定多个服务实例的第一历史时间调用特征。
在本申请实施例中,对于云服务架构中的任一类型的多个服务实例,获取多个服务实例的第一历史时间调用特征和第一历史运行数据;将多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测类型的服务实例在未来第一预设时长内的第一调用数量;根据类型的服务实例的第一调用数量和类型的服务实例当前的第二调用数量,调整云服务架构中类型在线的服务实例;根据调整后的类型在线的服务实例,为类型在线的服务实例分配资源。由于根据该类型的服务实例的第一调用数量和该类型的服务实例当前的第二调用数量,调整云服务架构中该类型在线的服务实例的数量,使云服务架构中该类型在线的服务实例的数量与该类型服务请求的数量相对应,因此,提高了在线的服务实例的利用率。
需要说明的是:上述实施例提供的资源调度装置在进行资源调度时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将服务器的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的资源调度装置与资源调度方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
图7是本申请实施例提供的一种服务器的结构示意图,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(central processingunits,CPU)701和一个或一个以上的存储器702,其中,存储器702中存储有至少一条指令,至少一条指令由处理器701加载并执行以实现上述各个方法实施例提供的资源调度方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。
本申请实施例还提供了一种计算机可读存储介质,该计算机可读存储介质中存储有至少一条指令,该至少一条指令由处理器加载并具有以实现上述实施例的资源调度方法中所具有的操作。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本申请实施例的较佳实施例,并不用以限制本申请实施例,凡在本申请实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (8)

1.一种资源调度方法,其特征在于,所述方法包括:
对于云服务架构中的任一类型的多个服务实例,获取所述多个服务实例的第一历史时间调用特征,以及,获取所述多个服务实例的第一历史运行数据;
将所述多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测所述类型的服务实例在未来第一预设时长内的第一调用数量;
根据所述类型的服务实例的第一调用数量和所述类型的服务实例当前的第二调用数量,调整所述云服务架构中所述类型在线的服务实例;
根据调整后的所述类型在线的服务实例,为所述类型在线的服务实例分配资源;
所述方法还包括:
获取所述云服务架构中的多个类型的服务实例的第二历史时间调用特征和第二历史运行数据,所述第二历史运行数据包括至少一个运行指标;
通过统计学分析算法,确定每个运行指标的权重;
通过所述统计学分析算法,预测每个类型的服务实例在未来第二预设时长内的第三调用数量;
根据所述每个运行指标的权重、所述第二历史时间调用特征和所述第二历史运行数据中的每个运行指标,通过第二服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第四调用数量;
根据所述第三调用数量与所述第四调用数量之间的差值,通过机器学习算法训练所述第二服务调用特征模型中每个运行指标的第一权重,得到所述第一服务调用特征模型。
2.根据权利要求1所述的方法,其特征在于,所述根据所述第三调用数量与所述第四调用数量之间的差值,通过机器学习算法训练所述第二服务调用特征模型中每个运行指标的第一权重,得到所述第一服务调用特征模型,包括:
若所述第三调用数量与所述第四调用数量之间的差值大于第一数量阈值时,对所述第二服务调用特征模型中每个运行指标的权重进行调整,得到第三服务调用特征模型;
通过所述第三服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第五调用数量;
若所述第三调用数量与所述第五调用数量之间的差值大于第一数量阈值,对所述权重再次进行调整,至到所述第三调用数量与所述第五调用数量之间的差值小于第一数量阈值,确定最后一次调整得到的第三服务调用特征模型为所述第一服务调用特征模型。
3.根据权利要求1所述的方法,其特征在于,所述获取所述多个服务实例的第一历史时间调用特征,包括:
根据所述类型,获取已记录的所述云服务架构中所述类型的多个服务实例的历史调用信息,所述历史调用信息包括调用时间和调用数量;
根据所述历史调用信息,确定所述多个服务实例的第一历史时间调用特征。
4.一种资源调度装置,其特征在于,所述装置包括:
获取模块,用于对于云服务架构中的任一类型的多个服务实例,获取所述多个服务实例的第一历史时间调用特征,以及,获取所述多个服务实例的第一历史运行数据;
预测模块,用于将所述多个服务实例的第一历史时间调用特征和第一历史运行数据输入第一服务调用特征模型,预测所述类型的服务实例在未来第一预设时长内的第一调用数量;
调整模块,用于根据所述类型的服务实例的第一调用数量和所述类型的服务实例当前的第二调用数量,调整所述云服务架构中所述类型在线的服务实例;
分配模块,用于根据调整后的所述类型在线的服务实例,为所述类型在线的服务实例分配资源;
所述获取模块,还用于获取所述云服务架构中的多个类型的服务实例的第二历史时间调用特征和第二历史运行数据,所述第二历史运行数据包括至少一个运行指标;
训练模块,通过统计学分析算法,确定每个运行指标的权重;
所述训练模块,还用于通过所述统计学分析算法,预测每个类型的服务实例在未来第二预设时长内的第三调用数量;根据所述每个运行指标的权重、所述第二历史时间调用特征和所述第二历史运行数据中的每个运行指标,通过第二服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第四调用数量;根据所述第三调用数量与所述第四调用数量之间的差值,通过机器学习算法训练所述第二服务调用特征模型中每个运行指标的第一权重,得到所述第一服务调用特征模型。
5.根据权利要求4所述的装置,其特征在于,所述训练模块,还用于若所述第三调用数量与所述第四调用数量之间的差值大于第一数量阈值时,对所述第二服务调用特征模型中每个运行指标的权重进行调整,得到第三服务调用特征模型;通过所述第三服务调用特征模型,预测所述每个类型的服务实例在未来第二预设时长内的第五调用数量;若所述第三调用数量与所述第五调用数量之间的差值大于第一数量阈值,对所述权重再次进行调整,至到所述第三调用数量与所述第五调用数量之间的差值小于第一数量阈值,确定最后一次调整得到的第三服务调用特征模型为所述第一服务调用特征模型。
6.根据权利要求4所述的装置,其特征在于,所述获取模块,还用于根据所述类型,获取已记录的所述云服务架构中所述类型的多个服务实例的历史调用信息,所述历史调用信息包括调用时间和调用数量;根据所述历史调用信息,确定所述多个服务实例的第一历史时间调用特征。
7.一种服务器,其特征在于,所述服务器包括:
处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由所述处理器加载并执行以实现权利要求1至3任一项所述的调度方法中的操作。
8.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至3任一项权利要求所述的调度方法中所执行的操作。
CN201911224422.6A 2019-12-04 2019-12-04 资源调度方法、装置、服务器及存储介质 Active CN110990138B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911224422.6A CN110990138B (zh) 2019-12-04 2019-12-04 资源调度方法、装置、服务器及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911224422.6A CN110990138B (zh) 2019-12-04 2019-12-04 资源调度方法、装置、服务器及存储介质

Publications (2)

Publication Number Publication Date
CN110990138A CN110990138A (zh) 2020-04-10
CN110990138B true CN110990138B (zh) 2023-04-14

Family

ID=70089784

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911224422.6A Active CN110990138B (zh) 2019-12-04 2019-12-04 资源调度方法、装置、服务器及存储介质

Country Status (1)

Country Link
CN (1) CN110990138B (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113747506A (zh) * 2020-05-28 2021-12-03 华为技术有限公司 一种资源调度方法、装置和网络***
CN111813523A (zh) * 2020-07-09 2020-10-23 北京奇艺世纪科技有限公司 时长预估模型生成方法、***资源调度方法、装置、电子设备和存储介质
CN112156453B (zh) * 2020-10-21 2022-06-03 腾讯科技(深圳)有限公司 实例自适应调整方法、装置、计算机可读存储介质及设备
CN112346860B (zh) * 2020-10-27 2022-02-08 四川长虹电器股份有限公司 基于机器学习的弹性部署服务的方法及***
CN112733892B (zh) * 2020-12-28 2024-06-21 北京聚云科技有限公司 一种用于模型训练的数据交互方法及装置
CN113791765B (zh) * 2021-09-15 2024-03-08 平安科技(深圳)有限公司 云服务的资源编排方法、装置、设备及存储介质
CN114844843B (zh) * 2022-03-24 2024-06-25 清华大学 应用实例数量的调整方法及装置
CN115629858A (zh) * 2022-10-17 2023-01-20 南京航空航天大学 无服务器背景下函数实例数量自适应方法及应用
CN117648167A (zh) * 2023-12-11 2024-03-05 北京火山引擎科技有限公司 资源调度方法、装置、设备及存储介质

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100481783C (zh) * 2007-04-20 2009-04-22 北京航空航天大学 网格服务容器的控制***
CN106161485B (zh) * 2015-03-23 2019-03-26 腾讯科技(深圳)有限公司 一种基础服务集群的资源调度方法、装置和***
CN107679634A (zh) * 2017-10-27 2018-02-09 国网陕西省电力公司西安供电公司 一种基于数据可视化的供电故障报修分析和预测的方法
CN109062769B (zh) * 2018-08-21 2021-09-24 南京星邺汇捷网络科技有限公司 It***性能风险趋势预测的方法、装置和设备
CN109284871A (zh) * 2018-09-30 2019-01-29 北京金山云网络技术有限公司 资源调整方法、装置和云平台
CN109548164B (zh) * 2019-01-11 2021-10-29 长沙学院 一种基于负载需求的自适应调度切换方法和***
CN110287003B (zh) * 2019-06-28 2020-04-21 北京九章云极科技有限公司 资源的管理方法和管理***

Also Published As

Publication number Publication date
CN110990138A (zh) 2020-04-10

Similar Documents

Publication Publication Date Title
CN110990138B (zh) 资源调度方法、装置、服务器及存储介质
Bhattacharjee et al. Barista: Efficient and scalable serverless serving system for deep learning prediction services
US11146502B2 (en) Method and apparatus for allocating resource
CN108776934B (zh) 分布式数据计算方法、装置、计算机设备及可读存储介质
CN110474852B (zh) 一种带宽调度方法及装置
CN109451072A (zh) 一种基于Kafka的消息缓存***和方法
CN112162865A (zh) 服务器的调度方法、装置和服务器
CN109995669B (zh) 分布式限流方法、装置、设备及可读存储介质
US9898315B1 (en) Management of demand for virtual computing resources
CN112165691A (zh) 内容分发网络调度方法、装置、服务器和介质
CN111131486B (zh) 执行节点的负载调节方法、装置、服务器及存储介质
CN112579304A (zh) 基于分布式平台的资源调度方法、装置、设备及介质
CN115421930B (zh) 任务处理方法、***、装置、设备及计算机可读存储介质
CN115033340A (zh) 一种宿主机的选择方法及相关装置
CN115202889A (zh) 计算资源调整方法及计算***
CN113079045B (zh) 带宽分配方法、装置、服务器及存储介质
CN115562841B (zh) 一种云视频服务自适应资源调度***和方法
CN115589489B (zh) 视频转码方法、装置、设备、存储介质及视频点播***
CN114896296B (zh) 云服务资源配置方法、装置、电子设备及计算机可读介质
CN114936089A (zh) 资源调度方法、***、设备及存储介质
CN113904940A (zh) 资源调整方法、装置、电子设备和计算机可读存储介质
CN112685157B (zh) 任务处理方法、装置、计算机设备及存储介质
CN114153714A (zh) 基于日志信息的容量调整方法、装置、设备及存储介质
CN113762972A (zh) 数据存储控制方法及装置、电子设备、存储介质
CN117972367B (zh) 一种数据存储预测方法、数据存储子***及智能计算平台

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant