CN115914235A - 负载均衡方法及装置 - Google Patents

负载均衡方法及装置 Download PDF

Info

Publication number
CN115914235A
CN115914235A CN202211518371.XA CN202211518371A CN115914235A CN 115914235 A CN115914235 A CN 115914235A CN 202211518371 A CN202211518371 A CN 202211518371A CN 115914235 A CN115914235 A CN 115914235A
Authority
CN
China
Prior art keywords
service node
computing power
task
load balancing
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211518371.XA
Other languages
English (en)
Inventor
朱萌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bank of China Ltd
Original Assignee
Bank of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of China Ltd filed Critical Bank of China Ltd
Priority to CN202211518371.XA priority Critical patent/CN115914235A/zh
Publication of CN115914235A publication Critical patent/CN115914235A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种负载均衡方法及装置,可应用于金融领域或其他领域,其中该方法包括:接收任务请求;根据所述任务请求和预先计算的各个服务节点的剩余算力,筛选出目标服务节点;将所述任务请求中的计算任务分发至所述目标服务节点。本发明的负载均衡方法及装置,与现有技术中负载均衡的技术方案相比,通过根据预先计算的各个服务节点的剩余算力筛选出目标服务节点进行任务分配,能够确保计算密集型任务被分配给剩余算力高的服务节点进行处理而得到快速地响应,保证了分布式***中任务请求的处理效率,实现任务的合理分配。

Description

负载均衡方法及装置
技术领域
本发明涉及***任务分配技术领域,尤其涉及负载均衡方法及装置。
背景技术
本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
目前在各个领域中,如金融领域、电信领域等,为实现整个***的负载均衡,需要将工作任务分配到多个服务节点进行执行,例如,FTP服务器、Web服务器、企业核心应用服务器和其它主要任务服务器等,从而协同完成工作任务。
现有的根据各个服务节点的资源使用情况进行业务分配的负载均衡方法在集群内计算机的计算能力存在差异时,无法真实反映计算机的负载能力,例如,一台计算能力较差的低性能计算机,虽然资源使用率低于另一台高性能计算机,但它已无法承担一些高计算量的任务(也即计算密集型任务),因此,根据各个服务节点的资源使用情况进行业务分配会导致计算密集型任务的服务处理时间长,整个分布式***的总计算资源无法获得合理的分配。
发明内容
本发明实施例提供一种负载均衡方法,用以解决目前基于资源使用情况无法实现任务的合理分配并导致计算密集型任务的服务处理时间长的技术问题,该方法包括:
接收任务请求;
根据所述任务请求和预先计算的各个服务节点的剩余算力,筛选出目标服务节点;
将所述任务请求中的计算任务分发至所述目标服务节点。
本发明实施例还提供一种负载均衡装置,用以解决目前基于资源使用情况无法实现任务的合理分配并导致计算密集型任务的服务处理时间长的技术问题,该装置包括:
任务接收模块,用于接收任务请求;
服务节点筛选模块,用于根据所述任务请求和预先计算的各个服务节点的剩余算力,筛选出目标服务节点;
任务分发模块,用于将所述任务请求中的计算任务分发至所述目标服务节点。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述负载均衡方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述负载均衡方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述负载均衡方法。
本发明实施例中,负载均衡方法及装置,与现有技术中负载均衡的技术方案相比,通过根据预先计算的各个服务节点的剩余算力筛选出目标服务节点进行任务分配,能够确保计算密集型任务被分配给剩余算力高的服务节点进行处理而得到快速地响应,保证了分布式***中任务请求的处理效率,实现任务的合理分配。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1为本发明实施例中负载均衡方法的流程示意图。
图2为本发明实施例中确定各个所述服务节点的总算力的流程示意图。
图3为本发明实施例中筛选出目标服务节点的流程示意图。
图4为本发明实施例中筛选出目标服务节点的另一流程示意图。
图5为本发明实施例中负载均衡装置的结构示意图。
图6为本发明实施例中总算力确定模块的结构示意图。
图7为本发明实施例中服务节点筛选模块的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。
如图1所示,本发明提供一种负载均衡方法,包括:
步骤101、接收任务请求。
其中,该任务请求为包括计算任务,还可以包括完成该计算任务所需的计算量,可以根据该任务请求的计算量以及预先建立的任务类型的分类列表进行该任务请求的分类,例如分为计算密集型任务或非计算密集型任务;任务请求也可以直接包括任务类型;进而可以根据任务类型选择不同的分配方式,本实施例中,对于计算密集型任务采用下述步骤进行目标服务节点的筛选和任务的分配;对于非计算密集型任务可以通过现有的负载均衡算法进行目标服务节点的筛选和任务的分配,例如轮询算法、加权轮询算法、随机算法、加权随机算法、哈希算法等。
步骤102、根据所述任务请求和预先计算的各个服务节点的剩余算力,筛选出目标服务节点。
其中,算力是计算能力(Computing Power)的简称,衡量的是通过对信息数据进行处理,实现目标结果输出的运算速度。衡量算力大小的指标有FLOPS(每秒浮点运算次数)、MIPS(每秒执行的百万指令数)、OPS(每秒运算次数)、Hash/s(每秒哈希运算次数)等。各个服务节点可以按预设的周期上报其自身的剩余算力,也可以是收到任务请求之后实时计算各个服务节点的剩余算力。筛选出的目标目标服务节点可以是一个也可以是多个。
步骤103、将所述任务请求中的计算任务分发至所述目标服务节点。
其中,可以将计算任务分发至其中一个目标服务节点进行执行,也可以将计算任务拆分为多个子任务分发至多个目标服务节点进行执行。
如图2所示,本发明实施例中,在预先计算各个服务节点的剩余算力之前,还包括:
步骤201、计算各个所述服务节点空载情况下的理论最高算力。
其中,理论最高算力的计算公式为:FLOPS(算力)=CPU核数*单核主频*CPU单个周期浮点计算能力,其中,CPU核数、单核主频以及CPU单个周期浮点计算能力这三个参数均可以查阅CPU的性能资料可以获得,例如英特尔至强6240R处理器,CPU核数为24,单核主频为2.4GHz,CPU单个周期浮点计算能力(AXV-512指令集,双精度运算次数)为32,从而算得FLOPS(算力)为24*2.4*32=1843.2GFLOPS。
步骤202、选取至少一所述服务节点作为测试服务节点,将计算量已知的任务分配给所述测试服务节点并使所述测试服务节点满载,从而计算出所述测试服务节点的实际最高算力。例如,任务的计算量为18000GFOP,任务完成用时10s,则该测试服务节点的实际最高算力为18000/10=1800GFOPS。
步骤203、根据所述测试服务节点的理论最高算力和实际最高算力,获得算力矫正系数。例如,理论最高算力1843.2GFOPS,实际最高算力为1800GFOPS,算力矫正系数为1800/1843.2,约为0.977。算力矫正系数在多任务并行时可能不同,需要设置多任务并行计算场景,然后重复上述步骤202和步骤203获得。
步骤204、根据各个所述服务节点空载情况下的理论最高算力和算力矫正系数,确定各个所述服务节点的总算力。其中,各个服务节点的总算力为其对应的理论最高算力*算力矫正系数。
如图3和图4所示,本发明实施例中,预先计算各个服务节点的剩余算力的步骤,包括:
步骤301、根据各个所述服务节点的总算力和各个所述服务节点当前的CPU使用率,确定各个所述服务节点的剩余算力。其中,各个服务节点的剩余算力=(1-CPU使用率)*该服务节点的总算力。
如图3所示,本发明实施例中,所述任务请求包括完成所述计算任务所需的需求算力;所述根据所述任务请求及预先计算的各个所述服务节点的剩余算力,筛选出服务节点,包括:
步骤302、筛选出所述剩余算力大于所述需求算力的服务节点作为所述目标服务节点。其中,通过从任务请求直接获取其需求算力参数,也可以通过从该任务请求中获取其计算量以及要求响应的时间,进而根据该计算量和要求响应的时间计算出其需求算力。
如图4所示,当无法从任务请求获取其需求算力参数,也无法同时获取其计算量参数和要求响应的时间参数,本发明实施例中,所述根据所述任务请求及各个所述服务节点的剩余算力,筛选出服务节点,包括:
步骤303、将各个所述服务节点按照对应的剩余算力由大至小地排序,筛选出设定排位前的服务节点作为所述目标服务节点。例如,选取排位在中位前(也即前50%)的服务节点作为目标服务节点。
如图5所示,本发明实施例中还提供了一种负载均衡装置,如下面的实施例所述。由于该装置解决问题的原理与上述负载均衡方法相似,因此该装置的实施可以参见软件需求评估方法的实施,重复之处不再赘述。
如图5所示,本发明的负载均衡装置包括:任务接收模块501,用于接收任务请求;服务节点筛选模块502,用于根据所述任务请求和预先计算的各个服务节点的剩余算力,筛选出目标服务节点;任务分发模块503,用于将所述任务请求中的计算任务分发至所述目标服务节点。
如图6所示,本发明实施例中,负载均衡装置还包括总算力确定模块504,用于确定各个服务节点的总算力;所述服务节点筛选模块502根据所述总算力预先计算剩余算力。所述总算力确定模块504包括:理论最高算力计算单元601,用于计算各个所述服务节点空载情况下的理论最高算力;实际最高算力计算单元602,用于选取至少一所述服务节点作为测试服务节点,将计算量已知的任务分配给所述测试服务节点并使所述测试服务节点满载,从而计算出所述测试服务节点的实际最高算力;算力矫正系数确定单元603,用于根据所述测试服务节点的理论最高算力和实际最高算力,获得算力矫正系数;总算力计算单元604,用于根据各个所述服务节点空载情况下的理论最高算力和算力矫正系数,确定各个所述服务节点的总算力。
如图7所示,本发明实施例中,所述服务节点筛选模块502包括:剩余算力计算单元701,用于根据各个所述服务节点的总算力和各个所述服务节点当前的CPU使用率,确定各个所述服务节点的剩余算力。
如图7所示,本发明实施例中,所述任务请求包括完成所述计算任务所需的需求算力,所述服务节点筛选模块502包括:第一筛选单元702,用于筛选出所述剩余算力大于所述需求算力的服务节点作为所述目标服务节点。
如图7所示,本发明实施例中,所述服务节点筛选模块502包括:第二筛选单元703,用于将各个所述服务节点按照对应的剩余算力由大至小地排序,筛选出设定排位前的服务节点作为所述目标服务节点。
本发明实施例还提供一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述负载均衡方法。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述负载均衡方法。
本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现上述负载均衡方法。
本发明实施例中,负载均衡方法及装置,与现有技术中负载均衡的技术方案相比,通过根据预先计算的各个服务节点的剩余算力筛选出目标服务节点进行任务分配,能够确保计算密集型任务被分配给剩余算力高的服务节点进行处理而得到快速地响应,保证了分布式***中任务请求的处理效率,实现任务的合理分配。
本领域内的技术人员应明白,本发明的实施例可提供为方法、***、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (13)

1.一种负载均衡方法,其特征在于,包括:
接收任务请求;
根据所述任务请求和预先计算的各个服务节点的剩余算力,筛选出目标服务节点;
将所述任务请求中的计算任务分发至所述目标服务节点。
2.根据权利要求1所述的负载均衡方法,其特征在于,在预先计算各个服务节点的剩余算力之前,还包括:
计算各个所述服务节点空载情况下的理论最高算力;
选取至少一所述服务节点作为测试服务节点,将计算量已知的任务分配给所述测试服务节点并使所述测试服务节点满载,从而计算出所述测试服务节点的实际最高算力;
根据所述测试服务节点的理论最高算力和实际最高算力,获得算力矫正系数;
根据各个所述服务节点空载情况下的理论最高算力和算力矫正系数,确定各个所述服务节点的总算力。
3.根据权利要求2所述的负载均衡方法,其特征在于,预先计算各个服务节点的剩余算力的步骤,包括:
根据各个所述服务节点的总算力和各个所述服务节点当前的CPU使用率,确定各个所述服务节点的剩余算力。
4.根据权利要求1所述的负载均衡方法,其特征在于,所述任务请求包括完成所述计算任务所需的需求算力;所述根据所述任务请求及各个所述服务节点的剩余算力,筛选出服务节点,包括:
筛选出所述剩余算力大于所述需求算力的服务节点作为所述目标服务节点。
5.根据权利要求1所述的负载均衡方法,其特征在于,所述根据所述任务请求及各个所述服务节点的剩余算力,筛选出服务节点,包括:
将各个所述服务节点按照对应的剩余算力由大至小地排序,筛选出设定排位前的服务节点作为所述目标服务节点。
6.一种负载均衡装置,其特征在于,包括:
任务接收模块,用于接收任务请求;
服务节点筛选模块,用于根据所述任务请求和预先计算的各个服务节点的剩余算力,筛选出目标服务节点;
任务分发模块,用于将所述任务请求中的计算任务分发至所述目标服务节点。
7.根据权利要求6所述的负载均衡装置,其特征在于,所述负载均衡装置还包括总算力确定模块,所述总算力确定模块包括:
理论最高算力计算单元,用于计算各个所述服务节点空载情况下的理论最高算力;
实际最高算力计算单元,用于选取至少一所述服务节点作为测试服务节点,将计算量已知的任务分配给所述测试服务节点并使所述测试服务节点满载,从而计算出所述测试服务节点的实际最高算力;
算力矫正系数确定单元,用于根据所述测试服务节点的理论最高算力和实际最高算力,获得算力矫正系数;
总算力计算单元,用于根据各个所述服务节点空载情况下的理论最高算力和算力矫正系数,确定各个所述服务节点的总算力。
8.根据权利要求7所述的负载均衡装置,其特征在于,所述服务节点筛选模块包括:
剩余算力计算单元,用于根据各个所述服务节点的总算力和各个所述服务节点当前的CPU使用率,确定各个所述服务节点的剩余算力。
9.根据权利要求6所述的负载均衡装置,其特征在于,所述任务请求包括完成所述计算任务所需的需求算力,所述服务节点筛选模块包括:
第一筛选单元,用于筛选出所述剩余算力大于所述需求算力的服务节点作为所述目标服务节点。
10.根据权利要求6所述的负载均衡装置,其特征在于,所述服务节点筛选模块包括:
第二筛选单元,用于将各个所述服务节点按照对应的剩余算力由大至小地排序,筛选出设定排位前的服务节点作为所述目标服务节点。
11.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5任一所述的负载均衡方法。
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至5任一所述的负载均衡方法。
13.一种计算机程序产品,其特征在于,所述计算机程序产品包括计算机程序,所述计算机程序被处理器执行时实现权利要求1至5任一所述的负载均衡方法。
CN202211518371.XA 2022-11-29 2022-11-29 负载均衡方法及装置 Pending CN115914235A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211518371.XA CN115914235A (zh) 2022-11-29 2022-11-29 负载均衡方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211518371.XA CN115914235A (zh) 2022-11-29 2022-11-29 负载均衡方法及装置

Publications (1)

Publication Number Publication Date
CN115914235A true CN115914235A (zh) 2023-04-04

Family

ID=86472565

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211518371.XA Pending CN115914235A (zh) 2022-11-29 2022-11-29 负载均衡方法及装置

Country Status (1)

Country Link
CN (1) CN115914235A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117707793A (zh) * 2024-02-05 2024-03-15 太平金融科技服务(上海)有限公司 一种计算任务处理方法、装置、设备及介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117707793A (zh) * 2024-02-05 2024-03-15 太平金融科技服务(上海)有限公司 一种计算任务处理方法、装置、设备及介质
CN117707793B (zh) * 2024-02-05 2024-05-03 太平金融科技服务(上海)有限公司 一种计算任务处理方法、装置、设备及介质

Similar Documents

Publication Publication Date Title
Andreolini et al. Dynamic load management of virtual machines in cloud architectures
Amini et al. A Dynamic SLA Aware Heuristic Solution For IaaS Cloud Placement Problem Without Migration
Selvarani et al. Improved cost-based algorithm for task scheduling in cloud computing
US7877755B2 (en) Dynamic application placement with allocation restrictions and even load distribution
Mapetu et al. A dynamic VM consolidation approach based on load balancing using Pearson correlation in cloud computing
US7668703B1 (en) Determining required capacity for a resource
US8572621B2 (en) Selection of server for relocation of application program based on largest number of algorithms with identical output using selected server resource criteria
Anousha et al. An improved Min-Min task scheduling algorithm in grid computing
Mosa et al. Dynamic virtual machine placement considering CPU and memory resource requirements
CN110968424A (zh) 一种基于K8s的资源调度方法、装置和存储介质
CN111124687A (zh) 一种cpu资源预留方法、装置及其相关设备
Moghaddam et al. Energy-efficient and sla-aware virtual machine selection algorithm for dynamic resource allocation in cloud data centers
CN115914235A (zh) 负载均衡方法及装置
CN116048773B (zh) 一种基于波函数坍缩的分布式协作任务指派方法和***
US20120042322A1 (en) Hybrid Program Balancing
Walia et al. Performance analysis of the task scheduling algorithms in the cloud computing environments
CN116302327A (zh) 资源调度方法及相关设备
CN115168014A (zh) 一种作业调度方法及装置
CN115794421A (zh) 资源分配方法、装置和电子设备
Li et al. A strategy game system for QoS-efficient dynamic virtual machine consolidation in data centers
Meyer et al. Pipel: exploiting resource reorganisation to optimise performance of pipeline-structured applications in the cloud
Ramesh et al. Machine learning for load balancing in cloud datacenters
Mehta Designing an effective dynamic load balancing algorithm considering imperative design issues in distributed systems
Wang et al. Resource Scheduling Method Based on Bayes for Cloud Computing.
Paridar et al. Scheduling the parallel execution of workflows in cloud computing based on the imperialist competitive and genetic algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination