CN114827157A - 集群任务处理方法、装置、***、电子设备及可读介质 - Google Patents
集群任务处理方法、装置、***、电子设备及可读介质 Download PDFInfo
- Publication number
- CN114827157A CN114827157A CN202210381189.8A CN202210381189A CN114827157A CN 114827157 A CN114827157 A CN 114827157A CN 202210381189 A CN202210381189 A CN 202210381189A CN 114827157 A CN114827157 A CN 114827157A
- Authority
- CN
- China
- Prior art keywords
- server
- task
- cluster
- cluster task
- scheduling
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 18
- 238000012545 processing Methods 0.000 claims abstract description 92
- 238000000034 method Methods 0.000 claims abstract description 45
- 230000008569 process Effects 0.000 claims description 23
- 230000002159 abnormal effect Effects 0.000 claims description 22
- 238000012544 monitoring process Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 10
- 238000012423 maintenance Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 5
- 238000004891 communication Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 230000015556 catabolic process Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 239000013307 optical fiber Substances 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 238000013468 resource allocation Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/10—Protocols in which an application is distributed across nodes in the network
- H04L67/1001—Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
- H04L67/1004—Server selection for load balancing
- H04L67/1014—Server selection for load balancing based on the content of a request
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Hardware Redundancy (AREA)
Abstract
本申请涉及一种集群任务处理方法、装置、***、电子设备及计算机可读介质。该方法包括:获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理。本申请涉及的集群任务处理方法、装置、***、电子设备及计算机可读介质,能够为选出最佳性能的服务器以执行集群任务、而且综合考虑了不同种类服务器的特征,采用灵活多样的方式保证集群任务的正常运行,提高集群任务的稳定性、和资源利用率。
Description
技术领域
本申请涉及计算机信息处理领域,具体而言,涉及一种集群任务处理方法、装置、***、电子设备及计算机可读介质。
背景技术
在集群任务处理的过程中,经常存在一些运行时间短,但是并发度很高的任务,比如定时任务,定时任务在运行过程中,存在运行时间较短,并发度较高等特点:例如集群中存在1000个定时任务,每个定时任务每分钟执行一次,每次执行30s,在该场景下,不得不为这1000定时任务预留下充足的资源,而这些资源当中,只有一半时间是在真正使用的(每过1分钟,只有30s使用时间,剩下30s时间没有任务任务使用)。
同时,在定时任务运行的过程中,频繁的任务创建和销毁,会带来服务器资源的碎片化,如内存、cgroup、磁盘等;大量的碎片化的服务器资源会影响服务器上其他服务的稳定性。
在这种情况下,如何保证集群任务的妥善执行,在服务器不稳定的时候及时发现问题处理问题是集群任务处理中的难题。
因此,需要一种新的集群任务处理方法、装置、***、电子设备及计算机可读介质。
在所述背景技术部分公开的上述信息仅用于加强对本申请的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本申请提供一种集群任务处理方法、装置、***、电子设备及计算机可读介质,能够为选出最佳性能的服务器以执行集群任务、而且综合考虑了不同种类服务器的特征,采用灵活多样的方式保证集群任务的正常运行,提高集群任务的稳定性、和资源利用率。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请的一方面,提出一种集群任务处理方法,该方法包括:获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理。
在本申请的一种示例性实施例中,还包括:在所述第一服务器进行任务处理的过程中,监控所述集群任务的异常退出概率;在所述异常退出概率大于阈值时,基于目标调度策略确定第二服务器;将所述集群任务发送至所述第二服务器进行任务处理。
在本申请的一种示例性实施例中,基于预设调度策略确定第二服务器,包括:在目标调度策略中提取多个服务器排序;基于所述服务器排序将所述第一服务器的后一组服务器作为所述第二服务器。
在本申请的一种示例性实施例中,根据所述集群任务的标识确定目标服务类型,包括:根据用户的操作为多个集群任务确定其对应的服务类型;基于多个集群任务和其对应的服务类型生成服务类型表;根据所述集群任务的标识在服务类型表中确定所述目标服务类型。
在本申请的一种示例性实施例中,基于所述目标服务类型和目标调度策略确定第一服务器,包括:根据用户的操作为多个服务类型确定其对应的调度策略;基于多个服务类型和其对应的调度策略生成调度策略表;根据所述集群任务的标识在调度策略表中确定所述第一服务器。
在本申请的一种示例性实施例中,根据所述集群任务的标识在调度策略表中确定所述第一服务器,包括:根据所述集群任务的标识在调度策略表中提取多个服务器;依据所述多个服务器的排序依次提取服务器并预分配服务器资源;在预分配服务器资源成功时,将当前服务器作为所述第一服务器。
在本申请的一种示例性实施例中,在预分配服务器资源成功时,包括:在所述服务器资源未被屏蔽且所述服务器资源减额量未被命中时,确定预分配服务器资源成功。
在本申请的一种示例性实施例中,将所述集群任务发送至所述第一服务器进行任务处理,包括:将所述集群任务发送至第三方云服务器进行任务处理;和/或将所述集群任务发送至低成本服务器进行任务处理;和/或将所述集群任务发送至普通服务器进行任务处理。
根据本申请的一方面,提出一种集群任务处理装置,该装置包括:任务模块,用于获取待处理的集群任务;类型模块,用于根据所述集群任务的标识确定目标服务类型;策略模块,用于基于所述目标服务类型和目标调度策略确定第一服务器;处理模块,用于将所述集群任务发送至所述第一服务器进行任务处理。
根据本申请的一方面,提出一种集群任务处理***,该***包括:调度服务器,用于获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理;第三方云服务器,用于根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理;低成本服务器,用于根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理;普通服务器,用于根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理。
根据本申请的一方面,提出一种电子设备,该电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当一个或多个程序被一个或多个处理器执行,使得一个或多个处理器实现如上文的方法。
根据本申请的一方面,提出一种计算机可读介质,其上存储有计算机程序,该程序被处理器执行时实现如上文中的方法。
根据本申请的集群任务处理方法、装置、***、电子设备及计算机可读介质,通过获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理的方式,能够为选出最佳性能的服务器以执行集群任务、而且综合考虑了不同种类服务器的特征,采用灵活多样的方式保证集群任务的正常运行,提高集群任务的稳定性、和资源利用率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性的,并不能限制本申请。
附图说明
通过参照附图详细描述其示例实施例,本申请的上述和其它目标、特征及优点将变得更加显而易见。下面描述的附图仅仅是本申请的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是根据一示例性实施例示出的一种集群任务处理***框图。
图2是根据一示例性实施例示出的一种集群任务处理方法的流程图。
图3是根据另一示例性实施例示出的一种集群任务处理方法的流程图。
图4是根据另一示例性实施例示出的一种集群任务处理方法的流程图。
图5是根据一示例性实施例示出的一种集群任务处理装置的框图。
图6是根据一示例性实施例示出的一种电子设备的框图。
图7是根据一示例性实施例示出的一种计算机可读介质的框图。
具体实施方式
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
附图中的流程图仅是一种示例性的流程演示,不代表本发明的方案中必须包括流程图中的所有的内容、操作和步骤,也不代表必须按照图中所显示的的顺序执行。例如,流程图中有的操作/步骤可以分解,有的操作/步骤可以合并或部分合并,等等,在不脱离本发明的发明主旨的情况下,流程图中显示的执行顺序可以根据实际情况改变。
附图中的框图一般表示的是功能实体,并不一定必然与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理单元装置和/或微控制器装置中实现这些功能实体。
各附图中相同的附图标记表示相同或类似的元件、组件或部分,因而下文中可能省略了对相同或类似的元件、组件或部分的重复描述。还应理解,虽然本文中可能使用第一、第二、第三等表示编号的定语来描述各种器件、元件、组件或部分,但是这些器件、元件、组件或部分不应受这些定语的限制。也就是说,这些定语仅是用来将一者与另一者区分。例如,第一器件亦可称为第二器件,但不偏离本发明实质的技术方案。此外,术语“和/或”、“及/或”是指包括所列出项目中的任一个或多个的所有组合。
为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明作进一步的详细说明。
在对于具体实施例的介绍过程中,对结构、性能、效果或者其他特征的细节描述是为了使本领域的技术人员对实施例能够充分理解。但是,并不排除本领域技术人员可以在特定情况下,以不含有上述结构、性能、效果或者其他特征的技术方案来实施本发明。
本领域技术人员可以理解,附图只是示例实施例的示意图,附图中的模块或流程并不一定是实施本申请所必须的,因此不能用于限制本申请的保护范围。
图1是根据一示例性实施例示出的一种集群任务处理***的框图。
如图1所示,***架构10可以包括终端设备101、102、103,网络104和调度服务器105、第三方云服务器106、低成本服务器107、普通服务器108。网络104用以在终端设备101、102、103和调度服务器105之间,调度服务器105、第三方云服务器106、低成本服务器107、普通服务器108之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备101、102、103通过网络104与调度服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如购物类应用、网页浏览器应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。
终端设备101、102、103可以是具有显示屏并且支持网页浏览的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
调度服务器105可以是提供各种服务的服务器,例如对用户利用终端设备101、102、103所浏览的网站提供支持的后台管理服务器。后台管理服务器可以对接收到的查询请求等数据进行分析等处理,并将数据转发至第三方云服务器106和/或低成本服务器107和/或普通服务器108进行处理。
其中,第三方云服务器106可为serverless服务器,也成为无服务器应用。Serverless依托第三方云服务平台,服务端逻辑运行在无状态的计算容器中,其业务层面的状态则被开发者使用的数据库和存储资源所记录。
其中,低成本服务器107是为了降低服务器制造使用成本而组建的一类服务器,会根据目标成本而在性能上有所限制。
其中,普通服务器108是计算机的一种,它比普通计算机运行更快、负载更高、价格更贵。服务器在网络中为其它客户机(如PC机、智能手机、ATM等终端甚至是火车***等大型设备)提供计算或者应用服务。服务器具有高速的CPU运算能力、长时间的可靠运行、强大的I/O外部数据吞吐能力以及更好的扩展性。
调度服务器105可例如获取待处理的集群任务;调度服务器105可例如根据所述集群任务的标识确定目标服务类型;调度服务器105可例如基于所述目标服务类型和目标调度策略确定第一服务器;调度服务器105可例如将所述集群任务发送至所述第一服务器进行任务处理;第三方云服务器106可例如根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理;低成本服务器107可例如根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理;普通服务器108可例如根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理。
调度服务器105可以是一个实体的服务器,还可例如为多个服务器组成,需要说明的是,本申请实施例所提供的集群任务处理方法可以由调度服务器105执行,相应地,集群任务处理装置可以设置于调度服务器105中。而提供给用户进行数量浏览的网页端一般位于终端设备101、102、103中。执行集群任务的计算端一般位于第三方云服务器106、低成本服务器107、普通服务器108。
图2是根据一示例性实施例示出的一种集群任务处理方法的流程图。集群任务处理方法20至少包括步骤S202至S208。
如图2所示,在S202中,获取待处理的集群任务。调度服务器可由客户端获取集群任务,还可在本地调取集群任务进行执行。
不失一般性,本申请的实施例中将以定时集群任务为例进行后续实施例的说明。
在S204中,根据所述集群任务的标识确定目标服务类型。可例如,根据用户的操作为多个集群任务确定其对应的服务类型;基于多个集群任务和其对应的服务类型生成服务类型表;根据所述集群任务的标识在服务类型表中确定所述目标服务类型。
在一个具体的实施例中,可根据管理员的操作,创建集群资源使用规则,可例如,假设集群中存在serverless、低成本任务服务器、正常服务器三级资源。
在S206中,基于所述目标服务类型和目标调度策略确定第一服务器。可例如,根据用户的操作为多个服务类型确定其对应的调度策略;基于多个服务类型和其对应的调度策略生成调度策略表;根据所述集群任务的标识在调度策略表中确定所述第一服务器。
在一个具体的实施例中,业务线A下的服务B的定时任务的可用资源为“serverless、低成本任务服务器、正常服务器”,按照先后次序降级。
则可根据以上策略为业务线A下的服务B的定时集群任务确定serverless服务器作为第一服务器。
在S208中,将所述集群任务发送至所述第一服务器进行任务处理。可将所述集群任务发送至第三方云服务器进行任务处理;可将所述集群任务发送至低成本服务器进行任务处理;可将所述集群任务发送至普通服务器进行任务处理。
根据本申请的集群任务处理方法,通过获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理的方式,能够为选出最佳性能的服务器以执行集群任务、而且综合考虑了不同种类服务器的特征,采用灵活多样的方式保证集群任务的正常运行,提高集群任务的稳定性、和资源利用率。
在一个具体的应用场景中,本申请的集群任务处理方法可应用在数据搜索和处理处理类的任务中,可提供给用户APP应用进行操作。后台服务器接收大量用户通过APP应用发送的处理指令,并通过集群任务服务器进行处理。
在集群任务服务器中,存在调度服务器,调度服务器可为集群任务中一个特定的服务器,还可为集群任务中当前时间服务处理任务空闲的服务器。调度服务器每10秒定时获取整个集群中所有服务器的资源运行状态和任务运行状态。运行状态可包括:网络、磁盘容量、磁盘是否只读以及运行测试任务的数量。
具体判断如下:
连续三次任务处理时间超时视为该服务器资源运行状态异常;
连续三次运行状态中磁盘容量超过一定80%视为该服务器资源运行状态异常;
运行中磁盘状态为只读状态,则判定该服务器资源运行状态异常;
连续三次任务处理失败视为该服务器资源运行状态异常。
调度服务器根据对集群中服务器的资源运行状态和任务运行状态的监测,对集群中服务器是否能够承担下个周期(10秒)的任务状态进行判断,并将其存储在资源列表中。
在接收到用户APP应用发送的任务请求时,先根据该任务请求对应的业务线和服务属性为用户分配待处理的服务器类型名称。服务器类型由高级别向低级别逐一排列,可例如为serverless、低成本任务服务器、正常服务器。
首先在资源列表中选择服务类型为serverless的服务器,如果存在对应于serverless类型的服务器的话,则调度服务器将该任务处理请求转发到serverless中进行处理。否则,则逐一选择下一级别的服务器进行任务分配。
在serverless类型的服务器进行处理的过程中,调度服务器定时检测任务处理的状态,在任务未按时完成或者该服务器资源存在异常时,逐一选择下一级别的服务器再次进行任务分配。
应清楚地理解,本申请描述了如何形成和使用特定示例,但本申请的原理不限于这些示例的任何细节。相反,基于本申请公开的内容的教导,这些原理能够应用于许多其它实施例。
图3是根据另一示例性实施例示出的一种集群任务处理方法的流程图。图3所示的流程30是对图2所示的流程的补充描述。
如图3所示,在S302中,在所述第一服务器进行任务处理的过程中,监控所述集群任务的异常退出概率。可接续上文的实施例,为业务线A下的服务B的定时集群任务确定serverless服务器作为第一服务器。检测serverless服务器的异常退出概率。
在S304中,集群任务的异常退出概率是否大于阈值。
在S306中,在所述异常退出概率大于阈值时,基于目标调度策略确定第二服务器。可例如,在serverless服务器上运行的任务异常超过10%,发出告警给维护人员,屏蔽该资源并将该资源上的任务转移。
在S308中,将所述集群任务发送至所述第二服务器进行任务处理。业务线A下的服务B的定时任务的可用资源为“serverless、低成本任务服务器、正常服务器”,则在serverless服务器异常时,可选择低成本服务器作为第二服务器以进行任务处理。
在S310中,在所述异常退出概率小于阈值时,根据不同的异常退出概率值生成不同的警告信息。
在一个实施例中,第一服务器上运行的任务异常退出几率少于0.01%,视为偶发现象大概率是非故障导致,发出告警给这部分异常退出的任务的创建者检查
在一个实施例中,第一服务器上运行的任务异常退出几率在0.01%-0.1%,发出告警给维护人员检查是否存在隐性问题
在一个实施例中,第一服务器上运行的任务异常退出几率在0.1%-10%,发出告警给维护人员检查,并通知调度模块减少该资源的分配率对应的数值。
图4是根据另一示例性实施例示出的一种集群任务处理方法的流程图。图4所示的流程40是对图2所示的流程中S206“根据所述集群任务的标识在调度策略表中确定所述第一服务器”的详细描述。
如图4所示,在S402中,根据所述集群任务的标识在调度策略表中提取多个服务器。以业务线A下的服务B的定时任务的可用资源为“serverless、低成本任务服务器、正常服务器”为例。
在S404中,依据所述多个服务器的排序依次提取服务器并预分配服务器资源。
在S406中,在所述服务器资源未被屏蔽且所述服务器资源减额量未被命中时,确定预分配服务器资源成功。
在一个具体的实施例中,可首先判断资源是否被屏蔽,如果被屏蔽,则该资源无法分配,进行下一项资源判断;还可判断资源是否存在减额,如果存在,则使用随机函数rand进行判断,命中减额量则该资源无法分配,进行下一项资源判断:比如减额10%,则使用rand(1,100)判断随机数是否小于等于10。
在S408中,将当前服务器作为所述第一服务器。
在一个实施例中,在预分配serverless资源成功时,则将服务副本调度到serverless上,结束决策。
在一个实施例中,在预分配serverless资源不成功时,预分配低成本服务器资源,在低成本服务器资源分配成功时,则将服务副本调度到低成本服务器上,结束决策。
在一个实施例中,在预分配低成本服务器资源不成功时,预分配普通服务器资源,在普通服务器资源分配成功时,则将服务副本调度到普通服务器上,结束决策。
在一个实施例中,在普通服务器资源分配不成功时,确定调度失败,生成告警信息。
在一个具体的应用中,可定时获取服务器上资源的运行状态和上边任务的运行状态(定时的时间可配置,可例如,每10s一次)。资源的运行状态,包括,网络、磁盘容量、磁盘是否只读以及运行一个测试任务,对资源运行状态的判断策略可配置,具体策略可如下:
1.请求运行状态超时,连续三次超时视为网络异常,将发出告警给维护人员并屏蔽本资源,该资源不再参与后续任务分配并将该资源上正在运行的任务转移,不再进行后续判断;
2.请求运行状态成功,连续三次运行状态中磁盘容量超过一定阈值(可配置,可例如为80%,连续三次),将发出警告给维护人员;
3.请求运行状态成功,运行状态中磁盘只读,出现一次将视为硬件故障,发出告警给维护人员、屏蔽本资源,该资源不再参与后续任务分配并将该资源上运行的任务转移,不再进行后续判断;
4.请求运行状态成功,运行状态均正常,连续三次运行任务失败视为未知异常,将发出警告并屏蔽本资源,不再参与后续任务分配。
根据本申请的集群任务处理方法,将集群服务器划分不同级别,定义服务的资源使用规则,从而完成降级策略决策的多级别集群任务调度。
通过使用如本案例中使用的serverless,低规格成本服务器,和正常服务器三种级别的资源,通过调度器决策机制和降级策略的组合,可以使得当serverless发生故障的时候,保证定时任务可以被创建到其他服务器资源上可以正常运行,避免了现有serverless的故障影响定时任务正常运行的问题。
本领域技术人员可以理解实现上述实施例的全部或部分步骤被实现为由CPU执行的计算机程序。在该计算机程序被CPU执行时,执行本申请提供的上述方法所限定的上述功能。所述的程序可以存储于一种计算机可读存储介质中,该存储介质可以是只读存储器,磁盘或光盘等。
此外,需要注意的是,上述附图仅是根据本申请示例性实施例的方法所包括的处理的示意性说明,而不是限制目的。易于理解,上述附图所示的处理并不表明或限制这些处理的时间顺序。另外,也易于理解,这些处理可以是例如在多个模块中同步或异步执行的。
下述为本申请装置实施例,可以用于执行本申请方法实施例。对于本申请装置实施例中未披露的细节,请参照本申请方法实施例。
图5是根据一示例性实施例示出的一种集群任务处理装置的框图。如图5所示,集群任务处理装置50包括:任务模块502,类型模块504,策略模块506,处理模块508。
任务模块502用于获取待处理的集群任务;
类型模块504用于根据所述集群任务的标识确定目标服务类型;类型模块504还用于根据用户的操作为多个集群任务确定其对应的服务类型;
基于多个集群任务和其对应的服务类型生成服务类型表;根据所述集群任务的标识在服务类型表中确定所述目标服务类型。
策略模块506用于基于所述目标服务类型和目标调度策略确定第一服务器;策略模块506还用于根据用户的操作为多个服务类型确定其对应的调度策略;基于多个服务类型和其对应的调度策略生成调度策略表;根据所述集群任务的标识在调度策略表中确定所述第一服务器。
处理模块508用于将所述集群任务发送至所述第一服务器进行任务处理。处理模块508还用于将所述集群任务发送至第三方云服务器进行任务处理;处理模块508还用于将所述集群任务发送至低成本服务器进行任务处理;处理模块508还用于将所述集群任务发送至普通服务器进行任务处理。
根据本申请的集群任务处理装置,通过获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理的方式,能够为选出最佳性能的服务器以执行集群任务、而且综合考虑了不同种类服务器的特征,采用灵活多样的方式保证集群任务的正常运行,提高集群任务的稳定性、和资源利用率。
图6是根据一示例性实施例示出的一种电子设备的框图。
下面参照图6来描述根据本申请的这种实施方式的电子设备600。图6显示的电子设备600仅仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,电子设备600以通用计算设备的形式表现。电子设备600的组件可以包括但不限于:至少一个处理单元610、至少一个存储单元620、连接不同***组件(包括存储单元620和处理单元610)的总线630、显示单元640等。
其中,所述存储单元存储有程序代码,所述程序代码可以被所述处理单元610执行,使得所述处理单元610执行本说明书中描述的根据本申请各种示例性实施方式的步骤。例如,所述处理单元610可以执行如图2,图3,图4中所示的步骤。
所述存储单元620可以包括易失性存储单元形式的可读介质,例如随机存取存储单元(RAM)6201和/或高速缓存存储单元6202,还可以进一步包括只读存储单元(ROM)6203。
所述存储单元620还可以包括具有一组(至少一个)程序模块6205的程序/实用工具6204,这样的程序模块6205包括但不限于:操作***、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
总线630可以为表示几类总线结构中的一种或多种,包括存储单元总线或者存储单元控制器、***总线、图形加速端口、处理单元或者使用多种总线结构中的任意总线结构的局域总线。
电子设备600也可以与一个或多个外部设备600’(例如键盘、指向设备、蓝牙设备等)通信,使得用户能与该电子设备600交互的设备通信,和/或该电子设备600能与一个或多个其它计算设备进行通信的任何设备(例如路由器、调制解调器等等)通信。这种通信可以通过输入/输出(I/O)接口650进行。并且,电子设备600还可以通过网络适配器660与一个或者多个网络(例如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。网络适配器660可以通过总线630与电子设备600的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备600使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理单元、外部磁盘驱动阵列、RAID***、磁带驱动器以及数据备份存储***等。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,如图7所示,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、或者网络设备等)执行根据本申请实施方式的上述方法。
所述软件产品可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以为但不限于电、磁、光、电磁、红外线、或半导体的***、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。
所述计算机可读存储介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了可读程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。可读存储介质还可以是可读存储介质以外的任何可读介质,该可读介质可以发送、传播或者传输用于由指令执行***、装置或者器件使用或者与其结合使用的程序。可读存储介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、有线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言的任意组合来编写用于执行本申请操作的程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、C++等,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。在涉及远程计算设备的情形中,远程计算设备可以通过任意种类的网络,包括局域网(LAN)或广域网(WAN),连接到用户计算设备,或者,可以连接到外部计算设备(例如利用因特网服务提供商来通过因特网连接)。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该计算机可读介质实现如下功能:获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理。该计算机可读介质还可实现如下功能:在所述第一服务器进行任务处理的过程中,监控所述集群任务的异常退出概率;在所述异常退出概率大于阈值时,基于目标调度策略确定第二服务器;将所述集群任务发送至所述第二服务器进行任务处理。
本领域技术人员可以理解上述各模块可以按照实施例的描述分布于装置中,也可以进行相应变化唯一不同于本实施例的一个或多个装置中。上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块。
以上具体地示出和描述了本申请的示例性实施例。应可理解的是,本申请不限于这里描述的详细结构、设置方式或实现方法;相反,本申请意图涵盖包含在所附权利要求的精神和范围内的各种修改和等效设置。
Claims (10)
1.一种集群任务处理方法,其特征在于,包括:
获取待处理的集群任务;
根据所述集群任务的标识确定目标服务类型;
基于所述目标服务类型和目标调度策略确定第一服务器;
将所述集群任务发送至所述第一服务器进行任务处理。
2.如权利要求1所述的集群任务处理方法,其特征在于,还包括:
在所述第一服务器进行任务处理的过程中,监控所述集群任务的异常退出概率;
在所述异常退出概率大于阈值时,基于目标调度策略确定第二服务器;
将所述集群任务发送至所述第二服务器进行任务处理。
可选地,基于预设调度策略确定第二服务器,包括:
在目标调度策略中提取多个服务器排序;
基于所述服务器排序将所述第一服务器的后一组服务器作为所述第二服务器。
3.如权利要求1所述的集群任务处理方法,其特征在于,根据所述集群任务的标识确定目标服务类型,包括:
根据用户的操作为多个集群任务确定其对应的服务类型;
基于多个集群任务和其对应的服务类型生成服务类型表;
根据所述集群任务的标识在服务类型表中确定所述目标服务类型。
4.如权利要求1所述的集群任务处理方法,其特征在于,基于所述目标服务类型和目标调度策略确定第一服务器,包括:
根据用户的操作为多个服务类型确定其对应的调度策略;
基于多个服务类型和其对应的调度策略生成调度策略表;
根据所述集群任务的标识在调度策略表中确定所述第一服务器。
5.如权利要求4所述的集群任务处理方法,其特征在于,根据所述集群任务的标识在调度策略表中确定所述第一服务器,包括:
根据所述集群任务的标识在调度策略表中提取多个服务器;
依据所述多个服务器的排序依次提取服务器并预分配服务器资源;
在预分配服务器资源成功时,将当前服务器作为所述第一服务器;
可选地,在预分配服务器资源成功时,包括:
在所述服务器资源未被屏蔽且所述服务器资源减额量未被命中时,确定预分配服务器资源成功。
6.如权利要求1所述的集群任务处理方法,其特征在于,将所述集群任务发送至所述第一服务器进行任务处理,包括:
将所述集群任务发送至第三方云服务器进行任务处理;和/或
将所述集群任务发送至低成本服务器进行任务处理;和/或
将所述集群任务发送至普通服务器进行任务处理。
7.一种集群任务处理装置,其特征在于,包括:
任务模块,用于获取待处理的集群任务;
类型模块,用于根据所述集群任务的标识确定目标服务类型;
策略模块,用于基于所述目标服务类型和目标调度策略确定第一服务器;
处理模块,用于将所述集群任务发送至所述第一服务器进行任务处理。
8.一种集群任务处理***,其特征在于,包括:
调度服务器,用于获取待处理的集群任务;根据所述集群任务的标识确定目标服务类型;基于所述目标服务类型和目标调度策略确定第一服务器;将所述集群任务发送至所述第一服务器进行任务处理;
第三方云服务器,用于根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理;
低成本服务器,用于根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理;
普通服务器,用于根据所述调度服务器的调度作为所述第一服务器进行集群任务的处理。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序;
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-6中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-6中任一所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210381189.8A CN114827157A (zh) | 2022-04-12 | 2022-04-12 | 集群任务处理方法、装置、***、电子设备及可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210381189.8A CN114827157A (zh) | 2022-04-12 | 2022-04-12 | 集群任务处理方法、装置、***、电子设备及可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114827157A true CN114827157A (zh) | 2022-07-29 |
Family
ID=82534521
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210381189.8A Pending CN114827157A (zh) | 2022-04-12 | 2022-04-12 | 集群任务处理方法、装置、***、电子设备及可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114827157A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745514A (zh) * | 2024-02-20 | 2024-03-22 | 浙江宇视科技有限公司 | 智能服务器集群的图像分配方法、装置、设备及介质 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150186489A1 (en) * | 2013-12-27 | 2015-07-02 | Oracle International Corporation | System and method for supporting asynchronous invocation in a distributed data grid |
CN107819825A (zh) * | 2017-10-11 | 2018-03-20 | 深圳市买买提乐购金融服务有限公司 | 一种服务调度方法、装置和电子设备 |
CN108737270A (zh) * | 2018-05-07 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 一种服务器集群的资源管理方法和装置 |
CN110018893A (zh) * | 2019-03-12 | 2019-07-16 | 平安普惠企业管理有限公司 | 一种基于数据处理的任务调度方法及相关设备 |
CN110290180A (zh) * | 2019-05-31 | 2019-09-27 | 北京大米科技有限公司 | 分布式任务调度方法、装置、计算机设备和存储介质 |
CN111597042A (zh) * | 2020-05-11 | 2020-08-28 | Oppo广东移动通信有限公司 | 业务线程运行方法、装置、存储介质及电子设备 |
WO2020238751A1 (zh) * | 2019-05-28 | 2020-12-03 | 阿里巴巴集团控股有限公司 | 无服务器架构下的资源访问方法、设备、***及存储介质 |
CN113422692A (zh) * | 2021-05-28 | 2021-09-21 | 作业帮教育科技(北京)有限公司 | 一种K8s集群内节点故障检测及处理方法、装置及存储介质 |
CN113515358A (zh) * | 2021-04-30 | 2021-10-19 | 北京奇艺世纪科技有限公司 | 任务调度方法、装置、电子设备及存储介质 |
CN114090265A (zh) * | 2021-11-30 | 2022-02-25 | 度小满科技(北京)有限公司 | 数据处理方法、装置、存储介质以及计算机终端 |
CN114237886A (zh) * | 2021-12-15 | 2022-03-25 | 平安证券股份有限公司 | 任务处理方法、装置、计算机设备和存储介质 |
-
2022
- 2022-04-12 CN CN202210381189.8A patent/CN114827157A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20150186489A1 (en) * | 2013-12-27 | 2015-07-02 | Oracle International Corporation | System and method for supporting asynchronous invocation in a distributed data grid |
CN107819825A (zh) * | 2017-10-11 | 2018-03-20 | 深圳市买买提乐购金融服务有限公司 | 一种服务调度方法、装置和电子设备 |
CN108737270A (zh) * | 2018-05-07 | 2018-11-02 | 北京京东尚科信息技术有限公司 | 一种服务器集群的资源管理方法和装置 |
CN110018893A (zh) * | 2019-03-12 | 2019-07-16 | 平安普惠企业管理有限公司 | 一种基于数据处理的任务调度方法及相关设备 |
WO2020238751A1 (zh) * | 2019-05-28 | 2020-12-03 | 阿里巴巴集团控股有限公司 | 无服务器架构下的资源访问方法、设备、***及存储介质 |
CN110290180A (zh) * | 2019-05-31 | 2019-09-27 | 北京大米科技有限公司 | 分布式任务调度方法、装置、计算机设备和存储介质 |
CN111597042A (zh) * | 2020-05-11 | 2020-08-28 | Oppo广东移动通信有限公司 | 业务线程运行方法、装置、存储介质及电子设备 |
CN113515358A (zh) * | 2021-04-30 | 2021-10-19 | 北京奇艺世纪科技有限公司 | 任务调度方法、装置、电子设备及存储介质 |
CN113422692A (zh) * | 2021-05-28 | 2021-09-21 | 作业帮教育科技(北京)有限公司 | 一种K8s集群内节点故障检测及处理方法、装置及存储介质 |
CN114090265A (zh) * | 2021-11-30 | 2022-02-25 | 度小满科技(北京)有限公司 | 数据处理方法、装置、存储介质以及计算机终端 |
CN114237886A (zh) * | 2021-12-15 | 2022-03-25 | 平安证券股份有限公司 | 任务处理方法、装置、计算机设备和存储介质 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117745514A (zh) * | 2024-02-20 | 2024-03-22 | 浙江宇视科技有限公司 | 智能服务器集群的图像分配方法、装置、设备及介质 |
CN117745514B (zh) * | 2024-02-20 | 2024-05-10 | 浙江宇视科技有限公司 | 智能服务器集群的图像分配方法、装置、设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10048996B1 (en) | Predicting infrastructure failures in a data center for hosted service mitigation actions | |
US11218386B2 (en) | Service ticket escalation based on interaction patterns | |
US10642585B1 (en) | Enhancing API service schemes | |
CN112017062B (zh) | 基于客群细分的资源额度分配方法、装置及电子设备 | |
CN111885184A (zh) | 高并发场景下热点访问关键字处理方法和装置 | |
CN114827157A (zh) | 集群任务处理方法、装置、***、电子设备及可读介质 | |
CN114070847B (zh) | 服务器的限流方法、装置、设备及存储介质 | |
CN113191889A (zh) | 风控配置方法、配置***、电子设备及可读存储介质 | |
CN111010453A (zh) | 服务请求处理方法、***、电子设备及计算机可读介质 | |
CN112994934B (zh) | 数据交互方法、装置及*** | |
CN112818204B (zh) | 一种业务的处理方法、装置、设备及存储介质 | |
US7558770B2 (en) | Method and system to detect application non-conformance | |
CN113282455A (zh) | 一种监控处理方法和装置 | |
CN113282489A (zh) | 一种接口测试方法和装置 | |
CN111784174A (zh) | 一种基于用户画像管理风险策略的方法、装置和电子设备 | |
CN111680867B (zh) | 一种资源配给的方法、装置和电子设备 | |
CN115858319B (zh) | 一种流数据处理方法及装置 | |
US20090125364A1 (en) | Framework for achieving a rewarding relationship | |
CN110262756B (zh) | 用于缓存数据的方法和装置 | |
US20210111941A1 (en) | Scalable subscriptions for virtual collaborative workspaces | |
CN111722986A (zh) | 软件性能监测方法及装置 | |
CN113448551A (zh) | 基于应用程序的消息处理方法和装置 | |
CN118034749A (zh) | 更新方法和电子设备 | |
CN117492975A (zh) | 分布式任务数据处理方法、装置及电子设备 | |
CN118227229A (zh) | 资源文件包处理方法、装置、介质和计算设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |