CN108170524A - 一种计算集群的任务处理方法和装置 - Google Patents

一种计算集群的任务处理方法和装置 Download PDF

Info

Publication number
CN108170524A
CN108170524A CN201711485182.6A CN201711485182A CN108170524A CN 108170524 A CN108170524 A CN 108170524A CN 201711485182 A CN201711485182 A CN 201711485182A CN 108170524 A CN108170524 A CN 108170524A
Authority
CN
China
Prior art keywords
task
instruction
client
server
computing device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711485182.6A
Other languages
English (en)
Inventor
杨银波
范祥
于晋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Qihoo Technology Co Ltd
Original Assignee
Beijing Qihoo Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Qihoo Technology Co Ltd filed Critical Beijing Qihoo Technology Co Ltd
Priority to CN201711485182.6A priority Critical patent/CN108170524A/zh
Publication of CN108170524A publication Critical patent/CN108170524A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/48Program initiating; Program switching, e.g. by interrupt
    • G06F9/4806Task transfer initiation or dispatching
    • G06F9/4843Task transfer initiation or dispatching by program, e.g. task dispatcher, supervisor, operating system

Landscapes

  • Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer And Data Communications (AREA)

Abstract

本发明实施例提供了一种计算集群的任务处理方法和装置,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述方法包括:通过所述客户端接收所述服务端的任务操作指令;通过所述客户端根据所述任务操作指令对任务进行处理;通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。通过在计算集群中部署C/S结构,可以在管理中心集中管理各项目的任务。

Description

一种计算集群的任务处理方法和装置
技术领域
本发明涉及通信的技术领域,特别是涉及一种计算集群的任务处理方法和一种计算集群的任务处理装置。
背景技术
在计算集群中,存在大量的定时任务crontab,如数据备份等,间隔一定的时间(如5分钟)进行执行。
目前,用户需要登录服务器,对该服务器上的定时任务crontab进行管理。
但是,不同的服务器上具有各自的定时任务crontab,用户需要频繁登录不同的服务器,导致管理定时任务crontab较为繁琐。
并且,为了避免单点故障,计算集群中部署有多台服务器,其中某台服务器出现故障时,其他服务器仍正常运行,用户难以发现,从而导致该服务器上的定时任务crontab执行失败。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种计算集群的任务处理方法和相应的一种计算集群的任务处理装置。
依据本发明的一个方面,提供了一种计算集群的任务处理方法,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述方法包括:
通过所述客户端接收所述服务端的任务操作指令;
通过所述客户端根据所述任务操作指令对任务进行处理;
通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;
通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
可选地,所述任务操作指令包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
可选地,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务新增指令,从所述任务新增指令中提取任务、任务参数;
按照所述任务参数在所述计算设备中执行所述任务。
可选地,所述任务参数包括如下的至少一种:
时间周期、目标数量、***用户;
所述按照所述任务参数在所述计算设备中执行所述任务,包括:
每间隔所述时间周期,执行所述任务;
和/或,
启动所述目标数量的进程;
基于所述进程执行所述任务;
和/或,
登录所述***用户;
通过所述***用户执行所述任务。
可选地,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务修改指令,从所述任务修改指令中提取任务标识、任务参数;
查找所述任务标识对应的任务;
按照所述任务修改指令中的任务参数对所述任务的任务参数进行修改。
可选地,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务删除指令,从所述任务删除指令中提取任务标识;
查找所述任务标识对应的任务;
删除所述任务。
可选地,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务暂停指令,从所述任务暂停指令中提取任务标识;
查找所述任务标识对应的任务;
暂停所述任务的执行。
可选地,所述任务状态包括如下的至少一种:
任务执行时长、执行所述任务的进程的标识、进程状态;
其中,所述进程状态用于在确定进程异常结束时,在所述服务端生成警报信息;
所述设备状态包括如下的至少一种:
内存占用率、任务总数、进程总数。
根据本发明的另一方面,提供了一种计算集群的任务处理装置,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述装置包括:
指令接收模块,用于通过所述客户端接收所述服务端的任务操作指令;
任务处理模块,用于通过所述客户端根据所述任务操作指令对任务进行处理;
状态采集模块,用于通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;
状态发送模块,用于通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
可选地,所述任务操作指令包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
可选地,所述任务处理模块包括:
第一任务信息提取子模块,用于若接收到任务新增指令,从所述任务新增指令中提取任务、任务参数;
任务执行子模块,用于按照所述任务参数在所述计算设备中执行所述任务。
可选地,所述任务参数包括如下的至少一种:
时间周期、目标数量、***用户;
所述任务执行子模块包括:
定时执行单元,用于每间隔所述时间周期,执行所述任务;
和/或,
进程启动单元,用于启动所述目标数量的进程;
进程执行单元,用于基于所述进程执行所述任务;
和/或,
用户登录单元,用于登录所述***用户;
用户执行单元,用于通过所述***用户执行所述任务。
可选地,所述任务处理模块包括:
第二任务信息提取子模块,用于若接收到任务修改指令,从所述任务修改指令中提取任务标识、任务参数;
第一任务查找子模块,用于查找所述任务标识对应的任务;
任务修改子模块,用于按照所述任务修改指令中的任务参数对所述任务的任务参数进行修改。
可选地,所述任务处理模块包括:
第三任务信息提取子模块,用于若接收到任务删除指令,从所述任务删除指令中提取任务标识;
第二任务查找子模块,用于查找所述任务标识对应的任务;
任务删除子模块,用于删除所述任务。
可选地,所述任务处理模块包括:
第四任务信息提取子模块,用于若接收到任务暂停指令,从所述任务暂停指令中提取任务标识;
第三任务查找子模块,用于查找所述任务标识对应的任务;
任务暂停子模块,用于暂停所述任务的执行。
可选地,所述任务状态包括如下的至少一种:
任务执行时长、执行所述任务的进程的标识、进程状态;
其中,所述进程状态用于在确定进程异常结束时,在所述服务端生成警报信息;
所述设备状态包括如下的至少一种:
内存占用率、任务总数、进程总数。
本发明实施例中,计算集群包括多个计算设备与管理中心,每个计算设备中部署有客户端,管理中心中部署有服务端,通过客户端接收服务端的任务操作指令,根据任务操作指令在计算设备中对任务进行处理,通过客户端采集任务的任务状态和/或计算设备的设备状态,并发送至服务端进行展示,通过在计算集群中部署C/S结构,可以在管理中心集中管理各项目的任务,用户无需频繁登录服务器对任务进行管理,服务端与客户端实时进行交互,服务端下发任务操作指令,客户端可以立即进行响应,大大提高了管理任务的简便性,同时,客户端上报任务状态和/或设备状态,可以方便用户查看任务、计算设备的情况,避免某台计算设备出现故障导致任务执行失败,保障任务的执行成功率。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了根据本发明一个实施例的一种计算集群的任务处理方法实施例的步骤示意流程图;以及
图2示出了根据本发明一个实施例的一种计算集群的任务处理装置实施例的结构示意框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
参照图1,示出了根据本发明一个实施例的一种计算集群的任务处理方法实施例的步骤示意流程图,具体可以包括如下步骤:
步骤101,通过所述客户端接收所述服务端的任务操作指令。
计算机群可以为多台设备聚集的集群,如分布式***等。
在计算集群中包括多个计算设备与管理中心。
其中,计算设备可以为执行任务(包括定时任务)的设备,管理中心为对任务进行管理的设备,该管理中心可以部署在一***立的设备上,也可以部署在某台计算设备上,本发明实施例对此不加以限制。
在本发明实施例中,每个计算设备中部署有客户端,管理中心中部署有服务端,从而在计算集群中形成C/S(Client/Server,客户端/服务端)结构。
在具体实现中,计算设备的客户端在初始化时调用服务端的初始化监控,将本地指定的端口等信息上报至管理中心的服务端。
管理中心的服务端可以按照用户的操作,生成任务操作指令,即用于指示任务操作的指令,通过该端口下发志计算设备的客户端。
计算设备的客户端监听指定的端口,等待接收管理中心的服务端的任务操作指令。
步骤102,通过所述客户端根据所述任务操作指令对任务进行处理。
如果计算设备的客户端在指定的端口接收到管理中心的服务端的任务操作指令,则里在计算设备中按照该任务操作指令对相关的任务进行处理。
在具体实现中,任务操作指令可以包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
其中,任务新增指令为增加任务的指令。
任务修改指令为对已有的任务进行修改的指令。
任务删除指令为对删除已有的任务的指令。
任务暂停指令为暂停已有的任务的指令。
在本发明的一个实施例中,步骤102可以包括如下子步骤:
子步骤S11,若接收到任务新增指令,从所述任务新增指令中提取任务、任务参数。
子步骤S12,按照所述任务参数在所述计算设备中执行所述任务。
在本发明实施例中,如果计算设备的客户端接收到任务新增指令,则可以从该任务新增指令中提取任务的内容(如任务ID、shell命令等)以及相关的任务参数,并按照该任务参数在计算设备中执行该任务。
在具体实现中,任务参数包括可以如下的至少一种:
时间周期、目标数量、***用户。
在一个示例中,可以每间该隔时间周期,执行该任务。
在另一个示例中,可以在计算设备中启动该目标数量的进程,基于进程执行该任务。
在另一个示例中,可以在计算设备中登录该***用户,通过该***用户执行该任务。
当然,上述任务参数只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他任务参数,本发明实施例对此不加以限制。另外,除了上述任务参数外,本领域技术人员还可以根据实际需要采用其它任务参数,本发明实施例对此也不加以限制。
在本发明的另一个实施例中,步骤102可以包括如下子步骤:
子步骤S21,若接收到任务修改指令,从所述任务修改指令中提取任务标识、任务参数。
子步骤S22,查找所述任务标识对应的任务。
子步骤S23,按照所述任务修改指令中的任务参数对所述任务的任务参数进行修改。
在本发明实施例中,如果计算设备的客户端接收到任务修改指令,则可以从该任务修改指令中提取任务标识(如任务ID)以及相关的任务参数,在客户端中查询该任务标识对应的任务,对该任务的任务参数进行修改,后续按照修改后的任务参数执行该任务。
在具体实现中,任务参数包括可以如下的至少一种:
时间周期、目标数量、***用户。
在本发明的又一个实施例中,步骤102可以包括如下子步骤:
子步骤S31,若接收到任务删除指令,从所述任务删除指令中提取任务标识。
子步骤S32,查找所述任务标识对应的任务。
子步骤S33,删除所述任务。
在本发明实施例中,如果计算设备的客户端接收到任务删除指令,则可以从该任务删除指令中提取任务标识(如任务ID),在客户端中查询该任务标识对应的任务并进行删除。
在本发明的再一个实施例中,步骤102可以包括如下子步骤:
子步骤S41,若接收到任务暂停指令,从所述任务暂停指令中提取任务标识;
子步骤S42,查找所述任务标识对应的任务;
子步骤S43,暂停所述任务的执行。
在本发明实施例中,如果计算设备的客户端接收到任务暂停指令,则可以从该任务暂停指令中提取任务标识(如任务ID),在客户端中查询该任务标识对应的任务并暂停该任务的执行。
步骤103,通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态。
步骤104,通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
在本发明实施例中,计算设备中的客户端可以每间隔一定的上报周期,采集任务的任务状态和/或计算设备的设备状态,并通过C/S结构发送至管理中心的服务端。
管理中心的服务端对该任务的任务状态和/或计算设备的设备状态进行展示,管理中心的用户可以通过该任务的任务状态和/或计算设备的设备状态对计算设备上的任务进行监控,检查任务是否正常执行,计算设备是否正常运行,等等,以便在发现问题、故障时,迅速定位问题、故障,并进行处理。
在具体实现中,任务状态包括如下的至少一种:
任务执行时长、执行任务的进程的标识、进程状态(如运行中、正常结束、异常结束等)。
其中,进程状态用于在确定进程异常结束时,在服务端生成警报信息,通知用户任务执行失败。
所述设备状态包括如下的至少一种:
内存占用率、任务总数、进程总数。
当然,上述任务状态和/或设备状态只是作为示例,在实施本发明实施例时,可以根据实际情况设置其他任务状态和/或设备状态,本发明实施例对此不加以限制。另外,除了上述任务状态和/或设备状态外,本领域技术人员还可以根据实际需要采用其它任务状态和/或设备状态,本发明实施例对此也不加以限制。
本发明实施例中,计算集群包括多个计算设备与管理中心,每个计算设备中部署有客户端,管理中心中部署有服务端,通过客户端接收服务端的任务操作指令,根据任务操作指令在计算设备中对任务进行处理,通过客户端采集任务的任务状态和/或计算设备的设备状态,并发送至服务端进行展示,通过在计算集群中部署C/S结构,可以在管理中心集中管理各项目的任务,用户无需频繁登录服务器对任务进行管理,服务端与客户端实时进行交互,服务端下发任务操作指令,客户端可以立即进行响应,大大提高了管理任务的简便性,同时,客户端上报任务状态和/或设备状态,可以方便用户查看任务、计算设备的情况,避免某台计算设备出现故障导致任务执行失败,保障任务的执行成功率。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
参照图2,示出了根据本发明一个实施例的一种计算集群的任务处理装置实施例的结构示意框图,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述装置具体可以包括如下模块:
指令接收模块201,用于通过所述客户端接收所述服务端的任务操作指令;
任务处理模块202,用于通过所述客户端根据所述任务操作指令对任务进行处理;
状态采集模块203,用于通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;
状态发送模块204,用于通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
在具体实现中,所述任务操作指令包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
在本发明的一个实施例中,所述任务处理模块202包括:
第一任务信息提取子模块,用于若接收到任务新增指令,从所述任务新增指令中提取任务、任务参数;
任务执行子模块,用于按照所述任务参数在所述计算设备中执行所述任务。
在本发明实施例的一个示例中,所述任务参数包括如下的至少一种:
时间周期、目标数量、***用户;
所述任务执行子模块包括:
定时执行单元,用于每间隔所述时间周期,执行所述任务;
和/或,
进程启动单元,用于启动所述目标数量的进程;
进程执行单元,用于基于所述进程执行所述任务;
和/或,
用户登录单元,用于登录所述***用户;
用户执行单元,用于通过所述***用户执行所述任务。
在本发明的一个实施例中,所述任务处理模块202包括:
第二任务信息提取子模块,用于若接收到任务修改指令,从所述任务修改指令中提取任务标识、任务参数;
第一任务查找子模块,用于查找所述任务标识对应的任务;
任务修改子模块,用于按照所述任务修改指令中的任务参数对所述任务的任务参数进行修改。
在本发明的一个实施例中,所述任务处理模块202包括:
第三任务信息提取子模块,用于若接收到任务删除指令,从所述任务删除指令中提取任务标识;
第二任务查找子模块,用于查找所述任务标识对应的任务;
任务删除子模块,用于删除所述任务。
在本发明的一个实施例中,所述任务处理模块202包括:
第四任务信息提取子模块,用于若接收到任务暂停指令,从所述任务暂停指令中提取任务标识;
第三任务查找子模块,用于查找所述任务标识对应的任务;
任务暂停子模块,用于暂停所述任务的执行。
在本发明实施例的一个示例中,所述任务状态包括如下的至少一种:
任务执行时长、执行所述任务的进程的标识、进程状态;
其中,所述进程状态用于在确定进程异常结束时,在所述服务端生成警报信息;
所述设备状态包括如下的至少一种:
内存占用率、任务总数、进程总数。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
在此提供的算法和显示不与任何特定计算机、虚拟***或者其它设备固有相关。各种通用***也可以与基于在此的示教一起使用。根据上面的描述,构造这类***所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
本发明的各个部件实施例可以以硬件实现,或者以在一个或者多个处理器上运行的软件模块实现,或者以它们的组合实现。本领域的技术人员应当理解,可以在实践中使用微处理器或者数字信号处理器(DSP)来实现根据本发明实施例的计算集群的任务处理设备中的一些或者全部部件的一些或者全部功能。本发明还可以实现为用于执行这里所描述的方法的一部分或者全部的设备或者装置程序(例如,计算机程序和计算机程序产品)。这样的实现本发明的程序可以存储在计算机可读介质上,或者可以具有一个或者多个信号的形式。这样的信号可以从因特网网站上下载得到,或者在载体信号上提供,或者以任何其他形式提供。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。在列举了若干装置的单元权利要求中,这些装置中的若干个可以是通过同一个硬件项来具体体现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了A1、一种计算集群的任务处理方法,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述方法包括:
通过所述客户端接收所述服务端的任务操作指令;
通过所述客户端根据所述任务操作指令对任务进行处理;
通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;
通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
A2、如A1所述的方法,所述任务操作指令包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
A3、如A2所述的方法,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务新增指令,从所述任务新增指令中提取任务、任务参数;
按照所述任务参数在所述计算设备中执行所述任务。
A4、如A3所述的方法,所述任务参数包括如下的至少一种:
时间周期、目标数量、***用户;
所述按照所述任务参数在所述计算设备中执行所述任务,包括:
每间隔所述时间周期,执行所述任务;
和/或,
启动所述目标数量的进程;
基于所述进程执行所述任务;
和/或,
登录所述***用户;
通过所述***用户执行所述任务。
A5、如A2或A3或A4所述的方法,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务修改指令,从所述任务修改指令中提取任务标识、任务参数;
查找所述任务标识对应的任务;
按照所述任务修改指令中的任务参数对所述任务的任务参数进行修改。
A6、如A2或A3或A4所述的方法,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务删除指令,从所述任务删除指令中提取任务标识;
查找所述任务标识对应的任务;
删除所述任务。
A7、如A2或A3或A4所述的方法,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务暂停指令,从所述任务暂停指令中提取任务标识;
查找所述任务标识对应的任务;
暂停所述任务的执行。
A8、如A1或A2或A3或A4所述的方法,
所述任务状态包括如下的至少一种:
任务执行时长、执行所述任务的进程的标识、进程状态;
其中,所述进程状态用于在确定进程异常结束时,在所述服务端生成警报信息;
所述设备状态包括如下的至少一种:
内存占用率、任务总数、进程总数。
本发明实施例还公开了B9、一种计算集群的任务处理装置,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述装置包括:
指令接收模块,用于通过所述客户端接收所述服务端的任务操作指令;
任务处理模块,用于通过所述客户端根据所述任务操作指令对任务进行处理;
状态采集模块,用于通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;
状态发送模块,用于通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
B10、如B9所述的装置,所述任务操作指令包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
B11、如B10所述的装置,所述任务处理模块包括:
第一任务信息提取子模块,用于若接收到任务新增指令,从所述任务新增指令中提取任务、任务参数;
任务执行子模块,用于按照所述任务参数在所述计算设备中执行所述任务。
B12、如B11所述的装置,所述任务参数包括如下的至少一种:
时间周期、目标数量、***用户;
所述任务执行子模块包括:
定时执行单元,用于每间隔所述时间周期,执行所述任务;
和/或,
进程启动单元,用于启动所述目标数量的进程;
进程执行单元,用于基于所述进程执行所述任务;
和/或,
用户登录单元,用于登录所述***用户;
用户执行单元,用于通过所述***用户执行所述任务。
B13、如B10或B11或B12所述的装置,所述任务处理模块包括:
第二任务信息提取子模块,用于若接收到任务修改指令,从所述任务修改指令中提取任务标识、任务参数;
第一任务查找子模块,用于查找所述任务标识对应的任务;
任务修改子模块,用于按照所述任务修改指令中的任务参数对所述任务的任务参数进行修改。
B14、如B10或B11或B12所述的装置,所述任务处理模块包括:
第三任务信息提取子模块,用于若接收到任务删除指令,从所述任务删除指令中提取任务标识;
第二任务查找子模块,用于查找所述任务标识对应的任务;
任务删除子模块,用于删除所述任务。
B15、如B10或B11或B12所述的装置,所述任务处理模块包括:
第四任务信息提取子模块,用于若接收到任务暂停指令,从所述任务暂停指令中提取任务标识;
第三任务查找子模块,用于查找所述任务标识对应的任务;
任务暂停子模块,用于暂停所述任务的执行。
B16、如B9或B10或B11或B12所述的装置,
所述任务状态包括如下的至少一种:
任务执行时长、执行所述任务的进程的标识、进程状态;
其中,所述进程状态用于在确定进程异常结束时,在所述服务端生成警报信息;
所述设备状态包括如下的至少一种:
内存占用率、任务总数、进程总数。

Claims (10)

1.一种计算集群的任务处理方法,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述方法包括:
通过所述客户端接收所述服务端的任务操作指令;
通过所述客户端根据所述任务操作指令对任务进行处理;
通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;
通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
2.如权利要求1所述的方法,其特征在于,所述任务操作指令包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
3.如权利要求2所述的方法,其特征在于,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务新增指令,从所述任务新增指令中提取任务、任务参数;
按照所述任务参数在所述计算设备中执行所述任务。
4.如权利要求3所述的方法,其特征在于,所述任务参数包括如下的至少一种:
时间周期、目标数量、***用户;
所述按照所述任务参数在所述计算设备中执行所述任务,包括:
每间隔所述时间周期,执行所述任务;
和/或,
启动所述目标数量的进程;
基于所述进程执行所述任务;
和/或,
登录所述***用户;
通过所述***用户执行所述任务。
5.如权利要求2或3或4所述的方法,其特征在于,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务修改指令,从所述任务修改指令中提取任务标识、任务参数;
查找所述任务标识对应的任务;
按照所述任务修改指令中的任务参数对所述任务的任务参数进行修改。
6.如权利要求2或3或4所述的方法,其特征在于,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务删除指令,从所述任务删除指令中提取任务标识;
查找所述任务标识对应的任务;
删除所述任务。
7.如权利要求2或3或4所述的方法,其特征在于,所述通过所述客户端根据所述任务操作指令对任务进行处理,包括:
若接收到任务暂停指令,从所述任务暂停指令中提取任务标识;
查找所述任务标识对应的任务;
暂停所述任务的执行。
8.如权利要求1或2或3或4所述的方法,其特征在于,
所述任务状态包括如下的至少一种:
任务执行时长、执行所述任务的进程的标识、进程状态;
其中,所述进程状态用于在确定进程异常结束时,在所述服务端生成警报信息;
所述设备状态包括如下的至少一种:
内存占用率、任务总数、进程总数。
9.一种计算集群的任务处理装置,在计算集群中包括多个计算设备与管理中心,每个计算设备中部署有客户端,所述管理中心中部署有服务端,所述装置包括:
指令接收模块,用于通过所述客户端接收所述服务端的任务操作指令;
任务处理模块,用于通过所述客户端根据所述任务操作指令对任务进行处理;
状态采集模块,用于通过所述客户端采集所述任务的任务状态和/或所述计算设备的设备状态;
状态发送模块,用于通过所述客户端将所述任务状态和/或所述设备状态发送至所述服务端进行展示。
10.如权利要求9所述的装置,其特征在于,所述任务操作指令包括如下的至少一种:
任务新增指令、任务修改指令、任务删除指令、任务暂停指令。
CN201711485182.6A 2017-12-29 2017-12-29 一种计算集群的任务处理方法和装置 Pending CN108170524A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711485182.6A CN108170524A (zh) 2017-12-29 2017-12-29 一种计算集群的任务处理方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711485182.6A CN108170524A (zh) 2017-12-29 2017-12-29 一种计算集群的任务处理方法和装置

Publications (1)

Publication Number Publication Date
CN108170524A true CN108170524A (zh) 2018-06-15

Family

ID=62516210

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711485182.6A Pending CN108170524A (zh) 2017-12-29 2017-12-29 一种计算集群的任务处理方法和装置

Country Status (1)

Country Link
CN (1) CN108170524A (zh)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101741885A (zh) * 2008-11-19 2010-06-16 珠海市西山居软件有限公司 分布式***及分布式***处理任务流的方法
CN102638372A (zh) * 2012-04-17 2012-08-15 浪潮(北京)电子信息产业有限公司 一种分布式集群***及其实现方法
CN105471812A (zh) * 2014-06-20 2016-04-06 北京奇虎科技有限公司 获取网络视频资源的方法及***
CN106127678A (zh) * 2016-06-23 2016-11-16 北京天文馆 数字球幕电影的集群制作平台***及工作方法
CN107454140A (zh) * 2017-06-27 2017-12-08 北京溢思得瑞智能科技研究院有限公司 一种基于大数据平台的Ceph集群自动化部署方法及***

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101741885A (zh) * 2008-11-19 2010-06-16 珠海市西山居软件有限公司 分布式***及分布式***处理任务流的方法
CN102638372A (zh) * 2012-04-17 2012-08-15 浪潮(北京)电子信息产业有限公司 一种分布式集群***及其实现方法
CN105471812A (zh) * 2014-06-20 2016-04-06 北京奇虎科技有限公司 获取网络视频资源的方法及***
CN106127678A (zh) * 2016-06-23 2016-11-16 北京天文馆 数字球幕电影的集群制作平台***及工作方法
CN107454140A (zh) * 2017-06-27 2017-12-08 北京溢思得瑞智能科技研究院有限公司 一种基于大数据平台的Ceph集群自动化部署方法及***

Similar Documents

Publication Publication Date Title
US10291638B1 (en) Cloud activity threat detection for sparse and limited user behavior data
WO2015180291A1 (zh) 监控服务器集群的方法和***
US10860962B2 (en) System for fully integrated capture, and analysis of business information resulting in predictive decision making and simulation
CN105404581B (zh) 一种数据库的评测方法和装置
CN105577799B (zh) 一种数据库集群的故障检测方法和装置
CN106936620B (zh) 一种告警事件的处理方法和处理装置
US20190394080A1 (en) Cloud service transaction capsulation
US9280741B2 (en) Automated alerting rules recommendation and selection
US8516110B2 (en) Automated availability data collection and reporting for system management environments
US20160149948A1 (en) Automated Cyber Threat Mitigation Coordinator
CN108234480A (zh) 入侵检测方法及装置
WO2016175851A1 (en) Automatic task tracking
CN110456765A (zh) 工控指令的时序模型生成方法、装置及其检测方法、装置
US20190384691A1 (en) Methods for providing an enterprise synthetic monitoring framework
CN104539449B (zh) 一种故障信息处理方法与相关装置
US8402125B2 (en) Method of managing operations for administration, maintenance and operational upkeep, management entity and corresponding computer program product
JP6294145B2 (ja) 監視方法、監視装置および監視制御プログラム
US20230388277A1 (en) System and methods for predictive cyber-physical resource management
CN108170524A (zh) 一种计算集群的任务处理方法和装置
US11232381B2 (en) Systems and methods for managing resources in an information technology (IT) infrastructure
WO2016079618A1 (en) Request monitoring
CN115167297A (zh) 基于线程控制的智能制造工业物联网及控制方法
CN105893226A (zh) 服务监测***
CN110874303A (zh) 数据采集方法、装置以及设备
US20170118087A1 (en) Computer Network Modeling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180615