CN109873709A - 平台调度方法、装置和多平台服务*** - Google Patents

平台调度方法、装置和多平台服务*** Download PDF

Info

Publication number
CN109873709A
CN109873709A CN201711263229.4A CN201711263229A CN109873709A CN 109873709 A CN109873709 A CN 109873709A CN 201711263229 A CN201711263229 A CN 201711263229A CN 109873709 A CN109873709 A CN 109873709A
Authority
CN
China
Prior art keywords
platform
service
backup
handover request
current state
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201711263229.4A
Other languages
English (en)
Other versions
CN109873709B (zh
Inventor
汪少敏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Telecom Corp Ltd
Original Assignee
China Telecom Corp Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Telecom Corp Ltd filed Critical China Telecom Corp Ltd
Priority to CN201711263229.4A priority Critical patent/CN109873709B/zh
Publication of CN109873709A publication Critical patent/CN109873709A/zh
Application granted granted Critical
Publication of CN109873709B publication Critical patent/CN109873709B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Hardware Redundancy (AREA)
  • Telephonic Communication Services (AREA)

Abstract

本公开提出一种平台调度方法、装置和多平台服务***,涉及大数据技术领域。本公开的一种平台调度方法包括:获取服务平台的监测数据;基于平台状态模型,根据监测数据确定服务平台的当前状态;若当前状态为高危状态,则向备份平台发送切换消息以切换至由备份平台提供服务。通过这样的方法,能够及时发现服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。

Description

平台调度方法、装置和多平台服务***
技术领域
本公开涉及大数据技术领域,特别是一种平台调度方法、装置和多平台服务***。
背景技术
多***平台由多个独立的对等***组成,各***独立承载业务和流量。由于多***平台的各个***独自承担各自的业务,互不相通,所以无法用负载均衡的方式实现***间调度。
当某个***发生故障,需要进行业务调度时,目前使用的方法为:发现***故障后,将故障平台的业务切换至备份平台。
发明内容
发明人发现,当***故障后切换服务平台将造成故障和切换期间的业务中断,影响服务对象的正常使用。
本公开的一个目的在于提高服务平台的业务连续性和可靠性。
根据本公开的一个方面,提出一种平台调度方法,包括:获取服务平台的监测数据;基于平台状态模型,根据监测数据确定服务平台的当前状态;若当前状态为高危状态,则向备份平台发送切换消息以切换至由备份平台提供服务。
可选地,监测数据包括平台硬件参数、业务流量参数和业务形态参数。
可选地,平台状态模型包括硬件参数、业务流量参数或业务形态参数中的至少一种与当前状态的关联关系。
可选地,所述平台状态模型为基于机器学***台性能参数生成。
可选地,还包括:接收来自服务平台的切换消息;向全局设备上报切换消息以便全局设备更改服务配置;根据全局设备反馈的确认信息向服务对象发布服务切换指令。
通过这样的方法,能够及时发现服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。
根据本公开的另一个方面,提出一种平台调度装置,包括:服务监测单元,被配置为获取服务平台的监测数据;和,数据分析单元,被配置为基于平台状态模型,根据监测数据确定服务平台的当前状态,若当前状态为高危状态,则向备份平台发送切换消息以切换至由备份平台提供服务。
可选地,还包括:平台监测单元,被配置为接收数据分析单元发送给备份平台的切换消息;状态发布单元,被配置为向全局设备上报切换消息以便全局设备更改服务配置,以及根据全局设备反馈的确认信息向服务对象发布服务切换指令。
可选地,还包括:状态接收单元,被配置为状态发布单元发送给全局设备的切换消息,以便全局设备更改服务配置。
可选地,服务监测单元和数据分析单元位于服务平台或与所述服务平台信号连接;平台监测单元和状态发布单元位于备份平台或与所述备份平台信号连接;和,状态接收单元位于全局设备或与所述全局设备信号连接。
根据本公开的又一个方面,提出一种平台调度装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行上文中的平台调度方法。
这样的平台调度装置能够及时发现服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。
根据本公开的其中一个方面,提出一种多平台服务***,包括:一个以上服务平台,被配置为获取自身服务平台的监测数据,基于平台状态模型,根据监测数据确定服务平台的当前状态,若当前状态为高危状态,则向备份平台发送切换消息;与服务平台相连接的备份平台,被配置为根据来自服务平台的切换消息为服务平台的服务对象提供服务。
可选地,还包括:全局设备,被配置为根据来自服务平台的切换消息更改服务配置;备份平台还被配置为根据全局设备完成更改服务配置后反馈的确认信息向服务对象发布服务切换指令。
这样的多平台服务***能够及时发现其中各个服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。
另外,根据本公开的一个方面,提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上文中任意一种平台调度方法的步骤。
通过执行上述计算机可读存储介质上的指令,能够及时发现服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。
附图说明
此处所说明的附图用来提供对本公开的进一步理解,构成本公开的一部分,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。在附图中:
图1为本公开的平台调度方法的一个实施例的流程图。
图2为本公开的平台调度方法的另一个实施例的流程图。
图3为本公开的平台调度装置的一个实施例的示意图。
图4为本公开的平台调度装置的另一个实施例的示意图。
图5为本公开的平台调度装置的又一个实施例的示意图。
图6为本公开的多平台服务***的一个实施例的示意图。
具体实施方式
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
本公开的平台调度方法的一个实施例的流程图如图1所示。
在步骤101中,获取服务平台监测数据。在一个实施例中,监测数据包括平台硬件参数、业务流量参数和业务形态参数等数据,如CPU占用率等平台硬件参数,当前的流量大小等业务流量参数,以及承载的业务种类、该种类业务的业务特点和对平台的负担等业务形态参数。
在步骤102中,基于平台状态模型,根据监测数据确定服务平台的当前状态。在一个实施例中,服务平台的状态可以包括健康状态,以及当监测数据中的各项指标达到一定阈值时判定进入的高危状态。高危状态可以认为是服务平台稳定性的临界状态,达到高危状态的服务平台能够维持当前提供服务,但很有可能会发生故障。
在步骤103中,若确定当前状态为高危状态,则向备份平台发送切换消息以切换至由备份平台提供服务。
通过这样的方法,能够及时发现服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。
在一个实施例中,平台状态模型包括硬件参数、业务流量参数或业务形态参数中的至少一种与当前状态的关联关系,如当CPU的占用率达到90%以上、当前承载的呼叫数量达到最大承载量的90%以上、或当前的业务大部分为具有大数据量的需求的业务时,可以确定对应的平台状态为高危状态。
通过这样的方法,能够用量化的指标记录监测数据与平台状态的对应关系,从而能够根据监测数据快速确定平台状态。
在一个实施例中,可以基于运行数据和服务平台本身的性能参数进行机器学***台状态模型,从而能够使平台状态的确认更加符合各个服务平台自身的状况,避免不必要或不及时的平台切换。
本公开的平台调度方法的另一个实施例的流程图如图2所示。
在步骤201中,获取服务平台监测数据。
在步骤202中,基于平台状态模型,根据监测数据确定服务平台的当前状态。
在步骤203中,若确定当前状态为高危状态,则向备份平台发送切换消息。
在步骤204中,备份平台在收到切换消息后,向全局设备上报切换消息以便全局设备更改服务配置。
在步骤205中,根据全局设备反馈的确认信息向服务对象发布服务切换指令。
通过这样的方法,在确认服务平台处于高危状态后,能够及时告知备份平台接收服务任务,而服务平台能够及时告知全局设备更改服务配置以使备份平台能够满足业务承载要求,备份平台在全局设备完成配置更改后向服务平台的服务对象发布服务切换指令,使得各个服务对象主动切换至备份平台,从而避免服务平台故障导致的服务对象被动获知服务中断,也避免了服务对象反复查找、尝试建立连接,提高了服务平台的业务连续性和可靠性。
本公开的平台调度装置的一个实施例的示意图如图3所示。服务监测单元301能够获取服务平台监测数据。在一个实施例中,监测数据包括平台硬件参数、业务流量参数和业务形态参数等数据。数据分析单元302能够基于平台状态模型,根据监测数据确定服务平台的当前状态。在一个实施例中,平台状态模型包括硬件参数、业务流量参数或业务形态参数中的至少一种与当前状态的关联关系。当确定当前状态为高危状态时,数据分析单元302能够向备份平台发送切换消息以切换至备份平台提供服务。服务监测单元301和数据分析单元302可以位于服务平台或与服务平台信号连接,以便及时收集服务平台的监测数据和确定服务平台的状态。
这样的平台调度装置能够及时发现服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。
在一个实施例中,如图3所示,平台调度装置还可以包括平台监测单元303和状态发布单元304。平台监测单元303能够接收数据分析单元发送的切换消息,状态发布单元304能够向全局设备上报切换消息以便全局设备更改服务配置,以及根据全局设备反馈的确认信息向服务对象发布服务切换指令。平台监测单元303和状态发布单元304可以位于备份平台或与备份平台信号连接。
这样的平台调度装置能够根据服务平台的切换消息及时通知各个服务对象主动切换至备份平台,从而避免服务平台故障导致的服务对象被动获知服务中断,也避免了服务对象反复查找、尝试建立连接,提高了服务平台的业务连续性和可靠性。
在一个实施例中,如图3所示,平台调度装置还可以包括状态接收单元305,能够接收状态发布单元发送给全局设备的切换消息,以便全局设备更改服务配置。状态接收单元305可以位于全局设备或与全局设备信号连接。
这样的平台调度装置能够及时更改服务配置,使得备份平台具备替代服务平台进行业务承载的能力,从而满足业务承载需求。
本公开平台调度装置的一个实施例的结构示意图如图4所示。平台调度装置包括存储器401和处理器402。其中:存储器401可以是磁盘、闪存或其它任何非易失性存储介质。存储器用于存储上文中平台调度方法的对应实施例中的指令。处理器402耦接至存储器401,可以作为一个或多个集成电路来实施,例如微处理器或微控制器。该处理器402用于执行存储器中存储的指令,能够实现及时发现服务平台的异常并主动切换至备份平台提供服务,提高了服务平台的业务连续性和可靠性。
在一个实施例中,还可以如图5所示,平台调度装置500包括存储器501和处理器502。处理器502通过BUS总线503耦合至存储器501。该平台调度装置500还可以通过存储接口504连接至外部存储装置505以便调用外部数据,还可以通过网络接口506连接至网络或者另外一台计算机***(未标出)。此处不再进行详细介绍。
在该实施例中,通过存储器存储数据指令,再通过处理器处理上述指令,能够实现及时发现服务平台的异常并主动切换至备份平台提供服务,提高了服务平台的业务连续性和可靠性。。
在另一个实施例中,一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现平台调度方法对应实施例中的方法的步骤。本领域内的技术人员应明白,本公开的实施例可提供为方法、装置、或计算机程序产品。因此,本公开可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本公开可采用在一个或多个其中包含有计算机可用程序代码的计算机可用非瞬时性存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本公开的多平台服务***的一个实施例的示意图如图6所示。服务平台611~61n中的每个服务平台包括服务监测单元和数据分析单元。备份平台62中同样具备多个能够承载业务的设备。备份平台62中包括平台监测单元和平台状态发布单元。
在一个实施例中,还可以包括全局设备,如全局配置管理设备63,或者还可以包括全局的语音接入设备64,各自分别具有平台状态接收单元和各自的调整单元。
在601中,位于服务平台611的服务监测单元获取同平台的各个设备的监测数据,并通过数据分析单元确定服务平台的当前状态。
在602中,当服务平台611当前状态为高危状态时,数据分析单元向备份平台62的平台检测单元发送切换消息。
在603中,平台监测单元激活本平台的各个设备准备开始提供服务。
在604中,备份平台的平台状态发布单元通知全局设备由备份平台提供服务,通知的信息可以包括哪个平台与备份平台进行切换,切换方向,切换是否成功等。全局设备,如全局配置管理设备63在域内进行配置调整,语音接入设备64执行接入设置自动调整等。
在605中,全局设备在完成调整后向备份平台62反馈消息,告知备份平台62已完成切换准备。
在606中,备份平台62的平台状态发布单元向由服务平台611提供服务的座席切换至备份平台62提供服务。座席收到切换信息后,根据切换信息,自动重新登录,切换完成,不影响业务。
这样的多平台服务***能够及时发现其中各个服务平台的异常并主动切换至备份平台提供服务,从而避免了故障发生时被动切换造成的服务中断,提高了服务平台的业务连续性和可靠性。
本公开是参照根据本公开实施例的方法、设备(***)和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
至此,已经详细描述了本公开。为了避免遮蔽本公开的构思,没有描述本领域所公知的一些细节。本领域技术人员根据上面的描述,完全可以明白如何实施这里公开的技术方案。
可能以许多方式来实现本公开的方法以及装置。例如,可通过软件、硬件、固件或者软件、硬件、固件的任何组合来实现本公开的方法以及装置。用于所述方法的步骤的上述顺序仅是为了进行说明,本公开的方法的步骤不限于以上具体描述的顺序,除非以其它方式特别说明。此外,在一些实施例中,还可将本公开实施为记录在记录介质中的程序,这些程序包括用于实现根据本公开的方法的机器可读指令。因而,本公开还覆盖存储用于执行根据本公开的方法的程序的记录介质。
最后应当说明的是:以上实施例仅用以说明本公开的技术方案而非对其限制;尽管参照较佳实施例对本公开进行了详细的说明,所属领域的普通技术人员应当理解:依然可以对本公开的具体实施方式进行修改或者对部分技术特征进行等同替换;而不脱离本公开技术方案的精神,其均应涵盖在本公开请求保护的技术方案范围当中。

Claims (13)

1.一种平台调度方法,包括:
获取服务平台的监测数据;
基于平台状态模型,根据所述监测数据确定所述服务平台的当前状态;
若所述当前状态为高危状态,则向备份平台发送切换消息以切换至由所述备份平台提供服务。
2.根据权利要求1所述的方法,其中,所述监测数据包括平台硬件参数、业务流量参数和业务形态参数。
3.根据权利要求2所述的方法,其中,所述平台状态模型包括所述硬件参数、所述业务流量参数或所述业务形态参数中的至少一种与所述当前状态的关联关系。
4.根据权利要求1、2或3所述的方法,其中,所述平台状态模型为基于机器学***台性能参数生成。
5.根据权利要求1所述的方法,还包括:
接收来自所述服务平台的切换消息;
向全局设备上报所述切换消息以便所述全局设备更改服务配置;
根据所述全局设备反馈的确认信息向服务对象发布服务切换指令。
6.一种平台调度装置,包括:
服务监测单元,被配置为获取服务平台的监测数据;和,
数据分析单元,被配置为基于平台状态模型,根据所述监测数据确定所述服务平台的当前状态,若所述当前状态为高危状态,则向备份平台发送切换消息以切换至由所述备份平台提供服务。
7.根据权利要求6所述的装置,还包括:
平台监测单元,被配置为接收所述数据分析单元发送给所述备份平台的切换消息;
状态发布单元,被配置为向全局设备上报所述切换消息以便所述全局设备更改服务配置,以及根据所述全局设备反馈的确认信息向服务对象发布服务切换指令。
8.根据权利要求7所述的装置,还包括:
状态接收单元,被配置为接收所述数据分析单元发送给所述全局设备的切换消息,以便所述全局设备更改服务配置。
9.根据权利要求8所述的装置,其中,
所述服务监测单元和所述数据分析单元位于所述服务平台或与所述服务平台信号连接;
所述平台监测单元和所述状态发布单元位于所述备份平台或与所述备份平台信号连接;和,
所述状态接收单元位于所述全局设备或与所述全局设备信号连接。
10.一种平台调度装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至5任一项所述的方法。
11.一种多平台服务***,包括:
一个以上服务平台,被配置为获取服务平台的监测数据,基于平台状态模型,根据所述监测数据确定所述服务平台的当前状态,若所述当前状态为高危状态,则向备份平台发送切换消息;
与所述服务平台相连接的备份平台,被配置为根据来自所述服务平台的切换消息为所述服务平台的服务对象提供服务。
12.根据权利要求11所述的***,还包括:
全局设备,被配置为根据来自所述服务平台的切换消息更改服务配置;
所述备份平台还被配置为根据所述全局设备完成更改服务配置后反馈的确认信息向服务对象发布服务切换指令。
13.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至5任意一项所述的方法的步骤。
CN201711263229.4A 2017-12-05 2017-12-05 平台调度方法、装置和多平台服务*** Active CN109873709B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711263229.4A CN109873709B (zh) 2017-12-05 2017-12-05 平台调度方法、装置和多平台服务***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711263229.4A CN109873709B (zh) 2017-12-05 2017-12-05 平台调度方法、装置和多平台服务***

Publications (2)

Publication Number Publication Date
CN109873709A true CN109873709A (zh) 2019-06-11
CN109873709B CN109873709B (zh) 2022-03-04

Family

ID=66915925

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711263229.4A Active CN109873709B (zh) 2017-12-05 2017-12-05 平台调度方法、装置和多平台服务***

Country Status (1)

Country Link
CN (1) CN109873709B (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136900A (zh) * 2006-10-16 2008-03-05 中兴通讯股份有限公司 一种面向服务的快速透明故障转移装置及实现方法
EP2866410A1 (en) * 2013-10-22 2015-04-29 Canon Denshi Kabushiki Kaisha Apparatus for switching between multiple servers in a web-based system
CN106789246A (zh) * 2016-12-22 2017-05-31 广西防城港核电有限公司 一种主备服务器的切换方法及装置
CN106951984A (zh) * 2017-02-28 2017-07-14 深圳市华傲数据技术有限公司 一种***健康度动态分析预测方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101136900A (zh) * 2006-10-16 2008-03-05 中兴通讯股份有限公司 一种面向服务的快速透明故障转移装置及实现方法
EP2866410A1 (en) * 2013-10-22 2015-04-29 Canon Denshi Kabushiki Kaisha Apparatus for switching between multiple servers in a web-based system
CN106789246A (zh) * 2016-12-22 2017-05-31 广西防城港核电有限公司 一种主备服务器的切换方法及装置
CN106951984A (zh) * 2017-02-28 2017-07-14 深圳市华傲数据技术有限公司 一种***健康度动态分析预测方法及装置

Also Published As

Publication number Publication date
CN109873709B (zh) 2022-03-04

Similar Documents

Publication Publication Date Title
CN105187249B (zh) 一种故障恢复方法及装置
TWI701916B (zh) 用於在分布式系統中使管理能力自恢復的方法和裝置
WO2016169240A1 (zh) 一种变电站母线负荷转移方法及***
US20140372805A1 (en) Self-healing managed customer premises equipment
EP2451118A1 (en) Method and system for processing the failures of agents at call center
US20140122140A1 (en) Advanced managed service customer edge router
CN105515812A (zh) 资源的故障处理方法及装置
CN108924202B (zh) 一种分布式集群的数据容灾方法以及相关装置
EP2723017A1 (en) Method, apparatus and system for implementing distributed auto-incrementing counting
CN104753038A (zh) 一种智能变电站集中式继电保护***及保护方法
CN109921942B (zh) 云平台切换控制方法、装置、***及电子设备
CN104717077B (zh) 一种管理数据中心的方法、装置及***
CN107276839B (zh) 一种云平台的自监控方法和***
CN101729305A (zh) 故障自动恢复的方法、***和控制网元
CN105915426B (zh) 环形网络的故障恢复方法及装置
CN1937523A (zh) 一种客服应急***及其实现方法
CN110135604A (zh) 故障处理方法、装置及处理设备
CN106658559B (zh) 一种基于上下文预测的移动服务质量保持方法
CN102984184A (zh) 一种分布式***的服务负载均衡方法及装置
MXPA04006830A (es) Deteccion remota de estados de suministro de energia.
CN107547301A (zh) 一种主备设备倒换方法及装置
CN104901834A (zh) 一种网络服务器自动切换的方法及***
WO2010121459A1 (zh) 一种自动交换光网络中实现保护与恢复的方法及***
CN107656847A (zh) 基于分布式集群的节点管理方法、***、装置及存储介质
CN103490920A (zh) 电力光纤通信网络中的多重故障保护/恢复方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant