CN102360323A - 一种网络服务器宕机自修复的方法及*** - Google Patents

一种网络服务器宕机自修复的方法及*** Download PDF

Info

Publication number
CN102360323A
CN102360323A CN2011103338571A CN201110333857A CN102360323A CN 102360323 A CN102360323 A CN 102360323A CN 2011103338571 A CN2011103338571 A CN 2011103338571A CN 201110333857 A CN201110333857 A CN 201110333857A CN 102360323 A CN102360323 A CN 102360323A
Authority
CN
China
Prior art keywords
webserver
service
data
server
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2011103338571A
Other languages
English (en)
Inventor
丘亿昊
邓超
祁亨年
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dongguan Zhengxin Science & Technology Co Ltd
Original Assignee
Dongguan Zhengxin Science & Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dongguan Zhengxin Science & Technology Co Ltd filed Critical Dongguan Zhengxin Science & Technology Co Ltd
Priority to CN2011103338571A priority Critical patent/CN102360323A/zh
Publication of CN102360323A publication Critical patent/CN102360323A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本发明公开了一种网络服务器宕机自修复的方法及***,该方法包括步骤:a.服务器以正常模式启动;b.服务器开始提供服务,并将数据存储到共享内存,同时监控服务是否正常,如果正常,继续监控,否则进行步骤c;c.调用重启脚本,服务器以修复模式重启;d.服务器从共享内存加载数据,进行数据修复;e.修复完成后,返回步骤b。采用本方法或***,无需为服务器配置备用机,成本低,当服务器从共享内存里加载数据进行修复时,修复速度非常快,在极短的时间内就能完成,进而恢复服务,此外,当服务需要迁移到其他服务器时,可提供数据复制的可靠底层保证,通过读取共享内存的数据,将数据传输到其他服务器,启动相同服务,即可完成工作迁移。

Description

一种网络服务器宕机自修复的方法及***
 
技术领域
本发明涉及网络服务器宕机的数据处理技术,尤其涉及一种网络服务器宕机自修复的方法及***。
 
背景技术
随着网络技术的发展,互联网用户的数量呈几何倍数的***式增长,各种即时通讯工具、网络游戏平台都面临着百万甚至千万级以上负载量的考验,并且还将伴随日益频繁的网络攻击,在此状况下,网络服务器不可避免地会遇到宕机问题,在较早的时候,人们解决宕机的方法只是让故障服务器通过重新启动来恢复服务,而没有考虑到数据的丢失问题,这样造成的后果就是因数据丢失而回档,对于网游领域而言,后果带来的影响尤为严重:数据回档意味着大量玩家的劳动成果毁于一旦,这对玩家的兴趣以及经营者的正面形象都是一个相当严重的打击。到了现阶段,为了避免数据丢失,人们通过启动两个服务器进行宕机切换,即一个为主服务器,另一个为备用服务器,当主服务器正常工作时,备用服务器不工作,且主服务器的数据将在备用服务器的磁盘上进行数据日志备份,这样当主服务器宕机时,备用服务器接管服务成为新的主服务器,并通过磁盘数据日志备份来实现数据修复,同时原主服务器重启后成为新的备用服务器。然而,对于如今分布式架构而言,由于服务器集群的规模越来越庞大,如果为每一个服务器都配备一个备用服务器,将极大地提高成本,而且,采用磁盘数据日志备份来修复数据其速度较慢,需要较长的时间才能完成修复,难以在短时间内恢复服务。因此,基于目前的现状,有必要为人们提供一种成本低、能快速恢复服务的网络服务器宕机自修复的方法及***。
 
发明内容
针对现有技术的不足,本发明的目的旨在于提供一种网络服务器宕机自修复的方法及***,其成本低,数据修复速度快,能快速恢复服务。
为实现上述目的本发明采用如下技术方案:
一种网络服务器宕机自修复的方法,该方法包括如下步骤:
a.网络服务器以正常模式启动;
b.网络服务器开始提供服务,并将数据存储到共享内存,同时监控服务是否正常,如果服务正常,继续监控,否则,进行步骤c;
c.确定网络服务器宕机,调用重启脚本,使网络服务器以修复模式重新启动;
d.重启后的网络服务器从共享内存加载数据,进行数据修复;
e.修复完成后,返回上述步骤b。
作为一种优选方案,所述步骤b中,所述监控服务是否正常通过设置守护进程对服务进行监控来实现。
作为一种优选方案,所述步骤b中,所述监控服务是否正常通过对服务的线程进行hook来实现。
一种网络服务器宕机自修复的***,该***包括:
正常启动装置,用于将网络服务器以正常模式启动;
处理装置,用于控制网络服务器开始提供服务,并将数据存储到共享内存,同时监控服务是否正常,如果服务正常,继续监控,否则,运行重启装置;
重启装置,用于确定网络服务器宕机,调用重启脚本,使网络服务器以修复模式重新启动;
修复装置,用于控制重启后的网络服务器从共享内存加载数据,进行数据修复;
返回装置,用于在修复完成后控制处理装置运行。
本发明所阐述的一种网络服务器宕机自修复的方法及***,其有益效果在于:采用本方法或***,无需为服务器配置备用机,因而成本低,并且,由于数据存储在共享内存里,当因宕机而重启后的服务器从共享内存里加载数据进行修复时,修复速度非常快,在极短的时间内就能完成数据修复,进而恢复服务,此外,当服务需要迁移到其他服务器时,可提供数据复制的可靠底层保证,通过读取共享内存的数据,将数据传输到其他服务器,启动相同服务,即可完成工作迁移。
 
附图说明
图1是本发明一种网络服务器宕机自修复的方法的流程示意图。
 
具体实施方式
下面结合附图与具体实施例来对本发明作进一步描述。
请参照图1所示,其显示出了本发明一种网络服务器宕机自修复的方法的总体流程。在步骤(a)中,网络服务器以正常模式启动,正常模式启动的网络服务器不会从共享内存加载数据,从而尽可能快地为客户端提供服务。
进行到步骤(b),网络服务器开始提供服务,并将数据存储到共享内存,同时监控服务是否正常,如果服务正常,继续监控,否则,进行步骤c,在此步骤中,监控服务是否正常可通过两种方式实现:第一种是通过设置守护进程对服务进行监控来实现;第二种是通过对服务的线程进行hook来实现。这两种实现方式都属于比较成熟的现有技术,稳定性极高,当然,也可同时采用这两种方式,以达到更准确的监控效果。
进行到步骤(c).当在上一步骤中监控到服务异常时,可确定网络服务器已经宕机,此时调用重启脚本,使网络服务器以修复模式重新启动。
进行到步骤(d).以修复模式重启后的网络服务器从共享内存加载数据,进行数据修复,由于数据是存储在内存里,因此修复速度非常快。
进行到步骤(e).完成数据修复后的网络服务器恢复服务,此时网络服务器又将按照步骤(b)中的方式运行。
下面以网游服务器集群为例来对本方法进行进一步说明,为了提高安全性,现在的分布式服务器集群都采用业务分离的方式对服务器集群进行分层,每一层的服务器只处理本层相关的业务,在网游服务器集群中,第一层是接收数据层,该层中的服务器不进行数据处理,只负责接收客户端提交的数据及向客户端发送数据,第一层接收客户端提交的数据后会将数据向上提交给第二层的业务处理层,由第二层的服务器进行数据处理,如果还有其他第二层处理不了的业务,则由第二层将数据继续向上一层提交,直至处理完所有的业务,由于第二层的服务器涉及到数据处理,因而对服务器的性能要求较高,也比较容易发生宕机的现象,当本方法应用于第二层的服务器时,其工作过程是:步骤1、第二层的服务器以正常模式启动,启动后服务器与共享内存建立联系;步骤2、第二层服务器开始提供服务,当第一层服务器提交数据到第二层后,第二层的服务器对接收到的数据进处理,并将数据保存到共享内存中,同时监控服务是否正常,如果服务正常,继续监控,如果异常,进行下一步;步骤3、根据上一步的监控结果确定该第二层服务器已经宕机,不能正常提供服务,此时调用重启脚本,使该第二层服务器以修复模式重新启动;步骤4、以修复模式启动后的该第二层服务器从共享内存加载数据,进行数据场景修复;步骤5、修复完成后,该第二层服务器恢复服务,又按照步骤2的方式运行。当然,第一层服务器及其他的非第二层服务器都可采用上述的方法来应对宕机问题,不但成本低,而且宕机时数据修复速度快,能快速恢复服务,有利于避免玩家的信息数据发生回档,安全性好。
需指出的是,以上以网游服务器集群为例只是为了便于理解本方法,事实上,本方法适用于所有领域的网络服务器集群,集群的规模越大,本方法的优点越明显。
本发明还提供了一种网络服务器宕机自修复的***,其包括:正常启动装置,用于将网络服务器以正常模式启动;处理装置,用于控制网络服务器开始提供服务,并将数据存储到共享内存,同时监控服务是否正常,如果服务正常,继续监控,否则,运行重启装置;重启装置,用于确定网络服务器宕机,调用重启脚本,使网络服务器以修复模式重新启动;修复装置,用于控制重启后的网络服务器从共享内存加载数据,进行数据修复;返回装置,用于在修复完成后控制处理装置运行。本***所采用的相关方法与上述网络服务器宕机自修复的方法的实施方式相同,在此不再重复。
本发明的设计重点在于:采用本方法或***,无需为服务器配置备用机,因而成本低,并且,由于数据存储在共享内存里,当因宕机而重启后的服务器从共享内存里加载数据进行修复时,修复速度非常快,在极短的时间内就能完成数据修复,进而恢复服务,此外,当服务需要迁移到其他服务器时,可提供数据复制的可靠底层保证,通过读取共享内存的数据,将数据传输到其他服务器,启动相同服务,即可完成工作迁移。
以上所述,仅是本发明较佳实施例而已,并非对本发明的技术范围作任何限制,故凡是依据本发明的技术实质对以上实施例所作的任何细微修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (4)

1.一种网络服务器宕机自修复的方法,其特征在于,该方法包括如下步骤:
a.网络服务器以正常模式启动;
b.网络服务器开始提供服务,并将数据存储到共享内存,同时监控服务是否正常,如果服务正常,继续监控,否则,进行步骤c;
c.确定网络服务器宕机,调用重启脚本,使网络服务器以修复模式重新启动;
d.重启后的网络服务器从共享内存加载数据,进行数据修复;
e.修复完成后,返回上述步骤b。
2.根据权利要求1所述的一种网络服务器宕机自修复的方法,其特征在于,所述步骤b中,所述监控服务是否正常通过设置守护进程对服务进行监控来实现。
3.根据权利要求1所述的一种网络服务器宕机自修复的方法,其特征在于,所述步骤b中,所述监控服务是否正常通过对服务的线程进行hook来实现。
4.一种网络服务器宕机自修复的***,其特征在于,该***包括:
正常启动装置,用于将网络服务器以正常模式启动;
处理装置,用于控制网络服务器开始提供服务,并将数据存储到共享内存,同时监控服务是否正常,如果服务正常,继续监控,否则,运行重启装置;
重启装置,用于确定网络服务器宕机,调用重启脚本,使网络服务器以修复模式重新启动;
修复装置,用于控制重启后的网络服务器从共享内存加载数据,进行数据修复;
返回装置,用于在修复完成后控制处理装置运行。
CN2011103338571A 2011-10-28 2011-10-28 一种网络服务器宕机自修复的方法及*** Pending CN102360323A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2011103338571A CN102360323A (zh) 2011-10-28 2011-10-28 一种网络服务器宕机自修复的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2011103338571A CN102360323A (zh) 2011-10-28 2011-10-28 一种网络服务器宕机自修复的方法及***

Publications (1)

Publication Number Publication Date
CN102360323A true CN102360323A (zh) 2012-02-22

Family

ID=45585653

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2011103338571A Pending CN102360323A (zh) 2011-10-28 2011-10-28 一种网络服务器宕机自修复的方法及***

Country Status (1)

Country Link
CN (1) CN102360323A (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102650961A (zh) * 2012-03-31 2012-08-29 华为技术有限公司 监控容灾***数据复制的方法、***和一种容灾***
CN106155844A (zh) * 2016-07-29 2016-11-23 深圳创维数字技术有限公司 一种web服务器的自恢复方法和自恢复***
CN107026708A (zh) * 2016-02-02 2017-08-08 星辰天合(北京)数据科技有限公司 数据处理的方法和装置
CN109324834A (zh) * 2018-09-19 2019-02-12 郑州云海信息技术有限公司 一种分布式存储服务器自动重启的***及方法
CN109889762A (zh) * 2019-03-01 2019-06-14 视联动力信息技术股份有限公司 一种会议控制方法和装置
CN110943855A (zh) * 2019-11-19 2020-03-31 山东超越数控电子股份有限公司 一种通过bmc实现服务器宕机后状态恢复的方法
CN111106947A (zh) * 2018-10-29 2020-05-05 北京金山云网络技术有限公司 一种节点宕机修复方法、装置、电子设备及可读存储介质
CN111258665A (zh) * 2020-01-21 2020-06-09 上海米哈游天命科技有限公司 一种服务器启动方法、装置、服务器和介质
CN113641556A (zh) * 2021-08-24 2021-11-12 东风电子科技股份有限公司 用于保障汽车仪表稳定运行的***、方法、装置、处理器及其计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030217310A1 (en) * 2002-05-17 2003-11-20 Ebsen David S. Method and apparatus for recovering from a non-fatal fault during background operations
TWI240881B (en) * 2002-05-09 2005-10-01 Taiwan Semiconductor Mfg Monitor and diagnostic system and its method for breakdown facilities
CN1716212A (zh) * 2004-06-29 2006-01-04 联想(北京)有限公司 一种灾难恢复***及方法
CN101207515A (zh) * 2007-12-12 2008-06-25 中兴通讯股份有限公司 一种多机共享内存的处理方法、实现方法和同步方法
CN101226570A (zh) * 2007-09-05 2008-07-23 江启煜 一种监控与清除广义未知病毒的方法
CN101296115A (zh) * 2007-11-22 2008-10-29 ***通信集团山东有限公司 电信网络多维监控方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI240881B (en) * 2002-05-09 2005-10-01 Taiwan Semiconductor Mfg Monitor and diagnostic system and its method for breakdown facilities
US20030217310A1 (en) * 2002-05-17 2003-11-20 Ebsen David S. Method and apparatus for recovering from a non-fatal fault during background operations
CN1716212A (zh) * 2004-06-29 2006-01-04 联想(北京)有限公司 一种灾难恢复***及方法
CN101226570A (zh) * 2007-09-05 2008-07-23 江启煜 一种监控与清除广义未知病毒的方法
CN101296115A (zh) * 2007-11-22 2008-10-29 ***通信集团山东有限公司 电信网络多维监控方法
CN101207515A (zh) * 2007-12-12 2008-06-25 中兴通讯股份有限公司 一种多机共享内存的处理方法、实现方法和同步方法

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102650961B (zh) * 2012-03-31 2014-01-01 华为技术有限公司 监控容灾***数据复制的方法、***和一种容灾***
CN102650961A (zh) * 2012-03-31 2012-08-29 华为技术有限公司 监控容灾***数据复制的方法、***和一种容灾***
CN107026708A (zh) * 2016-02-02 2017-08-08 星辰天合(北京)数据科技有限公司 数据处理的方法和装置
CN106155844B (zh) * 2016-07-29 2019-02-12 深圳创维数字技术有限公司 一种web服务器的自恢复方法和自恢复***
WO2018019242A1 (zh) * 2016-07-29 2018-02-01 深圳创维数字技术有限公司 网站服务器的自恢复方法和自恢复***
CN106155844A (zh) * 2016-07-29 2016-11-23 深圳创维数字技术有限公司 一种web服务器的自恢复方法和自恢复***
CN109324834A (zh) * 2018-09-19 2019-02-12 郑州云海信息技术有限公司 一种分布式存储服务器自动重启的***及方法
CN111106947A (zh) * 2018-10-29 2020-05-05 北京金山云网络技术有限公司 一种节点宕机修复方法、装置、电子设备及可读存储介质
CN111106947B (zh) * 2018-10-29 2023-02-07 北京金山云网络技术有限公司 一种节点宕机修复方法、装置、电子设备及可读存储介质
CN109889762A (zh) * 2019-03-01 2019-06-14 视联动力信息技术股份有限公司 一种会议控制方法和装置
CN110943855A (zh) * 2019-11-19 2020-03-31 山东超越数控电子股份有限公司 一种通过bmc实现服务器宕机后状态恢复的方法
CN111258665A (zh) * 2020-01-21 2020-06-09 上海米哈游天命科技有限公司 一种服务器启动方法、装置、服务器和介质
CN113641556A (zh) * 2021-08-24 2021-11-12 东风电子科技股份有限公司 用于保障汽车仪表稳定运行的***、方法、装置、处理器及其计算机可读存储介质
CN113641556B (zh) * 2021-08-24 2024-05-17 东风电子科技股份有限公司 用于保障汽车仪表稳定运行的***、方法、装置、处理器及其计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN102360323A (zh) 一种网络服务器宕机自修复的方法及***
CN1213376C (zh) 用于被复制的服务器的协议
CN102521071B (zh) 一种基于私有云的虚拟机维护方法
CN102710763B (zh) 一种分布式缓存池化、分片及故障转移的方法及***
CN103729264A (zh) 一种Windows虚拟机***盘备份还原方法
CN102681871A (zh) 一种基于通信接口的固件升级***
CN104461744A (zh) 一种资源分配方法及装置
CN107844386A (zh) 一种数据备份、恢复方法及装置
CN106445733A (zh) 一种基于kvm虚拟化的无代理模式备份方法和***
CN102591668B (zh) 对弹性计算云***升级的装置、方法及***
CN111143128B (zh) 一种openstack云主机数据保护方法及***
CN110377314B (zh) 一种分布式存储***的***升级方法、装置、设备及介质
CN101739313A (zh) 一种连续数据保护和恢复方法
CN106201690A (zh) 应用运行控制方法及装置
CN104714863A (zh) 一种基于Linux操作***的***宕机后Raid卡日志完整保存的方法
CN103823708B (zh) 虚拟机读写请求处理的方法和装置
CN101183979A (zh) 一种配置备份的方法和装置
CN103077034B (zh) 混合虚拟化平台java应用迁移方法与***
CN106598774A (zh) 虚拟机的备份还原方法及装置
CN104216776A (zh) 一种基于blcr技术的安卓操作***快速启动方法
CN103442292A (zh) 用于处理智能电视软件错误的方法
CN103984309A (zh) 一种具有容灾功能的卷烟生产***及其容灾演练方法
CN110196749B (zh) 虚拟机的恢复方法及装置、存储介质及电子装置
CN1945521A (zh) 一种非同质存储设备的虚拟化***及方法
CN102880530A (zh) 终端和终端备份及恢复方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20120222