在如个人电脑***(PC)、终端机(TERMINAL)之类的数据处理***日益普及之际,支撑电脑***的作业***或套装软件日趋多元化;而数据处理***的周边产品更是五花八门,包括MPEG卡、VGA卡等附加卡,以及其他的周边资源。而这些硬件与软件在配合数据处理***的使用时,必需利用处理***的BIOS(BASIC INPUT OUTPUTSYSTEM)来进行通盘的管理。而这些周边设备是否能够顺利地在数据处理***中发挥作用,则常牵涉在BIOS中的设定是否正确无误。一旦BIOS中的设定出现错误,常会导致***无法正常运作。而以数据处理***普及状况而言,数据处理***的使用者多以应用为主,对硬件或软件相关问题的处理能力很有限;而类似在设定上的错误,虽然对专业人员而言仅是设定的更改即可更正错误,进而使***顺利动作,但是对使用者而言,此类设定问题,足以造成整个***无法作用,同时也造成了数据处理***普及的障碍。
电脑***的动作与管理,最重要的问题在于档案***(FILESYSTEM)的管理与设定、硬件的设定、软件及驱动程序的设定,以及***周边资源的设定。一旦这些管理及设定发生错误,最容易发生的就是死机情况的出现。而其他造成电脑***死机的原因,除了设定及管理发生的问题之外,更因为硬件上相关的因素发生错误而使得电脑***死机。例如:附加卡的设定(jumper)有误,或者是电源供应***的异常、散热***失去作用,使得中央处理单元的温度超过容许值、资源分配不均,使得某些总线数据流量过大,造成动作迟缓等均是发生错误的主要原因。
而网络的运用日趋普及,不论是区域网络或者是网际网络,皆提供了数据处理***经由网络的连接达成信息互通、联络及数据共享的功能。网络的运用,也就促进了网络服务产业的发展。经由网络连接的普及与数据传送迅速的特性,网络服务将可迅速地将新的数据传输至每一个网络的终端(NODE),甚至更进一步能够进入用户端(CLIENT)以进行数据的取用及修改;而在用户端方面,更得以经由网络的连接,随时取用网络服务的数据,或者是于发生问题时,经由网络连接至适当的网络服务中心或其他用户以寻求协助。
而伺服器(server)在电脑网络中,扮演了枢纽的角色,其功能动作正常与否,牵涉到整个网络***是否能正确动作。一旦伺服器发生功能异常情形,所造成的数据损失,难以计数。而网络是全天动作,若发生故障时无人及时处理,其所造成的损失难以弥补。而现今有许多电脑***全天运转,例如电子邮件伺服器、国际用电脑、气象电脑等,开机后即持续操作,因应于数据的输入或输出而进行数据处理工作,但其全天候运转的方式亦会出现在无人值班时发生故障的情形,而此种状况若未及时发现及解决,极可能一直无人发现,而导致数据的丢失,以及工作迟延,均会对使用电脑***的单位或企业造成损失,难以弥补。所以,研制一种能够于电脑发生异常状况时,自动察觉,并将相关***动作参数定时储存,以提供诊断时参考以及判断的根据;同时,并能自动进一步通知网络管理员或是远端的服务中心,以及时进行维修服务,以及尽早排除故障;而另一方面,最好的处理方式是:当电脑***发生故障时,能即时的自动连接上远端的数据处理***,由远端直接进行初步诊断,这样,即可在问题发生时,立即由远端来排除故障,而若问题属于较为重大的故障,即可直接利用***动作参数的提供,进行初步的诊断,这样,能有效地进行维修人员的派遣及备料,使维修工作亦更为顺利。
本发明的目的在于提供一种可更新数据处理***设定的具有检错处理功能的数据处理***。
本发明的另一目的在于提供一种利用网络连接,由远端进行数据处理***设定变更的具有检错处理功能的数据处理***。
本发明的再一目的在提供一种具备***自动检错功能的具有检错处理功能的数据处理***。
本发明的目的之四在于提供一种具有检测及诊断功能的具有检错处理功能的数据处理***,将***动作时的各项参数加以记录,以提供诊断时的依据。
本发明的之五在于提供一种利用网络连接,由远端进行记忆体内容更新的具有检错处理功能的数据处理***。
本发明的之六在于提供一种当***死机时,仍能连接上网络的具有检错处理功能的数据处理***。
本发明的目的之七在于提供一种当***死机时,自动以电话或呼叫器通知***管理员的具有检错处理功能的数据处理***。
本发明目的之八在于提供一种能自动检测故障,更进一步因应于故障的发生,自动将数据处理***与远端的数据处理***连接,以便由远端进行诊断的具有检错处理功能的数据处理***。
本发明的目的之九在于提供一种在数据***故障发生时,可自动通知一预先设定人员的具有检错处理功能的数据处理***。
为达到上述目的,本发明采取以下措施:
本发明的具有检错处理功能的数据处理***,包括:
一数据总线,用于传输数据;
一中央处理单元,电连接于数据总线,用以对数据进行处理及运算;
一记忆装置,电连接于数据总线,用以储存数据;
一数据输入装置,电连接于数据总线,用于输入数据;
一网络连接装置,通过数据处理***的一输出入接口与一网络***连接;
一数据输出装置,电连接于数据总线;
还包括:
一***监控装置及一储存有诊断程序的诊断控制装置;***监控装置因应于数据处理***的正常运作,产生***状态信号,送至诊断控制装置;诊断控制装置因应于一特定时间间隔内收到所述***状态信号的次数判断该数据处理***的运作状况。
所述的具有检错处理功能的数据处理***,其特征在于,所述诊断控制装置包括:
一输出入介面,电连接于所述中央处理单元;
一控制器,电连接于输出入介面;
控制器因应于该***处于不正常操作状态产生一诊断控制信号;
诊断控制装置使用一独立电源。
所述的具有检错处理功能的数据处理***,其特征在于,所述诊断控制装置还包括:
一诊断缓冲装置;
所述控制器分别电连接所述输出入介面及诊断缓冲装置。
结合附图及实施例对本发明进一步说明如下:
随着网络功能的普及,为通信信息建立了一个迅速传播的途径。而各机关与企业团体为了提高联络的效率,纷纷借由网络联络,以进行数据的流通。而因应于网际网络(INTERNET)的普及,电脑网络更彼此融合成一体,成为本世纪生活方式的最大突破。而在网络***中,伺服器扮演了一个关键的角色。伺服器的稳定与否,牵连到使用效率及可信度。若伺服器经常死机而无法修复,其所造成的损失无法估计,而运用网络所产生的效益也将因而被抵消。因此,建立一个稳定的网络环境是非常重要的。
一般的数据处理***,如个人电脑***,网络伺服器***等所使用的作业***包罗万象,包含DOS,NETWARE,SCO UNIX,M,WIN95等作业***,经由作业***来统筹管理整个数据处理***的资源分配与运作。而数据处理***在由基本输出入***(BIOS)完成对数据处理***的检测、测试及初始化后,即完成BIOS的开机阶段,随即将作业***载入并执行;在完成作业***的开机程序之后,即因应于相关的控制程序,载入所需的驱动程序及应用程序,完成***的开机过程。
本发明主要由三部分构成;
(a)数据处理***
(b)远端数据处理***
(c)诊断控制装置
其中,数据处理***设计成具有相关驱动程序、基本输出入***(BIOS)以及硬件***以执行本发明的检错处理功能,该数据处理***并具备与网络连接的功能;而远端数据处理***由执行相关的诊断功能,同时并具有与该数据处理***的通讯协定(PROTOCOL),以于必要时与该数据处理***通过网络构成通信途径与信号联络;而诊断控制装置包含相关的硬件设计以及用于控制相关检错处理功能的程序。
在本发明的实施例中,将以电脑***作为数据处理***。而电脑***除了一般个人电脑***之外,网络伺服器亦能运用本发明;当然,其他类似的数据处理***亦能运用本发明的***达到相同的功能。本发明的数据处理***中装设有***监控装置,***监控装置包含一于作业***下执行检错软件,如检错处理驱动程序等,该检错软件因应于不同的作业***将有与各作业***兼容的版本,其功能是用以检测该数据处理***的正常运作与否,并与诊断控制装置构成联络。而该***监控装置更可进一步包含一硬件检测装置,用以检测硬件运作时的相关参数,例如***运作的环境温度、总线的使用率、电源供应器的电压变动率、风扇的使用等。在***监控装置的实施例中,目前如宏基电脑公司(ACER INC)所发展出的宏基伺服器管理***(ACERSERVER MANAGER,ASM)已有充分的公开,其运用软件配合硬件检测装置,定时记录***相关的参数,如BIOS参数、I/O PORT状况、IRO分配、记忆体容量、中央处理器规格、ON BOARD DEVICE、档案***参数、总线设定、总线使用率、周边装置种类等,并将其储存于记忆体中,以维持记录最新的***运作状况及保持最新的运作数据:而在本发明中的***监控装置,除了具备如ASM的记录***参数功能之外,更具有检测数据处理***运作正常与否的功能,在一个较佳实施例中,其基本原理是使用一挂接在作业***下的检错程序来达到检测功能。在数据处理***的正常运作情形之下,***会定时发出中断信号以促使中央处理单元定时检查***相关的计数器设定是否成立,因应于计数器所设定的时间到期,中央处理单元将会执行相关的程序,然后再返回中断点继续执行原来的程序。该检错程序可利用设定一计时器(COUNTER),中央处理单元因应于该计时器的计数达到执行指挥***发出一代表***正常的***状态信号;***亦可利用作业***既有的其他相关的迟延功能(DELAY FUNCTION)来达到类似以一定间隔发出代表***运作正常的信号。反言之,当***发生动作异常情况时,该中央处理单元可能完全失去处理数据的能力,而停止动作,整个***就无法操作。对应于此类情形,明显地,计数器的计数或迟延功能即失去效应,***停止在该间隔中发出代表***正常信号的功能。因应于该信号的停止发出,即可判断***已进入不正常的操作状态。请参见图2(检错功能的流程图)。因应于相同的观念,仍有繁多的实施例来表示***的正常动作或异常动作,此为业界所习知。
在该电脑***的基本输出输入***(BIOS)方面,必需加入相关的程序,以执行有关于检错处理功能,此部分将在稍后详细说明。
另一方面,该数据处理***更具备有网络连接能力,其具有如数据机(MODEM)、网络卡(LAN CARD)等网络连接装置,以利用相对应的网络***与远端的端点构成信号连接,以构成数据传递的路径。
本发明的远端数据处理***,亦具有相关的网络连接装置,如上述数据机或网络卡等,甚至无线信号收发装置,以进行信号路径的建立与数据的传递。这种远端数据处理***并具有与该数据处理***进行信号联络的通信协定(PROTOCOL),以进行彼此间的数据交换及联络,并具备相关的诊断及驱动程序,以便于与该数据处理***连接时,执行诊断及判断功能。
本发明的诊断控制装置是一独立于该数据处理***运作的***,在一较佳实施例中,其包含一软件、一输出入介面以及一控制器,控制器可采用市面上现成的控制器,如飞利浦(PHILIPS)公司生产的87C625控制器或其他类似功能的控制器,亦可利用芯片设计公司专门设计的特殊用途芯片(ASIC),此方式亦为业界所普遍采用;而该输出入介面则可用TTL来完成。该软件用以控制该控制器的动作,以及该控制器与该数据处理***的信号通信协定,以及该控制器与其他***的通信协定,控制命令数据及信号的收发,该输出入介面作为与该数据处理***输出入介面使用。所有控制该控制器动作的软件,都储存在该控制器的只读记忆体(ROM)内,因此,该诊断控制装置为一独立于该数据处理***的作业***(OS)运作装置,其运作不受数据处理***的运作状况所影响。因此,利用该诊断控制装置,可于该数据处理***发生异常运作情形时,由该诊断控制装置作相关处置以解决问题。而为执行有关与该诊断控制装置沟通控制的功能以及检错,该数据处理***须载入相关的驱动程序,该驱动程序的载入可为如图1实施例流程所示,利用开机过程检视该诊断控制装置的存在与否而载入;反之,则可不载入,以免影响数据处理***的运作效率。为更进一步保证整个数据处理***的检错处理功能,可利用一独立于该数据处理***电源的独立电源对诊断控制装置供电。
该诊断控制装置于数据处理***工作正常时,固定接收来自该数据处理***用以代表该数据处理工作状态的***状态信号。一旦该***状态信号为代表该数据处理***处于异常工作状态,或是根本接收不到***状态信号,该诊断控制装置据此引发相关的检错处理程序,以诊断或解决该数据处理***所发生的故障;反之,当该***状态信号为代表该数据处理***处于正常工作状态时,该诊断控制装置因应于该***状信号的内容,保持在待命(STANDBY)状态,继续固定接收来自该数据处理***的***状态信号,而不影响该数据处理***的运作。本发明的一实施例的诊断控制装置的动作程序,请参见图3:该诊断控制装置因应于收到代表***工作正常的***状态信号,即设定计数器,同时因应于该计数器计数结束,检查是否再次收到***状态信号。若收到代表***工作正常的***状态信号,即如图所示再次设定计数器,否则,即进入步骤A所示的检错处理程序。
本发明的检错处理程序,谨以一较佳实施例A及一较佳实施例B作为说明,而其他相类似的处理方式为熟于本业者所能掌握。如图4所示,在实施例A中,诊断控制装置因应于该***工作不正常,即发出一***最高阶的中断信号,例如SMI(system managementinterrupt)至该***,利用此最高阶中断呼叫的发出,以中断该***目前的动作并且进入执行对应的SMM(system management mode)的处理程序,于一记忆单位树立代表***已进入不正常工作状态的旗标,并发出重开机命令控制该数据处理***重新开机。在实施例B中,该诊断控制装置直接于一记忆单元树立代表***已进入不正常工作状态的旗标,并发出重开机命令控制该数据处理***重新开机;其中与实施例A的不同点在于该检错处理程序将不涉及***动作。
如上述两个实施例中,皆于记忆单元树立旗标,此旗标的前提须为***重新开机后所能检视而不随数据处理***的重新开机而失去标记,因此,此记忆单元可位于***上的CMOS或非易失记忆体(NVRAM),亦可为该诊断控制装置本身的区域记忆体。而其相关的程序,则依赖于该诊断控制装置的软件所控制,同时配合***的驱动程序动作,以便协调。
该数据处理***的开机程序请参见图5。数据处理***开机后将为因应于驱动程序的控制,检测相视对应的记忆单位是否树立旗标:若旗标未树立,则该***将执行正常的开机程序;反之,该***将进入执行一诊断前置程序。
诊断前置程序在本实施例中,为***BIOS程序的一部分,***BIOS在开机过程因应于代表该***处于不正常工作状态的旗标的设立,进入诊断前置程序。
一般的电脑***欲利用网络与远端电脑***构成信号联络途径,必须在作业***载入之后才能进行相关程序的执行。但是,当***发生相关错误死机时,经常的情况是:连作业***程序都无法执行,更何况利用网络构成连接。因此,本发明的关键是相关的网络连接程序额外增设于诊断前置程序中,以便于该电脑***能在开机阶段经过相关程序后,完成网络的连接。诊断前置程序的功能在于使数据处理***能够于BIOS的开机阶段即能利用网络与远端的电脑***构成连接,同时,使该远端电脑***得以通过网络对该数据处理***进行控制与输入,此类功能类似于转向(REDIRECTION):将远端的输入作为数据处理***的输入,同时,将数据处理***的输出经由网络送至该远端电脑***。藉此,远端电脑***可通过网络存取该数据处理***的相关数据,并由该相关数据的取得,判断该数据处理***的故障情形以及其可修护状况。如果仅是相关的设定发生错误,即由网络上进行更改,使其成正确参数;反之,若是其他错误及故障原因,即可由该数据处理***相关参数的判断,可预先有所了解而进行相关的派工及备料。经由远端电脑***取得如前所述的***监控装置所记录储存在***CMOS或NVRAM,或是该诊断控制装置的区域记忆体(LOCALMEMORY)该数据处理***在死机前的相关运作参数,该远端服务中心的电脑***将能做相关的诊断及判断,而达到提高维修效率的目的。
诊断前置程序的实施例,请参见图6。首先,将相关输出入接口及网络连接装置初始化后,发出连接信号,即将相关的电话号码及信号数据包送出,以便与网络端点构成连接;接着将数据处理***的输入转为由该远端电脑***输入,并因应于该远端电脑***的控制,将输出亦送至远端;最后,由该远端电脑***经由相关参数的取得进行诊断,诊断处理完毕即将旗标清除,随即发出重开机命令,控制该数据处理***重新开机。
另一个实施例请参见图7。在此实施例中,因应于该数据处理***处于不正常工作状态,诊断控制装置经由改变数据处理装***与网络连接装置的连接途径,以便于获取一安全可靠的数据传送途径,增进***诊断及修复的可靠度。在本发明的实施例中,该诊断控制装置将该数据处理***原来通过整个输入装置(super I/O)与输出入接口的信号路径加以抑能,并将该数据处理***通过该诊断控制装置与该输出入接口连接的信号路径加以致能;而在诊断前置程序中,则控制该数据处理***在诊断过程中,经由此路径进行输出入工作,待诊断结束后,再恢复原有的信号连接路径。在本实施例中,亦可将此二步骤结合于诊断前置程序中一并执行。
在完成诊断以及清除旗标的工作后,利用重新开机的命令促使***重新开机,如图5所示,***重新开机后,会再次检查旗标是否被设立,而因应现今旗标被清除,***随即进入正常开机的程序,顺利的完成诊断工作。反之,若诊断工作无法由远端直接完成,远端的服务中心,将可利用***死机前的运作参数判断该***的故障状况,而派遗适当的人员及材料进行维修。
运用本发明的另一方式,则是该诊断控制装置因应于该数据处理***发生不正常工作状态,利用电话网络发出一呼叫器号码,以通知***管理者***发生故障,以便于及时完成检视及修护工作。
应用本发明的数据处理***,为因应于该数据处理***欲结束工作而离开工作环境,此将会造成诊断控制装置判断***进入不正常工作状态,而促使***进入一连串的诊断程序。因此,***在收到使用者发出离开作业环境的命令,必需先发出一离开命令至该诊断控制装置,以告知***即将进入关机状态。该诊断控制装置将会因应于此离开命令不进行相关的诊断程序。进而,该数据处理***即进入关机程序,进而离开作业***。相关流程请参见图8。
如图9所示,其为本发明的第一实施例示意图。其中数据处理***10O,设有具备诊断功能的输出输入***(BIOS)106、驱动程序108、CMOS102、数据机114以及诊断控制装置120。该数据处理***利用***监控制装置104因应于***正常工作发出***状态信号至诊断控制装置120,同时,***监控装置104并定时将***参数更新,并储存至CMOS102中。当数据处理***100发生故障,诊断控制装置120发出一诊断控制信号并于CMOS102树立旗标,并发出重开机命令,控制该数据处理***100重新开机,进入输出输入***(BIOS)106的诊断前置程序,通过输出入控制器110,由输出入接口112经由数据机114与远端电脑***140的数据机142构成连接,并进行诊断。诊断完成之后,即断线并清除CMOS102中的旗标,并重新开机,完成诊断工作。
如图10所示,其说明了本发明的第二实施例。图10中多了一个利用诊断控制装置120的控制器124控制的缓冲装置115,该缓冲装置可如型号为74LS244的缓冲器,其具有一致能控制端,用以控制其如开关动作,控制器124即利用控制该控制端来完成信号路径的改变。因此,利用控制器124的控制,可改变网络的连接途径。如图11所示,其为正常信号连接途径的示意图。该诊断控制装置120通过输出入介面122与***连接,当***发生不正常工作状态时,控制器124即控制该缓冲装置115成为图12所示的路径,通过诊断缓冲装置126与该诊断控制装置120连接,完成新的信号连接路径。
图13为本发明的第二实施例的诊断控制装置的电路图。根据本发明的原理可具有多样变化的实施方式,为熟悉本业者所熟知,在此谨作为例示而不欲对专利保护范围有所限制。