CN1550989A - 有计划的计算机问题诊断和解决及其自动报告和更新 - Google Patents

有计划的计算机问题诊断和解决及其自动报告和更新 Download PDF

Info

Publication number
CN1550989A
CN1550989A CNA200410043451XA CN200410043451A CN1550989A CN 1550989 A CN1550989 A CN 1550989A CN A200410043451X A CNA200410043451X A CN A200410043451XA CN 200410043451 A CN200410043451 A CN 200410043451A CN 1550989 A CN1550989 A CN 1550989A
Authority
CN
China
Prior art keywords
module
incident
computing system
computer
root
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200410043451XA
Other languages
English (en)
Other versions
CN100412802C (zh
Inventor
A
A·里茨
J·F·庞
ʷ
J·V·斯密史
M·R·弗尔丁
N·S·朱吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Adeia Technologies Inc
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of CN1550989A publication Critical patent/CN1550989A/zh
Application granted granted Critical
Publication of CN100412802C publication Critical patent/CN100412802C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B5/00Packaging individual articles in containers or receptacles, e.g. bags, sacks, boxes, cartons, cans, jars
    • B65B5/10Filling containers or receptacles progressively or in stages by introducing successive articles, or layers of articles
    • B65B5/101Filling containers or receptacles progressively or in stages by introducing successive articles, or layers of articles by gravity
    • B65B5/103Filling containers or receptacles progressively or in stages by introducing successive articles, or layers of articles by gravity for packaging pills or tablets
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0784Routing of error reports, e.g. with a specific transmission path or data flow
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B35/00Supplying, feeding, arranging or orientating articles to be packaged
    • B65B35/10Feeding, e.g. conveying, single articles
    • B65B35/12Feeding, e.g. conveying, single articles by gravity
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B65CONVEYING; PACKING; STORING; HANDLING THIN OR FILAMENTARY MATERIAL
    • B65BMACHINES, APPARATUS OR DEVICES FOR, OR METHODS OF, PACKAGING ARTICLES OR MATERIALS; UNPACKING
    • B65B61/00Auxiliary devices, not otherwise provided for, for operating on sheets, blanks, webs, binding material, containers or packages
    • B65B61/04Auxiliary devices, not otherwise provided for, for operating on sheets, blanks, webs, binding material, containers or packages for severing webs, or for separating joined packages
    • B65B61/06Auxiliary devices, not otherwise provided for, for operating on sheets, blanks, webs, binding material, containers or packages for severing webs, or for separating joined packages by cutting
    • B65B61/10Auxiliary devices, not otherwise provided for, for operating on sheets, blanks, webs, binding material, containers or packages for severing webs, or for separating joined packages by cutting using heated wires or cutters
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0781Error filtering or prioritizing based on a policy defined by the user or on a policy defined by a hardware/software module, e.g. according to a severity level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61JCONTAINERS SPECIALLY ADAPTED FOR MEDICAL OR PHARMACEUTICAL PURPOSES; DEVICES OR METHODS SPECIALLY ADAPTED FOR BRINGING PHARMACEUTICAL PRODUCTS INTO PARTICULAR PHYSICAL OR ADMINISTERING FORMS; DEVICES FOR ADMINISTERING FOOD OR MEDICINES ORALLY; BABY COMFORTERS; DEVICES FOR RECEIVING SPITTLE
    • A61J7/00Devices for administering medicines orally, e.g. spoons; Pill counting devices; Arrangements for time indication or reminder for taking medicine
    • A61J7/0076Medicament distribution means

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Mechanical Engineering (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Debugging And Monitoring (AREA)
  • Test And Diagnosis Of Digital Computers (AREA)

Abstract

在计算***中有计划地诊断问题的根源。在操作***中监视事件,并且事件至少一个子集被记录到日志文件。响应错误条件的检测激活诊断模块。诊断模块查询日志文件以关联有关问题的诊断的事件,并通过估算查询结果识别根源。一旦诊断了问题的根源,激活对应于该根源的解决模块,以便有计划地解决问题。能遵循策略规则激活诊断和解决模块。此外,记录、诊断和解决模块能按需要自动地更新。

Description

有计划的计算机问题诊断和解决及其自动报告和更新
                          发明的领域
本发明通常涉及软件,尤其涉及有计划地确定在操作个人计算机时发生的问题的根源,并针对那些问题向用户提供有计划的解决方法和/或丰富的诊断数据。
计算技术已经改变了我们工作和游戏方法。近数十年来,计算技术已经变得十分复杂。此复杂性使计算机***能完成各种各样的高复杂性功能及应用,从而稳定地改善计算***的利用。另一方面,那样的复杂性也使即使是最熟练的软件工程师也越来越难以开发那样的软件,使其在所有可能的环境下完全兼容和发挥作用。因而,即使先进的计算***常常遇到一些问题,如崩溃,***挂起,或性能退化。
现在要容易地诊断或判定在计算***中许多问题的根源是困难或不可能的。计算***的操作***通常包括一些有限的机制以基本错误消息的形式来识别问题的存在。然而,错误消息不向试图诊断和解决此问题根源或识别避免此问题的变通办法的人提供足够信息。
因为许多不同的应用和设备能在给定时刻在操作***上运行,且因为在那些组件之间的互操作性能导致复杂的问题,操作***常常难以确定,哪个应用,设备驱动程序或配置是所面临问题的根源。在各种互操作组件由不同的分销商提供时,互操作性尤其会导致复杂的问题。问题可能牵涉到操作***、应用、或设备驱动程序,但一旦问题暴露(如***崩溃),再提供在解决问题方面任何有用的信息已太晚了。当在操作***上执行的应用或设备驱动程序不遵循操作***按步就班的引导时,问题被恶化了。
此外,即使有足够的诊断问题的信息,用户还常需要作许多工作来诊断问题的根源并提供解决方法。用户作许多工作来诊断和解决计算***的问题的要求会降低用户在用计算***工作时的感受,尤其是在用户期望只有很少计算***问题时。
此外,许多用户没有足够经验来自己诊断及解决计算***的问题。因此,他们会采取他们认为正确的动作,但由于问题的不正确的诊断及解决,这些动作不能解决问题。那些动作实际上会更加恶化计算***的性能或稳定性。用户还能求助于他人来诊断和解决问题,从而导致用户或帮助解决问题的参与者的不必要的时间或经费上的开销。
为此,使操作***能更好判定计算***的问题的根源的***和方法是有益的。此外,提供用于处理所识别的问题的有计划的措施的***和方法也是有益的。
                          发明的概述
通过本发明的原理能克服以前技术有关的上述问题,该原则的目标是用于有计划地诊断计算***中问题的根源的***和方法。在一个实施例中,方法包括监视由操作***中合适的装置产生的事件,至少记录事件的子集到日志文件中,并检测一个或多个错误条件。作为响应激活诊断模块。诊断模块查询日志文件关于问题的诊断的事件,并通过估计查询的结果识别根源。一旦诊断到问题的根源,激活对应该根源的解决模块,有计划地解决问题。
用户定义的或默认的策略模块能控制是否和何时激活诊断模块和/或解决模决。因而计算***的问题能被诊断和解决,从而改善用户的感受,同时仍允许用户对一般的诊断及解决过程有某些程度的控制。在一个实施例中,至少某些查询结果被送到错误报告服务,后者返回多个更新之一到计算***。这些更新修改记录哪些事件、诊断模块如何诊断、和/或解决模块如何解决。
本发明的其他特征和优点将在下面的描述中说明,部分从描述中可见,或通过本发明的实践掌握。本发明的特征和优点能借助特别在附后的权利要求中指出的装置和组合认识到并获得。本发明的这些和其他特征能从下面描述和附后的权利要求完全明白,或能通过后面提出的本发明的实践掌握。
                          附图简介
为了描述能获得本发明的上述和其他优点和特征的方式,通过参考在附图中说明的特定实施例更具体地描述上面简述的本发明。理解这些附图仅画出本发明的典型实施例而不认为是对其范围的限制,本发明将通过使用附图用特别专一和详细方式加以描述,其中:
图1示出能实现本发明的特征的合适的计算***;
图2示出能用于实现本发明的特征的更具体的体系结构;
图3示出按本发明的原理在计算***中有计划地诊断及潜在地解决问题的方法的流程图。
                    较佳实施例的详细描述
本发明涉及在计算***中有计划地诊断问题的根源的机制。首先加入合适的测试设备以产生描述被诊断的任务的执行状态的事件。这些事件在操作***中被监视,且至少某些事件被记录到日志文件中。响应错误条件的检测,激活诊断模块。诊断模块查询日志文件关于问题的诊断的事件,并通过估计查询的结果识别根源。一旦诊断了问题的根源,激活对应该根源的解决模块,有计划地解决该问题。能遵循策略规则激活诊断及解决模块。此外,能由更新服务按需要自动地更新检测、诊断和解决模块。
转向附图,其中相同的参考号指的是相同的元件,本发明图示成在合适的计算环境中实现。下面的描述基于本发明的图示实施例,不认为限制不在此直接描述的本发明的其他实施例。
在下面描述中除非特别指出,参考由一个或多个计算机执行的过程及操作的符号表示来描述本发明。因此可以理解,有时称之为计算机可执行的那样的过程和操作包括由计算机的处理单元对以结构形式表示数据的电信号的处理。此处理转换了数据或将其保存在计算机的存储***的位置中,它以本专业行家众知的方式重新配置或更换计算机的操作。保存数据的数据结构是存储器的物理位置,它们具有由数据的格式确定的特定特性。然而,虽然本发明是在述背景中描述的,但这不意味着限制于此,因为本专业行家将会理解,后面描述的各种过程和操作也能在硬件中实施。
参考图1,本发明涉及监视软件应用和硬件的可靠性及可用性。软件应用驻留在计算机上,它可以具有多个不同计算机体系结构中的一个。为了说明,图1示出可用于这些设备的示例计算机体系结构的原理图。画出的体系结构仅是合适环境的一个例子,不是想要对本发明的使用或功能的范围提出任何限制。对于图1中示出的任何组件或其组合,该计算设备不认为有任何的依赖性或需求。
本发明可选用各种其他的通用或专用计算或通讯环境或配置。适用于本发明的众知的计算***、环境和配置的例子包括移动电话、口袋计算机、个人计算机、服务器、多处理***,基于微机的***、小型机,大型主机和包括任何上述***或设备的分布式计算环境,但不限于这些。
在其最基本的配置中,计算***100通常包括至少一个处理单元102和存储器104。存储器104能是易失的(如RAM)/非易失的(如ROM,闪存等),或者两者的某种组合。此最基本的配置在图1中由虚线106框出。
存储介质设备能具有另外的特征和功能。例如,它们能包括附加的存储器(可移动的及不可移动的),包括但不局限于PCMCIA卡、磁盘和光盘、和磁带。那些附加存储器在图1中由可移动存储器108和不可移动存储器110示出。计算机存储介质包括以任何方法或技术实现的易失和非易失,可移动和不可移动介质,用于存储如计算机可读指令、数据结构、程序模块、或其他数据那样的信息。存储器104、可移动存储器108、和不可移动存储器110均是计算机存储介质的例子。计算机存储介质包括RAM、ROM、EEPROM闪存、其他存储技术、CD-ROM、数字多功能盘,其他光存储器、盒式磁带、磁带、磁盘存储器,其他磁存储设备、和其他能用于存储所希望的信息并能由计算设备访问的介质,但不限于这些。
这里使用的术语“模块”或“组件”指的是在计算***上执行的软件对象或例行程序。这里描述的不同组件、模块,引擎和服务能作为在计算***上执行的对象或过程(如作为独立的线程)实现。虽然这里描述的***和方法最好以软件实现,以软硬件或硬件实现也是可能的并也是预期的。
计算设备100还能包括允许主机与其他设备通讯的通讯通道112。通讯通道112是通讯介质的例子。通讯介质通常体现在计算机可读指令,数据结构,程序模块,或其他以如载波或其他传输机制那样的调制数据信号形式的数据上,并包括任何信息提交介质。术语“调制数据信号”指的是具有一个或多个以编码信号中信息的方式设置或改变的特征的信号。例如,通讯介质包括如有线网络和直接线连结那样的有线介质,和如声音、无线电、红外和其他无线介质那样的无线介质,但不限于这些。这里使用的术语“计算机可读介质”包括存储介质和通讯介质两者。
计算设备100还具有如键盘,鼠标,输入笔,语音输入组件,接触输入设备等那样的输入组件114。输出组件116包括屏幕显示、扬声器、打印机等,以及驱动它们的演示模块(常称为“适配器”)。计算设备100具有电源供应118。所有这些组件是业内所众知的,不必在此多作讨论。
图2示出能用于实现本发明的特征的更具体的体系结构200。体系结构200包括与远程计算***236通讯的计算***201。然而,即使没有远程计算***236的帮助计算***201也能实现本发明的特征,但是没有下面描述的更新服务的特征。虽然不是必须,计算***201和236的每一个可以象上述对于计算***100描述的那样地构造。
图3示出按本发明的原理用于有计划地诊断和潜在地解决问题的方法的流程图300。因为方法300能在体系结构200的环境实现,将频繁地互相参考图2和3来描述它们。
在图3中,方法300包括监视在操作***中的事件的过程(过程301)。参考图2,被监视的事件由在这里一起称为“事件提供者262”的一系列操作***(OS)组件,驱动程序和服务262产生。事件提供者262将事件202通知记录器204。在一个实施例中,在任何给定时刻收集的数据量受限于当时现有的环境。因此,记录器204处理较少量事件。因而,任何给定的事件提供者不必对每个检测到的交互作用产生事件,而只能产生关系到问题根源的更有关的事件。例如,不需要每当盘驱动器写到扇区时产生事件。然而若盘驱动器未能响应读或写的命令,或试图写入禁写扇区时,应产生一事件。
事件提供者262的例子包括管理电源,即插即用(PnP)操作、存储管理、总线控制(如PCI)、和其他低层API(应用程序界面)的软件模块。其他操作***组件(或应用或驱动程序)也能向记录器204提出事件。其他操作***组件的例子包括网络模块、图象模块、音频模块、和打印模块。
通知记录器204的事件类型的例子包括用户请求、***调用、设备连接、通讯请求等。例如,一个事件可描述用户已请求将计算***201置于低功率或待机状态,和在用户请求不成功时帮助用户或支持工程师诊断或解决待机失败的后续事件。例如,待机失败可包括那个应用或驱动程序禁止该请求置于低功率状态。然而,可由操作***检测的任何其他事件能由事件提供者262向记录器204提供。
在计算***201(尤其是记录器204)监视事件(过程301)时,记录器204记录事件的至少一个子集到日志文件(过程302)。例如,事件追踪日志文件248表示那样日志文件的例子,记录器204配置成记录事件202的全部或一部分。可选地,记录器能配置成记录最可能有助于诊断问题的那些事件。记录器204还能通知诊断策略服务208关于这些事件。在某些实施例中,流向诊断策略服务208的事件的量远低于流向事件追踪日志文件248的事件的量。例如,记录器204在事务开始或终止时或在发生错误条件时简单地通知诊断策略服务208。
在记录监视的事件的至少一子集(过程302)的某点处,计算***201检测一个或多个错误条件(过程303)。参考图2,这能由诊断策略服务208完成。诊断策略服务208例如通过检测预定的单个错误条件,或通过检测已发生的错误条件的预定序列判断,何时发生实际的问题。
一旦检测到问题,计算***201完成一功能的、面向结果的步骤,来有计划地诊断由一个或多个错误条件证实的问题(步骤310)。这可包括用于完成此结果的任何对应过程。然而在图示实施例中,这包括从311到314的对应过程。
在实际上通过激活诊断模块完成有计划的诊断之前(过程311),计算***201可查询规则,以确定应该按该规则激活诊断模块(过程304)。规则能由所接收的用户输入指令设置,或多半是默认设置。因而,诊断策略服务208通过监视服务212间接地连接诊断模块220。
监视服务212应用策略来过滤,哪些事件被传播,直到激活用于判断根源的诊断模块220。何时希望过滤那样的事件的例子包括那样的企业环境,在那里信息技术(IT)经理或***管理员希望操作***不完成某些自动的根源判断和/或自动地问题解决过程。例如,IT经理希望得知问题的发生,但是没有自动的根源分析或不发生任何自动的解决。或IT经理希望有根源分析,但没有自动解决。
例如,计算***201在响应判断根源问题时可以采取的一个过程可以是自动安装更新的设备驱动程序。因为在某些情况,更新的设备驱动程序能引起不可预见的操作改变,企业的IT经理可输入216策略214,规定用户不能或无权更新设备驱动程序。IT经理能应用于监视服务212的策略的其他例子是不采取自动的问题解决步骤。这将允许用户或IT经理决定是否完成过程,而不是让计算***201自动地完成过程。
若其存储的政策允许,当由诊断政策服务208检测到一个或多个错误条件的特定组时,监视服务212激活218合适的一个诊断模块220(过程311)。另选地,合适的诊断模块能由诊断策略服务208或由事件提供者262之一直接激活(如在没有监视服务212的实施例中)。计算***201可包括多个诊断模块,每个用于诊断预定的错误条件或预定的错误条件序列的根源。
每个诊断模块在激活时被配置成查询和关联242相关的数据源,以诊断由一个或多个错误条件证实的问题(过程312),确定关于在此问题事件之前的哪些事件和/或状态的信息。例如,那样的相关数据源可包括事件追踪日志248、配置数据库252、如记录、***兼容性管理程序254、WMI提供程序256、和其他数据源及日志文件250。
根据特定的操作***实施,除了图中示出的源或代替它们,可以查询。其他日志文件250(如网络状态日志)和其他数据源。
***兼容性管理程序254是一个服务,它从不同的子***(如PCI总线子***、USB子***、和AGP子***)和***中其他总线驱动程序和驱动程序堆栈中接收有关已知硬件异常情况的状态和错误消息,这些异常情况需要设备特定的变通办法,以允许有问题的硬件正常地发挥作用。那样的变通办法能影响设备如何发挥功能,并从而不再成为最终用户感觉到的问题的根源。WMI提供程序揭示了有关***上硬件设备的诊断信息。
诊断模块估算查询的结果244(过程313),并响应该估算识别一个或多个错误条件的根源(过程314)。这可通过运行对应于错误条件的诊断例行程序来完成。至少某些诊断模块的每一个(以及至少某些解决模块224和诊断策略服务208)可具有***能力,以考虑更少地修改对应的诊断模块。尤其在一个实施例中,诊断模块220将查询结果与根源关联的表比较。这就完成了有计划地诊断由一个或多个错误条件证实的问题的步骤(步骤310)。
若查询结果244与识别的根源相关,激活的诊断模块220能激活合适的解决模块224(过程308),以完成对应于被识别的根源的识别的解决方法。对一个问题已识别的根源的已知存在的某个问题。将查询专门做成能诊断是否存在问题。监视服务212可再次考虑存储的策略,以判断是否按照规则激活解决模块(过程307)。因而,诊断模块首先通知222A监视服务212有关根源。若存储的策略允许,监视服务212激活222B合适的解决模块224。也可有多个解决模块224,每个与一个或多个根源的不同组相关。每个解决模块也可具有***能力,以考虑较少的所需修改。
每个解决模块224可配置错误解决例行程序,它们能遵循在监视服务212中的策略由合适的诊断模块激活。错误解决例行程序的例子包括搜索和/或安装新的设备驱动程序,或禁止或重新配置冲突的设备驱动程序或应用。在一个实施例中,至少某些例行程序自动地完成(即不需要用户输入)。然而,某些解决模块可利用通过激活228诊断用户界面模块232(如“故障检修导引”)获得的用户输入。可连接诊断用户界面模块232以提示用户输入附加信息,为合适的解决模块(或为整个计算***)使用,以求识别或解决问题。在一个或多个错误条件的根源在缺少进一步的用户帮助的情况不能有计划地识别和/或解决时,这特别有用。
在解决模块224和诊断用户界面232之间的交互由双向箭头228A表示。在诊断模块220和诊断用户界面232之间的交互由双向箭头228B表示。诊断用户界面232也能允许用户与事件产生器262交互228C以修改产生什么事件。
故障检修应用264提供一用户界面,允许用户直接向监视服务212报告问题,而不是等待监视策略服务208检测此问题。然后诊断模块220诊断所报告问题的根源,接着解决模块224解决该问题。
有时,修改记录什么事件,诊断模块如何诊断,或解决模块如何解决所识别的问题的根源是有益的。例如,也许诊断模块不能根据记录的事件诊断问题,或也许解决模块不作修改不能恰当地解决问题。因而,从诊断策略服务208、诊断模块220、解决模块224和/或诊断用户界面模块232来的信息能传递给过程日志230,用于向错误报告服务238报告(过程305)。例如,解决模块如箭头226所示地向过程日志230报告。
还能向用户显示过程日志230,允许用户看到检测到的问题、诊断的结果是什么、和如何解决被诊断到的问题。过程日志也能提供给远端,以允许技术支持部门看到有关事实,而不必依赖用户讲述有关事实。过程日志230也能送到的错误报告服务238,以协助形成有关在用户***通常发生那些问题的统计信息。
更新服务240可用来发送更新到计算***201的一个或多个模块,让计算机***201接收(过程306)。例如,更新服务240能用附加的事件或事件序列,更新记录器,以存储到事件追踪日志文件248,帮助解决由错误报告服务238,或由其它有关用户经历故障的信息源检测到的新问题的根源。更新服务240也能更新诊断策略服务208,以改变如何检测问题。更新服务240也能用于更新(改变现有模块,提供新的模块,或增加或修改***模块)一个或多个诊断模块220和解决模块224,以反映对特定问题确定的新的解决方法。在一个实施例中,更新服务240由分销商的计算***236操作,并通过因特网发送更新的计算***201的模块。另选地,第三方能提供定制改变或整个新模块以及配置信息。
若错误事件没有已知的与其相关的根源,诊断模块220将报告此信息到过程日志230,它转而发送错误报告234到错误报告服务238。
若分销商能够从由过程日志230发送的信息判定根源,根源相关的信息和对应的问题解决信息通过更新服务240被送到计算***201。若分销商不能判定根源,分销商能使用更新服务240,命令诊断策略服务204以存储附加的事件或状态信息到事件追踪日志文件248。解决模块224能类似地命令260记录器存储附加事件224,以保证达到合适的解决。当附加的信息在下次发生问题之后发送到错误报告服务238时,该附加信息使分销商能更好地识别问题的根源。
错误报告234能在诊断已知的根源之前被发送。早期报告错误允许更新服务240在试图诊断和解决之前更新要更新的诊断模块220和/或解决模块224。另选地,错误能在诊断之后而在解决之前报告234。在那种情况,更新服务240能更新专用于解决特定诊断的问题的特定解决模块。
可配置诊断策略服务208、诊断模块220、和解决模块224,以报告它们的过程到过程日志230(如检测到错误、诊断模块被激活、诊断模块采取某些步骤、根源被找到且就是它、根源不能判定、解决模块被激活、解决模块采取这些步骤、问题被解决,问题未解决等)。这就向分销商提供关于***是否正诊断问题和问题是否被解决的信息。此信息对分销商是有价值的,因为它可用于判断诊断模块220或解决模块224是否需要更新。信息对于分销商理解哪些问题对终端用户是最普遍的是有用的,从而允许分销商按此信息工作。例如,分销售能通过创建新的体系结构作出响应,以避免将来再发生该普遍的问题。
错误报告234甚至能在诊断已知根源之前发送。早期报告错误允许更新服务240在试图诊断及解决之前更新诊断模块220和/或解决模块224。另选地,错误能在诊断后但在解决前报告234。在此情况,更新服务240能更新专用于解决特定的诊断出的问题的特定的解决模块。
如上所述,能通过更新服务240更新的一个例子是用于解决模块224的新的问题解决方法。若已识别出特定类型的错误,但根源难以判定,更新能命令事件提供者或记录器存储更多的事件信息到事件追踪日志文件248。将允许诊断模块220发送更详细的住处到过程日志230,后者发送更详细的信息到错误报告服务。在判定根源和解决问题时,附加信息有时能帮助分销商的计算***236。接着,能下载新的诊断及解决模块以处理此问题。
因而已描述了遵循内部的策略约束有计划地诊断和解决问题的机制。此外,该机制在需要时自我更新,以便更好地诊断错误条件的根源,并解决此根源。

Claims (35)

1.在执行操作***的计算***中,一种用于有计划地诊断计算***中问题的根源的方法,其特征在于,所述方法包括:
在操作***中产生事件的过程;
将事件的至少一个子集记录到日志文件的过程;
检测一个或多个错误条件的过程;
响应检测一个或多个错误的过程激活诊断模块的过程,其中,诊断模块配置成在激活时做下列工作:
查询日志文件以便关联与由一个或多个错误条件证实的问题的诊断相关的事件的过程;
估算查询结果的过程;和
响应该估算识别该一个或多个错误条件的根源的过程。
2.如权利要求1所述的方法,其特征在于,在检测一个或多个错误条件的过程之后还包括:
查询规则,以判定诊断模块按这些规则应被激活的过程。
3.如权利要求2所述的方法,其特征在于。所述方法还包括:接收用户输入,以设置规则的过程。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:把查询结果的至少一个子集发送到错误报告服务的过程。
5.如权利要求4所述的方法,其特征在于,所述方法还包括:接收一个或多个更新的过程,其中,这些更新修改哪些事件被记录。
6.如权利要求5所述的方法,其特征在于,所述这些更新还更改诊断模块如何诊断。
7.如权利要求4所述的方法,其特征在于,所述方法还包括:接收一个或多个更新的过程,其中,这些更新更改诊断模块如何诊断。
8.如权利要求1所述的方法,其特征在于,所述方法还包括:
响应识别一个或多个错误条件的根源,激活解决模块的过程,解决模块配置成在激活时做下述工作:
解决一个或多个错误条件的根源的过程。
9.如权利要求8所述的方法,其特征在于,所述方法还包括在检测一个或多个错误条件过程之后的下述工作:
查询规则,以判定诊断模块按这些规则应被激活的过程。
10.如权利要求9所述的方法,其特征在于,所述方法还包括:接收用户输入,以设置规则的过程。
11.如权利要求8所述的方法,其特征在于,所述方法还包括:把查询结果的至少一个子集发送到错误报告服务的过程。
12.如权利要求11所述的方法,其特征在于,所述方法还包括:接收一个或多个更新的过程,其中,所述这些更新修改哪些事件被记录。
13.如权利要求12所述的方法,其特征在于,所述这些更新还更改诊断模块如何诊断。
14.如权利要求13所述的方法,其特征在于,所述这些更新还更改解决模块如何解决问题。
15.如权利要求11所述的方法,其特征在于,所述这些更新更改诊断模块如何诊断。
16.如权利要求15所述的方法,其特征在于,所述这些更新还更改解决模块如何解决问题。
17.如权利要求11所述的方法,其特征在于,所述这些更新更改解决模块如何解决问题。
18.如权利要求17所述的方法,其特征在于,所述这些更新还更改哪些事件被记录。
19.如权利要求4所述的方法,其特征在于,所述方法还包括:接收一个或多个更新的过程,其中,所述这些更新更改诊断模块如何诊断。
20.如权利要求1所述的方法,其特征在于,所述方法还包括:
判定一个或多个错误条件的根源不能有计划地解决的过程;和
连接用户界面模块,以提示用户输入由诊断或解决模块使用的附加信息,以便识别或解决问题的过程。
21.如权利要求1所述的方法,其特征在于,所述用户界面模块是故障检修导引。
22.一种在执行操作***的计算***中使用的计算机程序产品,其特征在于所述计算机程序产品用于实现在计算***中有计划地诊断问题的根源的方法,所述计算机程序产品包括其上面有计算机可执行指令的一个或多个计算机可读介质,所述指令在由计算***的一个或多个处理器执行时使得计算***完成:
在操作***中产生事件的过程;
把事件的至少一个子集记录到日志文件的过程;
检测一个或多个错误条件的过程;
响应检测一个或多个错误条件的过程激活诊断模块的过程,其中,所述诊断模块配置成在激活时做:
查询日志文件以关联与由一个或多个错误条件证实的问题的诊断相关的事件的过程;和
估算查询结果的过程;和
响应该估算识别一个或多个错误条件的根源的过程。
23.如权利要求22所述的计算机程序产品,其特征在于,所述一个或多个计算机可读介质是物理的存储介质。
24.如权利要求22所述的计算机程序产品,其特征在于,所述一个或多个计算机可读介质还在其上面有计算机可读指令,当由一个或多个处理器在执行时使得计算***完成:
把查询的结果的至少一个子集发送到错误报告服务的过程,和
接收一个或多个更新的过程,这些更新修改哪个事件被记录或更改诊断模块如何诊断。
25.如权利要求22所述的计算机程序产品,其特征在于,所述一个或多个计算机可读介质还在其上面有计算机可执行指令,在由一个或多个处理器执行时,使得计算***完成:
响应识别一个或多个错误条件的根源的过程激活解决模块的过程,该解决模块配置成在激活时解决一个或多个错误条件的根源。
26.如权利要求22所述的计算机程序产品,其特征在于,所述一个或多个计算机可读介质还在其上面有计算机可执行指令,在由一个或多个处理器执行时使得计算***完成:
把查询结果的至少一个子集发送到错误报告服务的过程;和
接收一个或多个更新的过程,所述这些更新修改哪些事件被记录,更改诊断模块如何诊断,或更改解决模块如何解决问题。
27.如权利要求21所述的计算机程序产品,其特征在于,所述一个或多个计算机可读介质还在其上面有计算机可执行指令,在由一个或多个处理器执行时使得计算***完成:
判定一个或多个错误条件的根源不能有计划地解决的过程,和
连接用户界面模块,以提示用户输入由解决模块使用的附加信息,以便识别或解决问题的过程。
28.在执行操作***的计算***中,一种用于有计划地诊断计算***中问题的根源的方法,该方法包括:
在操作***中产生事件的过程;
将事件的至少一个子集记录到日志文件的过程;
检测一个或多个错误条件的过程;和
有计划地诊断由一个或多个错误条件证实的问题的步骤。
29.如权利要求28所述的方法,其特征在于,所述有计划地诊断由一个或多个错误条件证实的问题的步骤包括:
响应检测一个或多个错误的过程激活诊断模块的过程,其中诊断模块配置成在激活时做:
查询日志文件以便关联与由一个或多个错误条件证实的问题的诊断相关的事件的过程;
估算查询结果的过程,和
响应该估算识别该一个或多个错误条件的根源的过程。
30.一种在其上面有计算机可执行指令的计算机可读介质,其特征在于,这些指令在由计算***的一个或多个处理器执行时,使得计算***在存储器中实例化下列内容:
配置成在日志文件中记录事件的事件记录器;
配置成在发生一个或多个错误条件时检测问题,并配置成在检测到问题的至少某些情况下使解决模块激活的问题检测模块;如
配置成查询日志文件,估算查询结果,并根据该估算诊断该问题的诊断模块。
31.如权利要求30所述的计算机可读介质,其特征在于,所述计算机可读介质介质还在其上面有计算机可执行指令,由一个或多个处理器执行时使得计算***进一步在存储器中实例化下面内容:
保存关于何时激活诊断模块的规则的监视模块,其中监视模块在规则允许时,响应检测问题的问题检测模块引起激活诊断模块。
32.如权利要求30所述的计算机可读介质,其特征在于,所述计算机可读介质还在其上面有计算机可执行指令,在由一个或多个处理器执行时使得计算***进一步在存储器中实例化下面内容:
配置成在激活时解决问题的解决模块,其中,诊断模块还配置成在诊断模块诊断该问题的至少某些情况下使解决模块激活。
33.如权利要求32所述的计算机可读介质,其特征在于,所述计算机可读介质还在其上面有计算机可执行指令,在由一个或多个处理器执行时使得计算***进一步在存储器中实例化下述内容:
保存关于何时激活解决模块的规则的监视模块,其中,监视模块在规则允许时响应诊断问题的诊断模块使解决模块激活。
34.一种在执行操作***并通过网络连接到错误报告服务的计算***中判定计算***的问题的根源的方法,其特征在于,所述方法包括:
在操作***中产生事件的过程;
将事件的至少一个子集记录到日志文件的过程;
检测一个或多个错误条件的过程,并作为响应进行:
查询日志文件以关联有关事件的过程;
把查询结果的至少一个子集发送到错误报告服务的过程,和
接收一个或多个更新的过程,其中,所述这些更新修改哪些事件被记录,采取哪些诊断步骤,或由该计算***的操作***采取或向终端用户推荐哪些解决步骤。
35.一种在执行操作***并通过网络连接到错误报告服务的计算***中使用的计算机程序产品,其特征在于,所述计算机程序产品用于实现判定在该计算***中问题的根源的方法,所述算机程序产品包括一个或多个在其上面有计算机可执行指令的计算机可读介质,在由该计算机***的一个或多个处理器执行时,使得该计算***完成:
在操作***中产生事件的过程;
将事件的至少一个子集记录到日志文件的过程;
检测一个或多个错误条件的过程,并作为响应进行:
查询日志文件以关联有关事件的过程;
把查询结果的至少一个子集发送到错误报告服务的过程;和
接收一个或多个更新的过程,其中,所述这些更新修改哪些事件被记录,采取哪些诊断步骤,或由该计算机采取哪些解决步骤。
CNB200410043451XA 2003-05-07 2004-04-30 有计划的计算机问题诊断和解决及其自动报告和更新 Expired - Lifetime CN100412802C (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US46877203P 2003-05-07 2003-05-07
US60/468,772 2003-05-07
US10/468,772 2003-05-07
US10/651,430 2003-08-30
US10/651,430 US7263632B2 (en) 2003-05-07 2003-08-30 Programmatic computer problem diagnosis and resolution and automated reporting and updating of the same

Publications (2)

Publication Number Publication Date
CN1550989A true CN1550989A (zh) 2004-12-01
CN100412802C CN100412802C (zh) 2008-08-20

Family

ID=33423772

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB200410043451XA Expired - Lifetime CN100412802C (zh) 2003-05-07 2004-04-30 有计划的计算机问题诊断和解决及其自动报告和更新

Country Status (5)

Country Link
US (1) US7263632B2 (zh)
EP (1) EP1515234A3 (zh)
JP (1) JP2004334869A (zh)
KR (1) KR101021394B1 (zh)
CN (1) CN100412802C (zh)

Cited By (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100373350C (zh) * 2005-03-21 2008-03-05 华为技术有限公司 故障告警上报管理方法
CN101438249A (zh) * 2006-05-07 2009-05-20 应用材料股份有限公司 用于错误诊断的多种错误特征
CN100592315C (zh) * 2008-08-29 2010-02-24 中国科学院软件研究所 一种xacml策略规则检测方法
CN101192192B (zh) * 2006-11-21 2010-08-18 华为技术有限公司 用于实时操作***的任务异常诊断方法及***
CN102129372A (zh) * 2010-03-01 2011-07-20 微软公司 通过事件相关来进行根本原因问题标识
CN102341788A (zh) * 2009-04-13 2012-02-01 索尼公司 计算设备的***维护
CN102799492A (zh) * 2011-04-18 2012-11-28 通用电气公司 用于在***中解决错误的***、方法和设备
CN103257920A (zh) * 2012-02-15 2013-08-21 空中客车运营简化股份公司 检测飞行器中要解决的异常的方法和***
CN103339608A (zh) * 2011-01-31 2013-10-02 汤姆逊许可公司 诊断信息日志记录
CN104346571A (zh) * 2013-07-23 2015-02-11 深圳市腾讯计算机***有限公司 安全漏洞管理方法、***及设备
CN104956331A (zh) * 2013-09-18 2015-09-30 株式会社日立制作所 管理计算机***的管理***及其管理方法
CN105518629A (zh) * 2013-08-19 2016-04-20 微软技术许可有限责任公司 云部署基础结构确认引擎
CN105786635A (zh) * 2016-03-01 2016-07-20 国网江苏省电力公司电力科学研究院 一种面向故障敏感点动态检测的复杂事件处理***及方法
CN105930329A (zh) * 2015-12-28 2016-09-07 ***股份有限公司 一种交易日志分析方法及装置
CN113330425A (zh) * 2019-01-26 2021-08-31 微软技术许可有限责任公司 计算设备的远程诊断

Families Citing this family (101)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2503791A1 (en) 2002-10-22 2004-05-06 Jason A. Sullivan Non-peripherals processing control module having improved heat dissipating properties
MXPA05004336A (es) 2002-10-22 2005-11-23 A Sullivan Jason Sistemas y metodos para proporcionar una unidad de procesamiento dinamicamente modular.
BR0315624A (pt) 2002-10-22 2005-08-23 Jason A Sullivan Sistema de processamento em computador personalizável robusto
WO2005008496A1 (en) * 2003-07-11 2005-01-27 Alex Zakonov Dynamic discovery algorithm
DE102004022624A1 (de) * 2004-05-07 2005-12-08 Robert Bosch Gmbh Verfahren zur Überwachung eines Systems
US7440933B2 (en) * 2004-06-18 2008-10-21 International Business Machines Corporation Method for facilitating problem resolution
DE102004047363A1 (de) * 2004-09-29 2006-03-30 Siemens Ag Prozessor bzw. Verfahren zum Betreiben eines Prozessors und/oder Betriebssystems im Fall einer Störung
US20060155595A1 (en) * 2005-01-13 2006-07-13 Microsoft Corporation Method and apparatus of managing supply chain exceptions
US20060177004A1 (en) * 2005-01-26 2006-08-10 N-Able Technologies International, Inc. Apparatus and method for monitoring network resources
US20060200548A1 (en) * 2005-03-02 2006-09-07 N-Able Technologies International, Inc. Automation engine and method for providing an abstraction layer
US10210529B2 (en) * 2005-04-04 2019-02-19 Mediaport Entertainment, Inc. Systems and methods for advertising on remote locations
US9189792B2 (en) * 2005-04-04 2015-11-17 Mediaport Entertainment, Inc. System and methods for monitoring devices, systems, users, and user activity at remote locations
US20060249576A1 (en) * 2005-04-04 2006-11-09 Mark Nakada Systems and methods for providing near real-time collection and reporting of data to third parties at remote locations
US20060224517A1 (en) * 2005-04-04 2006-10-05 Anirudha Shimpi Systems and methods for delivering digital content to remote locations
US7421625B2 (en) * 2005-05-26 2008-09-02 Microsoft Corporation Indicating data connection and status conditions
KR100731497B1 (ko) * 2005-05-31 2007-06-21 지멘스 오토모티브 주식회사 마이컴의 고장 코드 제어 장치 및 방법
DE102005061386A1 (de) * 2005-12-22 2007-06-28 Robert Bosch Gmbh Verfahren zur Fehlerdiagnose
JP2008134705A (ja) * 2006-11-27 2008-06-12 Hitachi Ltd データ処理方法及びデータ分析装置
US20080155305A1 (en) * 2006-12-22 2008-06-26 International Business Machines Corporation Collaborative problem determination based on graph visualization
JP2008271126A (ja) 2007-04-19 2008-11-06 Ntt Docomo Inc 移動端末装置、移動端末装置の診断方法
JP4582167B2 (ja) * 2007-04-27 2010-11-17 ダイキン工業株式会社 群管理装置及び群管理プログラム
US10223858B2 (en) 2007-07-05 2019-03-05 Mediaport Entertainment, Inc. Systems and methods monitoring devices, systems, users and user activity at remote locations
DE102007035584B4 (de) * 2007-07-30 2009-12-17 Texas Instruments Deutschland Gmbh Watchdog-Vorrichtung zur Überwachung eines elektronischen Systems
DE102007035586B4 (de) * 2007-07-30 2009-12-17 Texas Instruments Deutschland Gmbh Watchdog-Vorrichtung zur Überwachung eines elektronischen Systems
JP2009048291A (ja) * 2007-08-15 2009-03-05 Oki Electric Ind Co Ltd システム解析装置及びプログラム
KR101441506B1 (ko) * 2007-11-20 2014-09-18 삼성전자주식회사 휴대 단말기 진단 및 감시 방법과 시스템
US20090182707A1 (en) * 2008-01-10 2009-07-16 Dbix Corporation Database changeset management system and method
US8201029B2 (en) * 2008-01-31 2012-06-12 International Business Machines Corporation Method and apparatus for operating system event notification mechanism using file system interface
JP2009181441A (ja) * 2008-01-31 2009-08-13 Nomura Research Institute Ltd 自動修復システム及び方法
US8806037B1 (en) 2008-02-29 2014-08-12 Netapp, Inc. Remote support automation for a storage server
US7793141B1 (en) * 2008-05-15 2010-09-07 Bank Of America Corporation eCommerce outage customer notification
US20090320021A1 (en) * 2008-06-19 2009-12-24 Microsoft Corporation Diagnosis of application performance problems via analysis of thread dependencies
JP5237034B2 (ja) * 2008-09-30 2013-07-17 株式会社日立製作所 イベント情報取得外のit装置を対象とする根本原因解析方法、装置、プログラム。
US8086909B1 (en) * 2008-11-05 2011-12-27 Network Appliance, Inc. Automatic core file upload
US8069374B2 (en) * 2009-02-27 2011-11-29 Microsoft Corporation Fingerprinting event logs for system management troubleshooting
US20100229022A1 (en) * 2009-03-03 2010-09-09 Microsoft Corporation Common troubleshooting framework
US8464221B2 (en) * 2009-06-16 2013-06-11 Microsoft Corporation Visualization tool for system tracing infrastructure events
CN102143008A (zh) * 2010-01-29 2011-08-03 国际商业机器公司 用于数据中心的诊断故障事件的方法及装置
US8380729B2 (en) 2010-06-04 2013-02-19 International Business Machines Corporation Systems and methods for first data capture through generic message monitoring
US20110307746A1 (en) * 2010-06-07 2011-12-15 Sullivan Jason A Systems and Methods for Intelligent and Flexible Management and Monitoring of Computer Systems
US9891971B1 (en) * 2010-06-30 2018-02-13 EMC IP Holding Company LLC Automating the production of runbook workflows
US9009530B1 (en) * 2010-06-30 2015-04-14 Purdue Research Foundation Interactive, constraint-network prognostics and diagnostics to control errors and conflicts (IPDN)
US9294946B2 (en) * 2010-08-27 2016-03-22 Qualcomm Incorporated Adaptive automatic detail diagnostic log collection in a wireless communication system
US8850172B2 (en) 2010-11-15 2014-09-30 Microsoft Corporation Analyzing performance of computing devices in usage scenarios
US8499197B2 (en) 2010-11-15 2013-07-30 Microsoft Corporation Description language for identifying performance issues in event traces
US9189317B1 (en) * 2011-03-17 2015-11-17 Extreme Networks, Inc. Software sustaining system
US8600992B2 (en) 2011-08-17 2013-12-03 International Business Machines Corporation Coordinating problem resolution in complex systems using disparate information sources
US8868064B1 (en) * 2011-11-09 2014-10-21 Sprint Communications Company L.P. Mobile device metrics management
JP2013101548A (ja) * 2011-11-09 2013-05-23 Hitachi Systems Ltd コンピュータシステム及びリカバリ方法
US8977909B2 (en) * 2012-07-19 2015-03-10 Dell Products L.P. Large log file diagnostics system
US10162693B1 (en) 2012-10-18 2018-12-25 Sprint Communications Company L.P. Evaluation of mobile device state and performance metrics for diagnosis and troubleshooting of performance issues
US20140282426A1 (en) * 2013-03-12 2014-09-18 Microsoft Corporation Divide and conquer approach to scenario timeline activity attribution
KR101537680B1 (ko) * 2013-09-02 2015-07-17 엘에스산전 주식회사 보호 계전기의 이벤트 통신 장치
US9535780B2 (en) * 2013-11-18 2017-01-03 International Business Machines Corporation Varying logging depth based on user defined policies
US20150161123A1 (en) * 2013-12-09 2015-06-11 Microsoft Corporation Techniques to diagnose live services
US9678825B2 (en) * 2014-02-18 2017-06-13 International Business Machines Corporation Autonomous reconfiguration of a failed user action
WO2015187001A2 (en) * 2014-06-04 2015-12-10 Mimos Berhad System and method for managing resources failure using fast cause and effect analysis in a cloud computing system
US9946614B2 (en) 2014-12-16 2018-04-17 At&T Intellectual Property I, L.P. Methods, systems, and computer readable storage devices for managing faults in a virtual machine network
EP3059676B1 (en) * 2015-02-20 2019-09-11 Siemens Aktiengesellschaft A method and apparatus for analyzing the availability of a system, in particular of a safety critical system
US10650085B2 (en) 2015-03-26 2020-05-12 Microsoft Technology Licensing, Llc Providing interactive preview of content within communication
US10379702B2 (en) 2015-03-27 2019-08-13 Microsoft Technology Licensing, Llc Providing attachment control to manage attachments in conversation
WO2016190856A1 (en) * 2015-05-27 2016-12-01 Hewlett Packard Enterprise Development Lp Data validation
US10365962B2 (en) * 2015-11-16 2019-07-30 Pearson Education, Inc. Automated testing error assessment system
US10073753B2 (en) * 2016-02-14 2018-09-11 Dell Products, Lp System and method to assess information handling system health and resource utilization
US10176034B2 (en) * 2016-02-16 2019-01-08 International Business Machines Corporation Event relationship analysis in fault management
US10162698B2 (en) 2016-03-25 2018-12-25 Dropbox, Inc. System and method for automated issue remediation for information technology infrastructure
US10223145B1 (en) * 2016-06-21 2019-03-05 Amazon Technologies, Inc. System for impairment issues of distributed hosts
US10416982B1 (en) 2016-06-30 2019-09-17 EMC IP Holding Company LLC Automated analysis system and method
US10095504B1 (en) * 2016-06-30 2018-10-09 EMC IP Holding Company LLC Automated analysis system and method
KR102195640B1 (ko) 2016-08-18 2020-12-28 휴렛-팩커드 디벨롭먼트 컴퍼니, 엘.피. 화상 형성 장치의 네트워크 진단을 수행하는 호스트 장치 및 방법, 네트워크 진단이 수행되는 화상 형성 장치 및 이를 제어하는 방법
US10216622B2 (en) 2016-09-01 2019-02-26 International Business Machines Corporation Diagnostic analysis and symptom matching
WO2018061258A1 (ja) * 2016-09-29 2018-04-05 株式会社ディーアンドエムホールディングス 音響映像機器
US10241848B2 (en) 2016-09-30 2019-03-26 Microsoft Technology Licensing, Llc Personalized diagnostics, troubleshooting, recovery, and notification based on application state
US10394633B2 (en) 2016-09-30 2019-08-27 Microsoft Technology Licensing, Llc On-demand or dynamic diagnostic and recovery operations in conjunction with a support service
US10476768B2 (en) 2016-10-03 2019-11-12 Microsoft Technology Licensing, Llc Diagnostic and recovery signals for disconnected applications in hosted service environment
US10929363B2 (en) * 2016-11-11 2021-02-23 International Business Machines Corporation Assisted problem identification in a computing system
US11429473B2 (en) 2016-11-30 2022-08-30 Red Hat, Inc. Automated problem resolution
US10467083B2 (en) * 2017-06-08 2019-11-05 International Business Machines Corporation Event relationship analysis in fault management
US10565045B2 (en) * 2017-06-28 2020-02-18 Microsoft Technology Licensing, Llc Modularized collaborative performance issue diagnostic system
US10452465B2 (en) * 2017-09-08 2019-10-22 Oracle International Corporation Techniques for managing and analyzing log data
US10678630B2 (en) * 2017-12-15 2020-06-09 Wipro Limited Method and system for resolving error in open stack operating system
US11075925B2 (en) 2018-01-31 2021-07-27 EMC IP Holding Company LLC System and method to enable component inventory and compliance in the platform
US10769009B2 (en) * 2018-03-21 2020-09-08 International Business Machines Corporation Root cause analysis for correlated development and operations data
US10713110B2 (en) * 2018-03-27 2020-07-14 Accenture Global Solutions Limited Automated issue detection and resolution framework for enterprise resource planning
US10754708B2 (en) 2018-03-28 2020-08-25 EMC IP Holding Company LLC Orchestrator and console agnostic method to deploy infrastructure through self-describing deployment templates
US10693722B2 (en) 2018-03-28 2020-06-23 Dell Products L.P. Agentless method to bring solution and cluster awareness into infrastructure and support management portals
US11086738B2 (en) * 2018-04-24 2021-08-10 EMC IP Holding Company LLC System and method to automate solution level contextual support
US10795756B2 (en) 2018-04-24 2020-10-06 EMC IP Holding Company LLC System and method to predictively service and support the solution
US10970632B2 (en) * 2018-06-25 2021-04-06 Hcl Technologies Ltd Generating a score for a runbook or a script
US10769043B2 (en) * 2018-06-25 2020-09-08 Hcl Technologies Ltd. System and method for assisting user to resolve a hardware issue and a software issue
US11599422B2 (en) 2018-10-16 2023-03-07 EMC IP Holding Company LLC System and method for device independent backup in distributed system
US10824528B2 (en) 2018-11-27 2020-11-03 Capital One Services, Llc Techniques and system for optimization driven by dynamic resilience
US10282248B1 (en) 2018-11-27 2019-05-07 Capital One Services, Llc Technology system auto-recovery and optimality engine and techniques
CN113424115B (zh) * 2019-02-14 2024-06-18 三菱电机株式会社 控制***、可编程逻辑控制器、方法及记录介质
US10862761B2 (en) 2019-04-29 2020-12-08 EMC IP Holding Company LLC System and method for management of distributed systems
US11061800B2 (en) * 2019-05-31 2021-07-13 Microsoft Technology Licensing, Llc Object model based issue triage
US11301557B2 (en) 2019-07-19 2022-04-12 Dell Products L.P. System and method for data processing device management
US10686645B1 (en) 2019-10-09 2020-06-16 Capital One Services, Llc Scalable subscriptions for virtual collaborative workspaces
US10866872B1 (en) 2019-11-18 2020-12-15 Capital One Services, Llc Auto-recovery for software systems
US20210406112A1 (en) * 2020-06-29 2021-12-30 International Business Machines Corporation Anomaly classification in information technology environments
US11322976B1 (en) * 2021-02-17 2022-05-03 Sas Institute Inc. Diagnostic techniques for monitoring physical devices and resolving operational events

Family Cites Families (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6822553B1 (en) * 1985-10-16 2004-11-23 Ge Interlogix, Inc. Secure entry system with radio reprogramming
US5200958A (en) * 1990-09-28 1993-04-06 Xerox Corporation Method and apparatus for recording and diagnosing faults in an electronic reprographic printing system
US5245615A (en) * 1991-06-06 1993-09-14 International Business Machines Corporation Diagnostic system and interface for a personal computer
US5463768A (en) * 1994-03-17 1995-10-31 General Electric Company Method and system for analyzing error logs for diagnostics
JP2868114B2 (ja) * 1994-06-07 1999-03-10 三菱電機株式会社 監視診断機能付計算機
EP0690378A1 (en) * 1994-06-30 1996-01-03 Tandem Computers Incorporated Tool and method for diagnosing and correcting errors in a computer programm
US5495573A (en) * 1994-08-05 1996-02-27 Unisys Corporation Error logging system with clock rate translation
JPH08305595A (ja) * 1995-05-11 1996-11-22 Mitsubishi Electric Corp 情報処理装置の診断方法
US5884073A (en) * 1996-10-28 1999-03-16 Intel Corporation System and method for providing technical support of an electronic system through a web bios
US6247149B1 (en) * 1997-10-28 2001-06-12 Novell, Inc. Distributed diagnostic logging system
US6212653B1 (en) * 1998-02-18 2001-04-03 Telefonaktiebolaget Lm Ericsson (Publ) Logging of events for a state driven machine
JP3141856B2 (ja) * 1998-09-30 2001-03-07 日本電気株式会社 障害復旧補助方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体
US6550055B1 (en) * 1998-12-29 2003-04-15 Intel Corp. Method and apparatus for cheating an information report resulting from a diagnostic session
US6446136B1 (en) * 1998-12-31 2002-09-03 Computer Associates Think, Inc. System and method for dynamic correlation of events
US6467052B1 (en) * 1999-06-03 2002-10-15 Microsoft Corporation Method and apparatus for analyzing performance of data processing system
JP2001067417A (ja) * 1999-06-29 2001-03-16 General Electric Co <Ge> 利用者に医療診断システムのサービス・ワークフローを自動的にガイドする方法及び装置
CN1283029A (zh) * 1999-07-29 2001-02-07 神基科技股份有限公司 远端***诊断方法
US6615367B1 (en) * 1999-10-28 2003-09-02 General Electric Company Method and apparatus for diagnosing difficult to diagnose faults in a complex system
US7500143B2 (en) * 2000-05-05 2009-03-03 Computer Associates Think, Inc. Systems and methods for managing and analyzing faults in computer networks
JP2002049508A (ja) * 2000-05-29 2002-02-15 Mirae E Net Co Ltd インターネットを通したコンピュータシステム診断方法
US7043661B2 (en) * 2000-10-19 2006-05-09 Tti-Team Telecom International Ltd. Topology-based reasoning apparatus for root-cause analysis of network faults
JP3979000B2 (ja) * 2000-11-27 2007-09-19 株式会社日立製作所 ログ情報取得出力方法および該方法を実現するプログラムを記録した記録媒体
US6738933B2 (en) * 2001-05-09 2004-05-18 Mercury Interactive Corporation Root cause analysis of server system performance degradations
US7120685B2 (en) * 2001-06-26 2006-10-10 International Business Machines Corporation Method and apparatus for dynamic configurable logging of activities in a distributed computing system
US7065767B2 (en) * 2001-06-29 2006-06-20 Intel Corporation Managed hosting server auditing and change tracking
US6738832B2 (en) * 2001-06-29 2004-05-18 International Business Machines Corporation Methods and apparatus in a logging system for the adaptive logger replacement in order to receive pre-boot information
BR0210881A (pt) * 2001-07-06 2004-06-22 Computer Ass Think Inc Método para gerenciamento de componente de empreendimento, meio legìvel por computador, sistema para a determinação de uma causa de origem de um evento de empreendimento, método de prover e selecionar a partir de um conjunto de entradas de dado no exibidor, conjunto de interfaces de programa de aplicação e sistema para correlacionar eventos e determinar um evento de base
US7194445B2 (en) * 2002-09-20 2007-03-20 Lenovo (Singapore) Pte. Ltd. Adaptive problem determination and recovery in a computer system
US7516362B2 (en) * 2004-03-19 2009-04-07 Hewlett-Packard Development Company, L.P. Method and apparatus for automating the root cause analysis of system failures
US7398429B2 (en) * 2005-02-03 2008-07-08 Cisco Technology, Inc. System and method for tracing and logging for software module

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100373350C (zh) * 2005-03-21 2008-03-05 华为技术有限公司 故障告警上报管理方法
CN101438249A (zh) * 2006-05-07 2009-05-20 应用材料股份有限公司 用于错误诊断的多种错误特征
CN101192192B (zh) * 2006-11-21 2010-08-18 华为技术有限公司 用于实时操作***的任务异常诊断方法及***
CN100592315C (zh) * 2008-08-29 2010-02-24 中国科学院软件研究所 一种xacml策略规则检测方法
CN102341788A (zh) * 2009-04-13 2012-02-01 索尼公司 计算设备的***维护
CN102129372A (zh) * 2010-03-01 2011-07-20 微软公司 通过事件相关来进行根本原因问题标识
CN102129372B (zh) * 2010-03-01 2014-10-29 微软公司 通过事件相关来进行根本原因问题标识
CN103339608A (zh) * 2011-01-31 2013-10-02 汤姆逊许可公司 诊断信息日志记录
CN102799492A (zh) * 2011-04-18 2012-11-28 通用电气公司 用于在***中解决错误的***、方法和设备
CN102799492B (zh) * 2011-04-18 2018-02-09 通用电气公司 用于在***中解决错误的***、方法和设备
CN103257920B (zh) * 2012-02-15 2018-01-19 空中客车运营简化股份公司 检测飞行器中要解决的异常的方法和***
CN103257920A (zh) * 2012-02-15 2013-08-21 空中客车运营简化股份公司 检测飞行器中要解决的异常的方法和***
CN104346571A (zh) * 2013-07-23 2015-02-11 深圳市腾讯计算机***有限公司 安全漏洞管理方法、***及设备
CN104346571B (zh) * 2013-07-23 2019-03-15 深圳市腾讯计算机***有限公司 安全漏洞管理方法、***及设备
CN105518629A (zh) * 2013-08-19 2016-04-20 微软技术许可有限责任公司 云部署基础结构确认引擎
CN105518629B (zh) * 2013-08-19 2019-02-19 微软技术许可有限责任公司 云部署基础结构确认引擎
CN104956331A (zh) * 2013-09-18 2015-09-30 株式会社日立制作所 管理计算机***的管理***及其管理方法
CN105930329A (zh) * 2015-12-28 2016-09-07 ***股份有限公司 一种交易日志分析方法及装置
CN105786635A (zh) * 2016-03-01 2016-07-20 国网江苏省电力公司电力科学研究院 一种面向故障敏感点动态检测的复杂事件处理***及方法
CN105786635B (zh) * 2016-03-01 2018-10-12 国网江苏省电力公司电力科学研究院 一种面向故障敏感点动态检测的复杂事件处理***及方法
CN113330425A (zh) * 2019-01-26 2021-08-31 微软技术许可有限责任公司 计算设备的远程诊断

Also Published As

Publication number Publication date
KR101021394B1 (ko) 2011-03-14
CN100412802C (zh) 2008-08-20
JP2004334869A (ja) 2004-11-25
KR20040095682A (ko) 2004-11-15
US7263632B2 (en) 2007-08-28
EP1515234A2 (en) 2005-03-16
EP1515234A3 (en) 2007-08-08
US20040225381A1 (en) 2004-11-11

Similar Documents

Publication Publication Date Title
CN100412802C (zh) 有计划的计算机问题诊断和解决及其自动报告和更新
KR101201008B1 (ko) 컴퓨터 시스템 및 분산 애플리케이션의 모델 기반 관리
Maxion et al. A case study of ethernet anomalies in a distributed computing environment
US7606814B2 (en) Tracing a web request through a web server
US7664986B2 (en) System and method for determining fault isolation in an enterprise computing system
US6460151B1 (en) System and method for predicting storage device failures
US8225308B2 (en) Managing software lifecycle
US7080287B2 (en) First failure data capture
US7007200B2 (en) Error analysis fed from a knowledge base
US20040128583A1 (en) Method and system for monitoring, diagnosing, and correcting system problems
US20030177412A1 (en) Methods, apparatus and computer programs for monitoring and management of integrated data processing systems
CN1755644A (zh) 基于程序执行不稳定性状态为软件程序提供自定义产品支持的方法、***和设备
CN102165423A (zh) 选择性地使用缓解来评估存储器管理技术的有效性以减少错误
US7836448B1 (en) System and methods for task management
CN110807064A (zh) Rac分布式数据库集群***中的数据恢复装置
CN111522703A (zh) 监控访问请求的方法、设备和计算机程序产品
CN111258832B (zh) 一种接口参数校验方法、装置、设备及介质
US11768727B2 (en) Reducing over-reporting of serviceable events
US20190149622A1 (en) Application Resilience System and Method Thereof for Applications Deployed on Platform
US20050216490A1 (en) Automatic database diagnostic usage models
CN113741912A (zh) 模型管理***、方法、装置及设备
KR100860125B1 (ko) 모바일 애플리케이션의 원격 진단 방법 및 시스템
CN115529332B (zh) 一种用于车机中控的云车机***及远程访问方法
CN114884807B (zh) 链路日志生成方法、装置、物联网平台及存储介质
Forman et al. Automated end-to-end system diagnosis of networked printing services using model-based reasoning

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: ROVI TECHNOLOGIES CORPORATION

Free format text: FORMER OWNER: MICROSOFT CORP.

Effective date: 20150723

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20150723

Address after: California, USA

Patentee after: Rovi Technologies Corp.

Address before: Washington State

Patentee before: Microsoft Corp.

CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20080820