CN1157960C - 电信平台***及其方法 - Google Patents
电信平台***及其方法 Download PDFInfo
- Publication number
- CN1157960C CN1157960C CNB988121077A CN98812107A CN1157960C CN 1157960 C CN1157960 C CN 1157960C CN B988121077 A CNB988121077 A CN B988121077A CN 98812107 A CN98812107 A CN 98812107A CN 1157960 C CN1157960 C CN 1157960C
- Authority
- CN
- China
- Prior art keywords
- node
- platform
- state
- service
- proposed
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
- H04L41/0806—Configuration setting for initial configuration or provisioning, e.g. plug-and-play
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L41/00—Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
- H04L41/08—Configuration management of networks or network elements
- H04L41/0803—Configuration setting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0823—Errors, e.g. transmission errors
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04Q—SELECTING
- H04Q3/00—Selecting arrangements
- H04Q3/0016—Arrangements providing connection between exchanges
- H04Q3/0062—Provisions for network management
- H04Q3/0095—Specification, development or application of network management software, e.g. software re-use
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/04—Processing captured monitoring data, e.g. for logfile generation
- H04L43/045—Processing captured monitoring data, e.g. for logfile generation for graphical visualisation of monitoring data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
- H04L43/062—Generation of reports related to network traffic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/06—Generation of reports
- H04L43/067—Generation of reports using time frame reporting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0811—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking connectivity
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/08—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
- H04L43/0805—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability
- H04L43/0817—Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters by checking availability by checking functioning
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/10—Active monitoring, e.g. heartbeat, ping or trace-route
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L43/00—Arrangements for monitoring or testing data switching networks
- H04L43/16—Threshold monitoring
Landscapes
- Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Environmental & Geological Engineering (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
- Computer And Data Communications (AREA)
- Exchange Systems With Centralized Control (AREA)
Abstract
提供了一个方法,用于在执行电信功能的应用程序和运行在一个站点的至少一个节点上、并且用于支撑应用程序的一个操作***之间提供一个软件接口,并且进一步形成在应用程序和一个电信网络之间的一个接口。这个方法包括提供可以用于从服务中删除节点,可以将节点恢复到服务中,可以从服务中删除应用,可以将应用恢复到服务中的一个网络平台管理者,提供可以用于监视节点和恢复发生故障的节点的一个网络***完整性管理者,提供可以用于与连接到这个电信平台的一个主机进行交互通信的一个配置管理者,提供可以用于为一个节点提供管理功能的一个节点平台管理者,提供可以用于根据所述节点平台管理者的指令来启动和停止进程的一个服务管理者,和提供可以用于监视节点间链路的一个节点***完整性管理者。
Description
技术领域
本发明一般涉及电信领域。更特别地,本发明涉及一个电信平台***及其方法。
发明内容
在本发明的一个方面,一个电信平台形成在执行电信功能的应用程序和在支持这些应用程序的一站点的至少一个节点上运行的一个操作***之间的一个接口,并且进一步形成在应用程序和一个电信网络之间的一个接口。电信平台包括可以提供节点间配置,监视和管理功能的网络管理进程,可以提供节点初始化、节点配置、监视和管理功能的节点管理进程,可以对预定事件作出响应,提供初始化、终结和任务的分配的事件进程,可以为开发应用程序提供多个编程工具库的公共进程,可以提供处理功能的消息的通信进程,和可以提供面向对象的一个分布式数据库的分布对象进程。
在本发明的另一个方面,提供了一个方法,用于在执行电信功能的应用程序和在支持这些应用程序的一站点的至少一个节点上运行的一个操作***之间提供一个软件接口,并且进一步形成在应用程序和一个电信网络之间的一个接口。这个方法包括提供可以提供节点间配置,监视和管理功能的网络管理进程,提供可以提供节点初始化、节点配置、监视和管理功能的节点管理进程,提供可以对预定事件作出响应,提供初始化、终结和任务的分配的事件进程,提供可以为开发应用程序提供多个编程工具库的公共进程,提供可以提供处理功能的消息的通信进程,和提供可以提供面向对象的一个分布式数据库的分布对象进程。
在本发明的另一个方面,提供了一个方法,用于在执行电信功能的应用程序和在支持这些应用程序的一站点的至少一个节点上运行的一个操作***之间提供一个软件接口,并且进一步形成在应用程序和一个电信网络之间的一个接口。这个方法包括提供可以用于从服务中删除节点、将节点恢复到服务、从服务中删除应用和将应用恢复到服务中的一个网络平台管理者,提供可以用于监视节点和使发生故障的节点进行恢复的一个网络***完整性管理者,提供可以用于与连接到这个电信平台的一个主机进行接口通信的一个配置管理者,提供可以用于为一个节点提供管理功能的一个节点平台管理者,提供可以用于根据节点平台管理者的指令开始和停止处理的一个服务管理者,和提供可以用于节点间链路的一个节点***完整性管理者。
附图说明
为了更好地理解本发明,可以参考附图,其中:
图1是根据本发明的一个实施方式的电信平台结构层的一个简化框图;
图2是根据本发明的一个实施方式的,电信平台概念部件的一个简化框图;
图3是根据本发明的一个实施方式,电信平台的概念部件和其关系的一个框图;
图4是根据本发明的一个实施方式,电信平台的逻辑划分的一个简化框图;
图5是根据本发明的一个实施方式,电信平台服务和它们相关性的一个简化框图;
图6是根据本发明的一个实施方式,电信平台的物理划分的一个简化框图;
图7A是根据本发明的一个实施方式,NetPM的测试流的一个框图;
图7B是根据本发明的一个实施方式,NetPM的时间同步流的一个框图;
图7C显示了根据本发明的一个实施方式,在网络管理服务和节点管理服务之间故障监测和交互的一个框图;
图7D显示了根据本发明的一个实施方式,在核心服务之间的交互作用的一个框图;
图8是根据本发明的一个实施方式,电信平台节点的一个状态转移图;
图9A是根据本发明的一个实施方式,节点启动进程的一个简化框图;
图9B是根据本发明的一个实施方式,节点初始化进程的一个消息流图;
图9C是根据本发明的一个实施方式,节点初始化进程的一个消息流图;
图9D是根据本发明的一个实施方式,节点初始化进程的一个消息流图;
图10是根据本发明的一个实施方式,服务管理接口协议的一个消息流图;
图11是根据本发明的一个实施方式,事件管理者使用的一个简化框图;
图12是根据本发明的一个实施方式,一个简化的信息和问题报告(IPR)流图;
图13是根据本发明的一个实施方式,一个简化的IPR处理流图;
图14是根据本发明的一个实施方式,一个示例性的IPR视图的、图形化用户界面;
图15是根据本发明的一个实施方式,数据收集的一个简化框图;
图16是根据本发明的一个实施方式,数据收集子***的一个简化框图;
图17是根据本发明的一个实施方式,阈值计数器数据通信路径的一个简化框图;
图18是根据本发明的一个实施方式,阈值计数器子***的一个简化框图;
图19是根据本发明的一个实施方式,消息处理子***的一个简化框图;
图20是根据本发明的一个实施方式,消息处理测试的一个简化框图;
图21是根据本发明的一个实施方式,分布式对象消息环境的一个简化框图;
图22是根据本发明的一个实施方式,内部跟踪和追踪对象关系的一个简化框图;
图23是根据本发明的一个实施方式,字典管理***的一个简化框图;
图24是根据本发明的一个实施方式,电信平台的一个硬件表示的一个简化框图;
图25是根据本发明的一个实施方式,电信平台的软件表示的一个简化框图;
图26是根据本发明的一个实施方式,电信平台的软件与硬件的动态匹配的一个简化框图。
具体实施方式
本发明的电信平台(TP)10是被设计成支持开发和执行分布式、可扩缩的、能够抗故障的电信应用的一个软件***12。电信平台10提供了一套独特的、用于在一个计算机环境例如UNIX下进行开发的工具。这些工具不仅包括电信平台开发和实时运行包所提供的接口,库和可执行代码的集合,并且还包括设计和管理分布式、可扩缩和抗故障应用所需要的一套概念部件。
如图1所显示的,电信平台10包括3个不同的软件层次14-16。层#1是一个电信平台应用编程接口(API)层14;层#2是一个电信平台服务层15;和#3是一个***接口层16。电信平台API层14为访问电信平台服务层15提供了通信方法,这包括电信中间件服务。电信平台服务层15是为例如基于UNIX的电信***提供最普遍需要的中间件服务的软件层。***接口层16包括操作***(OS)API和网络链路。***接口层16定义了进程和线程管理,存储器管理,定时器,文件***,通信,硬件装置的接口,和其它***部件的功能。电信平台10允许高层客户应用12与操作***和网络分离。通过使用电信平台10,开发人员可以编写应用程序,而不必掌握那些代表应用执行任务的其支持服务的复杂性,例如操作***和网络。
图2是与电信平台10相关的概念部件的一个框图。最小的概念部件是一个可配置部件(CE)30。一个可配置部件30被电信平台10定义为可以被电信平台10管理的、一个UNIX可执行程序的一个或者多个拷贝。例如,一个可配置部件可以是一个链路进程,数据库,图形化用户界面,定时进程,查询进程,错误处理进程等等。可配置部件30是应用程序的基本构建模块。电信平台10给应用程序开发人员所提供最基本服务是那些产生、配置和监视可配置部件30的服务。可配置部件30可以被配置成从节点初始化期间的某特定点开始。UNIX环境下可执行的、可配置部件表示可以允许多次,以支持可扩展性或者冗余性。提供足够服务所需要的、可配置部件的实例数目可以被配置,并且还可以配置在一个进程故障的事件中,这个实例是否应被电信平台10自动地重新启动。
一个可配置部件的可配置属性包括运行级别,这是一个可配置部件开始运行时的运行级别。运行级别包括PRE_MIN,OS_MIN,IN_SVC,和POST_IN_SVC。PRE_MIN运行级别规定了在引导期间,可配置部件可以被一个服务管理子***自动地产生。PRE_MIN可配置部件不被平台管理者子***监视。OS_MIN规定了当节点转移到OS_MIN时,可配置部件将被产生。IN_SVC规定了当节点转移到IN_SVC时,可配置部件将被产生。POST_IN_SVC规定了当节点转移到POST_IN_SVC状态时,可配置部件将被产生。另一个可配置属性是实例的数目NumberOfInstances,它规定了多少个可执行的拷贝可以被运行。InServiceThreshold是规定需要运行多少个不经NumberOfInstances来使能可配置部件的状态的一个可配置属性。如果实例的数目在这个阈值以下,将删除整个可配置部件或者可配置部件的所有实例。可配置部件的另一个属性是规定心跳消息被发送到一个可配置部件的时刻表的HeartbeatSchedule。每一个可配置部件也可以有一个AuditSchedule,它规定了审计消息被发送到可配置部件的时刻表。
一个可配置部件集合(CESet)26被电信平台10定义为被设计成可以一起放置在一个或者多个节点24的一组可配置部件。一个可配置部件集合是一个分布式部件。电信平台10可能不直接管理可配置部件集合26,但是支持对它们的产生和部署工作。可配置部件集合26可以被看作是一个应用28的可分布式和/或者可复制部件。
一个应用28被定义为完全定义了一个分布式程序的所有可配置部件30的一组可配置部件集合26。电信平台10提供了软件来对一个站点20内的应用28进行管理。从定义它们的分布式部件的角度,来定义应用的配置允许独立地定义一个分布式应用软件,而与它们所运行的硬件无关。在时间的某一点上,一个应用的可配置部件集合将被部署到一个站点20的节点24。当出现这个情形时,将根据用于支持每一个可配置部件集合的节点数目来决定应用28的可扩展性和抗故障性。
一个节点24被定义为其上运行了电信平台10的一个支撑操作***的一个实例。电信平台10提供了管理节点24上进程的软件。节点24可以是能够抗故障的或者不能够抗故障的、单或者多处理器。电信平台10运行操作***的服务,并且一般的情形下,不知道运行它的硬件。电信平台仅需要非常少的、关于一个节点24的配置信息。通过提供节点的名字和唯一的设备标识,节点就被配置到***中。
节点24具有被电信平台所支持的、描述在电信平台内部启动可配置部件顺序的操作状态。这个操作状态包括HALTED,PRE_MIN,OS_MIN,IN_SVC,和POST_IN_SVC。HALTED节点状态指示节点的操作***已经被关闭。PRE_MIN状态被用于启动需要在启动OS_MIN状态中的可配置部件以前被启动的可配置部件。电信平台首先启动被配置成在这个节点的PRE_MIN中运行的所有可配置部件,然后立即开始运行被配置成在OS_MIN状态中运行的可配置部件。被配置成在PRE_MIN中运行的可配置部件不直接影响这个节点的状态。OS_MIN节点状态协调被配置成在OS_MIN运行级别运行的、将被启动来将这个节点带入OS_MIN状态的所有可配置部件。在这个节点转移到OS_MIN状态以前,为OS_MIN节点状态而配置的所有可配置部件实现它们的可配置运行级转移状态。一旦已经实现了OS_MIN节点状态,如果任何可配置部件将其状态改变到其运行级转移状态以下,电信平台将这个节点的状态降低到HALTED节点状态。一个被关闭的节点可以自动地恢复。IN_SRV节点状态协调为IN_SRV运行级配置的可配置部件。在这个节点转移到IN_SRV状态以前,为IN_SRV节点状态而配置的所有可配置部件实现其可配置运行级别的转移状态。一旦已经实现IN_SRV节点状态,如果任何可配置部件将其状态改变到其运行级别转移状态以下,电信平台将这个节点的状态降低到OS_MIN节点状态。如果这个节点的降级不是由人工发起的,就可以进行一个节点的自动恢复。POST_IN_SRV节点状态被用于对在一个节点已经转移到IN_SRV状态以后就必须立即被启动的可配置部件进行配置。一旦一个节点已经实现了IN_SRV状态,电信平台将产生每一个POST_IN_SRV可配置部件。POST_IN_SRV可配置部件的状态改变不影响节点状态,并且可以重复地启动和停止POST_IN_SRV可配置部件状态的改变。停止一个POST_IN_SRV可配置部件的进程不促使这个节点降级到一个较低的节点状态。
一个站点20被电信平台定义为分布式应用可以在其中进行部署的一组节点。电信平台提供了可以管理一个站点20内部的节点24的、称作平台管理者的一个电信平台应用程序。一个站点可以由至少一个节点组成。在多节点的站点中,平台管理者应用可以在两个节点中作为一个激活的/备份分布式应用来进行运行。在单节点站点中,平台管理者应用与用户所定义的应用一起在这单个节点上进行运行,但是其运行没有一个备份节点所提供的处理故障的能力。平台管理者提供了对一个站点的管理。
一个处理器服务组(PSG)22被定义为作为冗余而部署的一特定可配置部件集合26的一组节点。电信平台10提供了软件应用来对一个应用内的处理器服务组进行管理。处理器服务组通过允许电信平台用户标识为了提供一个足够的服务级别而需要在其上运行一个可配置部件集合的节点的数目,来支持冗余备份。当节点状态或者在节点上运行的可配置部件集合改变时,电信平台10证实维持了合适的服务级别,或者它根据配置来改变应用状态。
图3是显示采用了被映射到硬件部件的、电信平台10的概念部件的一个***40设计的一个图。
就硬件结构来说,一个节点是在一个网络内部(例如以太网内部)、能够用作一个客户端或者一个服务器的一个计算机处理器。每一个节点在其上均运行了操作***的一单个实例。在一个节点内部的处理器不能够相互独立地进行运行,因为它们与操作***相关。在一个站点内的每一个节点可以被分类为一个平台管理者或者一个应用节点。一个站点可以包括连接到一个主机的一个节点或者一组节点。平台管理者节点具有一个冗余的合作设备。平台管理者节点和其合作设备可以工作于一个激活/备份模式或者一个负载分担的模式。
***40有8个节点,***40包括两个平台管理者节点(激活的平台管理者节点42和备用的平台管理者节点43),和6个应用节点44-49。在节点间部署了用于根据呼叫发起的时间或者与时间相关的路由来处理电话呼叫的一个应用50。应用50的可配置部件集合52和54是提供与时间相关的路由功能的分布式部件。每一个可配置部件集合52和54包括一特定时间区域的UNIX可执行程序或者可配置部件。如所显示的,应用50不必要存在于一单个应用节点44-49上。将可配置部件集合匹配到不同的节点是可取的。这允许通过增加配置了可配置部件集合的节点的数目,就可以对应用进行扩缩。
从逻辑和物理划分的角度来描述电信平台的内部结构。逻辑划分将电信平台分成如图4所显示的、不同的功能区域。每一个功能区域包括一个有内聚力的、能够提供一个特定***功能的类组。物理划分描述了分解***整体的分离的软件和硬件。电信平台10所提供的服务可以被分成两组:应用服务60和核心服务62。应用服务可以包括执行信息和问题报告(IPR)/告警64,统计65,字典66,图形用户界面(GUI)67和主机维护模拟器(HMS)的服务。IPR/告警服务64提供了一个标准的机制来告知***用户错误的条件和其它相关的***信息。统计服务65提供了访问***范围内测量数据和根据所收集的数据产生报告的方法。字典服务66提供了被设计成支持数据存储(永久地,共享的或者私有的)的类并且提供对数据的访问。图形用户界面服务67提供了用于对建立GUI应用的基本抽象,提供对***公用程序的访问和对***本身的访问,例如xterm窗口和操作***公用应用程序。主机维护模拟器访问75提供了一个方法,以使当这个***内部中仅有一个节点时或者仅连接了一个主机时,与电信平台进行接口通信。只有通过这个主机,才能进行平台的控制和操作。
核心服务62可能包括执行网络管理68,节点管理69,分布式对象70,通信72,公共功能73,和事件处理74的服务。网络管理服务68指挥网络活动,例如节点配置和网络层次的故障处理。节点管理服务69指挥节点层次的处理,例如节点状态报告和链路管理。分布式对象服务70为一个多处理环境中的、基于对象的通信提供一个分布式数据库。通信服务72提供了一个机制来对穿过平台外部的、进程间链路的消息进行处理。公共服务73提供了一个编程工具库,以帮助快速地开发在电信平台上或者电信平台内进行运行的进程。事件服务74提供了发起,终结,和/或者划分对一个任务来说很重要的特定动作的能力。
作为一个最小的电信平台,电信平台提供了所有核心服务,高层应用使用这些服务来完成低层次的功能。
图5进一步显示了电信平台服务及其相关性。开发人员通过电信平台应用程序接口14来访问所有核心和应用服务。这个开发人员也可以访问操作***,网络和第三方的软件/硬件,如果需要的话。通信服务72处理进程间、基于对象的通信。大多数核心和应用服务使用通信服务72和公共服务73来执行它们相应的功能。图形用户界面服务67仅与图形服务72相关。图5中的箭头指示服务之间的相关关系。
图6是包括一个应用层80和一个核心层82的电信平台10的物理划分图。包括核心服务62的核心层82存在于一个电信平台的每一个实例中。核心层82包括电信平台API14,进程间图形机制,事件机制,和平台管理。电信平台应用层80具有垂直和水平划分。垂直方向上,每一个电信平台应用进程被分类成一个主应用集合84的一部分或者不是。非主集合进程与主集合进程相关。水平地,电信平台应用80被分类成必需的或者可选的。可选的应用可能包括一个IPR/告警包86,一个数据收集包87,一个字典管理***包88,和一个主机维护模拟包89。
下面更详细地描述了电信平台服务。
网络管理服务68提供了网络部件的一个公共管理视图。它负责对网元节点实现高层次操作,例如从服务中删除服务器节点,将服务器节点恢复到服务,从服务中删除应用,将应用恢复到服务中,使能或者关闭应用,维持分布式应用的状态,维持服务器节点状态和状态,报告应用状态的改变。网络管理服务68包括一个网络平台管理者(NetPM),网络***完整性子***(NetSI),和配置管理者(ConfigMgr)。图7A是显示了带一个相应的或者合作的备用平台管理者节点102的一个激活平台管理者节点100。每一个平台管理者节点包括一个网络平台管理者104,一个网络***完整性子***106,和一个配置管理者108。一个平台管理者网络测试驱动器110提供了网络层次的测试。
网络平台管理者的类名是NetPM。NetPM负责提供对平台资源的管理功能。平台是一个分布式***,它包括提供对特定服务的处理功能,例如呼叫卡,或者***认证的多个节点或者服务器。一个服务器所提供的服务由驻留在这个节点上的可配置部件来决定。NetPM管理所有与这个平台相关的配置数据。配置数据包括关于硬件的信息(例如一个服务器的TCP/IP地址),状态信息(例如服务器和查询状态),软件配置信息(例如应用类型),节点名字,和与每个可配置部件相关的信息。
NetPM维持下述配置信息。在NetPM初始化期间,NetPM收集这个配置信息。
●可配置部件描述符信息-这为平台的每一个可配置部件提供了配置信息。NetPM从包括关于不同类型可配置部件的信息的一个磁盘文件中检索这些信息。
●应用信息-这提供了关于每一个应用(服务)的配置信息,它可以被用于计算一个用于的状态。NetPM从包括关于平台中所有应用的信息的一个磁盘文件中检索这个信息。
●处理器服务组信息-这提供了关于处理器服务组的配置信息,它可以被用于计算处理器服务组状态(处理器服务组指对相同应用提供服务的处理器组,例如CCD,CCL)。NetPM从包括关于平台中所有处理器服务组的信息的一个磁盘文件中检索这些信息。
●服务器信息-这提供了关于平台中所有服务器的特定信息。NetPM从ConfigMgr中请求和检索这个信息。首先,ConfigMgr向NetPM提供关于平台管理者节点的服务器信息。然后,如果ConfigMgr判断出当前的服务器是激活的平台管理者,它就向本地的NetPM提供关于平台中剩余服务器的信息。否则(备份平台管理者),NetPM将从其合作设备检索这些信息,而不是从ConfigMgr检索这些信息。
如果在收集这些信息的过程中检测到一个错误,NetPM发起合适的IPR并且退出运行。
NetPM使用一个NetMAP对象来管理所有配置数据。NetPM也使用一个永久保存的字典来保持服务器状态,查询状态,和经过平台管理者复位的规划动作信息。使用一个磁盘文件字典对象来管理这个字典。NetPM负责维持两个平台管理者服务器之间的配置数据的完整性和一致性。NetPM使用一个永久保存的字典,数据库同等和审计来维持数据的完整性和一致性。
根据处理器服务组状态来决定应用状态。在决定处理器服务组状态的过程中使用下述准则:
●PSG_DISABLED:至少处理器服务组中一设置数目的服务器处于不使能状态。
●PSG_INACTIVE:每一个处理器服务组中至少有一个服务器处于备份状态,并且没有一个服务器处于激活状态。
●PSG_ACTIVE_MINIMAL:处理器服务组中仅特定数目的服务器处于激活状态。
●PSG_ACTIVE:处理器服务组中一设置数目的服务器处于激活状态(注:这个数目比PSG_ACTIVE_MINIMAL所需要的激活服务器的数目大)。
并且可以使用下述准则来获得应用状态:
●AP_DISABLED-至少一设置数目的、给定应用的处理器服务组处于PSG_DISABLED状态。
●AP_INACTIVE-至少一给定应用的处理器服务组具有状态PSG_INACTIVE,并且没有处理器服务器组具有状态PSG_ACTIVE。
●AP_ACTIVE_MINIMAL-一设置数目的、给定应用的处理器服务组处于PSG_ACTIVE_MINIMAL状态,或者更高的状态(PSG_ACTIVE)。
●AP_ACTIVE_PARTIAL-一设置数目的、给定应用的处理器服务组处于PSG_ACTIVE_MINIMAL状态,或者更高的状态(PSG_ACTIVE)(注:AP_ACTIVE_PARTIAL所需要的处理器服务组数目比AP_ACTIVE_MINIMAL所需要的处理器服务组数目大)。
●AP_ACTIVE-一设置数目的、给定应用的处理器服务组处于PSG_ACTIVE状态(注:AP_ACTIVE所需要的处理器服务组数目比AP_ACTIVE_PARTIAL所需要的处理器服务组数目大)。
NetPM跟踪每一个服务器节点上的状态改变,并且当它获得这个信息时,它判断处理器服务组的状态,并且在发生一个改变的情形下,判断这个节点的新应用状态并且将这些改变告知ConfigMgr。
NetPM提供对应用状态的请求的和自动的更新。对自动更新来说,应用进程首先登录NetPM的一个函数,来接收对一个特定应用类型(CCD或者CCL)的更新。无论何时NetPM接收到一个服务器的改变或者接收到来自NodePM的查询状态,NetPM就计算应用状态,并且使用老的和新的应用状态来调用被登录的函数。也可以请求应用状态,在这个期间,NetPM将保存在其NetMAP中的、所计算的最新应用状态值返回给发起请求的进程。
部分地通过使用两个别名对象,NetPM向其它希望与NetPM进行通信的进程提供两组路由选项。NetPM提供一个本地的和一个全球激活/备份选项。在本地选项中,所有NetPM客户请求被发送到与客户对象在相同节点中的NetPM服务器对象。在全球激活-备份选项中,所有NetPM客户请求被发送到全球(即可能是节点间的)可用激活NetPM服务器对象。
NetPM能够对很多服务器配置数据提供一组阅读和写入的功能。这些功能包括读/写时刻表动作数据,平台管理者激活状态数据,服务器状态数据,等等。NetPM不对可配置部件描述数据进行直接的读/写操作。
NetPM也提供了对大部分服务器配置数据进行初始化的一个功能。这个功能使用一个ServerInfoMsg作为输入。
NetPM也提供了一组功能,来促使一特定的配置动作(例如正常关机,立即关机,正常降级,和恢复)在一特定的服务器上进行。
NetPM也提供了改变一特定服务器的服务器状态的一个功能。
NetPM提供了使能和关闭一特定服务器上的查询进程的一个功能。
NetPM提供了“报告”服务器状态和查询状态改变的几个功能。这些例程将新状态信息保存在NetMAP中,将改变告知ConfigMgr软件,并且将改变广播给平台中的所有NodePM软件。
NetPM也负责服务器网络内部的时间同步。时间同步包括3个主要部分,如图7B所显示的。第一部分是激活平台管理者100将它的本地时间同步于主机的时间。这包括将主机(110)的时间转换成一个可使用的形式,并且告知平台管理者节点100和102上的NodePM112执行一个adjtime()函数来将它们的时钟调节成与主机110的时钟一致。当NetPM104接收到时间消息时,NetPM104也将新主机时间告知主机的滴答类。然后,一个xntp进程120将应用节点(121)的时间同步于平台管理者节点100和102的时间。平台管理者节点100和102中的每一个平台管理者节点被配置成xntp主时间源。应用节点121上的xntp后台程序从属122选择平台管理者节点100和102的一个主xntp后台程序120来与其保持同步。最后,无论何时从主机110接收到一个不经请求的设置时间消息,网络的时间就与所接收的时间相同。
最后,NetPM104提供了向一个新引导的节点提供平台中所有服务器的永久服务器配置数据的一个功能。NetPM104是一个可配置部件。NetPM104提供了没有密封的操作:NodePM所需要的、用于控制NetPM的操作,例如删除,恢复和获得状态。当审计定时器起作用时,就调用NetPMTimerHandler。它中止提供服务的循环,并且调用NetPM函数SettimeToVerify来启动审计。
NetPM104是带其自己的控制线程的一个对象。在建立其NetMAP列表后,NetPM104进入一个无限循环来等待请求。NetPM104告知ConfigMgr108何时一个服务器的服务或者查询状态发生了改变。NetPM104也将这些状态改变发送到平台中的所有NodePM112。NetPM104告知特定的NodePM112使能,或者关闭查询进程。NetPM104提供服务状态同步功能。NetPM104为平台中的这些服务器建立IPR信息,并且在BootNotify成员函数中将这个信息传递到这个特定的NodePM112。在接收到降低服务级别的所有配置请求后(即,GraceDown,ImmedDown,GraceHalt,和ImmedHalt),NetPM将所希望的服务器状态告知这个特定的NodePM112。当请求恢复一个服务器时,NetPM104做几件事。首先,NetPM104从特定的NodePM112获得这个服务器的当前状态。第二,如果所返回的状态是不提供服务out-of-service/最小软件minimum-software,NetPM104向这个特定的NodePM112发送相关的NodeSpecInfo。第三,NetPM104将相关的可配置部件描述符信息发送到这个特定的NodePM112。最后,NetPM告知这个特定的NodePM112恢复服务。
网络***完整性和一致性(NetSI)子***106提供对网元的监视和恢复操作。它负责实现网络监视和恢复。网络***完整性所实现的操作包括:
-平台管理者激活/部分状态监视
-节点故障报告相关性检测
-发生故障节点的恢复动作
网络***完整性的类名是NetSI。NetSI106管理平台管理者的网络***完整性。NetSI106从发生故障节点的NodeSI接收服务器降级和发生通信故障的通知。NetSI106根据NodeSI所给的数据,来决定应采取什么动作。如果节点指示一个降级,NetSI将采取合适的动作来将节点从网络级别降级到所希望的降级状态。如果节点指示发生了一个通信故障,NetSI106将从前面所接收的数据来决定哪一个节点(如果有的话)发生了故障,并且如果需要的话,将采取动作来对发生故障的节点进行降级。当NetSI决定需要对一个节点进行降级时,NetSI调用合适的NetPM操作来执行降级操作。如果需要对激活状态进行一个改变,NetSI调用合适的NetPM操作来设置激活状态。在调用NetPM来执行降级操作后,NetSI将通知ConfigMgr一特定节点的状态已经发生了改变。这允许主机能够被立即通知,一个节点已经在被降级。然后,NetSI将一个表目写到网络配置报告中,指示已经发生了状态改变及其状态改变的原因。NetSI根据这个节点的当前状态,将节点降级到合法的服务状态。
NetSI包括一个通信故障列表。这个列表记录了报告每一个所接收的通信故障报告的服务器节点名字和产生问题的服务器节点名字。当接收了一个通信故障报告时,就在这个列表中搜寻关于这个发生问题的节点的另一个报告。如果没有发现,就将这个故障信息添加到这个列表中。NetSI也包括一个故障状态信息列表。当NodePM指示一个节点不能够提供服务并且NetPM状态没有指示这个节点已经停机时,就产生带这个被中止IPU的主机名字的一个故障状态信息表目。并且产生一个定时器,并且将这个故障状态信息添加到这个列表中。如果NodePM后面指示了这个节点的一个较高的状态(在这个定时器溢出以前);就从这个列表中清除这个故障状态信息表目,并且不进行进一步的动作。
NetSI例行地审计两个PM的状态条件。如果出现了无效的条件,NetSI试图通过将激活状态设置到正确的状态来纠正这个情形。其它进程也可以请求NetSI审计平台管理者状态条件。
NetSI使用“发送到两个”的负载分担概念来进行工作。如果两个平台管理者节点均可以进行工作,每一个平台管理者节点上的每一个NetSI进程将接收这个NodeSI请求。每一个NetSI进程将决定它是否应根据平台的激活/备份状态处理请求和和发生故障的服务器。激活的平台管理者的NetSI进程通常将采取所需要的动作,而备份平台管理者将丢弃信息。但是,如果发生故障的节点是激活平台管理者,备份平台管理者(如果有效)将自己设置为激活并且采取请求动作来对另一个平台管理者节点进行降级。
每一次调用一个NetSI操作时,NetSI首先判断它是激活的平台管理者还是备份平台管理者。如果是激活的平台管理者,NetSI将处理除目标节点是它自己和其合作设备仍然在提供服务的条件外的所有其它条件下的请求。如果是备份平台管理者,NetSI将丢弃除目标节点是合作设备外的所有其它条件下的请求。
在初始化期间,NetSI从NodePM请求合作设备的名字和其自己服务器和合作服务器的服务器描述符。在请求这个信息以前,NetSI轮询NodePM的状态,并且直到NodePM被阅读并且提供节点名字和服务器描述符,才请求节点名字和服务器描述符。NetSI将直到这个信息被正确接收,才准备提供服务。
NetSI使用命令行参数DWN_RPT_FILE来获得网络配置(降级)报告文件名字的名字。如果这个参数没有被规定,就不进行任何降级的报告表目。
参考图7C和7D,显示了节点管理和网络管理之间的进程通信。常监视器(ConMon)132是在一个应用节点136上运行的一个对象的一个实例。ConMon132检测一个发生故障的进程或者一个发生故障的可配置部件,它告知一个服务管理进程程序134。服务管理进程134判断这个可配置部件故障是否促使这个进程落到其阈值电平以下。如果没有,服务管理进程134重新启动这个可配置部件。但是,如果这个可配置部件落在其阈值电平以下,然后服务管理进程134产生一个可配置部件状态改变消息并且将这个通知转发到NodeSI130。NodeSI将这个可配置部件状态改变消息转发到NodePM112。NodePM112判断这个可配置状态改变是否影响了这个节点的运行级别,这将使节点降级。如果这个节点将要被删除,NodePM112向服务管理进程134提供指令来删除所有实现降级状态所必需的可配置部件。NodePM134通知NetPM104节点状态已经发生改变。NetPM104执行一个计算来判断这个节点状态的改变是否影响了处理器服务组和应用状态。NetPM的计算也判断是否应在这个节点上执行一个自动动作,例如从在服务内的删除一个节点到min-set并且再恢复它。如果需要删除这个节点,然后这个节点状态改变就被从NetPM转发到ConfigMgr108。ConfigMgr通知主机140,这个节点、处理器服务组和应用的状态已经发生改变。这些状态的改变可以被显示或者可以被打印在一个报告中。
特别地,每一个NetSI判断它是否应处理降级请求。如果应处理降级请求,就检索目标服务器的状态。如果目标服务器没有停机,就根据IPU状态来将这个服务器降级到合适的状态。如果IPU状态是不提供服务,NetSI就调用NetPM的立即中断操作来或者自动中断目标节点,或者人工中断目标节点。如果IPU状态是不提供最小服务(OS_MIN),NetSI就调用NetPM的立即降级操作来将目标节点降级到OS_MIN。如果IPU状态是在服务关闭,NetSI就调用NetPM的关闭查询操作来关闭目标节点的查询状态。在所有情形下,如果目标节点是激活平台管理者,NetSI就更新激活状态。另外,如果目标节点是本地站点的一部分,NetSI就经过ConfigMgr来通知这个主机,一个状态改变正在发生并且如果它判断应恢复目标服务器的处理器服务组就通知初始化处理器服务组的恢复(经过ConfigMgr)。然后,NetSI将一个表目写到网络配置报告文件中,以指示因为这个节点报告了一个故障而在发生状态的改变。
NodeSI通知NetSI,在两个节点之间发生了通信故障。NetSI根据前一接收的信息(如果有)保存这个故障或者对这个故障采取动作。每一个NetSI决定报告问题和发生问题节点的状态。如果任何一个服务器中止了,就丢弃通信故障报告,因为不能够确保数据的完整性和一致性。如果没有一个服务器停机,就在这个通信故障列表中搜寻关于发生问题的节点的另一个报告。如果没有发现关于发生问题节点的报告,就用服务器信息将一个通信故障列表表目添加到这个列表中。如果发现了另一个关于发生问题的节点的报告,并且另一个进行报告的服务器已经报告了它,就建立发生问题的服务器,以进行降级处理。一旦已经作出了关于是否应对服务器进行降级的决定,NetSI判断它是否应处理它(根据其激活状态和目标服务器是否是它自己)。如果它应处理这个降级,NetSI就调用NetPM的立即停机操作来或者自动地中止发生问题的节点或者人工中止发生问题的节点。如果需要被中止的服务器是激活PM,NetSI在中止这个节点以前就更新相应的激活状态。另外,如果目标是本地站点的一部分,NetSI就经过ConfigMgr来通知这个主机,一个状态改变正在发生并且如果它判断应恢复目标服务器的处理器服务组就通知初始化处理器服务组的恢复(经过ConfigMgr)。然后,NetSI将一个表目写到网络配置报告文件中,以指示因为一个通信故障而在进行中止。
配置管理子***(类名:ConfigMgr)提供了在SCP主机和服务器部件之间的控制接口。在服务器网络上可以被执行的所有操作均被定义在这个接口上。配置管理子***实现了下述特征:
-控制主机和服务器之间的消息接口
-有效操作的状态机
-用请求来驱动网络管理
一控制操作定时/时间溢出。
ConfigMgr管理平台管理者的服务器配置控制。ConfigMgr接收在CONFIGCTL,MAINT,APPLCTL,ROUTINGCTL逻辑链路上发送的主机消息,并且根据其消息标识和类型来处理每一个消息。如果主机需要发送一个响应或者一个报告,ConfigMgr决定必要的响应并且检索必要的报告信息,并且将它发送回到主机。ConfigMgr处理下述消息:
APPL_STATUS_MSG
ASPEC_MSG
CONFIGURE_SERVER_MSG
PSG_INFO_MSG
PSG_STATUS_MSG
QUERY_PROCESSING_MSG
RESET_SERVER_MSG
ROUTING_INFO_MSG
SCHED_ACTION_CTL_MSG
SERVER_INFO_MSG
SERVER_STATUS_MSG
TEST_SERVER_MSG
TIME_MSG
ConfigMgr也给平台管理者提供操作,来从主机检索服务器和时间信息。它也提供操作来向主机提供服务器状态的改变。在处理主机命令消息时,ConfigMgr需要一个时间以等待从主机来的一个响应,或者等待从一个特定的服务器来的一个状态改变。在进行这些等待时,ConfigMgr使用一个非阻塞的方法。不是停止并等待事件的发生,ConfigMgr而是将所希望的响应或者状态保存在一个PendingQueue中,并且继续对另一个主机消息进行处理或者继续向一个客户提供服务。当所希望的响应或者状态发生时,就调用合适的过程来恢复对主机命令消息的处理。如果在所规定的时间限制内,所希望的响应没有到来,或者所希望的状态没有发生,就调用一个故障过程来清除对主机命令消息的处理并且如果需要的话就发起IPR。
除了处理主机命令消息外,当一个状态改变时,还需要ConfigMgr通知主机。当ConfigMgr被通知说已经发生了一个状态改变,它就检查状态挂起队列,来判断它是否是在等待状态改变的发生。如果是,就执行挂起队列成功的操作。否则,ConfigMgr向主机发送服务器状态消息。在处理主机响应消息时,ConfigMgr检查主机响应挂起队列(HostPendQueue)来判断它是否是在等待响应。如果是,就执行挂起队列成功操作。否则,ConfigMgr丢弃从主机来的这个响应消息。当一个平台管理者节点被引导到OS_MIN状态时,它审计其合作设备并且判断合作设备的状态。在没有合作设备平台管理者节点出现的事件中,合作设备状态就自动地被设置为中止。可以对服务服务器节点(不是PM的节点)进行类似的审计,以判断它们的状态。
ConfigMgr具有一个登录能力,其中一个子***可以进行登录,来为一个特定的应用提供路由信息。当主机请求关于一个应用的路由信息时,ConfigMgr发起对合适登录子***(如果存在一个的话)的一个请求,以提供路由信息。
因为被执行服务的本质,配置服务器消息(ConfigServerMsgs)需要特殊的处理(即,中止,降级,恢复,和引导)。因为主机消息被发送到两个平台管理者服务器,就必须小心地确保仅一个平台管理者节点处理这个请求。这需要检查平台管理者节点和其合作设备的服务器状态。根据平台管理者节点的服务器状态和这个ConfigServer是否是针对一个平台管理者节点,其合作设备,或者一个服务服务器,可以采取不同的动作。两个有限状态机(PMCfgSvrFSM和SvcCfgSvrFSM)管理所有不同状态驱动的动作。
PMCfgSvrFSM是处理一个平台管理者应用服务器的恢复,中止,再同步,降级和引导的有限状态机。这个状态机根据这个请求是针对其自己或者其合作设备,其自己的状态,其合作设备的状态,和所请求的事件(中止,降级,恢复等等)来处理一个请求。被检查的平台管理者服务器状态是:中止(自动),中止(人工),XOS-MIN,AOS-MIN(自动),MOS-MIN(人工),和In-Svc。如果是In-Svc,就检查激活/备份状态来判断这个服务器是激活的或者是备份的。有效的事件是恢复,正常中止,立即中止,正常降级,立即降级,正常引导,立即引导,和主机再同步。
这个事件对决定哪一个平台管理者节点将处理这个请求是重要的。如果请求了一个恢复,正常地,正在被恢复的平台管理者节点将处理这个恢复(即,一个平台管理者节点将恢复其自己)。处理一个恢复请求,一个平台管理者服务器已经被中止,被中止的服务器的合作设备(如果可能的话)将发送一个否认响应到主机。如果一个平台管理者节点需要任何中止,降级,或者引导,平台管理者节点的合作设备将处理它,除非这个合作设备已经中止。当这个合作设备中止时,平台管理者节点将自己处理这个中止,降级,或者引导。处理一个中止,降级,或者引导可能包括实际地执行被请求操作或者向主机发送回一个否认响应。如果没有否认一个中止,降级,或者引导请求,主机就认为动作成功了。
当一个平台管理者节点将自己处理一个引导时,平台管理者节点调用NetPM的GraceHalt或者ImmedHalt操作(根据引导类型)来将其自己带入一个中止状态。然后,对这个节点的处理就完成了,因为它正在被带入一个中止状态。(主机将对服务器进行复位和引导)。当对最后一个的在服务的平台管理者节点请求一个中止,降级,或者引导操作时,就检查一个强迫标识。如果这个强迫标识没有被设置,就用一个响应″DENIED-LAST AMP″来否认这个请求。如果这个强迫标识被设置,就在这个最后的、在服务的平台管理者节点上执行中止,降级,或者引导。
如果对一个平台管理者节点请求一个主机再同步,目标平台管理者服务器的合作设备将处理这个请求,除非这个合作设备已经中止。如果目标平台管理者服务器的合作设备已经中止,再同步的这个平台管理者节点将处理这个请求。处理这个请求包括将服务器状态从XOS-MIN改变到AOS-MIN或者MOS-MIN,或者如果当前状态不是XOS-MIN就否认这个请求。
SvcCfgSvrFSM是处理一个服务应用服务器的恢复,中止,再同步,降级和引导的有限状态机。这个状态机根据执行这个动作的平台管理者节点的状态,正在工作的提供服务的服务器的状态,和被请求的事件(中止,降级,恢复等等)处理一个请求。被检查的服务状态是中止(自动),中止(人工),XOS-MIN,AOS-MIN(自动),MOS-MIN(人工),和In-Svc。有效的事件是恢复,正常中止,立即中止,正常降级,立即降级,正常引导,立即引导,和主机再同步。
激活平台管理者节点(OS-MIN或者IN_Service)将处理针对一个提供服务的服务器的配置服务器请求。只要一个平台管理者是至少一个OS-Min,就允许在一个提供服务的服务器上进行一个引导,中止,再同步,或者降级。当至少一个平台管理者处于In-Service时,仅允许对一个提供服务的服务器的恢复。如果没有平台管理者节点处于In-Service时,处于激活的平台管理者节点将向这个主机发送回一个DENY-AMP非In-Service响应。如果没有否认一个中止,降级,或者引导请求,主机就认为动作成功了。
当对最后一个的在服务的应用节点请求一个中止,降级,或者引导操作时,就检查一个强迫标识。如果这个强迫标识没有被设置,就用一个响应″DENIED-LAST SERVER IN Processor service groupPROCESSING QUERIES″来否认这个请求。如果这个强迫标识被设置,就在这个最后的、在服务的应用节点上执行中止,降级,或者引导。
无论何时处理一个配置事件(除了立即中止外),检查一个在配置的标识。如果设置了在配置的标识,就用一个响应“DENIED-SERVERUNDER CONFIGURATION”来否认这个请求。在事件处理期间,ConfigMgr设置和清除在配置标识。其它消息不需要有限状态机(即,ServerInfoMSG,ServerStatusMsg,TimeMsg,等等)。
当没有否认一个恢复请求时,ConfigMgr为服务器设置UnderConfig标识,并且将一个ConfigServerMsg“动作激发”响应发送到主机,并且调用NetPM的RestoreISV操作来将服务器恢复到In-Service。然后,ConfigMgr挂起恢复处理,并且为成为In-Service的服务器建立一个服务器状态挂起队列表目。直到ConfigMgr被通知服务器状态已经处于In-Service或者定时器溢出,才继续恢复处理。当ConfigMgr被通知服务器状态已经改变到In-Service时,就通过检查服务器查询状态来继续恢复处理。如果服务器的查询状态是DISABLED_SERVER_OOS并且激活服务器的数目比处理器服务组激活服务器计数少,ConfigMgr调用NetPM的EnalbeQuery操作来使能服务器的查询状态并且将当前查询状态设置为未决。然后,ConfigMgr向主机发送服务器状态消息,通知服务器和查询状态的改变。并且为成为使能的服务器查询状态建立一个QueryStatusPendingQueue表目。然后挂起处理,直到查询状态成为使能或者定时器溢出。当ConfigMgr被通知说查询状态被使能,就继续恢复处理,并且发送服务器状态消息和清除服务器的在配置标识。
如果在服务器的状态改变到In-Service前定时器溢出,或者从没有接收关于其它应用的被请求服务器信息,就激发对故障的恢复处理。故障处理包括正常将服务器降级到OS-MIN,发起一个IPR,和清除服务器的在配置标识。如果在查询状态改变到使能前定时器溢出,就通过将查询状态设置为非使能,正常将服务器降级到OS-MIN,发送服务器状态信息,激发一个IPR,和清除这个服务器的在配置标识,来继续恢复处理,
当没有否认一个正常中止请求时,ConfigMgr设置服务器的UnderConfig标识,向主机发送一个ConfigServerMsg“动作被激发”响应,并且调用NetPM的GraceHalt操作来中止这个服务器。如果这个节点已经没有被中止,然后ConfigMgr挂起中止处理,并且为成为中止的服务器建立一个服务器状态挂起队列表目。然后,它在网络配置报告中产生一个表目,指示这个主机请求了一个中止。直到ConfigMgr被通知服务器状态已经是中止并且定时器溢出,才继续中止处理。当ConfigMgr被通知服务器状态已经改变到一个中止状态时,通过使用服务器状态信息的发送和清除这个服务器的在配置标识,来继续中止处理。如果在服务器状态改变到中止以前定时器溢出了,就激发中止故障处理。故障处理包括激发一个IPR和清除服务器的在配置标识。
当没有否认一个立即中止请求时,ConfigMgr设置这个服务器的UnderConfig标识,从这个状态挂起队列中删除这个服务器的所有挂起服务器状态改变,并且调用NetPM的ImmedHalt操作来中止这个服务器。如果节点没有被中止,ConfigMgr挂起中止处理并且为将要中止的服务器建立一个服务器状态挂起队列表目。然后,它对指示一个中止被主机请求的网络配置报告产生一个表目。直到ConfigMgr被通知这个服务器状态已经处于中止或者这个定时器溢出,才继续进行中止处理。当ConfigMgr被通知服务器状态已经改变到一个中止状态时(或者当中止被激发时,这个节点已经中止了),继续进行中止处理,并且发送服务器状态消息,向这个主机发送一个ConfigServerMsg“成功完成”的响应,并且清除服务器的在配置标识。
如果定时器在服务器状态改变到中止以前溢出了,就激发中止故障处理。故障处理包括激发一个IPR,向主机发送一个ConfigServerMsg“动作失败”的响应,并且清除这个服务器的在配置标识。
当没有否认一个正常降级请求时,ConfigMgr设置这个服务器的UnderConfig标识,向主机发送一个ConfigServerMsg“动作激发”的响应,并且调用NetPM的GraceDown操作来对服务器进行降级。如果这个节点已经没有在所希望的降级状态,然后,ConfigMgr挂起降级处理并且为将要成为OS-MIN的服务器建立一个服务器状态PendingQueue表目。然后,它建立一个网络配置报告的表目,指示一个降级被主机请求。直到ConfigMgr被通知服务器状态是OS-MIN或者定时器溢出时,才继续降级处理。当ConfigMgr被通知,服务器状态已经改变到一个OS-MIN状态(或者这个节点已经处于这个状态),继续降级处理,发送服务器状态消息,并且清除服务器的在配置标识。如果在服务器状态改变到一个OS-MIN状态以前定时器溢出了,就激发降级故障处理。故障处理包括激发一个IPR,和清除服务器的在配置标识。
当没有否认一个立即降级请求时,ConfigMgr设置这个服务器的UnderConfig标识,并且调用NetPM的ImmedDown操作来对服务器进行降级。如果这个节点已经没有在所希望的降级状态,然后,ConfigMgr挂起降级处理并且为将要成为OS-MIN的服务器建立一个服务器状态PendingQueue表目。然后,它建立一个网络配置报告的表目,指示一个降级被主机请求。直到ConfigMgr被通知服务器状态是OS-MIN或者定时器溢出时,才继续降级处理。当ConfigMgr被通知,服务器状态已经改变到一个OS-MIN状态(或者这个节点已经处于这个状态),继续降级处理,发送服务器状态消息,向主机发送一个ConfigServerMsg“成功完成”的响应,和清除服务器的在配置标识。
如果在服务器状态改变到一个OS-MIN状态以前定时器溢出了,就激发降级故障处理。故障处理包括激发一个IPR,向主机发送一个ConfigServerMsg“动作失败”的响应,和清除服务器的在配置标识。
当没有否认一个正常或者立即引导请求时,ConfigMgr设置这个服务器的UnderConfig标识,并且向主机发送一个ConfigServerMsg″激发动作″的响应。ConfigMgr检查服务器的服务器状态,并且如果这个服务器没有处于一个中止状态就调用NetPM的GraceHalt或者ImmedHalt操作。如果已经调用了一个中止操作,就挂起处理,直到ConfigMgr被通知服务器状态是中止或者定时器溢出。然后,它在网络配置报告中建立一个表目,以指示一个引导被这个主机所请求。
当ConfigMgr被通知,服务器状态已经改变到一个OS-MIN状态(或者这个节点已经处于这个状态),继续降级处理,发送服务器状态消息,向主机发送一个ConfigServerMsg″成功完成″的响应,并且清除服务器的在配置标识。如果在服务器状态改变到一个OS-MIN状态以前定时器溢出了,就激发降级故障处理。故障处理包括激发一个IPR,向主机发送一个ConfigServerMsg″动作失败″的响应,和清除服务器的在配置标识。
当没有否认一个正常或者立即引导请求时,ConfigMgr设置这个服务器的UnderConfig标识,并且向主机发送一个ConfigServerMsg″激发动作″的响应。ConfigMgr检查服务器的服务器状态,并且如果这个服务器没有处于一个中止状态就调用NetPM的GraceHalt或者ImmedHalt操作。如果已经调用了一个中止操作,就挂起处理,直到ConfigMgr被通知服务器状态是中止或者定时器溢出。然后,它在网络配置报告中建立一个表目,以指示一个引导被这个主机所请求。
当ConfigMgr判断这个服务器已经中止时,它向这个主机发送一个ResetServerMsg请求。ConfigMgr建立一个主机响应PendingQueue表目,来等待从这个主机来的ResetServerMsg响应。然后挂起这个处理,直到接收到了这个响应或者定时器溢出了。一旦接收到了这个响应,ConfigMgr建立一个服务器状态PendingQueue表目,来等待服务器状态变为OS-MIN。如果在定时器溢出以前没有从这个主机接收到这个响应,就激发一个IPR,并且清除在配置标识。一旦服务器状态变为OS-MIN,ConfigMgr就向主机发送服务器状态消息,以指示新的服务器状态,并且清除在配置标识。如果在服务器状态变为OS-MIN以前定时器溢出了,ConfigMgr就激发一个IPR,并且清除在配置标识。
当没有否认一个主机再同步Resync请求时,ConfigMgr就判断这个服务器状态是否处于XOX_MIN。如果是,就调用NetPM的SetServerStatus操作来将服务器状态设置到合适的自动/人工OS_MIN状态,服务器状态消息被发送以指示新服务器状态,并且向主机发送一个ConfigServerMsg″成功″的响应。如果这个服务器状态不处于XOS_MIN,就激发一个IPR,并且向主机发送一个ConfigServerMsg″动作失败″的响应。
应用状态消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。在从这个主机接收到一个ApplStatusMsg请求类型的消息后,ConfigMgr就判断应用查询状态,并且将带有当前应用查询状态的一个ApplStatusMsgS_REPORT发送回到这个主机。当服务器状态发生了改变时,或者在处理一个主机配置服务器请求的期间按照需要,ConfigMgr将ApplStatusMsg U_REPORT类型的消息发送到这个主机。
ConfigMgr为在ApplsInfo.des描述符文件中的每一个应用,从这个主机接收一个ASPEC数据请求消息。ConfigMgr查询NetPM,以从NetMAP检索这个应用的信息。包括ASPEC数据的一个响应消息被发送回到这个主机,消息中还包括指示成功或者失败的一个响应码。如果有一个无效的应用标识,有不是ASPEC数据请求消息的一个消息,或者不是请求的一个消息类型,就激发IPR。
处理器服务组信息消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。在从这个主机接收到一个PSGInfoMsg请求类型的消息后,ConfigMgr就判断处理器服务组信息,并且将带有当前处理器服务组信息的一个PSGInfoMsg S_REPORT发送回到这个主机。
处理器服务组状态消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。在从这个主机接收到一个PSGStatusMsg请求类型的消息后,ConfigMgr就判断处理器服务组查询状态,并且将带有当前处理器服务组查询状态的一个PSGStatusMsg S_REPORT发送回到这个主机。当服务器状态发生了改变时,或者在处理一个主机配置服务器请求的期间按照需要,ConfigMgr将PSGStatusMsg U_REPORT类型的消息发送到这个主机。
查询进程消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。ConfigMgr从这个主机接收QueryProcMsg DISABLE_SERVER,DISABLE_SERVER_FORCED,和ENALBE_SERVER请求类型消息。在处理了这个消息后,ConfigMgr通过从NetPM调用EnableServer/DisableServer操作,激发对目标服务器进行查询处理的使能/关闭。ConfigMgr将为这个服务器建立一个查询状态挂起队列(QueryStatus PendingQueue)表目,并且挂起进一步的处理,直到这个服务器的查询状态改变到所希望的状态或者定时器溢出了。NetPM通过调用ConfigMgr的NefyQryStatChange操作,来通知ConfigMgr查询状态发生了一个改变。当ConfigMgr处理这个操作时,它将在查询状态挂起队列中检查服务器查询状态的状态。如果有一个所希望的表目状态的一个表目,就调用合适的成功查询处理过程,来恢复对QueryProcMsg的处理。对QueryProcMsg的成功处理包括将一个QueryProcMsg响应发送回到这个主机,以指示请求成功了并且如果需要的话改变一个平台管理者节点的激活状态。
如果在服务器查询状态处于所希望的状态以前,定时器溢出了,就调用合适的失败查询处理过程,来恢复对QueryProcMsg的处理。对QueryProcMsg的失败处理包括激发一个IPR,和将一个QueryProcMsg响应发送回到这个主机,以指示请求失败了。
在一个服务器进行引导过程期间,ConfigMgr发送ResetServerMsg请求类型消息。当这个主机请求对一个非PM服务器进行引导时,在目标服务器已经中止后,就发送ResetServerMsg请求。然后,ConfigMgr挂起引导处理,并且为一个ResetServerMsg响应类型消息建立一个主机响应挂起队列表目。直到接收到这个响应或者定时器溢出了,才继续进行引导处理。当ConfigMgr从这个主机接收到ResetServerMsg响应类型消息时,ConfigMgr将在主机响应挂起队列中进行检查,以判断在一个ResetServerMsg响应的主机响应挂起队列表目中是否有这个ResetServerMsg响应表目。如果有,就调用合适的过程来完成引导处理。
路由信息消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,就丢弃这个消息。从这个主机接收到一个RoutingInfoMsg请求类型消息后,ConfigMgr就向这个主机发送回一个RoutingInfoMsg响应,以指示这个请求被确认了,并且试图检索这个路由信息。一旦检索到了这个路由信息,ConfigMgr就将带有路由信息的一个RoutingInfoMsgS_REPORT发送回到这个主机。当被另一个子***请求发送路由信息时,ConfigMgr将RoutingInfoMsg U_REPORT类型的消息发送到这个主机。在从另一个子***接收到要求发送路由信息的一个请求后,ConfigMgr就检查路由挂起队列,以判断这个主机是否请求了信息。如果是,ConfigMgr就将带有路由信息的一个RoutingInfoMsgS_REPORT发送到这个主机。否则,ConfigMgr就将带有路由信息的一个RoutingInfoMsg U_REPORT发送到这个主机。在ConfigMgr将一个U_REPORT发送到这个主机。ConfigMgr就等待这个主机通过发送一个RoutingInfoMsg确认响应来确认对这个数据的接收。如果在所规定时间限内,ConfigMgr没有接收到响应,ConfigMgr就请求合适的子***来再一次发送应用路由信息(促使重新将这个数据发送到这个主机)。如果从这个主机接收到了一个非确认响应,ConfigMgr就激发一个IPR,来指示从主机来的一个故障响应码。
规划动作控制消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。在从这个主机接收到SchedActCtlMsg设置类型的消息后,ConfigMgr就调用NetPM的SetSchedAction来按照所希望的使能/关闭规划动作(例如常监视和一般审计)。ConfigMgr向这个主机发送回一个SchedActCtlMsg响应类型消息,以指示这个设置是否成功了。ConfigMgr具有一个GetSchedActions操作,这个操作可以被一个客户所使用来获得主机的时间信息。当激发这个操作时,ConfigMgr向这个主机发送一个SchedActCtlMsg请求类型消息。然后,ConfigMgr为所希望的、从这个主机所接收的SchedActCtlMsg S_REPORT建立一个主机响应挂起队列表目。然后挂起处理(对GetSchedActions的处理),直到接收到S_REPORT或者定时器溢出了。如果在接收到规划动作以前定时器溢出了,不采取动作。当ConfigMgr从这个主机接收到SchedActCtlMsgS_REPORT类型消息,ConfigMgr就在主机响应挂起队列中检查是否有一个SchedActCtlMsg S_REPORT的表目。如果有,ConfigMgr就调用NetPM的SetSchedAction操作,以按照所希望的使能/关闭规划动作。
服务器信息消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。在一个平台管理者服务器进行初始化处理和恢复处理期间,ConfigMgr向这个主机发送ServeInfoMsg请求和请求全部的类型消息。在发送了这个消息后,ConfigMgr挂起对任务的处理和为一个ServerInfoMsg S_REPORT类型(和/或者如果使用了请求全部的完成类型)建立一个主机响应挂起队列表目。直到已经获得了所需要的服务器信息或者定时器溢出了,才继续初始化和恢复处理。如果在初始化期间定时器溢出了(在获得信息以前),ConfigMgr再一次发送ServerInfoMsg请求和请求全部的类型消息,直到获得了这个信息。如果在恢复一个平台管理者服务器的期间定时器溢出了(在获得信息以前),ConfigMgr就激发恢复失败了的一个IPR。
当从这个主机接收到了ServerInfoMsg S_REPORT和完成消息时,ConfigMgr就在主机响应挂起队列中检查是否有ServerInfoMsgS_REPORT或者完成的表目。如果有,就调用合适的过程来完成初始化或者恢复处理。当从这个主机接收到ServerInfoMsg改变类型消息时,ConfigMgr就判断它是否处于一个合适的、处理一个服务器信息改变的状态。如果是,ConfigMgr就通知NetPM已经改变了的服务器信息,并且向这个主机发送回一个ServerInfoMsg响应类型,以指示这个服务器信息是否被成功地改变了。
服务器状态消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。在从这个主机接收到一个ServerStatusMsg请求类型的消息后,ConfigMgr就获得这个服务器和查询状态信息,并且将带有当前状态信息的一个ServerStatusMsg S_REPORT发送回到这个主机。当服务器状态发生了改变时,或者在处理一个主机配置服务器请求的期间按照需要,ConfigMgr将ServerStatusMsg U_REPORT类型的消息发送到这个主机。
测试服务器消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。如果目标服务器是自己并且其合作设备平台管理者没有中止,这个平台管理者节点将丢弃这个请求,而其它的平台管理者处理消息。在MAINT逻辑链路上,从这个主机接收到一个TestServerMsg请求或者中止类型消息后,ConfigMgr判断这个目标服务器的状态是MOS_MIN。如果是,ConfigMgr将一个TestServerMsg确认响应发送回到这个主机。在未来,ConfigMgr将根据是否接收了一个请求或者中止来激发或者中止合适的测试。如果目标服务器没有处于MOS_MIN,ConfigMgr就向这个主机发送一个TestServerMsg服务器没有处于MOS-MIN。如果不能够获得目标服务器状态,ConfigMgr将一个TestServerMsg否认响应发送回到这个主机,并且激发一个合适的IPR。
时间消息被处于In-Service在提供服务的激活状态的平台管理者节点处理。如果没有一个节点处于在提供服务的状态,处于OS-MIN激活状态的平台管理者节点将处理这个请求。在从这个主机接收到一个TimeMsg设置类型的消息后,ConfigMgr就调用NetPM的SetTime操作,来将服务器网络时间设置到合适的时间,并且将一个TimeMsg响应发送回到这个主机,以指示这个设置是否成功了。ConfigMgr具有一个GetTime操作,这个操作可以被一个客户所使用来获得主机的时间信息。当激发这个操作时,ConfigMgr向这个主机发送一个TimeMsg请求类型消息。然后,ConfigMgr为所希望的、从这个主机所接收的TimeMsg S_REPORT建立一个主机响应挂起队列表目。然后挂起处理,直到接收到S_REPORT或者定时器溢出了。如果在接收到定时器信息以前定时器溢出了,不采取动作。当ConfigMgr从这个主机接收到TimeMsg S_REPORT类型消息,ConfigMgr就在主机响应挂起队列中检查是否有一个TimeMsg响应的表目。如果有,ConfigMgr就调用NetPM的SetTime操作来设置网络时间。
节点管理服务
节点平台管理者(NodelPMMMain)
节点管理子***提供了在一单个服务器节点内的进程管理。它负载启动/停止这个服务器节点内的进程,来维持特定的运行级别。节点管理所支持的运行级别是:
-中止(没有软件在运行-甚至没有OS在运行)
-MIN-SET(OS+最小所需要的平台软件)
-INSERVIConfigurable部件(MIN-SET+公共软件)
网络管理将所希望的一特定节点的运行级别通知给节点管理。在一个进程发生故障的事件中,节点管理评价所发生的故障,并且如果可能的话,判断需要什么恢复动作。恢复动作包括忽视这个故障,自动将这个节点启动到下一低的运行级别并且返回到当前运行级别,然后关闭***。
作为每一个服务器节点的***启动过程的部分,NodePM将被激活。作为其初始化的一部分,NodePM:
●用具体的例子具体说明NodeMAP对象,并且在获得关于需要配置在每一个服务器上的最小可配置部件的配置信息后,它将服务器节点启动到一个最小操作状态(OS-MIN)。从这个状态,这个服务器节点仅被允许进行一最小的功能集合,例如启动这些进程的其余部分。在每一个节点的NodeMAP中所提供的配置数据决定了每一个服务器节点的能力(带平台管理能力的服务器节点和带查询处理能力的服务器节点)。
●建立NodePM服务器对象来处理执行相同服务器节点内部操作的NetPM请求。
对每一个NetPM请求,NodePM(可以通过其服务器对象所提供的操作)执行下述操作:
●将其服务器节点从一个最小可操作状态(OS-MIN)启动到
一个完全的操作状态(IN-SERVIConfigurable部件)(RestorNode操作)。
●将其服务器从一个完全操作状态(IN-SERVIConfigurable部件)降级到一个最小可操作状态(OS-MIN)或者中止状态(HALT)(RemoveNode操作)。
●使能/关闭其服务器节点上的查询处理。
●提供关于可配置部件的状态信息。
NodePM将关于每一个IPU的状态的改变自动地报告给NetPM(NodePM使用NetPM所提供的操作来报告状态改变)。
图8是显示一个节点的合法服务状态转移的一个图。注意,所有自动状态转移到另一个自动状态,所有人工状态转移到另一个人工状态。在一个人工状态和一个自动状态之间不存在合法的状态转移。在这个时刻,ISV状态没有自动的或者人工的指定。状态可以从在提供服务状态(ISV)200转移到任何其它状态,或者从任何其它状态转移到在提供服务状态(ISV)200。图8中所使用的缩写词的表示如下:
ISV 200 | 在提供服务的状态 |
OOSAM 202 | 自动地退出提供服务最小 |
OOSAM 204 | 人工退出提供服务 最小 |
OOSAN 206 | 自动地退出提供服务-中止 |
OOSMN 208 | 人工退出提供服务-中止 |
ABOOT 210 | 自动引导 |
MBOOT 212 | 人工引导 |
ADOWN 214 | 自动降级 |
MDOWN 216 | 人工降级 |
AHALT 218 | 自动中止 |
MHALT 220 | 人工中止 |
AREST 222 | 自动恢复 |
MREST 224 | 人工恢复 |
节点***完整性(NodeSIMain)
节点***完整性子***(类名NodeSI)提供了故障隔离和监视在一单个服务器节点内的服务。所有进程的故障被这个子***所记录,并且被转发到节点管理以进行恢复动作。节点***完整性实现了下述特征:
-被动地进程监视(信号捕获)
-节点间通信的监视
-本地故障的报告
AIN平台的***完整性(SI)能力可以被分类为那些提供在平台的服务器节点间能力的完整性能力,和那些提供在一单个服务器内部能力的完整性能力。NetSI在平台层次处理***完整性能力,而NodeSI提供在单个节点层次的***完整性。NodeSI驻留在平台中每一个服务器节点中,并且提供通过其每一个可配置部件的进程可以报告关于这个进程的故障条件的操作。这些故障包括:
●被常监视对象检测到的、在每一个进程上的故障。
●节点间通信故障。
●在主机和服务器网络之间的通信故障。
●IM服务器进程检测到的故障。
它也执行对到/出这个节点的所有连接的节点常监视。如果检测到一个通信故障,NodeSI将这个通信故障通知给NetSI。根据所报告的故障,NodeSI将采取合适的动作,包括激发IPR,并且对节点的状态进行降级(与NodePM合作)。
NodeSI监视每一个服务器节点上的磁盘利用率,当一特定文件***的总使用容量超过一特定阈值时就激发合适的IPR。经过DOME接口来处理NodeSI与其它对象所进行的通信。NodeSI从NodePM获得配置中所有IPU的列表。并且建立包括从每一个IPU来的下述信息的一个阵列:
●从NodePM接收到的IPU信息
●IPU状态
●故障计数
●存活信息被接收的指示器
一个到这个列表的一个阵列索引被用于与其它的NodeSI进行状态的通信交换,而不是进行节点名字的通信,因为就速度和效率来说,进行串比较的代价可能很高。所以,重要的是,在配置中的每一个节点具有相同顺序的相同IPU列表。
NodeSI使用NodePM进行注册来获得节点状态通知。当NodeSI被告知关于另一个IPU的一个状态改变时,它将更新IPU阵列中的IPU状态。如果状态被改变到中止状态,NodeSI将清除故障计数和存活消息被接收的指示器。
NodeSI有两个定时器来处理其常监视功能:
BroadcastTimer-定时器,促使NodeSI将“我存在”的消息广播到它视图内的其它NodeSI。
ConMonChkTimer-定时器,促使NodeSI决定,是否在这个时间间隔内接收了所有连接的合适的“我存在”消息。
当NodeSI被告知这个节点是OS-MIN,它开始将“我存在”消息广播给其视图内的其它NodeSI。然后,它触发这个BroadcastTimer。在BroadcastTimer溢出了,NodeSI立即重新广播“我存在”消息并且重新触发BroadcastTimer。这将中断正在进行的任何NodeSI处理。
当NodeSI从另一个NodeSI接收一个“我存在”消息时,它标识合适IPU阵列表目的、存活消息被接收的指示器。
当NodeSI被告知,这个节点处于OS-MIN时,它触发ConMonChkTimer。在ConMonChkTimer溢出后,NodeSI对CommFailCheck操作进行一个Dome调用,来执行通信故障检查并且重新触发这个定时器。它对自己使用一个DOME调用,来确保优先级被给予来进行存活消息的广播。
通信故障处理包括检查其阵列中的每一个IPU来判断,自从它最后一次进行检查以后,是否已经接收了一个存活消息。如果是,就清除存活消息被接收的指示器。如果没有消息被接收并且IPU状态没有中止,就将这个节点的故障计数增加1。如果这个IPU的故障数目达到其最大值,NodeSI向NetSI报告一个通信故障。
故障计数的最大值是可以通过使用关键字“MAX_COMM_FAULTS”从命令行输入的一个可配置值。如果没有给定一个值,故障计数的缺省值是2。另外,如果命令行中所给予的值比2少,最大数目将被设置为2。
每一个存活消息的广播之间的秒数目是可以使用一个关键字“BRDCAST_ALIVE-SECS”从命令行输入的一个可配置值。如果没有给定一个值,广播之间的缺省秒数目值是1秒。另外,如果命令行中所给予的值比1秒少,最大秒数目将被设置为1。
每一个常监视检查之间的秒数目是可以使用一个关键字“CONMON_CHK_SECS”从命令行输入的一个可配置值。如果没有给定一个值,检查之间的缺省秒数目值是2秒。另外,如果命令行中所给予的值比2秒少,最大秒数目将被设置为2。
作为每一个节点启动的一部分,在启动其它进程以前,NodePM启动NodeSI。作为其初始化的一部分,NodeSI读取包括被NodeSI所检测故障的定义的一个描述符文件(Fault.des),并且为这些故障记录产生一个列表(FaultInfoList)。每一个故障记录(FaultInfo)包括下述部分:
●FaultId-故障标识
●FaultActId-对每一个被报告故障应采取的动作。
当接收到故障时,NodeSI将在其列表(FaultInfoList)中,使用故障的标识来搜寻故障记录,并且执行与这个故障相关的动作。这些动作包括:
●激发合适的IPR。
●在检测到关于NodePM进程的灾难性故障时,中止这个节点。
●将关于可配置部件的自动状态改变报告给NodePM。
●将通信故障报告给NodePM并且依次报告给NetSI。
经过NodeSI的NotifyFault()操作,每一个进程将所有故障(从常监视器发起的或者其它进程发起的)报告给NodeSI。NodeSI跟踪这个服务器节点上的磁盘利用率,并且如果80(80%?)被使用了,就激发一个IPR。
NodePM接口
NodeSI使用NodePM所提供的接口来报告一个可配置部件状态的自动改变(AutoChgCEStat(…))。根据可配置部件对节点状态的影响,这个状态的改变可能会促使NodePM执行下述操作中的任何一个操作:
●降级节点的状态-如果可配置部件的状态改变对节点的当前操作状态有大的影响的话,就执行这个动作。在执行这个动作以前,NodePM将其内容通知给NetSI,并且启动一个定时器。然后在接收到来自NetPM的请求或者时间溢出后,它将对节点的状态进行降级。
●报告通信故障-如果可配置部件的状态改变指示是一个节点间通信的故障(TCP链路不能够提供服务),就执行这个动作。对于这个情形,NodePM将通信故障通知给NetSI,并且试图再建立通信。
NetSI接口
NetSI提供可以被NodeSI和/或者NodePM所使用的、用于报告下述条件的操作:
●一个IPU状态的自动改变(DowngradeIPStat(...))-在这个情形下,NetSI通过NetPM对这个节点进行降级(如果这个节点没有被中止,就请求NetPM执行降级)。
●通信故障(CommFaultRprt(...))-在这个情形下,如果其它IPU报告了关于这个相同IPU的通信故障,然后NetSI将这个IPU标识为发生故障的IPU,并且试图通过NetPM对这个IPU进行降级。
常监视器接口
为了检测和报告产生关于进程的不同信号的条件/事件,每一个可配置部件进程需要对常监视器对象进行实例化。常监视器经过NodeSI的NotifyFault()操作来报告这些条件。在无法将故障通知给NodeSI的情形下,常监视器将根据其实例化时所设置的选项来中止这个节点。
消息处理器/逻辑链路接口
消息处理器或者逻辑链路可配置部件进程使用NodeSI操作NotifyFault()来报告关于DNI/TCP链路的故障。
服务管理者(SMProcess)
服务管理子***提供对应用进程的进程控制。仅当节点已经达到在提供服务这个运行级别后,应用进程才运行。在一个服务器节点上,可以独立地删除/恢复应用进程,和独立地使能/关闭应用进程。网络管理通知服务管理需要删除,恢复,使能,关闭哪一个应用。服务管理所实现的特征包括:
-激活进程监视(心跳,审计)
-多进程实例支持
-应用进程状态管理
-管理状态
-操作状态
-使用状态
-应用进程状态改变通知
对提供一个一致的可配置部件接口的电信平台导航器特征来说,已经进行了一个改变来让服务管理启动***可配置部件,而不是NodePM来启动。通过这样做,这个***中的所有进程(除了服务管理)可以被服务管理来启动,所以一个可配置部件的特征在***的范围内来说是相同的。为了产生一个电信平台导航器GUI,已经存在了一个电信平台***的一个一致视图。图9A是显示在节点进行初始化期间,在电信平台的实体之间存在的新关系。对可以利用所有服务管理功能的一个可配置部件来说,就需要后面的服务管理接口。
产生一个引导描述文件230是需要在所有节点上进行运行所作的第一件事。当运行引导程序230时,它将标识平台管理者节点232,并且拷贝激活的平台管理者节点的Tcl描述符文件234进行使用,以启动这个节点。如果它判断出这是运行的第一个平台管理者节点,它将使用已经存在的Tcl描述符文件234来进行运行。
平台管理者子***,和服务管理子***236关于一可配置部件238所在平台的前一版本的概念是不同的。这两个概念被融合成一个可配置部件的概念,合并了它们分离的功能。为了实现这个,平台管理者子***将不再删除和恢复可配置部件,但是当它希望删除和恢复一个可配置部件时它将通知服务管理。现在,服务管理是第一个被启动的电信平台程序,并且作为其初始化的一部分,总数启动NodePM。然后,NodePM按照与以前相同的方法来控制进程的启动和停止,这个控制是仅通过服务管理,而不是通过老的RemoveCE和Restore CE功能。
图9B是显示节点被初始化为MIN_SET状态的一个消息流图。图9C是显示节点初始化为IN_SERVICE状态的一个消息流图。图9D是显示节点初始化为POST_ISV状态的一个消息流图。
图10总结了在SM和一个可配置部件之间所使用的消息协议。如果一个可配置部件不能够将一个服务管理接口(SMI)对象连接到其中,服务管理仍然将启动这个可配置部件,但是不能够获得服务管理所提供的很多服务。
事件管理者(eventmanagerimpl)
事件管理者子***给一个用户提供了一般将事件通知发送给一个或者多个已登记方的能力。多个事件∷管理者对象实例可能已经在***中存在。一个节点级别事件∷管理者存在于所有节点上。其它事件∷管理者实例也可能存在,来为感兴趣的方提供登记对一个进程来说很特殊的事件的能力。eventmanagerimpl程序提供了它正在其上运行的模式的、一个事件∷管理者对象实例。通过这个事件∷管理者实例,与一个节点相关的事件被发送。对一特定节点的事件感兴趣的用户可以通过使用这个节点名字作为实例∷管理者名字来绑定到这个节点事件∷管理者实例。程序也可以将一个事件:管理者对象嵌入到它们的程序内。IprMgrImpl程序是这样做的一个程序示例。IprMgrImpl有一个称作IprEventMgr的一个事件∷管理者。希望接收IPR事件的用户。对一特定事件感兴趣的用户可以使用一个特定的事件:管理者实例来进行登记,以通过这个事件:管理者实例来接收这个事件。事件∷管理者不永久地保存已经进行登记方的列表。如果事件∷管理者试图将一个事件转发到已经消失的一个事件∷接收器,这个事件∷接收器就从这个列表中被删除掉。
图11显示了使用在电信平台***中的事件∷管理者250的两个示例。eventmanagerimpl252包括节点事件∷管理者对象示例250。当这个节点的状态改变时,NodePMMain电信平台程序254使用这个事件∷管理者250来发送一个事件。当NodePMMain254通过调用关于“节点123”事件∷管理者250的通知,即事件∷管理者250将发现所有已经进行登记来接收这个事件的事件接收器对象258,而产生一个事件,然后应用程序256产生一个事件∷接收器对象268并且将一个CORBA对象参考传递到“节点123”事件∷管理者250上的登记调用。在应用程序已经登记了这个事件后,事件∷管理者250将调用关于这个事件∷接收器对象258的notify()方法,这个事件∷接收器对象258促使在应用程序256中激发这个notify()方法。在上述示例中,应用程序256已经登记了IprMgrImpl程序262中的“IprEventMgr”事件∷管理者260。当NodePMMain254使用IprMgrImpl接口来激发一个IPR时,IprMgrImpl程序262查询这个IPR,并且执行证实处理,并且调用“IprEventMgr”事件∷管理者260上的notify()。这促使事件∷管理者250将在登记呼叫中被传递的、所产生的事件传递到在应用程序256中的事件∷接收器264。
应用程序256可以使用与IprMgrImpl程序的方法相同的方法,使用其自己的名字来产生它们自己的事件∷管理者。事件:管理者实例在***中需要唯一的名字,以避免为一个不正确的事件∷管理者产生一个事件,或者避免一个用户登记到不正确的事件∷管理者。
IPR/告警 服务
信息和问题报告子***(IPR)为这个***中的所有进程提供了产生信息和产生问题报告的能力。IPR是标准的、用于将错误条件或者其它永久***信息通知给这个***的用户的机制。这个信息和问题报告子***实现对电信平台中IPR的收集。一个告警是可以被附着到一个IPR的一个机制。现在不提供告警服务,但是在将来的电信平台版本中将提供告警服务。
IPR子***提供了几个特征。它提供了激活/备份IPR服务冗余性,提供了将IPR转发到已登记接收器的能力,提供了将IPR转发到这个主机的能力,提供了实时显示IPR的能力,与传统的PAConfigurable部件IPR接口,一个CORBA IPR接口的后向兼容性,使用一个IPR字典来证实IPR的能力,提供关于从IPR字典发送出的IPR的附加信息的能力,和向IPR字典提供IPR的能力。
参考图12,IprMgrImpl程序是一个电信平台站点中所有IPR的收集点。这个程序包括IprMgrImpl CORBA服务器对象。IprMgrImpl对象运行在每一个激活/备份平台管理者节点上。IprMgrImpl对其作出反应的激活/备份状态是电信平台管理者节点的节点级激活/备份状态。当平台管理者节点改变激活/备份状态时,备份IprMgrImpl对象将不公布其接口,而激活的IprMgrImpl对象将公布其CORBA接口。通过这样做,两个IprMgr和IPRClient接口的客户用户将其IPR转发到激活的IprMgrImpl对象。
在IPR子***内使用事件管理者子***来发布IPR。这允许IPR被转发到多个目的地。通过使用事件管理者,附加的IPR特征可以被很容易地添加到***中,而不需要改变接口。IPR子***的事件管理者机制目前在电信平台中被使用,来提供某些已有的IPR服务。为了当IPR出现时显示它们,登记了实时IPR GUI270来接收IPR。Ipr2host程序272登记到IPR子***来接收IPR,并且将IPR转发到这个主机。一个IPR记录器也可以进行登记来接收需要被记录到磁盘的IPR。
Ipr2host程序272负责将IPR转发到这个主机。它从IprMgrImpl的事件管理者接收IPR,并且将其格式化为一个主机消息来进行转发。所有需要被转发到这个主机的IPR使用消息处理器子***来经过IPR_ASSERT逻辑链路来转发IPR。
IPR子***具有两个外部接口:IPRClient接口274和CORBA IPR接口276。IPRClient接口274的存在是为了与前面的PAConfigurable部件版本后向兼容。一旦已经使用IPRClient码来对从IPRClient接口274接收的、被发送IPR进行了转换,就使用一个IprMgrImplCORBA接口来发送一个IPR,以将IPR路由到激活的IprMgrImpl对象。这个接口仍然使用LOCIPRDB.DSK IPR字典来作为将老的PAConfigurable部件IPR转换为当前IPR子***格式的输入。这需要在每一个具有发送IPR程序的节点上驻留一个LOCIPRDB.DSK。在前一版本中,在IPR被转发到这个主机以前,LOCIPRDB.DSK字典被用于进行IPR证实。RegisterIPR公共软件被使用来将IPR输入到LOCIPRDB.DSK字典中。在数据库表目中的字段包括:ASCII关键字(IPR文本),主机IPR号码,IPR优先级,所使用的数据词的数目,和数据词格式。为了测试IPRMgr,在将被转换成一个关键字字典的ipr.in中,必须定义IPR(通过RegisterIPR公共软件)。
IprMgrImpl接口是一个CORBA IDL接口。如果使用这个接口来发送一个IPR,就不需要被输入到LOCIPRDB.DSK字典中。当IprMgrImpl对象接收到一个被发送的IPR时,它在其IPR字典中查找这个被发送的IPR,并且构造一个需要被发送的IPR事件。这个IPR事件包括从发送这个IPR的这个客户所传递来的信息,和从IPR字典中来的信息。在发送一个IPR以前,IPR必须被添加到IPR字典中和MegaHub主机IPR中。IprDriver工具被用于将IPR添加到IprMgrImpl IPR字典中。重新格式化和重新格式化2描述是帮助将一个VAX IPR文件转换为可以被IprDriver所使用的一个格式,以移植于IprMgrImpl IPR字典中。
图13显示了一个应用发送一个IPR,这个IPR管理者处理这个IPR,并且事件管理者将这个IPR路由到一个IPR GUI以进行显示的情形。
1)IPR GUI登记说希望接收被报告到IPR事件管理者的所有IPR。
2)一个应用发送一个IPR。
3)IPR管理者将这个IPR转发到这个事件管理者。
4)这个事件管理者将IPR分发到IPR GUI。
图14是一个IPR视图GUI屏幕打印的一个示例。IPR视图GUI应用提供了以一个分隔窗口显示IPR的方式。在顶部的窗口中,使用根据类型的方式,以花费与时间的关系来显示了IPR的图形视图。在底部窗口中,显示了IPR的一个传统的完全/简短文本视图。也允许显示子类型和对显示进行一定的客户定制。另外,对所显示的IPR也可以进行过滤和高亮度显示。通信是经过CORBA处理的。
统计服务
数据收集(DcMprocess,DcProcess)
参考图15,数据收集子***(DC)298提供了对一个节点内的应用程序进行业务量测量的功能。这些测量是被PegCounter类所记录的计数和被TimeMeter类所记录的花费时间。PegCounter299测试将间接地测试共享存储器300和信号量。客户进程301标记共享存储器300,并且数据收集298从共享存储器300收集数据并且发送到DCMaster302。每隔30分钟,数据收集298向DCMaster302(在激活的平台管理者节点内)发送30分钟内的peg计数器时隙299,并且然后数据收集将这些时隙清零。激活的平台管理者节点304更新备份平台管理者节点306。
参考图16,统计服务或者数据收集子***320提供了业务量测量和平台的测量能力。这个子***320支持统计测量,例如peg计数器,时间测量器,阈值计数器,收集和查询的产生,收集,和报告。PegCounter322和TimeMeter324被显示成可以支持分布式应用。数据收集子***320所实现的特征包括:
-PegCounter322和TimeMeter324 API支持
-对从多个节点来的累加数据的收集
-本地显示统计数据的报告GUI
-用户定义的测量集合,以报告客户定制的信息
阈值计数器(TCServer)
可以使用orbeline的ORB实施方式,将阈值计数器子***实现为一个对象请求代理(ORB)的分布式对象。经过orbeline,应用被连接到驻留在平台管理者节点中的一个服务器对象。这个服务器经过分布式对象消息环境(DOME),将计数器阈值的跨越报告给应用。这个服务器对象被阈值计数器服务器进程,TCServer所产生。每一个TCServer进程也经过orbeline与远程节点上的TCServers进行通信,以使计数器可以在站点之间被同步。TCServer使用在公共服务库中作为模板类RepShmDict被提供的永久字典,来将所有计数器保存在永久存储器中。
图17显示了在应用进程340和计数器服务器进程之间的通信路径。TCServer进程342经过Orbeline344和DOME346这两个来与应用进程340进行通信。TCServer进程342运行在一个orbelineimpl_is_ready循环中,以等待从应用进程340或者是从另一个节点上的一个TCServer服务器进程342来的服务请求。它产生一个DOMEReqServ调用来通知应用进程340,一个计数器已经达到其阈值。
参考图18,阈值计数器子***360API为应用程序的编程人员隐藏了与orbeline相关的实现细节部分。相反,子***的客户层包括两个层次:一个与ORB无关的层362,一个与ORB相关的层364。尽管为应用程序的编程人员隐藏了与orbeline相关的实现细节部分,但是子***的分布式特征没有被隐藏。为了使对计数器增加1所需要的时间最少,计数器增量被缓存在API中,并且以批处理的方式被发送到服务器。这意味着应用程序不能够立即接收到对API对象所进行的某些操作的成功或者失败的通知。
通信服务
消息处理(MsgHndl,LinkXXX)
如图19和20所显示的,消息处理子***370提供了基于消息的、处理器间的通信服务。一般,所有在服务器节点上的进程间通信均通过如图21所显示的分布式对象消息环境(DOME)372来执行。当必须在节点边界进行信息的交换通信时,DOME372使用消息处理子***370。消息处理子***370也用于与非服务器外部的***,例如SCP主机进行通信。消息处理子***370实现了下述特征。
-多协议的公共接口。
-TCP/IP 374
-UDP/IP 376
-DECNET 378
-连接到相同目的地的多链路的单访问标识(逻辑链路组名字)
-冗余链路过滤(改善了可扩展性)
-链路故障恢复
-异步接收接口
分布式对象服务
参考图21,DOME372是用于进程间客户/服务器通信的一个客户/服务器接口。它包括允许服务器进程382登记可以被客户进程384所使用的对象和成员函数的服务器接口382。DOME372包括可以保存这个服务器描述和一个独立的DOMEServices进程(domeSrv)的一个共享存储器数据库380,这个独立的DOMEServices进程(domeSrv)维护从其它节点来的服务器对象描述。它也包括提供对节点DOME数据库中的任何已经登记的服务器对象进行访问的客户接口384。
进程间通信子***主要包括DOME。DOME为一个进程提供了登记一个服务器对象和其方法的能力,其登记方法允许这个***中的其它进程可以激发这些方法。DOME支持故障登记模式和访问模式,并且包括可以帮助开发抗故障软件的、很多特殊选项。进程间通信子***实现的特征包括:
-跨越节点和站点,登记对象名字管理。
-具有优先级的请求处理
-激活/备份对象请求路由
-负载分担对象请求路由
-广播对象请求路由
-阻塞/非阻塞对象请求
公共服务
公共程序子***提供了一个编程工具库,来帮助快速地开发可以在平台层或者在平台层内部运行的进程。公共程序子***所实现的特征包括:
-命令行对象
-跟踪对象
-共享存储器对象
-信号语对象
-关键字字典对象
-列表对象
-复制的、关键字字典对象
-共享存储器字典对象
-等等。
DbgTrace对象
参考图22,DbgTrace工具软件400提供了将跟踪消息发送到一个跟踪缓冲器,发送到一个文件,和/或者发送到标准错误的能力。跟踪数据可以使用两个不同的格式来输入:标准的打印格式,和一个数据缓冲器转储格式。一个掩码402可以被用于过滤掉不同级别的消息。对每一个DbgTrace组来说,有32个可能的掩码级别。
DbgCntl接口404是DbgTrace对象400的控制接口。它允许用户规定DbgTrace工具软件400的很多不同方面。这个接口允许用户对DbgTrace工具对象400作下面的事情:
-设置/获得一个DbgTrace组400的掩码402。
-设置/获得内部消息缓冲器410的大小。
-获得一个已经存在组的列表。
-打开/关闭到标准错误的显示
-打开/关闭一次将跟踪到一个文件的一次转储。
-使能/关闭在它们被覆盖以前,将跟踪数据转储到文件的能力。
一个DbgDisk接口允许用户规定对所有的写请求,跟踪缓冲器410将被写到哪一个文件中。
DbgTrace工具软件400允许用户产生每一个可以属于多个组中一个组的不同DbgTrace对象400。这允许用户有对每一个组唯一的一个掩码值。所有经过DbgTrace接口400被发送的跟踪被保存在一个内部消息缓冲器中。除了内部缓冲器外,用户还可以规定是否需要发送到标准的错误上。
跟踪对象
跟踪对象给用户提供了可选地将跟踪消息发送到标准错误的能力。当这个用户发送一个跟踪时,就规定了表示这个跟踪将被输出的跟踪级别的一个掩码。这个跟踪接口允许这个用户规定一个掩码,其中这个UNIX进程中跟踪的所有实例将使用这个掩码来决定是否发送这个跟踪消息。这个跟踪掩码必须支持8个唯一的掩码值。
字典管理***
参考图23,字典管理提供了被设计成支持数据保存和访问的类。字典可以被保存在磁盘上(永久地)或者被保存在存储器中。字典也可以是私有的(仅被本地进程所使用)或者所共享的(可以被多个进程所访问)。这些字典的目的由应用程序来定义。DmsMaster430和DmsServer432之间所进行的基本交互通信是当DmsMaster430从这个应用接收到一个更新消息时,DmsMaster430更新DmsServer432。DmsMaster430作为平台管理者节点中的激活/备份来运行,而DmsServer432在所有的IPU(或者一个子集)中运行。
事件服务
事件服务提供了在松散耦合的进程间,产生和分发对一个任务特别重要的特定事件的能力。一个事件的一个示例是一个输入/输出转移的完成。这个事件服务可以是基于CORBA的进程间通信工具软件。它使用使一个对象执行一个操作的标准CORBA请求。这通过事件管理者实现程序来完成。
通过定义对象的两个不同作用,可以分离对象之间的通信;产生了异步的通信。一个对象接收和累加新事件,而另一个对象登记对转发这些新事件的兴趣。这由两个CORBA类来实现,EventManager和EventReceiver。EventManager提供了用于接收新事件的一个接口定义语言(IDL)接口。EventReceiver为希望接收事件的客户提供了一个接口定义语言接口。
软件和硬件表示
图24显示了一个电信平台***的硬件图。在最高层,一个电信平台***包括一个或者多个站点440。在一个站点440内部,存在多个节点442。
软件表示是分层的,允许软件部件可以被组合到一起。图25显示了这个分层结构。一个应用450存在在最高层。一个应用450由一个或者多个可配置部件集合452组成,可配置部件集合452由一个或者多个可配置部件454组成。一个***内可以定义多个应用450。一个***内部的所有这些应用450可以组成一个***的软件表示。
图26中所显示的、将软件动态地匹配到一个***的硬件表示描述了,一个应用450的部分如何被放置到节点442上。站点440包括应用450。应用450具有处理器服务组456。处理器服务组456跨越多个节点442。节点442的上面配置有可配置部件集合452。可配置部件454驻留在可配置部件集合452中。例如,表示一个与时间相关的路由应用的一个软件可能具有两个可配置部件集合:WestCoastSet和EastCoastSet。在这个WestCoastSet集合内,与时间相关的路由应用可能具有需要在处理西部海岸呼叫的节点上运行的所有程序。这可能包括专门为西部海岸处理而配置的数据库程序,链路进程,等等。在这个EastCoastSet集合内,与时间相关的路由应用可能具有需要在处理西部海岸呼叫的节点上运行的所有程序。然后,与时间相关的路由应用可能被分配到一个站点上。那些将运行与时间相关的路由应用的节点将被组合成处理器服务组。然后,这个应用的可配置部件集合将被放置在已经被添加到一个与时间相关的路由应用处理器服务组中的节点上。
尽管已经详细描述了本发明的几个实施方式和其优点,但是应理解,可以进行变化,改变,替换,变换,修改,改动,和改变,而不会偏离本发明的思想,不会偏离后附权利要求书所提出的、本发明的精神和范围。
Claims (42)
1.一个电信平台,形成在执行电信功能的应用程序和运行在一个站点的至少一个节点上、并且用于支撑应用程序的一个操作***之间的一个接口,并且进一步形成在应用程序和一个电信网络之间的一个接口,包括:
网络管理进程,可以用于提供节点间配置,监视和管理功能;
节点管理进程,可以用于提供节点的初始化,配置,监视和管理功能;
事件进程,可以用于对预定的事件作出响应,提供任务的初始化,终结,和分发;
公共进程,可以用于提供开发应用程序的多个编程工具库;
通信进程,可以用于提供消息处理功能;和
分布式对象进程,可以用于为面向对象的通信提供一个分布式数据库。
2.如权利要求1所提出的这个电信平台,进一步包括信息和问题报告和告警进程,用于提供错误条件监视,告警和报告。
3.如权利要求1所提出的这个电信平台,进一步包括统计进程,可以用于提供访问***测量数据的方法和提供产生关于***测量数据的报告。
4.如权利要求1所提出的这个电信平台,进一步包括字典进程,用于提供数据保存和访问方法。
5.如权利要求1所提出的这个电信平台,进一步包括图形用户界面进程,可以用于提供图形用户界面的建立方法。
6.如权利要求1所提出的这个电信平台,进一步包括:
至少一个平台管理节点,在这个节点上可以支持网络管理进程;
至少一个应用节点,连接到至少一个平台管理节点,并且可以支持节点管理进程。
7.如权利要求6所提出的这个电信平台,其中所述至少一个平台管理节点也是所述至少一个应用节点。
8.如权利要求6所提出的这个电信平台,其中所述至少一个平台管理节点包括:
一第一平台管理节点,工作在一个激活模式下;和
一第二平台管理节点,工作在一个备用模式下。
9.如权利要求6所提出的这个电信平台,其中所述至少一个平台管理节点包括两个或者多个工作在一个负载分担模式的平台管理节点。
10.如权利要求1所提出的这个电信平台,其中所述网络管理进程包括:
一个网络平台管理者,可以用于从服务中删除节点,可以将节点恢复到服务中,可以从服务中删除应用,可以将应用恢复到服务中;
一个网络***完整性管理者,可以用于监视节点和恢复发生故障的节点;和
一个配置管理者,可以用于与连接到这个电信平台的一个主机进行交互通信。
11.如权利要求1所提出的这个电信平台,其中所述节点管理进程包括:
一个节点平台管理者,可以用于为一个节点提供管理功能;
一个服务管理者,可以用于根据所述节点平台管理者的指令来启动和停止进程;和
一个节点***完整性管理者,可以用于监视节点间链路。
12.如权利要求1所提出的这个电信平台,其中所述事件进程包括:
一个事件管理者,可以用于登记希望接收事件的客户进程;和
一个事件接收器,可以用于为被登记来接收事件的客户进程提供一个接口。
13.如权利要求1所提出的这个电信平台,其中所述公共管理进程包括:一个定时器管理者,可以用于提供日期和时间功能。
14.如权利要求1所提出的这个电信平台,其中所述统计管理进程包括:
一个peg计数器进程,可以用于对发生在多个节点间的特定事件进行计数;
一个时间测量进程,可以用于累加一特定事件的持续时间;
一个数据收集进程,可以用于收集关于一个节点的计数器数据并且保存所述被收集的数据。
15.一个方法,用于在执行电信功能的应用程序和运行在一个站点的至少一个节点上、并且用于支撑应用程序的一个操作***之间提供一个软件接口,并且进一步形成在应用程序和一个电信网络之间的一个接口,包括:
提供可以用于提供节点间配置,监视和管理功能的网络管理进程;
提供可以用于提供节点的初始化,配置,监视和管理功能的节点管理进程;
提供事件进程,所述事件进程可以用于对预定的事件作出响应,提供任务的初始化,终结,和分发;
提供公共进程,所述公共进程可以用于提供开发应用程序的多个编程工具库;
提供可以用于提供消息处理功能的通信进程;和
提供可以用于为面向对象的通信提供一个分布式数据库的分布式对象进程。
16.如权利要求15所提出的这个方法,进一步包括提供用于提供错误条件监视,告警和报告的信息和问题报告和告警进程。
17.如权利要求15所提出的这个方法,进一步包括统计进程,所述统计进程可以用于提供访问***测量数据的方法和提供用于报告关于***测量数据的方法。
18.如权利要求15所提出的这个方法,进一步包括提供用于提供数据保存和访问方法的字典进程。
19.如权利要求15所提出的这个方法,进一步包括提供可以用于提供图形用户界面的建立方法的图形用户界面进程。
20.如权利要求15所提出的这个方法,进一步包括:
在至少一个平台管理节点上运行所述网络管理进程;和
在至少一个连接到所述至少一个平台管理节点上的应用节点上运行所述节点管理进程。
21.如权利要求20所提出的这个方法,进一步包括在也用作一个应用节点上的一个平台管理节点上运行所述网络管理进程和所述节点管理进程。
22.如权利要求20所提出的这个方法,进一步包括:
使一第一平台管理节点工作在一个激活模式;和
使一第二平台管理节点工作在一备用模式。
23.如权利要求20所提出的这个方法,进一步包括使两个或者多个平台管理节点工作在一个负载分担的模式。
24.如权利要求15所提出的这个电信平台,其中提供所述网络管理进程包括:
提供了可以用于从服务中删除节点,可以将节点恢复到服务中,可以从服务中删除应用,可以将应用恢复到服务中的一个网络平台管理者;
提供了可以用于监视节点和恢复发生故障的节点的一个网络***完整性管理者;和
提供了可以用于与连接到这个电信平台的一个主机进行交互通信的一个配置管理者。
25.如权利要求24所提出的这个方法,其中提供所述节点管理进程包括:
提供可以用于为一个节点提供管理功能的一个节点平台管理者;
提供可以用于根据所述节点平台管理者的指令来启动和停止进程的一个服务管理者;和
提供可以用于监视节点间链路的一个节点***完整性管理者。
26.如权利要求15所提出的这个方法,其中提供所述事件进程包括:
提供一个事件管理者,可以用于登记希望接收事件的客户进程;和
提供一个事件接收器,可以用于为被登记来接收事件的客户进程提供一个接口。
27.如权利要求15所提出的这个方法,其中提供所述公共管理进程包括:提供可以用于提供日期和时间功能的一个定时器管理者。
28.如权利要求15所提出的这个方法,其中提供所述统计管理进程包括:
提供一个计数器进程,可以用于对发生在多个节点间的特定事件进行计数;
提供一个时间测量进程,可以用于累加一特定事件的持续时间;
提供一个数据收集进程,可以用于收集关于一个节点的计数器数据并且保存所述被收集的数据。
29.如权利要求15所提出的这个方法,进一步包括:
运行一个引导脚本;
根据所述引导脚本来启动一个服务管理者;
所述服务管理者启动一个节点的一个节点平台管理者;
所述服务管理者启动所述节点的运行最小电信程序的状态PRE_MIN配置部件;
所述服务管理者启动所述节点的最小可操作状态OS_MIN配置部件;和
对所述节点中的所述最小可操作状态OS_MIN配置部件作出响应,将所述节点的状态升级。
30.如权利要求25所提出的这个方法,包括:
监视和检测一个可配置部件中的一个故障;
将所述故障通知给所述服务管理者;
所述服务管理者产生所述可配置部件的一个状态改变,并且将所述通知转发到所述节点***完整性管理者;
所述节点***完整性管理者将所述通知转发到所述节点平台管理者;
对所述发生故障的可配置部件作出响应,所述节点平台管理者判断所述节点的状态;和
所述节点平台管理者将一个节点状态的改变通知给所述网络平台管理者。
31.如权利要求30所提出的这个方法,进一步包括:
所述网络平台管理者决定在具有所述发生故障的可配置部件的一个应用中的状态改变,和决定其中包括具有所述发生故障的可配置部件的所述应用的一个处理器服务组的状态改变;和
将任何状态改变通知给所述配置管理者。
32.如权利要求31所提出的这个方法,进一步包括所述配置管理者将一个节点,处理器服务组或者应用的状态改变通知给一个主机。
33.如权利要求25所提出的这个方法,进一步包括:
一个应用登记到一个事件管理者,以表示希望接收一特定的事件;
所述事件接收器将特定的事件发送到已经登记的应用。
34.一个方法,用于在执行电信功能的应用程序和运行在一个站点的至少一个节点上、并且用于支撑应用程序的一个操作***之间提供一个软件接口,并且进一步形成在应用程序和一个电信网络之间的一个接口,包括:
提供可以用于从服务中删除节点,可以将节点恢复到服务中,可以从服务中删除应用,可以将应用恢复到服务中的一个网络平台管理者;
提供了可以用于监视节点和恢复发生故障的节点的一个网络***完整性管理者;
提供了可以用于与连接到这个电信平台的一个主机进行交互通信的一个配置管理者;
提供可以用于为一个节点提供管理功能的一个节点平台管理者;
提供可以用于根据所述节点平台管理者的指令来启动和停止进程的一个服务管理者;和
提供可以用于监视节点间链路的一个节点***完整性管理者。
35.如权利要求34所提出的这个方法,进一步包括:
提供一个事件管理者,可以用于登记希望接收事件的客户进程;和
提供一个事件接收器,可以用于为被登记来接收事件的客户进程提供一个接口。
36.如权利要求34所提出的这个方法,进一步包括提供可以用于提供日期和时间功能的一个定时器管理者。
37.如权利要求34所提出的这个方法,进一步包括:
提供一个计数器进程,可以用于对发生在多个节点间的特定事件进行计数;
提供一个时间测量进程,可以用于累加一特定事件的持续时间;
提供一个数据收集进程,可以用于收集关于一个节点的计数器数据并且保存所述被收集的数据。
38.如权利要求34所提出的这个方法,进一步包括:
运行一个引导脚本;
根据所述引导脚本来启动一个服务管理者;
所述服务管理者启动一个节点的一个节点平台管理者;
所述服务管理者启动所述节点的运行最小电信程序的状态PRE_MIN配置部件;
所述服务管理者启动所述节点的最小可操作状态OS_MIN配置部件;和
对所述节点中的所述最小可操作状态OS_MIN配置部件作出响应,将所述节点的状态升级。
39.如权利要求34所提出的这个方法,包括:
监视和检测一个可配置部件中的一个故障;
将所述故障通知给所述服务管理者;
所述服务管理者产生所述可配置部件的一个状态改变,并且将所述通知转发到所述节点***完整性管理者;
所述节点***完整性管理者将所述通知转发到所述节点平台管理者;
对所述发生故障的可配置部件作出响应,所述节点平台管理者判断所述节点的状态;和
所述节点平台管理者将一个节点状态的改变通知给所述网络平台管理者。
40.如权利要求39所提出的这个方法,进一步包括:
所述网络平台管理者决定在具有所述发生故障的可配置部件的一个应用中的状态改变,和决定其中包括具有所述发生故障的可配置部件的所述应用的一个处理器服务组的状态改变;和
将任何状态改变通知给所述配置管理者。
41.如权利要求40所提出的这个方法,进一步包括所述配置管理者将一个节点,处理器服务组或者应用的状态改变通知给一个主机。
42.如权利要求34所提出的这个方法,进一步包括:
一个应用登记到一个事件管理者,以表示希望接收一特定的事件;
所述事件接收器将特定的事件发送到已经登记的应用。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US6957697P | 1997-12-12 | 1997-12-12 | |
US60/069,576 | 1997-12-12 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1297654A CN1297654A (zh) | 2001-05-30 |
CN1157960C true CN1157960C (zh) | 2004-07-14 |
Family
ID=22089911
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB988121077A Expired - Fee Related CN1157960C (zh) | 1997-12-12 | 1998-12-11 | 电信平台***及其方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US6269396B1 (zh) |
EP (1) | EP1040678B1 (zh) |
JP (1) | JP4565740B2 (zh) |
CN (1) | CN1157960C (zh) |
AU (1) | AU1820599A (zh) |
DE (1) | DE69832096T2 (zh) |
ES (1) | ES2251118T3 (zh) |
WO (1) | WO1999030514A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101232540B (zh) * | 2008-02-21 | 2012-04-04 | 中兴通讯股份有限公司 | ***间消息交互方法及消息交互*** |
Families Citing this family (131)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6735773B1 (en) | 1998-06-27 | 2004-05-11 | Intel Corporation | Method and apparatus for issuing commands to a network processor configured to provide a plurality of APIs |
US6657959B1 (en) | 1998-06-27 | 2003-12-02 | Intel Corporation | Systems and methods for implementing ABR with guaranteed MCR |
US6724767B1 (en) | 1998-06-27 | 2004-04-20 | Intel Corporation | Two-dimensional queuing/de-queuing methods and systems for implementing the same |
US6728249B2 (en) | 1998-06-27 | 2004-04-27 | Intel Corporation | System and method for performing cut-through forwarding in an ATM network supporting LAN emulation |
US6603768B1 (en) | 1998-06-27 | 2003-08-05 | Intel Corporation | Multi-protocol conversion assistance method and system for a network accelerator |
US6604136B1 (en) * | 1998-06-27 | 2003-08-05 | Intel Corporation | Application programming interfaces and methods enabling a host to interface with a network processor |
JP3834452B2 (ja) * | 1999-04-01 | 2006-10-18 | セイコーエプソン株式会社 | 機器管理システム、管理サーバ及びコンピュータ読取可能な記録媒体 |
US6513129B1 (en) * | 1999-06-30 | 2003-01-28 | Objective Systems Integrators, Inc. | System and method for managing faults using a gateway |
US6820214B1 (en) * | 1999-07-26 | 2004-11-16 | Microsoft Corporation | Automated system recovery via backup and restoration of system state |
US6851073B1 (en) * | 1999-07-26 | 2005-02-01 | Microsoft Corporation | Extensible system recovery architecture |
US7089300B1 (en) * | 1999-10-18 | 2006-08-08 | Apple Computer, Inc. | Method and apparatus for administering the operating system of a net-booted environment |
US6751658B1 (en) | 1999-10-18 | 2004-06-15 | Apple Computer, Inc. | Providing a reliable operating system for clients of a net-booted environment |
US6857023B2 (en) * | 2000-04-25 | 2005-02-15 | Pegasus Solutions, Inc. | System uses an interface controller for managing operations of devices that each has a unique communication protocol |
US20020026473A1 (en) * | 2000-08-31 | 2002-02-28 | Telefonaktiebolaget Lm Ericsson (Publ) | Application-programming-interface-based method and system including triggers |
US6888937B1 (en) * | 2000-09-06 | 2005-05-03 | Cisco Technology, Inc. | Managing processes of a network component |
US7043636B2 (en) * | 2000-09-26 | 2006-05-09 | Telefonaktiebolaget Lm Ericsson (Publ) | Data integrity mechanisms for static and dynamic data |
US6725266B1 (en) * | 2000-10-05 | 2004-04-20 | Hewlett-Packard Development Company, L.P. | System and method for changing the status of a system service |
US7099955B1 (en) | 2000-10-19 | 2006-08-29 | International Business Machines Corporation | End node partitioning using LMC for a system area network |
US6941350B1 (en) | 2000-10-19 | 2005-09-06 | International Business Machines Corporation | Method and apparatus for reliably choosing a master network manager during initialization of a network computing system |
US6981025B1 (en) | 2000-10-19 | 2005-12-27 | International Business Machines Corporation | Method and apparatus for ensuring scalable mastership during initialization of a system area network |
US6990528B1 (en) | 2000-10-19 | 2006-01-24 | International Business Machines Corporation | System area network of end-to-end context via reliable datagram domains |
US6978300B1 (en) * | 2000-10-19 | 2005-12-20 | International Business Machines Corporation | Method and apparatus to perform fabric management |
US7636772B1 (en) | 2000-10-19 | 2009-12-22 | International Business Machines Corporation | Method and apparatus for dynamic retention of system area network management information in non-volatile store |
US7113995B1 (en) | 2000-10-19 | 2006-09-26 | International Business Machines Corporation | Method and apparatus for reporting unauthorized attempts to access nodes in a network computing system |
US7606898B1 (en) | 2000-10-24 | 2009-10-20 | Microsoft Corporation | System and method for distributed management of shared computers |
DE10052929A1 (de) * | 2000-10-25 | 2002-05-08 | Alcatel Sa | Verfahren und Vorrichtung (RNC) zum Steuern eines Funkzellenclusters bestehend aus mehreren Funkzellen eines Multistandard-Funknetzwerks |
US7278104B1 (en) * | 2000-11-02 | 2007-10-02 | Lucent Technologies Inc. | Graphical user interface for managing network elements |
US20020073257A1 (en) * | 2000-12-07 | 2002-06-13 | Ibm Corporation | Transferring foreign protocols across a system area network |
US7051326B2 (en) * | 2000-12-13 | 2006-05-23 | International Business Machines Corporation | Code image distribution in a multi-node network of processors |
US20020091720A1 (en) * | 2001-01-05 | 2002-07-11 | Jun Liu | Methods and arrangements for providing improved software version control in managed devices |
US7143405B2 (en) * | 2001-01-05 | 2006-11-28 | Microsoft Corporation | Methods and arrangements for managing devices |
GB2372175B (en) | 2001-02-13 | 2004-06-23 | Vodafone Ltd | Provision of services via a mobile telecommunications network |
US7882253B2 (en) * | 2001-04-05 | 2011-02-01 | Real-Time Innovations, Inc. | Real-time publish-subscribe system |
US20040015856A1 (en) * | 2001-05-15 | 2004-01-22 | Goward Philip J. | Automatically propagating distributed components during application development |
US8032625B2 (en) | 2001-06-29 | 2011-10-04 | International Business Machines Corporation | Method and system for a network management framework with redundant failover methodology |
ATE308208T1 (de) * | 2001-07-06 | 2005-11-15 | Koninkl Kpn Nv | Abfrage- und analyseverfahren für mstp in einem funktelekommunikationsnetzwerk |
US20030046433A1 (en) * | 2001-07-25 | 2003-03-06 | Omer Luzzatti | Method to synchronize information between online devices |
US7584425B2 (en) * | 2001-07-31 | 2009-09-01 | Verizon Business Global Llc | Systems and methods for generating reports |
US20030046334A1 (en) * | 2001-08-29 | 2003-03-06 | Simpson Shell S. | Client resident service that launches a browser to provide device status |
US7389332B1 (en) | 2001-09-07 | 2008-06-17 | Cisco Technology, Inc. | Method and apparatus for supporting communications between nodes operating in a master-slave configuration |
CN100388698C (zh) * | 2001-10-19 | 2008-05-14 | 上海贝尔有限公司 | 用于数字数据网接入模块的管理指配控件及其控制方法 |
KR100408048B1 (ko) * | 2001-12-31 | 2003-12-01 | 엘지전자 주식회사 | 인터넷 기반 ip전화 시스템 서버의 다중화 방법 |
US20030140093A1 (en) * | 2002-01-23 | 2003-07-24 | Factor Cory L. | Method and apparatus for providing content over a distributed network |
US7587759B1 (en) * | 2002-02-04 | 2009-09-08 | Mcafee, Inc. | Intrusion prevention for active networked applications |
US7415270B2 (en) * | 2002-02-15 | 2008-08-19 | Telefonaktiebolaget L M Ericsson (Publ) | Middleware services layer for platform system for mobile terminals |
US7363033B2 (en) * | 2002-02-15 | 2008-04-22 | Telefonaktiebolaget Lm Ericsson (Publ) | Method of and system for testing equipment during manufacturing |
US7286823B2 (en) * | 2002-02-15 | 2007-10-23 | Telefonaktiebolaget Lm Ericsson (Publ) | Mobile multimedia engine |
US7240830B2 (en) * | 2002-02-15 | 2007-07-10 | Telefonaktiebolaget Lm Ericsson (Publ) | Layered SIM card and security function |
US8079015B2 (en) * | 2002-02-15 | 2011-12-13 | Telefonaktiebolaget L M Ericsson (Publ) | Layered architecture for mobile terminals |
US7536181B2 (en) * | 2002-02-15 | 2009-05-19 | Telefonaktiebolaget L M Ericsson (Publ) | Platform system for mobile terminals |
US7421478B1 (en) | 2002-03-07 | 2008-09-02 | Cisco Technology, Inc. | Method and apparatus for exchanging heartbeat messages and configuration information between nodes operating in a master-slave configuration |
US7200610B1 (en) | 2002-04-22 | 2007-04-03 | Cisco Technology, Inc. | System and method for configuring fibre-channel devices |
US7433952B1 (en) | 2002-04-22 | 2008-10-07 | Cisco Technology, Inc. | System and method for interconnecting a storage area network |
US7587465B1 (en) | 2002-04-22 | 2009-09-08 | Cisco Technology, Inc. | Method and apparatus for configuring nodes as masters or slaves |
US7188194B1 (en) * | 2002-04-22 | 2007-03-06 | Cisco Technology, Inc. | Session-based target/LUN mapping for a storage area network and associated method |
US7415535B1 (en) * | 2002-04-22 | 2008-08-19 | Cisco Technology, Inc. | Virtual MAC address system and method |
US7165258B1 (en) | 2002-04-22 | 2007-01-16 | Cisco Technology, Inc. | SCSI-based storage area network having a SCSI router that routes traffic between SCSI and IP networks |
US7240098B1 (en) | 2002-05-09 | 2007-07-03 | Cisco Technology, Inc. | System, method, and software for a virtual host bus adapter in a storage-area network |
US7509436B1 (en) | 2002-05-09 | 2009-03-24 | Cisco Technology, Inc. | System and method for increased virtual driver throughput |
US7302692B2 (en) | 2002-05-31 | 2007-11-27 | International Business Machines Corporation | Locally providing globally consistent information to communications layers |
US7143615B2 (en) * | 2002-07-31 | 2006-12-05 | Sun Microsystems, Inc. | Method, system, and program for discovering components within a network |
US20040045007A1 (en) * | 2002-08-30 | 2004-03-04 | Bae Systems Information Electronic Systems Integration, Inc. | Object oriented component and framework architecture for signal processing |
US7149510B2 (en) * | 2002-09-23 | 2006-12-12 | Telefonaktiebolaget Lm Ericsson (Publ) | Security access manager in middleware |
US7350211B2 (en) | 2002-09-23 | 2008-03-25 | Telefonaktiebolaget Lm Ericsson (Publ) | Middleware application environment |
US7478395B2 (en) * | 2002-09-23 | 2009-01-13 | Telefonaktiebolaget L M Ericsson (Publ) | Middleware application message/event model |
US7730155B1 (en) | 2002-10-01 | 2010-06-01 | Apple Inc. | Method and apparatus for dynamically locating resources |
US6876733B2 (en) * | 2002-12-03 | 2005-04-05 | International Business Machines Corporation | Generic service component for message formatting |
CN1317653C (zh) * | 2002-12-25 | 2007-05-23 | 中兴通讯股份有限公司 | 一种数据库连接的高效管理方法 |
CN1300979C (zh) * | 2003-01-28 | 2007-02-14 | 华为技术有限公司 | 全动态分布式网络服务管理***及其服务方法 |
JP2004259044A (ja) * | 2003-02-26 | 2004-09-16 | Hitachi Ltd | 情報処理装置の管理方法およびシステム |
US7831736B1 (en) | 2003-02-27 | 2010-11-09 | Cisco Technology, Inc. | System and method for supporting VLANs in an iSCSI |
US7890543B2 (en) | 2003-03-06 | 2011-02-15 | Microsoft Corporation | Architecture for distributed computing system and automated design, deployment, and management of distributed applications |
US8122106B2 (en) | 2003-03-06 | 2012-02-21 | Microsoft Corporation | Integrating design, deployment, and management phases for systems |
US7092504B1 (en) * | 2003-03-18 | 2006-08-15 | Sprint Communications Company L.P. | Method and system for presenting data stored within a network component |
US7295572B1 (en) | 2003-03-26 | 2007-11-13 | Cisco Technology, Inc. | Storage router and method for routing IP datagrams between data path processors using a fibre channel switch |
US7433300B1 (en) | 2003-03-28 | 2008-10-07 | Cisco Technology, Inc. | Synchronization of configuration data in storage-area networks |
US7904599B1 (en) | 2003-03-28 | 2011-03-08 | Cisco Technology, Inc. | Synchronization and auditing of zone configuration data in storage-area networks |
US7526527B1 (en) | 2003-03-31 | 2009-04-28 | Cisco Technology, Inc. | Storage area network interconnect server |
JP2004361994A (ja) * | 2003-05-30 | 2004-12-24 | Toshiba Corp | データ管理装置、データ管理方法及びプログラム |
EP1484678A1 (en) * | 2003-06-04 | 2004-12-08 | Hewlett-Packard Development Company, L.P. | Method and system for running a software application to perform a plurality of similar tasks |
US7451208B1 (en) | 2003-06-28 | 2008-11-11 | Cisco Technology, Inc. | Systems and methods for network address failover |
US7774774B1 (en) * | 2003-10-22 | 2010-08-10 | Apple Inc. | Software setup system |
CN100463535C (zh) * | 2003-11-28 | 2009-02-18 | 中兴通讯股份有限公司 | 一种电信网管机架板位图的数据绑定方法 |
US7475406B2 (en) * | 2003-12-15 | 2009-01-06 | International Business Machines Corporation | Event notification structure for dynamically aggregated logical components |
US7431699B2 (en) * | 2003-12-24 | 2008-10-07 | Cardiac Pacemakers, Inc. | Method and apparatus for third heart sound detection |
US7115096B2 (en) | 2003-12-24 | 2006-10-03 | Cardiac Pacemakers, Inc. | Third heart sound activity index for heart failure monitoring |
US7778422B2 (en) | 2004-02-27 | 2010-08-17 | Microsoft Corporation | Security associations for devices |
US20050246529A1 (en) | 2004-04-30 | 2005-11-03 | Microsoft Corporation | Isolated persistent identity storage for authentication of computing devies |
JP4722558B2 (ja) * | 2004-06-01 | 2011-07-13 | 株式会社小松製作所 | ダイクッション装置 |
US20050278693A1 (en) * | 2004-06-15 | 2005-12-15 | Brunell Edward G | Distribution adaptor for network management application development |
US20060070082A1 (en) * | 2004-06-15 | 2006-03-30 | Manjula Sridhar | Managed object framework for network management application development |
US20060036721A1 (en) * | 2004-06-15 | 2006-02-16 | Dong Zhao | Run-time tool for network management application |
US7555743B2 (en) * | 2004-06-15 | 2009-06-30 | Alcatel-Lucent Usa Inc. | SNMP agent code generation and SNMP agent framework for network management application development |
US20060004856A1 (en) * | 2004-06-15 | 2006-01-05 | Xiangyang Shen | Data management and persistence frameworks for network management application development |
US20050278361A1 (en) * | 2004-06-15 | 2005-12-15 | Brunell Edward G | View definition language for network management application development |
US20050278708A1 (en) * | 2004-06-15 | 2005-12-15 | Dong Zhao | Event management framework for network management application development |
JP4576249B2 (ja) * | 2005-01-27 | 2010-11-04 | 株式会社クラウド・スコープ・テクノロジーズ | ネットワーク管理装置及び方法 |
US8489728B2 (en) | 2005-04-15 | 2013-07-16 | Microsoft Corporation | Model-based system monitoring |
US7802144B2 (en) | 2005-04-15 | 2010-09-21 | Microsoft Corporation | Model-based system monitoring |
US7922669B2 (en) | 2005-06-08 | 2011-04-12 | Cardiac Pacemakers, Inc. | Ischemia detection using a heart sound sensor |
US8549513B2 (en) | 2005-06-29 | 2013-10-01 | Microsoft Corporation | Model-based virtual system provisioning |
CN100579146C (zh) * | 2005-09-02 | 2010-01-06 | 深圳市东进通讯技术股份有限公司 | 综合电信平台中的模块配置管理方法 |
US7533128B1 (en) | 2005-10-18 | 2009-05-12 | Real-Time Innovations, Inc. | Data distribution service and database management systems bridge |
US7941309B2 (en) | 2005-11-02 | 2011-05-10 | Microsoft Corporation | Modeling IT operations/policies |
US20070112954A1 (en) * | 2005-11-15 | 2007-05-17 | Yahoo! Inc. | Efficiently detecting abnormal client termination |
US7780606B2 (en) | 2006-03-29 | 2010-08-24 | Cardiac Pacemakers, Inc. | Hemodynamic stability assessment based on heart sounds |
US7865583B2 (en) * | 2006-03-31 | 2011-01-04 | The Invention Science Fund I, Llc | Aggregating network activity using software provenance data |
US7783853B1 (en) | 2006-04-24 | 2010-08-24 | Real-Time Innovations, Inc. | Memory usage techniques in middleware of a real-time data distribution system |
US8671135B1 (en) | 2006-04-24 | 2014-03-11 | Real-Time Innovations, Inc. | Flexible mechanism for implementing the middleware of a data distribution system over multiple transport networks |
US7827559B1 (en) | 2006-04-24 | 2010-11-02 | Real-Time Innovations, Inc. | Framework for executing multiple threads and sharing resources in a multithreaded computer programming environment |
US8977252B1 (en) * | 2006-07-06 | 2015-03-10 | Gryphonet Ltd. | System and method for automatic detection and recovery of malfunction in mobile devices |
JP4377899B2 (ja) * | 2006-09-20 | 2009-12-02 | 株式会社東芝 | リソース管理装置及びプログラム |
US7974211B2 (en) * | 2006-10-30 | 2011-07-05 | Hewlett-Packard Development Company, L.P. | Methods and apparatus for network configuration baselining and restoration |
US20080119749A1 (en) | 2006-11-20 | 2008-05-22 | Cardiac Pacemakers, Inc. | Respiration-synchronized heart sound trending |
US8096954B2 (en) | 2006-11-29 | 2012-01-17 | Cardiac Pacemakers, Inc. | Adaptive sampling of heart sounds |
JP4249780B2 (ja) * | 2006-12-26 | 2009-04-08 | 株式会社東芝 | リソースを管理する装置、およびプログラム |
US7853327B2 (en) | 2007-04-17 | 2010-12-14 | Cardiac Pacemakers, Inc. | Heart sound tracking system and method |
JP4907603B2 (ja) * | 2007-06-27 | 2012-04-04 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー. | アクセス制御システムおよびアクセス制御方法 |
JP2009086733A (ja) * | 2007-09-27 | 2009-04-23 | Toshiba Corp | 情報処理装置、情報処理装置の制御方法および情報処理装置の制御プログラム |
US7958386B2 (en) * | 2007-12-12 | 2011-06-07 | At&T Intellectual Property I, L.P. | Method and apparatus for providing a reliable fault management for a network |
JP2010102612A (ja) * | 2008-10-27 | 2010-05-06 | Seiko Epson Corp | デバイス状態通知装置 |
JP5238525B2 (ja) * | 2009-01-13 | 2013-07-17 | 株式会社東芝 | リソースを管理する装置、およびプログラム |
US9690818B2 (en) * | 2009-12-01 | 2017-06-27 | Sybase, Inc. | On demand locking of retained resources in a distributed shared disk cluster environment |
US8830240B1 (en) * | 2011-09-30 | 2014-09-09 | Rockwell Collins, Inc. | Universal stack analyzer |
US8943034B2 (en) * | 2011-12-22 | 2015-01-27 | Sap Se | Data change management through use of a change control manager |
US9081818B2 (en) * | 2012-03-13 | 2015-07-14 | Hewlett-Packard Development Company, L.P. | SAS fabric discovery |
US9497095B2 (en) * | 2012-03-22 | 2016-11-15 | International Business Machines Corporation | Dynamic control over tracing of messages received by a message broker |
TWI594186B (zh) * | 2012-05-16 | 2017-08-01 | 緯創資通股份有限公司 | 虛擬頻道之管理方法、擷取數位內容之方法及具有虛擬頻道之網路多媒體重現系統 |
US9542172B2 (en) | 2013-02-05 | 2017-01-10 | Apple Inc. | Automatic updating of applications |
CN103647668A (zh) * | 2013-12-16 | 2014-03-19 | 上海证券交易所 | 一种高可用集群内主机群体决策***及切换方法 |
US9800515B2 (en) * | 2014-01-31 | 2017-10-24 | Apollo Education Group, Inc. | Mechanism for controlling a process on a computing node based on the participation status of the computing node |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0587880A1 (en) * | 1992-04-07 | 1994-03-23 | Digital Equipment Corporation | Entity management system with remote call feature |
WO1997007638A1 (en) * | 1995-08-15 | 1997-02-27 | Broadcom Eireann Research Limited | A communications network management system |
GB2308779B (en) * | 1995-12-28 | 1998-06-10 | Nokia Telecommunications Oy | Telecommunications network management system |
US5726979A (en) | 1996-02-22 | 1998-03-10 | Mci Corporation | Network management system |
US5940487A (en) * | 1996-04-10 | 1999-08-17 | Alcatel Usa Sourcing, L.P. | Programmable call processing system and method |
-
1998
- 1998-12-11 ES ES98963110T patent/ES2251118T3/es not_active Expired - Lifetime
- 1998-12-11 CN CNB988121077A patent/CN1157960C/zh not_active Expired - Fee Related
- 1998-12-11 EP EP98963110A patent/EP1040678B1/en not_active Expired - Lifetime
- 1998-12-11 DE DE69832096T patent/DE69832096T2/de not_active Expired - Lifetime
- 1998-12-11 US US09/211,016 patent/US6269396B1/en not_active Expired - Lifetime
- 1998-12-11 AU AU18205/99A patent/AU1820599A/en not_active Abandoned
- 1998-12-11 JP JP2000524941A patent/JP4565740B2/ja not_active Expired - Fee Related
- 1998-12-11 WO PCT/US1998/026439 patent/WO1999030514A2/en active IP Right Grant
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101232540B (zh) * | 2008-02-21 | 2012-04-04 | 中兴通讯股份有限公司 | ***间消息交互方法及消息交互*** |
Also Published As
Publication number | Publication date |
---|---|
JP2001526508A (ja) | 2001-12-18 |
WO1999030514A2 (en) | 1999-06-17 |
ES2251118T3 (es) | 2006-04-16 |
AU1820599A (en) | 1999-06-28 |
DE69832096D1 (de) | 2005-12-01 |
CN1297654A (zh) | 2001-05-30 |
JP4565740B2 (ja) | 2010-10-20 |
EP1040678B1 (en) | 2005-10-26 |
US6269396B1 (en) | 2001-07-31 |
WO1999030514A3 (en) | 1999-07-22 |
DE69832096T2 (de) | 2006-07-13 |
EP1040678A2 (en) | 2000-10-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1157960C (zh) | 电信平台***及其方法 | |
CN1225709C (zh) | 分散存储型多处理机***及故障恢复方法 | |
CN1149492C (zh) | 遥控方法和服务器 | |
CN1669001A (zh) | 用于服务器整合环境的业务连续性策略 | |
CN1275152C (zh) | 制造和更新可***的便携式操作***模块的***和方法 | |
CN1115884C (zh) | 可编程的呼叫处理***和方法 | |
CN1608257A (zh) | 包括相关矩阵和基于量度分析的聚集***资源分析 | |
CN1906583A (zh) | 信息处理设备、中断处理控制方法、以及计算机程序 | |
CN101044498A (zh) | 工作流服务体系结构 | |
CN1870532A (zh) | 一种信令跟踪方法和*** | |
CN1466720A (zh) | 代理程序*** | |
CN1601483A (zh) | 一种基于脚本解释工具的自动化软件测试*** | |
CN1779660A (zh) | 三者间的异步复制 | |
CN1805349A (zh) | 传感器网络***、传感器数据的检索方法及程序 | |
CN101069157A (zh) | 用于访问资源的方法和*** | |
CN1650274A (zh) | 操作管理方法和操作管理服务器 | |
CN1678998A (zh) | ***事件过滤和给过程控制对象连接和嵌入法客户的通知 | |
CN1502191A (zh) | 路由器和路由协议冗余 | |
CN1684029A (zh) | 存储*** | |
CN101042676A (zh) | 存储***以及存储区域释放方法以及存储装置 | |
CN1200514A (zh) | 信息处理方法和装置及存储服务器控制程序的存储器媒体 | |
CN1658184A (zh) | 网络***、分布式处理方法和信息处理装置 | |
CN1285032C (zh) | 外部事件处理器***和方法 | |
CN1637714A (zh) | 远程复制网络 | |
CN1846419A (zh) | 自管理媒介信息流 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20040714 Termination date: 20161211 |
|
CF01 | Termination of patent right due to non-payment of annual fee |