KR20170032608A - Enterprise Business Service Level Integration Monitoring Method and System - Google Patents

Enterprise Business Service Level Integration Monitoring Method and System Download PDF

Info

Publication number
KR20170032608A
KR20170032608A KR1020150130138A KR20150130138A KR20170032608A KR 20170032608 A KR20170032608 A KR 20170032608A KR 1020150130138 A KR1020150130138 A KR 1020150130138A KR 20150130138 A KR20150130138 A KR 20150130138A KR 20170032608 A KR20170032608 A KR 20170032608A
Authority
KR
South Korea
Prior art keywords
service
services
displaying
display step
resource
Prior art date
Application number
KR1020150130138A
Other languages
Korean (ko)
Other versions
KR101738770B1 (en
Inventor
김원철
유영채
손영섭
Original Assignee
에스케이 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 에스케이 주식회사 filed Critical 에스케이 주식회사
Priority to KR1020150130138A priority Critical patent/KR101738770B1/en
Priority to PCT/KR2016/009651 priority patent/WO2017047951A1/en
Publication of KR20170032608A publication Critical patent/KR20170032608A/en
Application granted granted Critical
Publication of KR101738770B1 publication Critical patent/KR101738770B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5009Determining service level performance parameters or violations of service level contracts, e.g. violations of agreed response time or mean time between failures [MTBF]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/18Delegation of network management function, e.g. customer network management [CNM]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5003Managing SLA; Interaction between SLA and QoS
    • H04L41/5019Ensuring fulfilment of SLA

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Marketing (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Debugging And Monitoring (AREA)

Abstract

An integration monitoring method and system of an enterprise business service level is provided. The integration monitoring method according to the embodiment of the present invention includes monitoring services and resources provided by an enterprise, displaying the services, and displaying the status of the resources used to provide a selected service. Thus, it is easy to check the cause of the service failure and to determine the scope of impact, by an integrated monitoring system centering on services and tasks.

Description

엔터프라이즈 비즈니스 서비스 레벨의 통합 모니터링 방법 및 시스템{Enterprise Business Service Level Integration Monitoring Method and System}{Enterprise Business Service Level Integration Monitoring Method and System}

본 발명은 기업 시스템 모니터링 기술에 관한 것으로, 더욱 상세하게는 엔터프라이즈 비즈니스 수준의 서비스들을 제공하는데 사용되는 기업 시스템을 모니터링하는 방법 및 시스템에 관한 것이다.The present invention relates to enterprise system monitoring technology, and more particularly, to a method and system for monitoring enterprise systems used to provide services at an enterprise business level.

비즈니스 서비스를 제공하기 위해서는 시스템이 필요하다. 서비스를 제공하기 위해 사용되는 시스템은 여러 개의 리소스들로 구성되는 것이 일반적이며, 시스템 구성은 복잡해지고 있는 추세에 있다.A system is needed to provide business services. The system used to provide the service is generally composed of a plurality of resources, and the system configuration is becoming more complicated.

특히, 대규모 기업에 의해 제공되는 엔터프라이즈 비즈니스의 경우에는, 아주 많은 서비스들을 아주 복잡하게 구성된 시스템으로 제공하기 때문에, 규모 면에서 방대하고, 서비스 연계 측면에서 매우 복잡하다.Especially in the case of enterprise business provided by a large corporation, it provides a large number of services in a very complicated system, so it is large in scale and very complex in terms of service linkage.

이에 따라, 서비스 장애 발생에 대한 모니터링 역시 매우 복잡할 수 밖에 없어, 서비스 장애 감지 및 이를 위한 대응에 많은 인력이 필요하고 막대한 비용이 소요된다.As a result, the monitoring of the occurrence of the service failure is also very complicated, requiring a large amount of manpower for the service failure detection and countermeasures, and a great cost.

본 발명은 상기와 같은 문제점을 해결하기 위하여 안출된 것으로서, 본 발명의 목적은, 엔터프라이즈 비즈니스를 위해 복잡하게 연결된 여러 서비스들의 장애를 보다 효과적으로 통합 모니터링할 수 있도록 하는 방법 및 시스템을 제공함에 있다.SUMMARY OF THE INVENTION The present invention has been made in order to solve the above-mentioned problems, and it is an object of the present invention to provide a method and system for more effectively monitoring a failure of various services connected to an enterprise business.

상기 목적을 달성하기 위한 본 발명의 일 실시예에 따른, 서비스 통합 모니터링 방법은, 기업에서 제공하는 서비스들 및 상기 서비스들을 제공하는데 사용되는 리소스들을 모니터링하는 단계; 상기 서비스들을 표시하는 제1 표시단계; 및 상기 서비스들 중 선택된 서비스를 제공하는데 사용되는 리소스들의 현황을 표시하는 제2 표시단계;를 포함한다.According to an aspect of the present invention, there is provided a service integration monitoring method comprising: monitoring a service provided by an enterprise and resources used to provide the services; A first display step of displaying the services; And a second display step of displaying a status of resources used to provide the selected one of the services.

그리고, 상기 제1 표시단계는, 상기 서비스들을 해당 등급에 따라 구분하여 표시하고, 서비스의 등급은, 장애 발생시 상기 기업의 비즈니스에 미치는 영향을 기초로 결정될 수 있다.In the first display step, the services are classified according to the corresponding class and displayed, and the class of the service can be determined on the basis of the influence on the business of the company when a failure occurs.

또한, 본 발명의 일 실시예에 따른 서비스 통합 모니터링 방법은, 선택된 서비스와 연관된 서비스들을 선택가능하도록 표시하는 제3 표시단계; 및 연관 서비스들 중 선택된 연관 서비스를 제공하는데 사용되는 리소스들의 현황을 표시하는 제4 표시단계;를 더 포함할 수 있다.According to another aspect of the present invention, there is provided a service integration monitoring method comprising: a third display step of displaying services associated with a selected service so as to be selectable; And a fourth display step of displaying a status of resources used to provide the selected associated service among the related services.

그리고, 상기 제1 표시단계는, 상기 서비스들 중 장애가 발생한 서비스를 다른 서비스들과 다르게 표시할 수 있다.In addition, the first display step may display a service in which a failure occurs among the services differently from other services.

또한, 상기 제2 표시단계는, 선택된 서비스가 장애가 발생한 서비스인 경우, 상기 리소스들 중 장애가 발생한 리소스를 다른 리소스와 다르게 표시할 수 있다.Also, in the second display step, when the selected service is a service in which a failure occurs, the resource in which the failure has occurred among the resources may be displayed differently from the other resources.

그리고, 상기 제2 표시단계는, 발생된 장애들에 대한 정보를 표시하되, 장애 등급에 따라 구분하여 표시할 수 있다.In addition, the second display step may display information on the generated obstacles, and may be classified according to the fault class.

또한, 본 발명의 일 실시예에 따른 서비스 통합 모니터링 방법은, 상기 리소스들 중 선택된 리소스의 세부 상태를 표시하는 제5 표시단계;를 더 포함할 수 있다.In addition, the service integration monitoring method according to an embodiment of the present invention may further include displaying a detailed state of the selected resource among the resources.

그리고, 상기 제5 표시단계는, 선택된 리소스가 장애가 발생한 리소스인 경우, 상기 리소스에 발생된 장애들에 대한 정보를 표시할 수 있다.The fifth display step may display information on the faults generated in the resource when the selected resource is a faulty resource.

또한, 상기 제5 표시단계는, 상기 장애가 발생한 리소스에 대해 수행된 변경 작업에 대한 정보를 표시할 수 있다.In addition, the fifth display step may display information on a change operation performed on the resource in which the failure occurs.

한편, 본 발명의 다른 실시예에 따른, 서비스 통합 모니터링 시스템은, 기업에서 제공하는 서비스들 및 상기 서비스들을 제공하는데 사용되는 리소스들을 모니터링하여 정보를 수집하는 수집부; 및 상기 서비스들을 표시하는 화면 및 상기 서비스들 중 선택된 서비스를 제공하는데 사용되는 리소스들의 현황을 표시하는 화면을 생성하는 생성부;를 포함한다.According to another aspect of the present invention, there is provided a service integration monitoring system comprising: a collecting unit for collecting information by monitoring services used by a company and resources used to provide the services; And a generation unit generating a screen displaying the screen for displaying the services and the status of resources used for providing the selected one of the services.

이상 설명한 바와 같이, 본 발명의 실시예들에 따르면, 서비스와 업무를 중심으로 한 통합 모니터링 시스템을 통해, 시스템 상황실에서 서비스 장애의 원인 파악과 영향 범위 판단이 용이 해진다.As described above, according to the embodiments of the present invention, it is easy to grasp the cause of the service failure and determine the influence range in the system status room through the integrated monitoring system centered on the service and the service.

또한, 본 발명의 실시예들에 따르면, 이를 기반으로 빠른 의사결정을 내릴 수 있어, 효율적인 장애 상황 관리가 가능해지고, 발생한 장애를 빠르게 조치할 수 있게 된다.In addition, according to the embodiments of the present invention, it is possible to make quick decisions based on this, and it is made possible to efficiently manage the fault situation and to quickly deal with the fault that has occurred.

도 1은 본 발명의 일 실시예에 따른 서비스 통합 모니터링 방법의 개념 설명에 제공되는 도면,
도 2는 서비스 통합 모니터링 초기 화면,
도 3은 서비스 모니터링 화면,
도 5는 SOP 현황 상세 정보,
도 6은 서비스 배포 현황 상세 정보, 그리고,
도 7은 본 발명의 다른 실시예에 따른 서비스 통합 모니터링 시스템의 블럭도이다.
FIG. 1 is a block diagram illustrating a concept of a service integration monitoring method according to an exemplary embodiment of the present invention.
2 shows an initial screen for service integration monitoring,
3 shows a service monitoring screen,
5 shows SOP status details,
FIG. 6 shows service distribution status details,
7 is a block diagram of a service integration monitoring system according to another embodiment of the present invention.

이하에서는 도면을 참조하여 본 발명을 보다 상세하게 설명한다.Hereinafter, the present invention will be described in detail with reference to the drawings.

도 1은 본 발명의 일 실시예에 따른 서비스 통합 모니터링 방법의 개념 설명에 제공되는 도면이다. 본 발명의 실시예에 따른 서비스 통합 모니터링 방법은, 엔터프라이즈 기업의 비즈니스 서비스 레벨에서 통합 모니터링을 수행한다.FIG. 1 is a diagram illustrating a concept of a service integration monitoring method according to an embodiment of the present invention. Referring to FIG. The integrated service monitoring method according to an exemplary embodiment of the present invention performs integrated monitoring at a business service level of an enterprise.

구체적으로, 도 1에 도시된 바와 같이, 엔터프라이즈 비즈니스를 위한 기업의 시스템에서, 서비스들과 이 서비스들을 제공하는데 사용되는 서버, 네트워크, WEB/WAS, DBMS, 스토리지, 애플리케이션 등의 리소스들이 모니터링 대상이 된다.Specifically, as shown in FIG. 1, in an enterprise system for an enterprise business, resources such as services and servers, networks, WEB / WAS, DBMS, storage, and applications used to provide these services are monitored do.

이를 위해, 서비스 통합 모니터링 시스템은, "①"에 나타난 바와 같이, 서비스들과 리소스들의 상태 정보를 수집한다. 하나의 상태 정보로부터 단일 패턴 분석을 통해 장애로 판단되는 경우, 서비스 통합 모니터링 시스템은 정보 수집 과정 중에 알람을 발생시킨다.To this end, the service integration monitoring system collects status information of services and resources as shown in "1 ". When it is judged from the single state information through the single pattern analysis, the service integration monitoring system generates an alarm during the information collection process.

또한, 서비스 통합 모니터링 시스템은, 수집된 서비스들과 리소스들의 상태 정보를 필터링하고, 표준/정형화한 후 연계/가공하여, 장애 예측 분석의 기초 정보를 생성할 수 있다.In addition, the service integration monitoring system can filter the state information of collected services and resources, and standard / formulate and link / process the information to generate basic information of the failure prediction analysis.

한편, 서비스 통합 모니터링 시스템은, "②"에 나타난 바와 같이, 다수의 서비스 상태 정보들로부터 복합 패턴 분석을 통해, 장애 징후를 감지하고, 장애 징후가 감지되면 알람을 발생시킨다.On the other hand, as shown in (2), the service integration monitoring system detects a failure symptom through a complex pattern analysis from a plurality of service state information and generates an alarm when a failure symptom is detected.

나아가, "①"에서 연계/가공된 기초 정보들을 장기간 누적하여 획득한 빅 데이터를 분석하여 장애 예측을 수행할 수도 있다.Furthermore, it is also possible to perform the failure prediction by analyzing the big data obtained by accumulating the basic information linked / processed in "①" for a long period of time.

또한, "③"에 나타난 바와 같이, 서비스 통합 모니터링 시스템은 관계-맵을 생성하고, 업데이트하여 관리한다. 관계-맵에는, 서비스들 간의 연관 관계, 서비스들을 제공하는데 사용되는 리소스들에 대한 정보가 서비스 별로 구축되어 있다.Also, as shown in (3), the service integration monitoring system generates and updates the relationship-map. In the relationship-map, information on resources used to provide services and relationships between services is constructed for each service.

관계-맵은, 장애 발생에 의한 비즈니스/서비스 영향도를 판단하고, 서비스 통합 모니터링 결과를 체계적으로 제공하여 주기 위해 필요하다.The relationship-map is necessary to determine the business / service impact due to the occurrence of the failure and systematically provide the service integration monitoring result.

"④"에 나타난 바와 같이, 서비스 통합 모니터링 시스템에 의해, 서비스 장애 발생 여부에 대한 모니터링은 자동으로 이루어지고 장애 발생시 운영자에게 알람을 발생시킨다.As shown in "④", the service integration monitoring system automatically monitors the occurrence of a service failure and generates an alarm to the operator in the event of a failure.

지금까지 설명한 방법에 의한 서비스 통합 모니터링의 결과는 계층적으로 구성된 체계적인 화면들을 통해 운영자에게 제공된다. 계층적 화면 구성에 의해, 운영자는 시스템 장애 발생시 이를 빠르게 감지할 수 있고, 원인 분석을 신속하게 수행할 수 있어, 장애를 최소화할 수 있다.The result of the service integration monitoring by the method described up to now is provided to the operator through hierarchical structured screens. The hierarchical screen configuration allows the operator to quickly detect when a system failure occurs and to quickly analyze the cause of the failure, thereby minimizing the failure.

이하에서, 서비스 통합 모니터링 화면들에 대해, 도 2 내지 도 6을 참조하여 상세히 설명한다. 도 2는 서비스 통합 모니터링 초기 화면을 나타낸 도면이다. 이는, 최상위 화면에 해당한다.Hereinafter, the service integration monitoring screens will be described in detail with reference to FIG. 2 to FIG. 2 is a view showing an initial service integration monitoring screen. This corresponds to the topmost screen.

도 2에 도시된 바와 같이, 서비스 통합 모니터링 초기 화면에는, 엔터프라이즈 비즈니스를 통해 제공하는 서비스들이 표시된다. 서비스들은 그룹화되어 있다. 예를 들어, 서비스-21 내지 서비스-26은 서비스-2로 그룹화되어 있다.As shown in FIG. 2, services provided through the enterprise business are displayed in the service integration monitoring initial screen. Services are grouped. For example, Service-21 to Service-26 are grouped into Service-2.

도 2에 표현하지는 않았지만, 서비스들은 서비스 등급에 따라 구분하여 표시될 수 있다. 이를 테면,Although not shown in FIG. 2, the services can be classified and displayed according to the service class. For example,

1) 장애 시 비즈니스에 영향을 미쳐 직접적인 손해가 발생하는 서비스에 대해서는 S 등급,1) For services that are directly affected by business disruption,

2) 장애 시 비즈니스에 영향을 미치기는 하지만 직접적으로 손해가 발생하지는 않는 서비스 또는 전 직원의 업무 수행에 영향을 미치는 서비스에 대해서는 A 등급,2) For services that affect the business in the event of a disability but do not directly cause damage, or services that affect the performance of all employees, Class A,

3) 장애 시 일부 직원의 업무 수행에 영향을 미치는 서비스에 대해서는 B 등급,3) For services that affect the performance of some employees in case of disability,

4) 장애가 발생해도 즉각적인 조치를 요하지 않는 서비스에 대해서는 C 등급4) For services that do not require immediate action in the event of a disability,

을 각각 부여하고, 등급에 해당하는 태그를 생성하여, 서비스들의 우측 상부에 부가 표시되도록 구현하는 것이 가능하다.And a tag corresponding to the rating is generated, and it is possible to implement an additional display in the upper right portion of the services.

서비스의 등급은 항상 표시되는 것이 아닌, 운영자의 요청/명령이 있는 경우에만 표시되도록 한정할 수도 있다.The rating of the service may not always be displayed, but may be limited to display only when there is an operator's request / command.

또한, 서비스 통합 모니터링 초기 화면에 나열되는 서비스들 중 장애가 발생한 서비스에 대해서는 다른 서비스들과 다르게 표시되도록 한다. 예를 들어, 도 2에 도시된 바와 같이, 장애가 발생한 서비스-23이 다른 서비스들과 다르게 표시되는 것이다.In addition, among the services listed on the initial screen of the service integration monitoring, the failed service is displayed differently from the other services. For example, as shown in FIG. 2, the service -23 in which a failure occurs is displayed differently from other services.

구체적으로는, 장애가 발생한 서비스의 색상을 다른 서비스의 색상과 다르게 표시하는 것인데, 이때 장애 등급(위험도)에 따라 색상의 종류가 달라지도록 할 수 있다. 이를 테면, 서비스에 영향을 미치는 장애가 발생한 경우에는 장애 경보를 의미하는 붉은색으로, 서비스에 영향은 없지만 즉각적인 조치가 필요한 경우에는 상황 경보를 의미하는 주황색으로, 즉각적인 조치가 필요한지 확신할 수 없지만 점검이 필요한 경우에는 예측 경보를 의미하는 노란색으로, 표시하는 것이다.Specifically, the color of the service in which the failure occurs is displayed differently from the color of the other services. At this time, the type of the color can be changed according to the failure level (risk level). For example, in the event of a failure affecting the service, it is red, indicating a failure alarm. In the event that the service is unaffected but immediate action is required, it is orange, indicating a situation alarm. If necessary, it is displayed in yellow, which means predictive alarm.

도 2에 도시된 서비스 통합 모니터링 초기 화면에 나열된 서비스들 중 운영자에 의해 하나가 선택되면, 선택된 서비스를 제공하는데 사용되는 리소스들의 현황이 하나의 화면에 표시된다.When one of the services listed in the service integration monitoring initial screen shown in FIG. 2 is selected by the operator, the status of the resources used to provide the selected service is displayed on one screen.

리소스들은, 앞서 언급한 서버, 네트워크, WEB/WAS, DBMS, 스토리지, 애플리케이션 등을 지칭한다.Resources refer to the aforementioned servers, networks, WEB / WAS, DBMS, storage, applications, and the like.

도 3에는 서비스 통합 모니터링 초기 화면에서 서비스-23이 선택된 경우에 제공되는 서비스 모니터링 화면을 나타내었다. 도 3에 도시된 바와 같이, 서비스 모니터링 화면의 우측 부분을 통해 서비스-23을 제공하는데 사용되는 모든 리소스들에 대한 현황은 물론 그들의 상태까지 파악할 수 있다.FIG. 3 shows a service monitoring screen provided when Service-23 is selected in the service integration monitoring initial screen. As shown in FIG. 3, the status of all the resources used to provide the service -23 through the right part of the service monitoring screen can be grasped as well as their status.

한편, 도 2에 나열된 서비스들 중 운영자가 선택할 수 있는 서비스는 장애가 발생한 서비스에 국한되지 않음에 유념하여야 한다. 즉, 장애가 발생하지 않은 서비스를 선택하여, 그 서비스를 제공하는 사용되는 리소스들의 현황과 상태를 파악하는 것도 가능함은 물론이다.It should be noted that, among the services listed in FIG. 2, the service that the operator can select is not limited to the service in which the failure occurs. That is, it is also possible to select a service in which no failure has occurred, and to grasp the status and status of resources used to provide the service.

장애가 발생한 서비스에 대한 모니터링 화면의 경우, 리소스들 중 장애가 발생한 리소스에 대해서는 다른 리소스들과 다르게 표시된다. 예를 들어, 서비스-23을 제공하는데 사용되는 리소스들 중 DBMS에 장애가 발생한 경우에는, 도 3에 도시된 바와 같이, DBMS가 다른 리소스들과 다르게 표시, 이를 테면 붉은 색으로 표시된다.In the case of a monitoring screen for a service in which a failure occurs, among the resources, a failure resource is displayed differently from other resources. For example, when a failure occurs in the DBMS among the resources used for providing the service-23, the DBMS is displayed differently from other resources, for example, red, as shown in FIG.

또한, 도 3의 좌측 상부에 나타난 바와 같이, 서비스-23에 대해 발생된 장애 정보가 표시된다. 그리고, 이 장애 정보는 장애 등급에 따라 지정된 색상으로 표시된다.In addition, as shown in the upper left part of FIG. 3, the fault information generated for the service -23 is displayed. The fault information is displayed in the designated color according to the fault class.

하나의 서비스에 대해 다수의 장애가 발생할 수도 있다. 이 경우에는, 다수의 장애 정보들이 해당 장애 등급에 부여된 색상으로 표시된다.Multiple failures may occur for a single service. In this case, a plurality of pieces of fault information are displayed in a color assigned to the fault class.

한편, 도 3의 우측 상부에 나타난 "관련 서비스" 에는, 연관된 서비스들이 나열되는데, 운영자는 나열된 서비스들 중 하나를 선택할 수 있다. 운영자에 의해 나열된 연관 서비스들 중 하나가 선택되면, 선택된 연관 서비스를 제공하는데 사용되는 리소스들의 현황과 상태가 나타난 서비스 모니터링 화면이 표시된다.On the other hand, in the "related service" shown at the upper right of Fig. 3, the related services are listed, and the operator can select one of the listed services. If one of the associated services listed by the operator is selected, a service monitoring screen displaying the status and status of the resources used to provide the selected associated service is displayed.

여기서, 연관 서비스란 업무가 연동된 서비스이다. 예를 들어, 서비스-23의 업무-1이 서비스-12의 업무-3와 연동되는 경우, 서비스-23은 서비스-12의 연관 서비스이고, 마찬가지로 서비스-12는 서비스-23의 연관 서비스이다.Here, the related service is a service in which tasks are linked. For example, if Task-1 of Service-23 is interworking with Task-3 of Service-12, Service-23 is an associated service of Service-12, and Service-12 is an Association Service of Service-23.

나아가, 도 3의 좌측 중앙부에는, 서비스에 대한 자동 점검 히스토리가 나타난다. 아울러, 좌측의 SOP 탭을 통해 장애 발생에 대한 표준운영절차를 안내할 수 있는데, 도 4에는 이를 통해 제공되는 상세 정보를 예시하였다.Further, in the left center part of FIG. 3, an automatic check history of the service appears. In addition, the standard operation procedure for the occurrence of a fault can be guided through the left SOP tab. FIG. 4 illustrates detailed information provided through the SOP tab.

또한, 우측의 배포 현황 탭을 통해 서비스 배포 현황을 안내할 수 있다. 도 5에는 이를 통해 제공되는 상세 정보를 예시하였다.In addition, the service distribution status can be guided through the distribution status tab on the right side. FIG. 5 illustrates the detailed information provided through this.

한편, 서비스 모니터링 화면에 나열된 리소스들 중 운영자에 의해 하나가 선택되면, 선택된 리소스에 대한 보다 구체적인 상태 정보가 하나의 화면에 표시된다. 한편, 동종의 리소스가 다수인 경우 하나를 선택하는 절차가 추가된다.On the other hand, if one of the resources listed on the service monitoring screen is selected by the operator, more specific status information about the selected resource is displayed on one screen. On the other hand, when there are a plurality of homogeneous resources, a procedure for selecting one is added.

예를 들어, 도 3에서 DBMS 아래에 표기된 "2"는 서비스-23을 제공하는데 사용되는 DBMS가 2개가 있음을 나타낸다. 따라서, 도 3에서 DBMS를 선택하면, 2개의 DBMS들 중 하나를 선택받기 위한 메뉴가 나타나고, 운영자는 이 메뉴를 통해 1개의 DBMS를 선택하여야 한다. 한편, 메뉴 상에서는, 장애가 발생한 DBMS가 그렇지 않은 DBMS와 다른 색상으로 구분되어 표시된다.For example, "2 " shown below the DBMS in FIG. 3 indicates that there are two DBMSs used to provide the service -23. Accordingly, when the DBMS is selected in FIG. 3, a menu for selecting one of the two DBMSs appears, and the operator must select one DBMS through this menu. On the other hand, on the menu, the DBMS in which the failure occurs is displayed in a different color from the DBMS in which the failure occurs.

도 3에 나열된 리소스들 중 운영자가 선택할 수 있는 리소스는 장애가 발생한 리소스에 국한되지 않음에 유념하여야 한다. 즉, 장애가 발생하지 않은 리소스를 선택하여, 그 리소스의 세부 상태를 파악하는 것도 가능함은 물론이다.It should be noted that among the resources listed in FIG. 3, the resources that the operator can select are not limited to the resources that are failing. That is, it goes without saying that it is also possible to select a resource that has not failed and to grasp the detailed state of the resource.

도 6에는, 도 3에 도시된 서비스 모니터링 화면에서 DBMS가 선택된 경우에 제공되는 DBMS 모니터링 화면을 나타내었다. 도 6에 도시된 바와 같이, 리소스 모니터링 화면에는, 리소스 상태에 대한 상세 정보가 표시되고, 장애 정보와 배포 정보가 제공되며, 관련 서비스들이 나열된다. 여기서, 관련 서비스들은, 해당 리소스를 사용하는 서비스들이다.FIG. 6 shows a DBMS monitoring screen provided when the DBMS is selected in the service monitoring screen shown in FIG. As shown in FIG. 6, in the resource monitoring screen, detailed information on the resource status is displayed, fault information and distribution information are provided, and related services are listed. Here, the related services are services using the corresponding resource.

한편, 리소스 모니터링 화면의 좌측 하부에는, 해당 리소스에 대해 수행된 변경 작업에 대한 정보가 표시된다. 변경 작업은 해당 리소스에 장애를 발생시켰을 가능성이 높은 원인이 될 수 있으므로, 운영자에게 이를 특별히 안내하는 것이다.On the other hand, in the lower left part of the resource monitoring screen, information about a change operation performed on the resource is displayed. The change can be a high possibility that the resource has failed, so it is a special guide to the operator.

나아가, 장애가 발생할 경우, 해당 서비스 혹은 리소스와 관련된 전일 혹은 최근에 발생한 소스 배포 현황과 변경 작업 현황을 자동으로 매핑하여 보여 줌으로써, 장애 원인 분석이 신속히 이루어질 수 있도록 할 수 있다.Furthermore, when a fault occurs, the source distribution status of the previous or latest occurrence related to the service or resource is automatically mapped to the status of the change operation so that the cause of the failure can be quickly analyzed.

도 7은 본 발명의 다른 실시예에 따른 서비스 통합 모니터링 시스템의 블럭도이다. 이해의 편의를 위해, 도 7에는 모니터링 대상이 되는 기업 시스템(10)을 더 도시하였다.7 is a block diagram of a service integration monitoring system according to another embodiment of the present invention. For ease of understanding, FIG. 7 further shows the enterprise system 10 to be monitored.

본 발명의 실시예에 따른 서비스 통합 모니터링 시스템(100)은, 수집부(110), 관계-맵 저장부(120), 분석부(130), 저장부(140) 및 모니터링 화면 생성부(150)를 포함한다.The service integration monitoring system 100 according to an embodiment of the present invention includes a collection unit 110, a relation-map storage unit 120, an analysis unit 130, a storage unit 140, and a monitoring screen generation unit 150, .

수집부(110)는 서비스 상태 정보와 리소스 상태 정보를 수집하고, 배포 현황과 변동 작업에 대한 정보를 수집하여 저장부(140)에 저장한다. 또한, 수집부(110)는 수집된 단일 정보로부터 단일 패턴 분석을 통해 서비스나 리소스의 장애 여부를 판단하고, 장애 발생시에는 알람을 발생시킨다.The collection unit 110 collects the service status information and the resource status information, and collects information on the distribution status and the variation job and stores the collected information in the storage unit 140. In addition, the collecting unit 110 determines whether a service or a resource has failed through a single pattern analysis from the collected single information, and generates an alarm when a failure occurs.

또한, 수집부(110)는 수집된 상태 정보들을 필터링하고, 표준/정형화한 후 연계/가공하여, 장애 예측 분석의 기초가 되는 정보를 생성한다.In addition, the collecting unit 110 filters the collected state information, standardizes and formats and then associates / processes the information to generate information on which the failure prediction analysis is based.

관계-맵 저장부(120)는 전술한 관계-맵이 저장되는 저장 매체이다. 저장된 관계-맵은 기업 시스템(10)의 변경시에 업데이트 된다.The relationship-map storage unit 120 is a storage medium in which the aforementioned relationship-map is stored. The stored relationship-map is updated at the time of change of the enterprise system 10.

분석부(130)는 저장부(140)에 저장된 다수의 정보들로부터 복합 패턴 분석을 통해 서비스나 리소스의 장애 여부를 판단하고, 장애 발생시에는 알람을 발생시킨다.The analyzer 130 determines whether a service or a resource has failed through a complex pattern analysis from a plurality of information stored in the storage unit 140, and generates an alarm when a failure occurs.

또한, 분석부(130)는 수집부(110)에서 생성된 기초 정보를 장기간 누적시켜 획득한 빅 데이터를 분석하여 장애 예측을 수행한다.In addition, the analysis unit 130 analyzes the big data acquired by accumulating the basic information generated by the collecting unit 110 for a long period of time to perform the failure prediction.

모니터링 화면 생성부(150)는 전술한 서비스/리소스 모니터링 화면을 생성하여 운영자에게 제공한다.The monitoring screen generating unit 150 generates the service / resource monitoring screen and provides it to the operator.

한편, 본 실시예에 따른 장치와 방법의 기능을 수행하게 하는 컴퓨터 프로그램을 수록한 컴퓨터로 읽을 수 있는 기록매체에도 본 발명의 기술적 사상이 적용될 수 있음은 물론이다. 또한, 본 발명의 다양한 실시예에 따른 기술적 사상은 컴퓨터로 읽을 수 있는 기록매체에 기록된 컴퓨터로 읽을 수 있는 코드 형태로 구현될 수도 있다. 컴퓨터로 읽을 수 있는 기록매체는 컴퓨터에 의해 읽을 수 있고 데이터를 저장할 수 있는 어떤 데이터 저장 장치이더라도 가능하다. 예를 들어, 컴퓨터로 읽을 수 있는 기록매체는 ROM, RAM, CD-ROM, 자기 테이프, 플로피 디스크, 광디스크, 하드 디스크 드라이브, 등이 될 수 있음은 물론이다. 또한, 컴퓨터로 읽을 수 있는 기록매체에 저장된 컴퓨터로 읽을 수 있는 코드 또는 프로그램은 컴퓨터간에 연결된 네트워크를 통해 전송될 수도 있다.It goes without saying that the technical idea of the present invention can also be applied to a computer-readable recording medium having a computer program for performing the functions of the apparatus and method according to the present embodiment. In addition, the technical idea according to various embodiments of the present invention may be embodied in computer-readable code form recorded on a computer-readable recording medium. The computer-readable recording medium is any data storage device that can be read by a computer and can store data. For example, the computer-readable recording medium may be a ROM, a RAM, a CD-ROM, a magnetic tape, a floppy disk, an optical disk, a hard disk drive, or the like. In addition, the computer readable code or program stored in the computer readable recording medium may be transmitted through a network connected between the computers.

또한, 이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed exemplary embodiments, but, on the contrary, It will be understood by those skilled in the art that various changes in form and detail may be made therein without departing from the spirit and scope of the present invention.

100 : 서비스 통합 모니터링 시스템
110 : 수집부 120 : 관계-맵 저장부
130 : 분석부 140 : 저장부
150 : 모니터링 화면 생성부
100: Service integration monitoring system
110: Collecting unit 120: Relation-map storage unit
130: Analyzer 140:
150: Monitoring screen generating unit

Claims (10)

기업에서 제공하는 서비스들 및 상기 서비스들을 제공하는데 사용되는 리소스들을 모니터링하는 단계;
상기 서비스들을 표시하는 제1 표시단계; 및
상기 서비스들 중 선택된 서비스를 제공하는데 사용되는 리소스들의 현황을 표시하는 제2 표시단계;를 포함하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
Monitoring services provided by the enterprise and resources used to provide the services;
A first display step of displaying the services; And
And a second display step of displaying a status of resources used to provide the selected one of the services.
청구항 1에 있어서,
상기 제1 표시단계는,
상기 서비스들을 해당 등급에 따라 구분하여 표시하고,
서비스의 등급은,
장애 발생시 상기 기업의 비즈니스에 미치는 영향을 기초로 결정되는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method according to claim 1,
Wherein the first display step includes:
The services are classified and displayed according to the corresponding classes,
The rating of the service,
Wherein the determination is based on an impact on the business of the enterprise when a failure occurs.
청구항 1에 있어서,
선택된 서비스와 연관된 서비스들을 선택가능하도록 표시하는 제3 표시단계; 및
연관 서비스들 중 선택된 연관 서비스를 제공하는데 사용되는 리소스들의 현황을 표시하는 제4 표시단계;를 더 포함하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method according to claim 1,
A third display step of displaying the services associated with the selected service so as to be selectable; And
And displaying a status of resources used to provide the selected associated service among the related services.
청구항 1에 있어서,
상기 제1 표시단계는,
상기 서비스들 중 장애가 발생한 서비스를 다른 서비스들과 다르게 표시하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method according to claim 1,
Wherein the first display step includes:
And displaying the faulty service among the plurality of services differently from the other services.
청구항 4에 있어서,
상기 제2 표시단계는,
선택된 서비스가 장애가 발생한 서비스인 경우, 상기 리소스들 중 장애가 발생한 리소스를 다른 리소스와 다르게 표시하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method of claim 4,
Wherein the second display step comprises:
Wherein if the selected service is a service in which a failure occurs, displaying the failed resource among the resources differently from the other resources.
청구항 5에 있어서,
상기 제2 표시단계는,
발생된 장애들에 대한 정보를 표시하되, 장애 등급에 따라 구분하여 표시하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method of claim 5,
Wherein the second display step comprises:
Wherein the information about the generated failures is displayed and displayed according to the degree of failure.
청구항 5에 있어서,
상기 리소스들 중 선택된 리소스의 세부 상태를 표시하는 제5 표시단계;를 더 포함하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method of claim 5,
And a fifth display step of displaying a detailed state of the selected resource among the resources.
청구항 7에 있어서,
상기 제5 표시단계는,
선택된 리소스가 장애가 발생한 리소스인 경우, 상기 리소스에 발생된 장애들에 대한 정보를 표시하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method of claim 7,
The fifth display step may include:
And if the selected resource is a faulty resource, displays information about faults generated in the resource.
청구항 8에 있어서,
상기 제5 표시단계는,
상기 장애가 발생한 리소스에 대해 수행된 변경 작업에 대한 정보를 표시하는 것을 특징으로 하는 서비스 통합 모니터링 방법.
The method of claim 8,
The fifth display step may include:
And displays information on a change operation performed on the resource in which the failure has occurred.
기업에서 제공하는 서비스들 및 상기 서비스들을 제공하는데 사용되는 리소스들을 모니터링하여 정보를 수집하는 수집부; 및
상기 서비스들을 표시하는 화면 및 상기 서비스들 중 선택된 서비스를 제공하는데 사용되는 리소스들의 현황을 표시하는 화면을 생성하는 생성부;를 포함하는 것을 특징으로 하는 서비스 통합 모니터링 시스템.
A collection unit for collecting information by monitoring the services provided by the enterprise and the resources used to provide the services; And
And a generation unit generating a screen displaying a screen displaying the services and a status of resources used to provide the selected one of the services.
KR1020150130138A 2015-09-15 2015-09-15 Enterprise Business Service Level Integration Monitoring Method and System KR101738770B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020150130138A KR101738770B1 (en) 2015-09-15 2015-09-15 Enterprise Business Service Level Integration Monitoring Method and System
PCT/KR2016/009651 WO2017047951A1 (en) 2015-09-15 2016-08-30 Method and system for integrated monitoring of enterprise business service levels

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150130138A KR101738770B1 (en) 2015-09-15 2015-09-15 Enterprise Business Service Level Integration Monitoring Method and System

Publications (2)

Publication Number Publication Date
KR20170032608A true KR20170032608A (en) 2017-03-23
KR101738770B1 KR101738770B1 (en) 2017-05-22

Family

ID=58289293

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150130138A KR101738770B1 (en) 2015-09-15 2015-09-15 Enterprise Business Service Level Integration Monitoring Method and System

Country Status (2)

Country Link
KR (1) KR101738770B1 (en)
WO (1) WO2017047951A1 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107886242A (en) * 2017-11-10 2018-04-06 平安科技(深圳)有限公司 Data monitoring method, device, computer equipment and storage medium

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030022603A (en) * 2001-09-11 2003-03-17 주식회사 크로스쉬프트 Management system for service operation and its operation method
KR100696083B1 (en) * 2005-02-22 2007-03-19 주식회사 어니언소프트웨어 Information Technology Service Management Method
KR101229569B1 (en) * 2006-06-30 2013-02-04 주식회사 케이티 Apparatus and Method for displaying and Error Using Integrated Topology
KR20090001786A (en) * 2007-05-21 2009-01-09 김진수 System for analyzing business influence due to computational failure
KR100781211B1 (en) * 2007-06-13 2007-11-30 주식회사 국민은행 It service management method for bank and system there-of

Also Published As

Publication number Publication date
KR101738770B1 (en) 2017-05-22
WO2017047951A1 (en) 2017-03-23

Similar Documents

Publication Publication Date Title
US10901727B2 (en) Monitoring code sensitivity to cause software build breaks during software project development
US10102113B2 (en) Software test automation systems and methods
US7251584B1 (en) Incremental detection and visualization of problem patterns and symptoms based monitored events
CN102713861B (en) Operation management device, operation management method and program recorded medium
CN101201786B (en) Method and device for monitoring fault log
US20080065928A1 (en) Technique for supporting finding of location of cause of failure occurrence
JP5267736B2 (en) Fault detection apparatus, fault detection method, and program recording medium
US11533216B2 (en) Aggregating alarms into clusters to display service-affecting events on a graphical user interface
JP2010526352A (en) Performance fault management system and method using statistical analysis
CN108170566A (en) Product failure information processing method, system, equipment and collaboration platform
CN111858254B (en) Data processing method, device, computing equipment and medium
KR20160132698A (en) Apparatus and method of intelligent system diagnosis
KR102580916B1 (en) Apparatus and method for managing trouble using big data of 5G distributed cloud system
CN103023028A (en) Rapid grid failure positioning method based on dependency graph of entities
KR102232876B1 (en) Breakdown type analysis system and method of digital equipment
US8554908B2 (en) Device, method, and storage medium for detecting multiplexed relation of applications
CN105207797A (en) Fault locating method and fault locating device
US20040034614A1 (en) Network incident analyzer method and apparatus
JP5746565B2 (en) Maintenance management system, work priority calculation method and program
KR101738770B1 (en) Enterprise Business Service Level Integration Monitoring Method and System
WO2013035266A1 (en) Monitoring device, monitoring method and program
KR20170123389A (en) System and method for human error probability calculation of nuclear generating station
KR101288535B1 (en) Method for monitoring communication system and apparatus therefor
KR101757558B1 (en) IT Service Quality Auto Diagnostic Method and System
CN114531338A (en) Monitoring alarm and tracing method and system based on call chain data

Legal Events

Date Code Title Description
AMND Amendment
E601 Decision to refuse application
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant