KR102301946B1 - 분산 시스템에서 결함을 분석하기 위한 비주얼 툴 - Google Patents

분산 시스템에서 결함을 분석하기 위한 비주얼 툴 Download PDF

Info

Publication number
KR102301946B1
KR102301946B1 KR1020177002500A KR20177002500A KR102301946B1 KR 102301946 B1 KR102301946 B1 KR 102301946B1 KR 1020177002500 A KR1020177002500 A KR 1020177002500A KR 20177002500 A KR20177002500 A KR 20177002500A KR 102301946 B1 KR102301946 B1 KR 102301946B1
Authority
KR
South Korea
Prior art keywords
errors
cloud
faulty component
components
component
Prior art date
Application number
KR1020177002500A
Other languages
English (en)
Other versions
KR20170040210A (ko
Inventor
아트 사도브스키
벤카트 나라야난
스미타 오하
Original Assignee
마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 마이크로소프트 테크놀로지 라이센싱, 엘엘씨 filed Critical 마이크로소프트 테크놀로지 라이센싱, 엘엘씨
Publication of KR20170040210A publication Critical patent/KR20170040210A/ko
Application granted granted Critical
Publication of KR102301946B1 publication Critical patent/KR102301946B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/321Display for diagnostics, e.g. diagnostic result display, self-test user interface
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0751Error or fault detection not based on redundancy
    • G06F11/0754Error or fault detection not based on redundancy by exceeding limits
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0766Error or fault reporting or storing
    • G06F11/0772Means for error signaling, e.g. using interrupts, exception flags, dedicated error registers
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/323Visualisation of programs or trace data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/32Monitoring with visual or acoustical indication of the functioning of the machine
    • G06F11/324Display of status information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3065Monitoring arrangements determined by the means or processing involved in reporting the monitored data
    • G06F11/3072Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting
    • G06F11/3082Monitoring arrangements determined by the means or processing involved in reporting the monitored data where the reporting involves data filtering, e.g. pattern matching, time or event triggered, adaptive or policy-based reporting the data filtering being achieved by aggregating or compressing the monitored data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • G06F11/3414Workload generation, e.g. scripts, playback
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3466Performance evaluation by tracing or monitoring
    • G06F11/3495Performance evaluation by tracing or monitoring for systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Hardware Design (AREA)
  • Human Computer Interaction (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • General Factory Administration (AREA)
  • Multi-Process Working Machines And Systems (AREA)

Abstract

분산 시스템에서 결함을 분석하기 위한 비주얼 툴이 제공된다. 클라우드 기반 서비스와 연관된 사용 데이터 및 종합 측정으로부터의 오류들은 관리 애플리케이션에 의해 취합된다. 오류들은 클라우드 기반 서비스의 컴포넌트들에 기초하여 오류들을 세그먼트화하는 분포를 생성하도록 프로세싱된다. 결함과 연관된 오류들의 서브세트를 생성하는 고장 컴포넌트는 하이라이팅된다. 고장 컴포넌트는 클라우드 기반 서비스의 컴포넌트들 중 하나이다. 분포는 고장 컴포넌트의 주변에서 결함 정보를 사용하여 고장 컴포넌트를 강조함으로써 결함을 식별할 수 있도록 시각화하여 제공된다.

Description

분산 시스템에서 결함을 분석하기 위한 비주얼 툴{VISUAL TOOLS FOR FAILURE ANALYSIS IN DISTRIBUTED SYSTEMS}
분산형 컴퓨팅 기법은 복수의 컴퓨팅 리소스가 조직화되고 별개인 솔루션을 제공할 수 있게 한다. 분산형 컴퓨팅의 일 예시인 클라우드 컴퓨팅은 사용자 필요에 대한 솔루션을 제공하기 위해 복수의 시스템을 결속한다. 클라우드 컴퓨팅은 엄청나게 많은 컴퓨팅 리소스를 포괄할 수 있다. 클라우드 컴퓨팅 애플리케이션과 서비스 내에서 이용되는 컴퓨팅 리소스는 네트워크들 및 위치들에 걸쳐 분산된다. 분산된 컴퓨팅 리소스는 원격으로 제어되고 관리된다. 보통, 수동 솔루션(manual slutions)은 클라우드 컴퓨팅 자산에 대한 설치 및 구성 지원을 제공한다. 널리 분산된 컴퓨팅 리소스의 휴먼 컴포넌트에 의한 수동 설치 솔루션은 비용 효율적이지 않다.
클라우드 컴퓨팅 시스템을 위한 기존 오류 모니터링 솔루션은 제약조건을 갖는다. 클라우드 컴퓨팅 시스템들의 개별 컴포넌트들은 건강 관련 메트릭(health related metric)을 로컬로 모니터링한다. 모니터링 프로세스에 의해 생성된 정보는 보통 로컬로 소비된다. 정보에 기반한 임의의 액션은 로컬로 시도되고 액션의 결과는 로컬로 로깅되거나 폐기된다.
본 요약은 아래의 상세한 설명에서 더 설명되는 개념들 중 선택된 것을 간략한 형태로 소개하고자 제공된다. 본 요약은 특허청구되는 주제의 중요한 특징 또는 필수적인 특징을 배타적으로 식별하고자 하는 것도 아니고, 특허청구되는 주제의 범주를 결정하는데 도움을 주고자 하는 것도 아니다.
실시예들은 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 것에 관한 것이다. 일부 실시예들에서, 클라우드 기반 서비스의 관리 애플리케이션이 클라우드 기반 서비스와 연관된 사용 데이터 및 종합 측정(synthetic measurement)으로부터 오류들을 취합(aggregate)할 수 있다. 사용 데이터는 클라우드 기반 서비스의 사용 시나라오와 연관된 고객 액션의 출력을 포함할 수 있다. 종합 측정은 고객 액션의 시뮬레이션의 출력을 포함할 수 있다. 관리 애플리케이션은 클라우드 기반 서비스의 컴포넌트들에 기초하여 이들 오류를 처리하여 오류들을 세그먼트화하는 분포를 생성할 수 있다. 결함과 연관된 오류들의 서브세트를 생성하는 고장 컴포넌트가 하이라이팅될 수 있고, 고장 컴포넌트는 컴포넌트들 중 하나이다. 분포는 고장 컴포넌트의 주변에서 결함 정보를 사용하여 고장 컴포넌트를 강조함으로써 결함을 식별할 수 있도록 시각화하여 제공될 수 있다.
이러한 및 다른 특징 및 이점은 이어지는 상세한 설명을 읽고 연관 도면을 검토함으로써 명백해질 것이다. 전술된 일반적 설명 및 후술되는 상세 설명은 예시적인 것으로서 특허청구되는 양태들을 한정하는 것이 아님을 이해해야 한다.
도 1은 실시예들에 따른, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 스킴의 컴포넌트들을 도시하는 개념도이다.
도 2는 실시예들에 따른, 분산 시스템에서 결함 분석을 제공하는 분포의 시각화에 관한 일 예를 도시한다.
도 3은 실시예들에 따른, 분산 시스템에서 결함 분석을 제공하는 분포의 시각화에 관한 다른 예를 도시한다.
도 4는 실시예들에 따른, 분산 시스템에서 결함 분석을 제공하는 분포의 시각화에 관한 다른 예를 도시한다.
도 5는 실시예들에 따른 시스템이 구현될 수 있는 간략화된 네트워크화된 환경이다.
도 6은 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하도록 구성될 수 있는 범용 컴퓨팅 디바이스를 도시한다.
도 7은 실시예에 따른, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 프로세스에 대한 논리 흐름도를 도시한다.
앞서 간략히 설명된 바와 같이, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴이 관리 애플리케이션에 의해 제공될 수 있다. 관리 애플리케이션은 클라우드 기반 서비스와 연관된 사용 데이터 및 종합 측정으로부터 오류들을 취합(aggregate)할 수 있다. 오류들은 클라우드 기반 서비스의 컴포넌트들에 기초하여 오류들을 세그먼트화하는 분포(distribution)를 생성하도록 프로세싱될 수 있다. 결함과 연관된 오류들의 서브세트를 발생시키는 고장 컴포넌트는 하이라이팅될 수 있고, 고장 컴포넌트는 컴포넌트들 중 하나이다. 분포는, 고장 컴포넌트의 주변에서 결함 정보를 사용하여 고장 컴포넌트를 강조함으로써 결함을 식별할 수 있도록 시각화하여 제공될 수 있다.
이어지는 상세한 설명에서는, 본원의 일부를 형성하는 첨부 도면을 참조하는데, 이들 도면은 특정 실시예들 또는 예들을 보여준다. 본 개시물의 사상이나 범주를 벗어나지 않으면서 이러한 양태들은 조합될 수도 있고, 다른 양태들이 이용될 수도 있고, 구조적 변경이 행해질 수도 있다. 따라서, 이어지는 상세한 설명은 제한적인 의미로 여겨져서는 안 되며, 본 발명의 범주는 첨부된 특허청구범위 및 이들의 균등물에 의해 정의된다.
실시예들은 컴퓨팅 디바이스 상의 운영 체제 상에서 작동하는 애플리케이션 프로그램과 함께 실행되는 프로그램 모듈에 관한 일반적 맥락으로 설명될 것이지만, 본 기술분야의 당업자는 양태들이 다른 프로그램 모듈과 함께 또한 구현될 수 있다는 것을 인식할 것이다.
일반적으로, 프로그램 모듈은 루틴, 프로그램, 컴포넌트, 데이터 구조, 및 특정 작업을 수행하거나 특정 추상 데이터 유형을 구현하는 다른 유형의 구조를 포함한다. 더욱이, 본 기술분야의 당업자는 실시예들이 핸드헬드 디바이스, 마이크로프로세서 시스템, 마이크로프로세서 기반 또는 프로그램가능 가전제품, 미니 컴퓨터, 메인프레임 컴퓨터, 및 유사 컴퓨팅 디바이스를 포함하는 다른 컴퓨터 시스템 구성과 함께 실시될 수 있다는 것을 이해할 것이다. 실시예들은 또한 통신 네트워크를 통해 링크되는 원격 프로세싱 디바이스들에 의해 작업이 수행되는 분산형 컴퓨팅 환경에서 실시될 수 있다. 분산형 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 디바이스 둘 모두에 위치될 수 있다.
실시예들은 컴퓨터로 구현되는 프로세스(방법), 컴퓨팅 시스템, 또는 컴퓨터 프로그램 제품이나 컴퓨터 판독가능 매체와 같은 제조 물품으로 구현될 수도 있다. 컴퓨터 프로그램 제품은 컴퓨터 시스템에 의해 판독가능하고 컴퓨터나 컴퓨팅 시스템으로 하여금 예시적 프로세스(들)를 수행하게 하는 명령어를 포함하는 컴퓨터 프로그램을 인코딩하는 컴퓨터 저장 매체일 수도 있다. 컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 메모리 디바이스이다. 컴퓨터 판독가능 저장 매체는, 예를 들어, 휘발성 컴퓨터 메모리, 비휘발성 메모리, 하드 드라이브, 및 플래시 드라이브 중 하나 이상을 통해 구현될 수 있다.
본 명세서 전반에 걸쳐, 용어 "플랫폼"은 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하기 위한 소프트웨어 컴포넌트와 하드웨어 컴포넌트의 조합일 수 있다. 플랫폼에 관한 예들은 복수의 서버를 통해 실행되는 호스팅된 서비스, 단일 컴퓨팅 디바이스 상에서 실행되는 애플리케이션, 및 이와 유사한 시스템을 포함하나 이로 제한되지 않는다. 용어 "서버"는 전형적으로 네트워크화된 환경에서 하나 이상의 소프트웨어 프로그램을 실행하는 컴퓨팅 디바이스를 일반적으로 지칭한다. 그러나, 서버는 또한 네트워크 상의 서버로 보여지는 하나 이상의 컴퓨팅 상에서 실행되는 가상 서버(소프트웨어 프로그램)로서 구현될 수도 있다. 이러한 기술 및 예시적 실시예들에 대한 더 많은 세부사항은 다음의 설명에서 발견될 수 있다.
도 1은 실시예들에 따른, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 스킴의 컴포넌트들을 도시하는 개념도이다.
다이어그램 100에서, 클라우드 기반 서비스(104)는 클라이언트 디바이스(118)를 통해 고객(116)에게 서비스를 제공할 수 있다. 클라우드 기반 서비스(104)는 하나 이상의 서비스를 제공하도록 상호작용하는 복수의 컴포넌트를 포함하는 예시의 분산 시스템일 수 있다. 클라우드 기반 서비스(104)는 클라이언트 디바이스(118)에서 클라이언트 인터페이스를 통해 매우 다양한 서비스를 제공할 수 있다. 서비스는 무엇보다도 문서 공유, 이메일 서비스, 저장 서비스를 포함할 수 있다. 또한, (클라이언트 디바이스(118)와 상호작용하도록 허가된) 고객(116)은 무엇보다도 사람, 여러 사람, 사람의 그룹, 조직체를 포함하는 엔티티일 수 있다.
클라우드 기반 서비스(104)는 분산형 애플리케이션의 하나 이상의 컴포넌트를 실행하는 하나 이상의 컴퓨팅 디바이스를 통해 서비스를 제공하는 분산형 애플리케이션일 수 있다. 하나 이상의 컴퓨팅 디바이스는 유선 또는 무선 인프라스트럭처를 사용하는 하나 이상의 네트워크를 통해 접속될 수 있다. 클라우드 기반 서비스(104)의 일 예는 이메일 서비스를 포함할 수 있다. 이메일 서비스는 복수의 컴퓨팅 디바이스에서 호스팅될 수 있다. 이메일 서비스는 각각의 컴퓨팅 디바이스의 이용가능한 처리 능력에 기초하여 컴퓨팅 디바이스들 사이에서 분할될 수 있다. 이메일 서비스는 디렉토리 기능, 네트워킹 기능, 메일박스 기능 등을 제공하는 복수의 컴포넌트들을 통해 제공될 수도 있다.
다른 예시적 시나리오에서, 클라우드 기반 서비스(104)는 문서 공유 서비스를 포함할 수도 있다. 문서 공유 서비스는 각각의 컴퓨팅 디바이스의 이용가능한 저장 용량에 기초하여 저장된 문서를 복수의 컴퓨팅 디바이스에 걸쳐 분배할 수 있다. 문서 공유 서비스는 디렉토리 기능, 네트워킹 기능, 문서 호스팅 기능 등을 제공하는 복수의 컴포넌트를 통해 제공될 수 있다. 이메일 서비스 및 문서 공유 서비스와 같은 클라우드 기반 서비스(104)의 예시들은 제한적인 의미로 제공된 것이 아니다. 클라우드 기반 서비스(104)는 고객(116)과 같은 하나 이상의 고객에게 서비스를 제공하는 임의의 분산형 계산 솔루션을 포함할 수도 있다.
고객(116)은 클라이언트 디바이스(118)를 통해 클라우드 기반 서비스(104)와 상호작용할 수도 있다. 클라이언트 디바이스(118)는 데스크톱 컴퓨터, 스마트폰, 노트북 컴퓨터, 태블릿 컴퓨터 등과 같은 다수의 컴퓨팅 디바이스를 포함할 수 있다. 고객(116)은 클라이언트 디바이스(118)에 의해 제공되는 클라우드 기반 서비스(104)의 클라이언트 인터페이스를 통해 클라우드 기반 서비스(104)와 상호작용할 수 있다. 이와 달리, 클라우드 기반 서비스(104)는 클라이언트 인터페이스를 제공할 수 있고 클라이언트 디바이스(118)는 클라이언트 애플리케이션 내에 클라이언트 인터페이스를 렌더링할 수 있다. 고객(116)은 터치 기반 액션(114), 키보드 기반 입력, 마우스 기반 입력 등을 포함하는 다수의 클라이언트 입력 모달리티를 통해 클라이언트 인터페이스와 상호작용할 수 있다. 터치 기반 액션(114)은 터치 액션, 스와이프 액션 등과 같은 다수의 제스처를 포함할 수 있다.
관리 애플리케이션(102)은 종합 측정(synthetic measurements)(108) 및 사용 데이터(110)를 분석하여 클라우드 기반 서비스(104)의 컴포넌트(106)와 연관된 결함을 판정할 수 있다. 관리 애플리케이션(102)은 클라우드 기반 서비스(104)의 다른 컴포넌트일 수도 있다. 이와 달리, 관리 애플리케이션은 클라우드 기반 서비스(104)와 같이 분산 시스템과 관련하여 분석 서비스를 제공하는 독립형 애플리케이션일 수도 있다.
사용 데이터(110)는 클라우드 기반 서비스(104)의 사용 시나리오와 연관된 고객 액션의 출력을 포함할 수 있다. 고객 액션의 일 예는 고객(116)이 클라우드 기반 서비스(104)를 사용하여 인증 스킴을 개시하는 것 및 클라우드 기반 서비스(104)의 클라이언트 인터페이스와 상호작용하는 것을 포함할 수 있다. 클라우드 기반 서비스(104)의 일 예로서의 이메일 서비스에서, 고객 액션의 예들은 고객(116)이 클라이언트 인터페이스에 인증하는 것, 이메일을 검색하는 것, 및 이메일로 상호작용하는 것을 포함할 수 있다. 클라우드 기반 서비스(104)의 일 예시로서의 문서 공유 서비스에서, 고객 액션의 예들은 고객(116)이 클라이언트 인터페이스와 인증하는 것, 문서를 검색하는 것, 및 문서와 상호작용하는 것을 포함할 수 있다.
종합 측정(108)은 고객 액션에 관한 시뮬레이션의 출력을 포함할 수 있다. 사용 데이터(110)는 사용 시나리오의 측정을 캡처하는 클라우드 기반 서비스(104) 또는 클라이언트 디바이스(118)와 같은 클라이언트 디바이스의 컴포넌트들로부터의 로그 파일로부터 검색될 수 있다. 종합 측정(108)은 관리 애플리케이션(102)에 의해 실행되어 시뮬레이션된 사용 시나리오와 연관된 결함을 검출함으로써 클라우드 기반 서비스(104)의 상태를 판정할 수 있다. 사용 데이터(110) 및 종합 측정(108)의 출력은 컴포넌트(106)와 같은 클라우드 기반 서비스의 컴포넌트들과 연관된 오류(107)들을 검출하도록 파싱될 수 있다. 컴포넌트(106)는 서버, 네트워킹 디바이스, 프로세서, 메모리, 저장 디바이스 등과 같은 하드웨어 컴포넌트를 포함할 수 있다.
종합 측정(108) 및 사용 데이터(110)로부터 검출된 오류(107)는 취합될 수 있다. 오류(107)는 오류 유형, 클라우드 기반 서비스(104)의 연관 컴포넌트의 식별, 연관 컴포넌트 유형 등을 포함하는 기준에 기초하여 취합될 수 있다. 오류(107)는 클라우드 기반 서비스(104)의 컴포넌트에 기초하여 오류(107)를 세그먼트화하는 분포(112)를 생성하도록 프로세싱될 수 있다. 일 예시적 시나리오에서, 컴포넌트(106)와 연관된 오류(107)는 분포의 세그먼트를 생성하는데 사용될 수 있다.
결함(109)과 관련된 오류(107)로 이루어진 서브세트를 발생하는 컴포넌트(106)와 같은 고장 컴포넌트는 하이라이팅될 수 있다. 결함은 고장 컴포넌트와 연관된 오류(107)로 이루어진 서브세트의 백분율을, 이 서브세트의 개수를 전체 오류(107)의 개수로 나누는 식으로 계산하는 것에 의해 확인될 수 있다. 결함(109)과 연관된 분포(112)의 세그먼트는 컬러링 스킴, 분포(112)에서 유사한 아이템으로부터 세그먼트의 배경 변형, 세그먼트에 적용된 애니메이션, 세그먼트의 선 크기 증가 또는 변형(예를 들어, 선 색 변경 및 점 형태로 변경) 등을 포함하는 그래픽 스킴을 사용하여 하이라이팅될 수 있다.
분포(112)는 클라이언트 디바이스(118) 상에 디스플레이된 클라이언트 인터페이스에서 렌더링될 수 있다. 분포(112)는 히스토그램, 파이 차트, 그래프 등과 같은 시각화로 렌더링될 수 있다. 관리 애플리케이션은 결함(109)을 식별하기 위해 고장 컴포넌트 주변에서 결함 정보를 강조하는 분포(112)를 제공할 수 있다. 시각화는 관리 애플리케이션(102)의 사용자 인터페이스(UI)로서 웹 페이지에 디스플레이된 분포(112)를 포함할 수 있다. 분포(112)는 컴포넌트(106)와 연관된 결함(109)을 식별하기 위한 기간(time period) 동안 관리 애플리케이션(102)에 의해 프로세싱된 오류(107)를 포함할 수 있다.
클라우드 기반 서비스(104)의 결함을 분석하기 위한 비주얼 툴을 제공하는 것에 더하여, 관리 애플리케이션(102)은 또한 다른 클라우드 기반 서비스의 결함을 분석하기 위한 비주얼 툴을 제공하도록 구성될 수 있다. 관리 애플리케이션(102)은 UI의 상이한 렌더링으로 다른 클라우드 기반 서비스를 위한 비주얼 툴을 디스플레이하도록 구성될 수 있다. 이와 달리, 관리 애플리케이션(102)은 클라우드 기반 서비스(104)와 다른 클라우드 기반 서비스들 사이의 결함 분석을 통합하는 특징을 제공할 수도 있다.
도 1의 예시적 시스템은 클라우드 기반 서비스(104) 및 분포(112)를 포함하는 특정 컴포넌트로 설명되었지만, 실시예들은 그러한 컴포넌트 또는 시스템 구성으로 제한되지 않고 더 적거나 더 많은 컴포넌트를 포함하는 다른 시스템 구성과 함께 구현될 수 있다.
도 2는 실시예들에 따른, 분산 시스템에서 결함 분석을 제공하는 분포의 시각화에 관한 일 예를 도시한다.
다이어그램 200에서, 클라우드 기반 서비스에서의 결함을 분석하기 위한 비주얼 툴을 제공하는 분포(202)가 설명된다. 관리 애플리케이션은 클라우드 기반 서비스의 사용 데이터 및 종합 측정의 출력에서 식별된 오류로부터 분포(202)를 생성할 수 있다. 사용 데이터는 고객의 IP 어드레스와 같은 고객 식별 데이터 등을 삭제함으로써 프로세싱 전에 익명화(anonymize)될 수 있다. 오류는 컴포넌트와의 연관성에 기초하여 그룹으로 분리될 수 있다. 히스토그램은 분포(202)로서 그룹으로부터 생성될 수 있다. 그룹의 각각은 분포(202)의 세그먼트로 표현될 수 있다.
일부 예들에 따라, 세그먼트의 백분율 값은 임계치(204)와 비교될 수 있다. 백분율 값은 세그먼트(206)와 같은 세그먼트들 중 한 세그먼트의 오류 개수를 전체 오류 개수로 나누고 그 결과 값에 100을 곱함으로써 계산될 수 있다. 백분율 값이 임계치(204)를 초과한다는 판정에 응답하여, 세그먼트(206)와 연관된 고장 컴포넌트는 결함의 원인(source)으로 식별될 수 있다. 또한, 임계치(204)는 클라우드 기반 서비스의 관리자 및 고장 컴포넌트를 관리하는 팀의 멤버와 같은 이해관계자(stakeholder)에 의해 구성가능할 수 있다. 이해관계자는 클라우드 기반 서비스의 결함을 검출하는 관리 애플리케이션의 민감도를 감소 또는 증가시키도록 임계치(204)의 값을 증가 또는 감소시키도록 허용될 수 있다.
도 3은 실시예들에 따른, 분산 시스템에서 결함 분석을 제공하는 분포의 시각화에 관한 다른 예를 도시한다.
다이어그램 300에서, 관리 애플리케이션은 클라우드 기반 시스템에서 결함 분석을 제공할 수 있다. 분포(302)는 클라우드 기반 서비스의 사용 데이터 및 종합 측정의 출력으로부터 생성될 수 있다. 출력 데이터는 클라우드 기반 서비스의 컴포넌트와 연관된 오류들을 검출하기 위해 분석될 수 있다. 오류는 오류와 컴포넌트 사이의 연관성에 기초하여 분포(302)의 세그먼트를 생성하도록 파싱되고 프로세싱될 수 있다.
일부 예들에 따르면, 관리 애플케이션은 분포(302)를 포함하는 시각화를 제공할 수 있다. 시각화는 관리 애플리케이션의 UI에서 렌더링된 웹 페이지를 포함할 수 있다. 분포(302)는 클라우드 기반 서비스의 고장 컴포넌트(306)를 식별할 수 있다. 고장 컴포넌트(306)는 임계치(304)를 초과하는 고장 컴포넌트와 연관된 오류의 서브세트에 기초하여 검출될 수 있다.
고장 컴포넌트(306)는 고장 컴포넌트(306)에 의해 생성된 오류의 서브세트와 연관된 기간을 포함함으로써 결함 정보를 사용하여 하이라이팅될 수 있다. 오류의 유형은 분포(302)의 이해관계자에게 오류를 설명하도록 라벨링될 수 있다. 오류의 유형은 오류 유형 1(310) 또는 오류 유형 2(312)를 포함할 수 있다. 오류 유형은 이해관계자에 대한 관련 기준에 기초하여 분류될 수 있다. 일 예는 오류 유형 1(310)로 라벨링된 네트워크 불능 오류(network outage errors)를 포함할 수 있다. 네트워크 불능 오류는 고장 컴포넌트(306)와 연관된 네트워크 팀에 더 높은 값을 가질 수 있다. 저장 서브시스템 입력/출력(I/O) 오류와 같은 오류 유형 2(312)는 네트워크 팀에 대해 더 낮은 관련성을 가질 수도 있다. 그 결과, 오류 유형 2(312)는 오류 유형 1(310)보다 아래에 배치될 수 있다.
관리 애플리케이션은 분포(302)에서 관련 컴포넌트(308)를 또한 식별할 수 있다. 고장 컴포넌트(306)와 연관된 관련 컴포넌트(308)는 공유 접속, 공유 데이터 리소스, 공유 동작 등을 포함하는 관련성에 기초하여 검출될 수 있다. 관련 컴포넌트(308)와 연관된 오류는 오류 유형과 같은 기준에 기초하여 파티셔닝될 수 있다. 오류는 고장 컴포넌트(306)의 오류와 유사한 오류 유형에 기초한 이해관계자에 대한 적합성(relevancy)에 기초하여 랭킹되고 배치될 수 있다. 오류 유형 1(314)은 이해관계자에 대해 오류 유형 1(314)의 적합성이 오류 유형(316)보다 높은 것에 기초하여 오류 유형 2(316)보다 위에 배치될 수 있다.
관련 컴포넌트(308) 및 다른 관련 컴포넌트는 관련 컴포넌트들에 의해 생성된 오류의 연관 백분율에 기초하여 랭킹될 수 있다. 관련 컴포넌트는 연관 백분율에 기초하여 분포(302) 내에서 고장 컴포넌트에 인접하여 배치되어 결함에 의해 영향을 받는 관련 컴포넌트를 하이라이팅할 수 있다. 다른 관련 컴포넌트보다 높은 오류 백분율을 갖는 관련 컴포넌트(308)는 고장 컴포넌트(306) 옆에 배치될 수 있다. 다른 관련 컴포넌트는 연관된 오류 백분율에 기초하여 인접 위치 내에 배치될 수 있다. 다른 관련 컴포넌트보다 낮은 오류 백분율을 갖는 다른 관련 컴포넌트는 관련 컴포넌트(308) 옆이지만 고장 컴포넌트(306)에 인접하지는 않게 배치될 수 있다. 관련 컴포넌트는 고장 컴포넌트(306)에 근접하여 배치되어 관련 컴포넌트가 고장 컴포넌트(306)와 함께 고려될 필요가 있다는 것을 이해관계자에게 강조할 수 있다.
또한, 다른 컴포넌트(318)가 분포 내에 배치될 수 있다. 다른 컴포넌트(318)는 오류를 발생시킬 수 있다. 오류는 오류 유형 3(320)과 같은 오류 유형으로 라벨링될 수 있는 오류 유형으로 파티셔닝될 수 있다. 다른 컴포넌트(318)는 고장 컴포넌트(306)와 연관되지 않을 수도 있다. 다른 컴포넌트(318)는 분산 시스템에서 오류를 생성하지만 강조를 필요하게 만드는 임계치(304)를 초과하기에는 충분하지 않다.
도 4는 실시예들에 따른 분산 시스템에서 결함 분석을 제공하는 분포의 시각화에 관한 다른 예를 도시한다.
다이어그램 400에서, 관리 애플리케이션은 임계치(404)를 초과하는 오류를 생성하는 고장 컴포넌트(410)를 강조하는 분포(402)를 생성할 수 있다. 하나 보다 많은 컴포넌트가 임계치(404)를 초과할 수 있고, 이는 클라우드 기반 서비스의 결함을 야기할 수 있다. 또한, 관련 컴포넌트(408)는 관련 컴포넌트 및 관련 컴포넌트(408)에 의해 생성된 오류들에 관심을 끌기 위해 고장 컴포넌트에 인접하여 배치될 수 있다.
일부 예들에 따라, 결함 정보(412)는 고장 컴포넌트(410)에서 고장을 강조하기 위해 관리 애플리케이션에 의해 제공될 수 있다. 결함 정보(412)는 고장 컴포넌트의 식별, 고장 컴포넌트(410)와 연관된 오류의 서브세트의 백분율, 또는 분포(402) 내 서브세트의 빈도를 사용하여 고장 컴포넌트(410)를 식별할 수 있다. 결함 정보(412)는 고장 컴포넌트(41) 내의 텍스트 또는 유사한 방식으로 고장 컴포넌트(410)에 인접하여 팝업 창으로 표현될 수 있다.
이해관계자의 액세스 권한은 인증 스킴을 통해 검출될 수 있다. 관리 애플리케이션은 (이해관계자로서) 클라우드 기반 서비스의 관리자에게 고장 컴포넌트(410), 관련 컴포넌트(408), 및 클라우드 기반 서비스의 다른 컴포넌트와 연관된 오류와 연관된 세분화된 정보(granular information)를 보는 서비스 액세스를 제공한다. 관리 애플리케이션은 또한 (이해관계자로서) 고장 컴포넌트(410)를 관리하는 팀의 멤버에게 클라우드 기반 서비스의 관련 컴포넌트(408) 및 고장 컴포넌트와 연관된 오류와 연관된 세분화된 정보를 보는 액세스를 제공할 수도 있다. 클라우드 기반 서비스의 다른 컴포넌트들과 연관된 오류들에 대한 액세스는 고장 컴포넌트(410)를 관리하는 팀 멤버로 한정되거나 제한될 수도 있다.
분산 시스템에서 결함을 분석하기 위한 비주얼 툴의 기술적 효과는 개별 컴포넌트 기반 솔루션에 비해 분산 시스템 및 분산 시스템의 컴포넌트들을 포괄하는 오류 분석의 향상일 수 있다.
도 2 및 도 4에서의 예시적 시나리오 및 스키마는 특정 컴포넌트, 데이터 유형, 및 구성을 사용하여 도시된다. 실시예들은 이러한 예시적 구성에 따른 시스템으로 한정되지 않는다. 분산 시스템에서의 결합 분석을 위한 비주얼 툴을 제공하는 것은 애플리케이션 및 사용자 인터페이스에서 더 적거나 더 많은 컴포넌트를 포함하는 구성으로 구현될 수도 있다. 더욱이, 도 2 및 도 4에 도시된 예시적 스키마 및 컴포넌트 및 이들의 서브컴포넌트는 본원에 설명된 원리를 사용하는 다른 값들을 갖는 유사한 방식으로 구현될 수도 있다.
도 5는 실시예들이 구현될 수 있는 예시적 네트워크형 환경이다. 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하도록 구성된 관리자 애플리케이션은 호스팅된 서비스와 같은 하나 이상의 서버(514)를 통해 실행되는 소프트웨어를 통해 구현될 수도 있다. 플랫폼은 네트워크(들)(510)를 통해 스마트폰(513), 랩톱 컴퓨터(512), 또는 데스크톱 컴퓨터(511)('클라이언트 디바이스들')와 같은 개별 컴퓨팅 디바이스 상의 클라이언트 애플리케이션과 통신할 수 있다.
클라이언트 디바이스(511-513) 중 임의의 디바이스 상에서 실행되는 클라이언트 애플리케이션은 서버들(514)에 의해 또는 개별 서버(516) 상에서 실행되는 애플리케이션(들)을 통해 통신을 가능하게 할 수 있다. 관리 애플리케이션은 클라우드 기반 서비스의 사용 데이터 및 종합 측정으로부터 오류들을 처리하여 클라우드 기반 서비스의 컴포넌트들에 기초하여 오류들을 나누는 분포를 생성할 수 있다. 고장난 하나 이상의 컴포넌트는 분포에서 강조되고 시각화를 통해 제공될 수 있다. 관리 애플리케이션은 직접 또는 데이터베이스 서버(518)를 통해 데이터 저장소(들)(519) 내에 분포와 연관된 데이터를 저장할 수 있다.
네트워크(들)(510)는 임의의 토폴로지의 서버, 클라이언트, 인터넷 서비스 제공자, 및 통신 매체를 포함할 수 있다. 실시예들에 따른 시스템은 정적 또는 동적 토폴로지를 가질 수도 있다. 네트워크(들)(510)는 기업 네트워크와 같은 보안 네트워크, 무선 개방 네트워크와 같은 비보안 네트워크, 또는 인터넷을 포함할 수 있다. 네트워크(들)(510)는 또한 공중 교환 전화망(public switched telephone network: PSTN) 또는 셀룰러 네트워크와 같은 다른 네트워크를 통해 통신을 조정할 수도 있다. 더욱이, 네트워크(들)(510)는 블루투스 등과 같은 단거리 무선 네트워크를 포함할 수도 있다. 네트워크(들)(510)는 본원에 개시된 노드들 사이에 통신을 제공한다. 한정이 아닌 예시로써, 네트워크(들)(510)는 음향, RF, 적외선과 같은 무선 매체 및 다른 무선 매체를 포함할 수도 있다.
많은 다른 구성의 컴퓨팅 디바이스, 애플리케이션, 데이터 소스, 및 데이터 분산 시스템이 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는데 채용될 수도 있다. 더욱이, 도 5에서 설명된 네트워크형 환경은 단지 예시를 위한 것이다. 실시예들은 예시의 애플리케이션, 모듈, 또는 프로세스로 한정되지 않는다.
도 6은 본원에 설명된 적어도 일부 실시예들에 따라 배치되고, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하도록 구성될 수 있는, 범용 컴퓨팅 디바이스를 예시한다.
예를 들어, 컴퓨팅 디바이스(600)는 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는데 사용될 수 있다. 일 예의 기본 구성(602)에서, 컴퓨팅 디바이스(600)는 하나 이상의 프로세서(604) 및 시스템 메모리(606)를 포함할 수 있다. 메모리 버스(608)는 프로세서(604)와 시스템 메모리(606) 사이의 통신을 위해 사용될 수 있다. 기본 구성(602)은 도 6에서 내부 점선 내의 컴포넌트로 도시된다.
원하는 구성에 따라, 프로세서(604)는 마이크로프로세서(μP), 마이크로컨트롤러(μC), 디지털 신호 프로세서(DSP), 또는 이들의 임의의 조합을 포함하나 이로 한정되지 않는 임의의 유형의 프로세서일 수 있다. 프로세서(604)는 하나 이상의 캐싱 레벨, 예컨대, 레벨 캐시 메모리(612), 프로세서 코어(614), 및 레지스터(616)를 포함할 수 있다. 프로세서 코어(614)는 산술 논리 연산 장치(arithmetic logic unit: ALU), 부동 소수점 장치(floating point unit: FPU), 디지털 신호 처리 코어(DSP Core), 또는 이들의 임의의 조합을 포함할 수 있다. 메모리 컨트롤러(618)는 또한 프로세서(604)와 함께 사용될 수 있고, 또는 일부 구현예들에서, 메모리 컨트롤러(618)는 프로세서(604)의 내부 부분일 수 있다.
원하는 구성에 따라, 시스템 메모리(606)는 휘발성 메모리(예컨대, RAM), 비휘발성 메모리(예컨대, ROM, 플래시 메모리 등), 또는 이들의 임의의 조합일 수 있다. 시스템 메모리(606)는 운영 체제(620), 관리 애플리케이션(622), 및 프로그램 데이터(624)를 포함할 수 있다. 관리 애플리케이션(622)은 클라우드 기반 서비스에서 오류를 발생시키는 컴포넌트에 기초하여 분할된 오류의 분포를 생성할 수 있다. 프로그램 데이터(624)는 본원에서 설명된 바와 같이, 다른 어떤 데이터보다도 분포 데이터(628) 등을 포함할 수 있다. 분포 데이터(628)는 오류 및 결함과 관련된 정보를 포함할 수 있다.
컴퓨팅 디바이스(600)는 추가 특징 또는 기능, 및 기본 구성(602)과 임의의 원하는 디바이스 및 인터페이스 사이의 통신을 가능하게 하는 추가 인터페이스를 가질 수 있다. 예를 들어, 버스/인터페이스 컨트롤러(630)는 저장 인터페이스 버스(634)를 통해 기본 구성(602)과 하나 이상의 데이터 저장 디바이스(632) 사이의 통신을 가능하게 하는데 사용될 수 있다. 데이터 저장 디바이스(632)는 하나 이상의 착탈식 저장 디바이스(636), 하나 이상의 비착탈식 저장 디바이스(638), 또는 이들의 조합일 수 있다. 착탈식 저장소 및 비착탈식 저장소의 예시는, 몇 가지 예를 들면, 플렉서블 디스크 드라이브, 하드 디스크 드라이브(HDD)와 같은 자기 디스크 디바이스, 컴팩트 디스트(CD) 드라이브 또는 디지털 다목적 디스크(DVD) 드라이브와 같은 광 디스크 드라이브, 솔리드 스테이트 드라이브(SSD), 및 테이프 드라이브를 포함할 수 있다. 예시적 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 다른 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기법으로 구현되는 휘발성 및 비휘발성, 착탈식, 및 비착탈식 매체를 포함할 수 있다.
시스템 메모리(606), 착탈식 저장 디바이스(636), 및 비착탈식 저장 디바이스(638)는 컴퓨터 저장 매체에 관한 예시들일 수 있다. 컴퓨터 저장 매체는, RAM, ROM, EEPROM, 플래시 메모리 또는 다른 메모리 기법, CD-ROM, DVD, 솔리드 스테이스 드라이브, 또는 다른 광학 저장소, 자기 카세트, 자기 테이프, 자기 디스크 저장소 또는 다른 자기 저장 디바이스, 또는 컴퓨팅 디바이스(600)에 의해 액세스될 수 있고 원하는 정보를 저장하는데 사용될 수 있는 임의의 다른 매체를 포함할 수 있으나 이로 한정되지 않는다. 임의의 그러한 컴퓨터 저장 매체는 컴퓨팅 디바이스(600)의 일부분일 수 있다.
컴퓨터 디바이스(600)는 버스/인터페이스 컨트롤러(630)를 통해 다양한 인터페이스 디바이스(예를 들어, 하나 이상의 출력 디바이스(642), 하나 이상의 주변장치 인터페이스(644), 및 하나 이상의 통신 디바이스(666))로부터 기본 구성(602)으로의 통신을 가능하게 하기 위한 인터페이스 버스(630)를 또한 포함할 수 있다. 예시적 출력 디바이스(642) 중 일부는, 하나 이상의 A/V 포트(652)를 통해 디스플레이 또는 스피커와 같은 다양한 외부 디바이스와 통신하도록 구성될 수 있는, 그래픽 프로세싱 유닛(648) 및 오디오 프로세싱 유닛(650)을 포함할 수 있다. 하나 이상의 예시적 주변장치 인터페이스(644)는, 하나 이상의 I/O 포트(658)를 통해 입력 디바이스(예를 들어, 키보드, 마우스, 펜, 음성 입력 디바이스, 터치 입력 디바이스 등) 또는 다른 주변 디바이스(예를 들어, 프린터, 스캐너 등)와 같은 외부 디바이스와 통신하도록 구성될 수 있는 직렬 인터페이스 컨트롤러(654) 또는 병렬 인터페이스 컨트롤러(656)를 포함할 수 있다. 예시적 통신 디바이스(666)는 하나 이상의 통신 포트(664)를 거쳐 네트워크 통신 링크를 통해 하나 이상의 다른 컴퓨팅 디바이스(662)와의 통신을 가능하게 하도록 구성될 수 있는 네트워크 컨트롤러(660)를 포함할 수 있다. 하나 이상의 다른 컴퓨팅 디바이스(662)는 서버, 클라이언트 장치, 및 이와 유사한 디바이스를 포함할 수 있다.
네트워크 통신 링크는 통신 매체에 관한 일 예일 수 있다. 통신 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파 또는 다른 전송 메커니즘과 같은 변조된 데이터 신호 내의 다른 데이터에 의해 이용될 수 있고, 임의의 정보 전달 매체를 포함할 수도 있다. "변조된 데이터 신호"는 신호 내에 정보를 인코딩하는 방식으로 설정되거나 변경된 변조된 데이터 신호 특성 중 하나 이상을 갖는 신호일 수 있다. 한정이 아닌 예시로써, 통신 매체는 유선 네트워크 또는 직접 무선 접속과 같은 유선 매체, 및 음향, 무선 주파수(RF), 마이크로웨이브, 적외선(IR)과 같은 무선 매체, 및 다른 무선 매체를 포함할 수 있다. 본원에서 사용되는 바와 같은 용어 컴퓨터 판독가능 매체는 저장 매체 및 통신 매체 둘 모두를 포함할 수 있다.
컴퓨팅 디바이스(600)는 범용 또는 특수용 서버, 메인프레임, 또는 앞에서 설명된 기능 중 일부를 포함하는 유사 컴퓨터의 일부분으로 구현될 수도 있다. 컴퓨팅 디바이스(600)는 또한 랩톱 컴퓨터 및 비랩톱 컴퓨터 구성 둘 모두를 포함하는 퍼스널 컴퓨터로서 구현될 수도 있다.
실시예들은 또한 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 포함할 수 있다. 이러한 방법은 본원에 설명된 구조를 포함하는 임의의 많은 방법으로 구현될 수 있다. 하나의 그러한 예시는 본 개시물에 설명된 유형의 디바이스들을 사용하는 머신 동작에 의한 것일 수 있다. 다른 선택적 방법은 방법의 개별 동작들 중 하나 이상의 동작이 이들 동작들 중 일부를 수행하는 하나 이상의 운용자(human operator)와 함께 수행되는 한편 다른 동작들은 머신에 의해 수행되는 것일 수도 있다. 이러한 운용자는 서로 함께 위치될 필요는 없지만, 각각은 프로그램의 일 부분을 수행하는 머신과 함께 있을 수도 있다. 다른 예들에서, 휴먼 인터랙션은 예컨대 머신 자동형일 수 있는 사전선택된 기준에 의해 자동화될 수도 있다.
도 7은 실시예들에 따라 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 프로세스에 대한 논리 흐름도를 도시한다. 프로세스(700)는 클라우드 기반 서비스의 관리 애플리케이션 상에서 구현될 수 있다.
프로세스(700)는 클라우드 기반 서비스와 연관된 사용 데이터 및 종합 측정으로부터의 오류가 취합될 수 있는 동작 700으로 시작한다. 사용 데이터는 클라우드 기반 서비스의 사용 시나리오와 연관된 고객 액션의 출력을 포함할 수 있다. 종합 측정은 고객 액션의 시뮬레이션의 출력을 포함할 수 있다. 동작 720에서, 오류는 클라우드 기반 서비스의 컴포넌트에 기초하여 오류들을 세그먼트화하는 분포를 생성하도록 처리될 수 있다. 오류들의 서브세트를 생성하는 고장 컴포넌트는 동작 730에서 하이라이팅될 수 있고, 여기서 고장 컴포넌트는 클라우드 기반 서비스의 컴포넌트들 중 하나 일 수 있다. 동작 740에서, 분포가 고장 컴포넌트에 근접하여 결함 정보를 사용하여 고장 컴포넌트를 강조함으로써 결함을 식별할 수 있도록 시각화하여 제공될 수 있다.
프로세스(700)에 포함된 동작들은 예시를 위한 것이다. 실시예들에 따른 관리 애플리케이션은 더 적거나 더 많은 단계뿐만 아니라 본원에 설명된 원리들을 사용하는 동작들과 상이한 순서를 갖는 유사한 프로세스들에 의해 구현될 수도 있다.
일부 예들에 따르면, 컴퓨팅 디바이스 상에서 실행되는, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 방법이 설명될 수 있다. 상기 방법은, 클라우드 기반 서비스와 연관된 사용 데이터(usage data) 및 종합 측정(synthetic measurements)으로부터 오류들을 취합하는(aggregating) 단계와, 상기 클라우드 기반 서비스의 컴포넌트들에 기초하여 상기 오류들을 세그먼트화하는 분포(distribution)를 생성하도록 상기 오류들을 프로세싱하는 단계와, 결함과 연관된 상기 오류들의 서브세트를 생성하는 고장 컴포넌트(failed component)를 하이라이팅하는(highlighting) 단계 - 상기 고장 컴포넌트는 상기 컴포넌트들 중 하나임 - 와, 상기 고장 컴포넌트의 주변에서 결함 정보를 사용하여 상기 고장 컴포넌트를 강조함으로써(emphasizing) 상기 결함을 식별할 수 있도록 상기 분포를 시각화하여 제공하는 단계를 포함할 수 있다.
다른 예들에 따르면, 상기 방법은 상기 클라우드 기반 서비스의 사용 시나리오와 연관된 하나 이상의 고객 액션의 출력을 포함하는 상기 사용 데이터를 익명화하는(anonymizing) 단계와, 상기 하나 이상의 고객 액션의 시뮬레이션의 출력을 포함하는 상기 종합 측정 및 상기 사용 데이터를 파싱하는(parsing) 단계를 더 포함할 수 있다. 상기 종합 측정 및 상기 사용 데이터는 오류 유형, 상기 클라우드 기반 서비스의 연관 컴포넌트의 식별, 및 상기 연관된 컴포넌트의 유형의 세트 중에서 하나 이상을 포함하는 하나 이상의 기준에 기초하여 취합될 수 있고, 상기 종합 측정 및 상기 사용 데이터는 공유 기간(a shared time period) 동안 수집될 수 있다. 오류들은 상기 컴포넌트들과의 연관성에 기초하여 그룹으로 분리될 수 있고 히스토그램은 상기 그룹으로부터 상기 분포로서 생성될 수 있다.
추가 예들에 따르면, 상기 방법은, 상기 서브세트의 개수를 상기 오류들의 개수로 나눔으로써 상기 오류들의 서브세트와 연관된 오류들의 백분율을 계산하는 단계와, 상기 백분율이 임계치를 초과한다는 판정에 응답하여, 상기 고장 컴포넌트를 상기 결함의 원인으로 식별하는 단계, 상기 고장 컴포넌트의 주변에서 상기 분포에 내에 상기 서브세트의 유형 및 상기 서브세트의 기간을 포함함으로써 결함 정보를 사용하여 상기 고장 컴포넌트를 하이라이팅하는 단계를 더 포함할 수 있다. 결함 정보는 상기 고장 컴포넌트를 식별하기 위해 상기 고장 컴포넌트의 식별, 상기 서브세트의 백분율, 및 상기 분포 내의 상기 서브세트의 빈도(frequency)의 세트 중에서 하나 이상으로 제공된다.
일부 예들에 따르면, 상기 방법은 상기 공유 접속, 공유 데이터 리소스, 및 공유 동작의 세트 중에서 하나 이상을 포함하는 관계에 기초하여 상기 고장 컴포넌트와 연관된 관련 컴포넌트들을 검출하는 단계와, 상기 관련 컴포넌트들에 의해 생성된 상기 오류들의 연관 백분율에 기초하여 상기 관련 컴포넌트들을 랭크하는(ranking) 단계와, 상기 결함에 의해 영향받는 상기 관련 컴포넌트들을 하이라이팅하도록 상기 연관 백분율에 기초하여 상기 고장 컴포넌트의 주변에서 상기 관련 컴포넌트들을 배치하는 단계를 더 포함할 수 있다.
일부 예들에 따르면, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 컴퓨팅 디바이스가 설명될 수 있다. 상기 컴퓨팅 디바이스는 메모리와, 상기 메모리에 연결된 프로세서를 포함할 수 있다. 상기 프로세서는 상기 메모리 내에 저장된 명령어와 함께 관리 애플리케이션을 실행하도록 구성될 수 있다. 상기 관리 애플리케이션은, 클라우드 기반 서비스와 연관된 사용 데이터 및 종합 측정으로부터 오류들을 취합 - 상기 사용 데이터는 상기 클라우드 기반 서비스의 사용 시나리오에 관한 고객 액션의 익명화된 출력을 포함하고, 상기 종합 측정은 상기 고객 액션의 시뮬레이션의 출력을 포함함 - 하고, 상기 클라우드 기반 서비스의 컴포넌트들에 기초하여 상기 오류들을 세그먼트화하는 분포를 생성하도록 상기 오류들을 프로세싱하고, 결함과 연관된 상기 오류들의 서브세트를 생성하는 고장 컴포넌트를 하이라이팅 - 상기 고장 컴포넌트는 상기 컴포넌트들 중 하나임 - 하고, 상기 고장 컴포넌트의 주변에서 결함 정보를 사용하여 상기 고장 컴포넌트를 강조함으로써 상기 결함을 식별할 수 있도록 상기 분포를 시각화하여 제공하도록 구성될 수 있다.
다른 예들에 따르면, 상기 관리 애플리케이션은 또한, 인증 스킴(authentication scheme)을 통해 이해관계자(stakeholder)의 액세스 권한을 검출 - 상기 이해관계자는 상기 클라우드 기반 서비스의 관리자임 - 하고, 상기 고장 컴포넌트, 상기 고장 컴포넌트와 관련된 컴포넌트들, 및 상기 클라우드 기반 서비스의 다른 컴포넌트와 연관된 상기 오류들과 연관된 세분화된 정보(granular information)를 보도록 액세스를 제공하도록 구성된다.
일부 예들에 따르면, 상기 관리 애플리케이션은 또한, 인증 스킴을 통해 이해관계자의 액세스 권한을 검출 - 상기 이해관계자는 상기 클라우드 기반 서비스의 상기 고장 컴포넌트를 관리하는 팀의 멤버임 - 하고, 상기 고장 컴포넌트와 연관된 오류들 및 상기 고장 컴포넌트에 관련된 컴포넌트들과 연관된 오류들과 연관된 세분화된 정보에 대한 액세스를 제공하고, 상기 클라우드 기반 서비스의 다른 컴포넌트들과 연관된 상기 오류들에 대한 액세스를 제한하도록 구성된다. 이해관계자는 상기 결함을 검출하는 것과 연관된 임계치를 구성하도록 허용될 수 있고, 상기 이해관계자는 상기 클라우드 기반 서비스의 관리자 및 상기 클라우드 기반 서비스의 상기 고장 컴포넌트를 관리하는 팀을 포함한다.
일부 예들에 따르면, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하도록 명령어가 저장된 컴퓨터 판독가능 메모리 디바이스가 설명될 수 있다. 상기 명령어는 전술된 방법과 유사한 동작들을 포함할 수 있다.
앞의 명세서, 예들, 및 데이터는 실시예들의 구성요소의 사용 및 제조에 관한 완전한 설명을 제공한다. 본 주제는 구조적 특징 및/또는 방법적 동작에 특정한 언어로 설명되었으나, 첨부된 특허청구범위에 정의되는 주제는 전술된 특정 특징 또는 동작으로 반드시 한정되는 것이 아님이 이해될 것이다. 오히려, 전술된 특정 특징 및 동작은 특허청구범위 및 실시예들을 구현하기 위한 예시적 형태로서 개시된다.

Claims (19)

  1. 컴퓨팅 디바이스 상에서 실행되는, 분산 시스템에서 결함을 분석하기 위한 비주얼 툴(visual tool)을 제공하는 방법으로서,
    클라우드 기반 서비스의 연관된 컴포넌트의 유형의 식별 및 오류 유형으로 이루어진 세트 중에서 하나 이상을 포함하는 하나 이상의 기준에 기초하여, 종합 측정(synthetic measurements) 및 사용 데이터(usage data)로부터 오류들을 취합하는(aggregating) 단계- 상기 사용 데이터는 상기 클라우드 기반 서비스의 사용 시나리오와 연관된 하나 이상의 고객 액션의 익명화된 출력을 포함함 -와,
    상기 오류들을 처리하여, 상기 클라우드 기반 서비스의 컴포넌트들에 기초하여 상기 오류들을 세그먼트화하는 분포(a distribution)를 생성하는 단계- 상기 분포를 생성하는 단계는 상기 오류 유형 및 이해관계자(stakeholder)와의 관련성에 기초하여 상기 오류들을 랭크하고(ranking), 상기 분포에서 하위 랭크의 오류 위에 상위 랭크의 오류를 배치함으로써 수행됨 -와,
    결함과 연관된 상기 오류들의 서브세트를 발생시키는 고장 컴포넌트(failed component)를 디스플레이되는 시각화(a visualization) 내에서 하이라이팅하는 단계- 상기 고장 컴포넌트는 상기 컴포넌트들 중 하나임 -와,
    디스플레이되는 상기 고장 컴포넌트의 주변에서 결함 정보를 사용하여 상기 고장 컴포넌트를 강조함으로써 상기 결함을 식별하도록 상기 시각화 내에 상기 분포를 제공하는 단계를 포함하는
    방법.
  2. 제1항에 있어서,
    상기 하나 이상의 고객 액션의 시뮬레이션의 출력을 포함하는 상기 종합 측정 및 상기 사용 데이터를 파싱하는(parsing) 단계를 더 포함하는
    방법.
  3. 제1항에 있어서,
    상기 오류들을 상기 컴포넌트들과의 연관성에 기초하여 그룹으로 분리하는 단계와,
    상기 그룹으로부터 히스토그램을 상기 분포로서 생성하는 단계를 더 포함하는
    방법.
  4. 제1항에 있어서,
    상기 오류들의 서브세트의 개수를 상기 오류들의 개수로 나눔으로써 상기 오류들의 서브세트와 연관된 상기 오류들의 백분율을 계산하는 단계를 더 포함하는
    방법.
  5. 제4항에 있어서,
    상기 백분율이 임계치를 초과한다는 판정에 응답하여, 상기 고장 컴포넌트를 상기 결함의 원인으로 식별하는 단계를 더 포함하는
    방법.
  6. 제5항에 있어서,
    상기 분포 내에서 상기 고장 컴포넌트의 주변에 상기 서브세트의 유형 및 상기 서브세트의 기간을 포함함으로써 결함 정보를 사용하여 상기 고장 컴포넌트를 하이라이팅하는 단계를 더 포함하는
    방법.
  7. 제1항에 있어서,
    상기 고장 컴포넌트를 식별하기 위해 상기 고장 컴포넌트의 식별, 상기 서브세트의 백분율, 및 상기 분포 내의 상기 서브세트의 빈도(frequency)로 이루어진 세트 중에서 하나 이상을 갖는 결함 정보를 제공하는 단계를 더 포함하는
    방법.
  8. 제1항에 있어서,
    공유 접속, 공유 데이터 리소스, 및 공유 동작으로 이루어진 세트 중에서 하나 이상을 포함하는 관계에 기초하여 상기 고장 컴포넌트와 연관된 관련 컴포넌트들을 검출하는 단계를 더 포함하는
    방법.
  9. 제8항에 있어서,
    상기 관련 컴포넌트들에 의해 발생된 상기 오류들의 연관된 백분율에 기초하여 상기 관련 컴포넌트들을 랭크하는 단계를 더 포함하는
    방법.
  10. 제9항에 있어서,
    상기 결함에 의해 영향받는 상기 관련 컴포넌트들을 하이라이팅하도록 상기 연관된 백분율에 기초하여 상기 고장 컴포넌트의 주변에 상기 관련 컴포넌트들을 배치하는 단계를 더 포함하는
    방법.
  11. 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 컴퓨팅 디바이스로서,
    메모리와,
    상기 메모리에 연결되고, 상기 메모리 내에 저장된 명령어와 함께 관리 애플리케이션을 실행시키는 프로세서를 포함하되,
    상기 관리 애플리케이션은,
    클라우드 기반 서비스의 연관된 컴포넌트의 유형의 식별 및 오류 유형으로 이루어진 세트 중에서 하나 이상을 포함하는 하나 이상의 기준에 기초하여, 종합 측정 및 사용 데이터로부터 오류들을 취합하고- 상기 사용 데이터는 상기 클라우드 기반 서비스의 사용 시나리오의 고객 액션의 익명화된 출력을 포함하고, 상기 종합 측정은 상기 고객 액션의 시뮬레이션의 출력을 포함함 -,
    상기 오류들을 처리하여, 상기 클라우드 기반 서비스의 컴포넌트들에 기초하여 상기 오류들을 세그먼트화하는 분포를 생성하고- 상기 분포를 생성하는 것은 상기 오류 유형 및 이해관계자와의 관련성에 기초하여 상기 오류들을 랭크하고, 상기 분포에서 하위 랭크의 오류 위에 상위 랭크의 오류를 배치함으로써 수행됨 -,
    결함과 연관된 상기 오류들의 서브세트를 발생시키는 고장 컴포넌트를 디스플레이되는 시각화 내에서 하이라이팅하며- 상기 고장 컴포넌트는 상기 컴포넌트들 중 하나임 -,
    디스플레이되는 상기 고장 컴포넌트의 주변에서 결함 정보를 사용하여 상기 고장 컴포넌트를 강조함으로써 상기 결함을 식별하도록 상기 시각화 내에 상기 분포를 제공하도록 구성된
    컴퓨팅 디바이스.
  12. 제11항에 있어서,
    상기 관리 애플리케이션은 또한,
    인증 스킴(authentication scheme)을 통해 이해관계자의 액세스 권한을 검출하도록 구성되되, 상기 이해관계자는 상기 클라우드 기반 서비스의 관리자인
    컴퓨팅 디바이스.
  13. 제12항에 있어서,
    상기 관리 애플리케이션은 또한,
    상기 고장 컴포넌트, 상기 고장 컴포넌트에 관련된 컴포넌트들, 및 상기 클라우드 기반 서비스의 다른 컴포넌트와 연관된 상기 오류들과 연관된 세분화된 정보(granular information)를 보기 위한 액세스를 제공하도록 구성된
    컴퓨팅 디바이스.
  14. 제11항에 있어서,
    상기 관리 애플리케이션은 또한,
    인증 스킴을 통해 이해관계자의 액세스 권한을 검출하도록 구성되되, 상기 이해관계자는 상기 클라우드 기반 서비스의 상기 고장 컴포넌트를 관리하는 팀의 멤버인
    컴퓨팅 디바이스.
  15. 제14항에 있어서,
    상기 관리 애플리케이션은 또한,
    상기 고장 컴포넌트와 연관된 오류들 및 상기 고장 컴포넌트에 관련된 컴포넌트들과 연관된 오류들과 연관된 세분화된 정보를 보기 위한 액세스를 제공하고,
    상기 클라우드 기반 서비스의 다른 컴포넌트들과 연관된 상기 오류들에 대한 액세스를 제한하도록 구성된
    컴퓨팅 디바이스.
  16. 제11항에 있어서,
    상기 관리 애플리케이션은 또한,
    이해관계자가 상기 결함을 검출하는 것과 연관된 임계치를 구성하게 하도록 구성되되,
    상기 이해관계자는 상기 클라우드 기반 서비스의 관리자 및 상기 클라우드 기반 서비스의 상기 고장 컴포넌트를 관리하는 팀을 포함하는
    컴퓨팅 디바이스.
  17. 분산 시스템에서 결함을 분석하기 위한 비주얼 툴을 제공하는 명령어를 저장한, 집적 회로(IC)로 구현된 하드웨어 판독가능 메모리 디바이스로서,
    상기 명령어는,
    클라우드 기반 서비스의 연관된 컴포넌트의 유형의 식별 및 오류 유형으로 이루어진 세트 중에서 하나 이상을 포함하는 하나 이상의 기준에 기초하여, 종합 측정 및 사용 데이터로부터 오류들을 취합하는 것- 상기 사용 데이터는 상기 클라우드 기반 서비스의 사용 시나리오의 고객 액션의 익명화된 출력을 포함하고, 상기 종합 측정은 상기 고객 액션의 시뮬레이션의 출력을 포함함 -과,
    상기 오류들을 처리하여, 상기 클라우드 기반 서비스의 컴포넌트들에 기초하여 상기 오류들을 세그먼트화하는 분포를 생성하는 것- 상기 분포를 생성하는 것은 상기 오류 유형 및 이해관계자와의 관련성에 기초하여 상기 오류들을 랭크하고, 상기 분포에서 하위 랭크의 오류 위에 상위 랭크의 오류를 배치함으로써 수행됨 -과,
    결함과 연관된 상기 오류들의 서브세트를 발생시키는 고장 컴포넌트를 디스플레이되는 시각화 내에서 하이라이팅하는 것- 상기 고장 컴포넌트는 상기 컴포넌트들 중 하나임 -과,
    디스플레이되는 상기 고장 컴포넌트의 주변에서 결함 정보를 사용하여 상기 고장 컴포넌트를 강조함으로써 상기 결함을 식별하도록 상기 시각화 내에 상기 분포를 제공하는 것을 포함하는
    하드웨어 판독가능 메모리 디바이스.
  18. 제17항에 있어서,
    상기 명령어는
    공유 접속, 공유 데이터 리소스, 및 공유 동작으로 이루어진 세트 중에서 하나 이상을 포함하는 관계에 기초하여 상기 고장 컴포넌트와 연관된 관련 컴포넌트들을 검출하는 것과,
    상기 관련 컴포넌트들에 의해 발생된 상기 오류들의 연관된 백분율에 기초하여 상기 관련 컴포넌트들을 랭크하는 것과,
    상기 결함에 의해 영향받는 상기 관련 컴포넌트들을 하이라이팅하도록 상기 연관된 백분율에 기초하여 상기 고장 컴포넌트의 주변에 상기 관련 컴포넌트들을 배치하는 것을 더 포함하는
    하드웨어 판독가능 메모리 디바이스.
  19. 제17항에 있어서,
    상기 명령어는
    상기 오류들의 서브세트의 개수를 상기 오류들의 개수로 나눔으로써 상기 오류들의 서브세트와 연관된 상기 오류들의 백분율을 계산하는 것과,
    상기 백분율이 임계치를 초과한다는 판정에 응답하여, 상기 고장 컴포넌트를 상기 결함의 원인으로 식별하는 것과,
    상기 분포 내에서 상기 고장 컴포넌트의 주변에 상기 서브세트의 유형 및 상기 서브세트의 기간을 포함함으로써 결함 정보를 사용하여 상기 고장 컴포넌트를 하이라이팅하는 것을 더 포함하는
    하드웨어 판독가능 메모리 디바이스.
KR1020177002500A 2014-07-30 2015-07-24 분산 시스템에서 결함을 분석하기 위한 비주얼 툴 KR102301946B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US14/447,591 2014-07-30
US14/447,591 US9558093B2 (en) 2014-07-30 2014-07-30 Visual tools for failure analysis in distributed systems
PCT/US2015/041872 WO2016018730A1 (en) 2014-07-30 2015-07-24 Visual tools for failure analysis in distributed systems

Publications (2)

Publication Number Publication Date
KR20170040210A KR20170040210A (ko) 2017-04-12
KR102301946B1 true KR102301946B1 (ko) 2021-09-13

Family

ID=53801188

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020177002500A KR102301946B1 (ko) 2014-07-30 2015-07-24 분산 시스템에서 결함을 분석하기 위한 비주얼 툴

Country Status (11)

Country Link
US (1) US9558093B2 (ko)
EP (1) EP3175362A1 (ko)
JP (1) JP2017523526A (ko)
KR (1) KR102301946B1 (ko)
CN (1) CN106575253B (ko)
AU (1) AU2015298146B2 (ko)
BR (1) BR112017000970B1 (ko)
CA (1) CA2955615C (ko)
MX (1) MX2017001067A (ko)
RU (1) RU2696347C2 (ko)
WO (1) WO2016018730A1 (ko)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10444939B2 (en) * 2016-03-15 2019-10-15 Microsoft Technology Licensing, Llc Analysis of recurring processes
US10614085B2 (en) 2016-05-26 2020-04-07 International Business Machines Corporation System impact based logging with enhanced event context
US10614398B2 (en) 2016-05-26 2020-04-07 International Business Machines Corporation System impact based logging with resource finding remediation
CN106528389B (zh) * 2016-10-27 2021-03-09 北京小米移动软件有限公司 ***流畅性的性能评测方法、装置及终端
US10191731B2 (en) 2017-06-27 2019-01-29 Microsoft Technology Licensing, Llc Safe and agile rollouts in a network-accessible server infrastructure using slices
US11057276B2 (en) 2017-10-04 2021-07-06 Servicenow, Inc. Bulk service mapping
US10853231B2 (en) * 2018-12-11 2020-12-01 Sap Se Detection and correction of coding errors in software development
US11025704B2 (en) * 2019-07-08 2021-06-01 International Business Machines Corporation Methods and systems for enhanced component relationships in representations of distributed computing systems
US11630684B2 (en) * 2019-07-26 2023-04-18 Microsoft Technology Licensing, Llc Secure incident investigation workspace generation and investigation control
US11372707B2 (en) 2020-02-06 2022-06-28 International Business Machines Corporation Cognitive problem isolation in quick provision fault analysis
US20240069999A1 (en) * 2022-08-31 2024-02-29 Microsoft Technology Licensing, Llc Detecting and mitigating cross-layer impact of change events on a cloud computing system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132543A (ja) * 2000-10-25 2002-05-10 Hitachi Ltd 計算機システムの管理方法
JP2005531070A (ja) * 2002-06-25 2005-10-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 分散環境中でアプリケーションの性能を監視するための方法およびシステム
JP2011065563A (ja) * 2009-09-18 2011-03-31 Fujitsu Ltd 情報システムの品質管理方法及び品質管理装置
JP2013054402A (ja) * 2011-08-31 2013-03-21 Fujitsu Fip Corp 運用監視装置、運用監視プログラム及び記録媒体

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5819028A (en) 1992-06-10 1998-10-06 Bay Networks, Inc. Method and apparatus for determining the health of a network
US6456306B1 (en) 1995-06-08 2002-09-24 Nortel Networks Limited Method and apparatus for displaying health status of network devices
JPH1139031A (ja) * 1997-07-24 1999-02-12 Kubota Corp 監視システム及び記録媒体
US6449739B1 (en) * 1999-09-01 2002-09-10 Mercury Interactive Corporation Post-deployment monitoring of server performance
US6816461B1 (en) 2000-06-16 2004-11-09 Ciena Corporation Method of controlling a network element to aggregate alarms and faults of a communications network
JP2002229923A (ja) * 2000-11-29 2002-08-16 Bha:Kk ディスク状態取得方法および記録媒体
US6950865B1 (en) 2001-03-26 2005-09-27 Cisco Technology, Inc. Network audit tool
US7197559B2 (en) 2001-05-09 2007-03-27 Mercury Interactive Corporation Transaction breakdown feature to facilitate analysis of end user performance of a server system
US20030074606A1 (en) * 2001-09-10 2003-04-17 Udi Boker Network-based control center for conducting performance tests of server systems
US7069184B1 (en) * 2003-10-09 2006-06-27 Sprint Communications Company L.P. Centralized monitoring and early warning operations console
RU2270470C2 (ru) * 2004-02-18 2006-02-20 Академия Федеральной службы охраны Российской Федерации Анализатор параметрических отказов и сбоев
US8032863B2 (en) * 2004-11-18 2011-10-04 Parasoft Corporation System and method for global group reporting
US8015139B2 (en) 2007-03-06 2011-09-06 Microsoft Corporation Inferring candidates that are potentially responsible for user-perceptible network problems
US7757117B2 (en) * 2007-04-17 2010-07-13 International Business Machines Corporation Method and apparatus for testing of enterprise systems
JP5390513B2 (ja) * 2007-06-05 2014-01-15 アストリウム・リミテッド 遠隔検査システム及び方法
JP5459608B2 (ja) * 2007-06-06 2014-04-02 日本電気株式会社 通信網の障害原因分析システムと障害原因分析方法、及び障害原因分析用プログラム
US8156378B1 (en) 2010-10-15 2012-04-10 Red Hat, Inc. System and method for determination of the root cause of an overall failure of a business application service
US8452761B2 (en) * 2007-10-24 2013-05-28 International Business Machines Corporation Apparatus for and method of implementing system log message ranking via system behavior analysis
US8234522B2 (en) * 2008-09-04 2012-07-31 Telcordia Technologies, Inc. Computing diagnostic explanations of network faults from monitoring data
JP5375829B2 (ja) * 2008-09-18 2013-12-25 日本電気株式会社 運用管理装置、運用管理方法、および運用管理プログラム
US8196047B2 (en) 2009-01-20 2012-06-05 Microsoft Corporation Flexible visualization for services
JP2011065364A (ja) * 2009-09-16 2011-03-31 Konica Minolta Business Technologies Inc ログ管理装置、ログ管理方法、およびコンピュータプログラム
US9124488B2 (en) 2010-04-21 2015-09-01 Vmware, Inc. Method and apparatus for visualizing the health of datacenter objects
US9208012B2 (en) * 2010-11-29 2015-12-08 Nec Corporation Display processing system, display processing method, and program
JP2013222313A (ja) * 2012-04-17 2013-10-28 Hitachi Ltd 障害連絡効率化システム
JP2014002290A (ja) * 2012-06-19 2014-01-09 Toshiba Corp シミュレータおよびシミュレーション実行方法
US9047410B2 (en) * 2012-07-18 2015-06-02 Infosys Limited Cloud-based application testing
US8904389B2 (en) 2013-04-30 2014-12-02 Splunk Inc. Determining performance states of components in a virtual machine environment based on performance states of related subcomponents

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002132543A (ja) * 2000-10-25 2002-05-10 Hitachi Ltd 計算機システムの管理方法
JP2005531070A (ja) * 2002-06-25 2005-10-13 インターナショナル・ビジネス・マシーンズ・コーポレーション 分散環境中でアプリケーションの性能を監視するための方法およびシステム
JP2011065563A (ja) * 2009-09-18 2011-03-31 Fujitsu Ltd 情報システムの品質管理方法及び品質管理装置
JP2013054402A (ja) * 2011-08-31 2013-03-21 Fujitsu Fip Corp 運用監視装置、運用監視プログラム及び記録媒体

Also Published As

Publication number Publication date
JP2017523526A (ja) 2017-08-17
US20160034334A1 (en) 2016-02-04
RU2017102502A3 (ko) 2019-02-11
CN106575253B (zh) 2019-11-05
KR20170040210A (ko) 2017-04-12
BR112017000970B1 (pt) 2022-11-29
RU2696347C2 (ru) 2019-08-01
CA2955615C (en) 2023-01-31
MX2017001067A (es) 2017-05-09
EP3175362A1 (en) 2017-06-07
CN106575253A (zh) 2017-04-19
US9558093B2 (en) 2017-01-31
WO2016018730A1 (en) 2016-02-04
AU2015298146B2 (en) 2020-04-09
AU2015298146A1 (en) 2017-01-05
CA2955615A1 (en) 2016-02-04
BR112017000970A2 (pt) 2017-11-21
RU2017102502A (ru) 2018-07-26

Similar Documents

Publication Publication Date Title
KR102301946B1 (ko) 분산 시스템에서 결함을 분석하기 위한 비주얼 툴
US9378079B2 (en) Detection of anomalies in error signals of cloud based service
US9590880B2 (en) Dynamic collection analysis and reporting of telemetry data
US9645629B2 (en) Providing energy consumption analytics of cloud based service
US20200133814A1 (en) Application performance analytics platform
CN106663041B (zh) 从***故障恢复基于云的服务的易用性的方法及装置
US10073726B2 (en) Detection of outage in cloud based service using usage data based error signals
US9444708B2 (en) Detection of outage in cloud based service using synthetic measurements and anonymized usage data
US10114636B2 (en) Production telemetry insights inline to developer experience
US9692665B2 (en) Failure analysis in cloud based service using synthetic measurements
US9952773B2 (en) Determining a cause for low disk space with respect to a logical disk

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant