KR101953558B1 - 스마트 기기 결함 관리 장치 및 방법 - Google Patents

스마트 기기 결함 관리 장치 및 방법 Download PDF

Info

Publication number
KR101953558B1
KR101953558B1 KR1020120117988A KR20120117988A KR101953558B1 KR 101953558 B1 KR101953558 B1 KR 101953558B1 KR 1020120117988 A KR1020120117988 A KR 1020120117988A KR 20120117988 A KR20120117988 A KR 20120117988A KR 101953558 B1 KR101953558 B1 KR 101953558B1
Authority
KR
South Korea
Prior art keywords
fdi
value
defect
profile
values
Prior art date
Application number
KR1020120117988A
Other languages
English (en)
Other versions
KR20140051678A (ko
Inventor
문용혁
김정녀
정보흥
한진희
김대원
문화신
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020120117988A priority Critical patent/KR101953558B1/ko
Priority to US14/028,486 priority patent/US9235463B2/en
Publication of KR20140051678A publication Critical patent/KR20140051678A/ko
Application granted granted Critical
Publication of KR101953558B1 publication Critical patent/KR101953558B1/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0852Delays
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0748Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a remote unit communicating with a single-box computer node experiencing an error/fault
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • G06F11/3006Monitoring arrangements specially adapted to the computing system or computing system component being monitored where the computing system is distributed, e.g. networked systems, clusters, multiprocessor systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3452Performance evaluation by statistical analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/06Management of faults, events, alarms or notifications
    • H04L41/0631Management of faults, events, alarms or notifications using root cause analysis; using analysis of correlation between notifications, alarms or events based on decision criteria, e.g. hierarchy, tree or time analysis
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/08Monitoring or testing based on specific metrics, e.g. QoS, energy consumption or environmental parameters
    • H04L43/0876Network utilisation, e.g. volume of load or congestion level
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/34Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
    • G06F11/3409Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment for performance assessment
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/08Configuration management of networks or network elements
    • H04L41/0876Aspects of the degree of configuration automation
    • H04L41/0883Semiautomatic configuration, e.g. proposals from system

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Biomedical Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Environmental & Geological Engineering (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Debugging And Monitoring (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 스마트 기기 결함 관리 방법으로, 스마트 기기에서 발생되는 하나 이상의 성능 지표들에 대한 결함을 탐지하는 지시자(Fault Detection Indicator : 이하 'FDI'로 기재함)의 정상 상태에서의 수치와 관측한 FDI 수치를 비교하고, 상대적 변이 레벨을 산출하여 결함을 탐지하는 단계와, 상기 탐지된 결함의 원인 및 대응책을 포함하는 분석 객체(Diagnosis Object : 이하 'DO'로 기재함)를 생성하여 결함을 분석하는 단계를 포함한다.

Description

스마트 기기 결함 관리 장치 및 방법{Apparatus and Method for Fault Management of Smart Devices}
본 발명은 전자기기의 결함(Fault)을 탐지 및 분석하는 기술에 관한 것으로, 특히 스마트 기기의 결함 탐지 및 분석을 자동화할 수 있는 장치 및 방법에 관한 것이다.
최근 특정 기능만을 수행하기 위해 고안된 개인 단말, 예컨대 음악 파일 재생기, e-Book 리더, 전자 사전, 휴대폰 등이 사실상 PC 기능을 수행하는 스마트 기기(Smart Device)로 대체되고 있다. 이에 따라, 모바일 응용 프로그램 기반의 다양한 서비스들, 예컨대 기기 동기화(Universal Device Synchronization), 파일 공유 등의 상용화 서비스들이 일반화되고 있고, 다양한 크기 및 사양을 기반으로 그 기능이 고도화되고 있는 단말이 출시되고 있다.
그러나, 이러한 스마트 기기의 대중화에도 불구하고, 단말 관리 기술의 발전은 크게 진전되지 않고 있는 상황이다. 특히, 단말 결함은 실시간으로 자동 관리될 필요성이 있는데, 단일 기기에서 다양한 소프트웨어 결함(Software Fault) 문제가 발생될 수 있어, 개인 사용자가 스스로 단말 결함을 분석하고 관련 문제를 해결하는 것은 기대하기 어렵다.
한편, 스마트 기기가 주요한 네트워크 구성 요소(Network Element)로 인식되면서, 원격지에서의 단말 관리 기술은 스마트 기기 제작사 및 스마트 기기 기반의 응용 서비스 제공자에게도 큰 이슈로 대두되고 있다. 그런데, 사업자에게 기존의 수동적인 형태의 단말 관리는 CAPEX(Capital Expenditures) 및 OPEX(Operational Expenditures) 관점에서 큰 비용 부담을 초래하는 요인으로 등장하고 있다. 따라서, 단말 기반의 서비스 시장에서 자동화된 단말 결함 관리 프레임 워크 제공이 시급하다.
한편, 단말의 이상 유무를 판별하기 위하여 서비스 운영자에게 의존하는 수동 분석 방법의 한계성을 극복하기 위해, 종래에는 정적인 규칙(Rule 또는 Policy)을 정의하고, 이에 따라 If/Else 구문기반으로 결함을 탐지 및 분석하는 방법이 주로 적용되어 왔다. 그러나, 이러한 종래의 방법은 단말로 구성된 네트워크 크기가 커질수록 규칙의 개수 역시 방대해지는 문제점이 있다.
다른 방법으로, 개별 성능 지표에 별도의 임계치(Threshold)를 설정하고, 이의 위반 사실만을 관찰하여 결함 여부를 판별하는 기법이 제안되었다. 그러나, 현실적으로 적합한 임계치 설정이 어렵고, 설사 초기 임계치가 정확하다 하더라도 단말 및 네트워크 상황에 따라 끊임없이 임계치 값을 재설정(Recalibration)해야만 한다는 단점이 있다.
또 다른 개선된 방법으로, 패턴 매칭(Pattern Matching) 기반의 기법이 연구되고 있으나, 판별식 적용이 난해하고 결함 판별 시 많은 계산량이 요구된다는 문제점이 있다.
또한, 전술한 세 가지 방법들은 결함 또는 정상을 판별하는 이진 결정(Binary Decision)에 근간을 두고 있어, 탐지 및 분석에 있어 많은 오류를 포함할 수 있다는 단점이 있다. 즉, 단순화된 정보를 기반으로 하는 이러한 탐지 기법은 정보 손실을 초래할 수밖에 없는 구조적 취약성을 안고 있어, 실제 시스템으로의 적용하는데 실효성이 저하된다.
본 발명은 단말 결함의 탐지 및 분석 절차의 자동화(Automation)를 지원하여 서비스 운영자의 개입을 최소화할 수 있는 스마트 기기 결함 관리 장치 및 방법을 제공한다.
본 발명은 단편적 해석으로 인한 오류를 최소화(Errorless)할 수 있는 스마트 기기 결함 관리 장치 및 방법을 제공한다.
본 발명은 스마트 기기 결함 관리 방법으로, 스마트 기기에서 발생되는 하나 이상의 성능 지표들에 대한 결함을 탐지하는 지시자(Fault Detection Indicator : 이하 'FDI'로 기재함)의 정상 상태에서의 수치와, 실시간 관측한 FDI 수치를 비교하고, 관측치의 상대적 변이 레벨을 산출하여 결함을 탐지하는 단계와, 상기 탐지된 결함의 원인 및 대응책을 포함하는 분석 객체(Diagnosis Object : 이하 'DO'로 기재함)를 생성하여 결함을 분석하는 단계를 포함한다.
본 발명은 스마트 기기의 결함 관리 장치로, 상기 스마트 기기에서 발생되는 하나 이상의 성능 지표들에 대한 결함을 탐지하는 지시자(Fault Detection Indicator : 이하 'FDI'로 기재함)의 정상 상태에서의 수치와 실시간 관측한 FDI 수치를 비교하고, 관측치의 상대적 변이 레벨을 산출하여 결함을 탐지하는 FDI 레벨 산출부와, 상기 탐지된 결함의 원인 및 대응책을 포함하는 분석 객체(Diagnosis Object : 이하 'DO'로 기재함)와의 연관성을 확인하는 연관성 확인부와, 상기 연관성 확인부에 의해 확인된 연관성 수치를 비교하여 최대 적합성 수치를 갖는 분석 객체를 생성하는 적합성 측정부를 포함한다.
본 발명의 실시 예에 의하면, 스마트 기기를 포함하는 개인 단말의 결함을 FDI와 분석 객체를 자동화된 기법으로 실시간 대응시킴으로써, 보다 정확한 결함 탐지 및 해당 원인 판별을 가능하게 한다.
또한, 종래의 방법론과 같이 단순히 결함의 유무만을 판별하는 것이 아니라, 결함 탐지를 알린 FDI와 그에 대응한 가장 적합한 결함유발 원인(Root Cause(s)) 및 대응책(Action(s))을 쌍으로 대응시킬 수 있는 기법을 제공하는 함으로써, 단말 결함에 대한 실질적인 조치(Repair)가 가능하다. 일례로, 종래의 임계치(Threshold) 기반 결함 탐지 시스템에서는 임의 설정한 임계치 값에 따라 결함 탐지의 정확도가 크게 좌우되고, 결함으로 확정된 사례로부터 기 설정된 임계치의 재설정(Recalibration)을 반복해야 하며, 또한, 결함의 대상 성능, 이벤트, 스마트 기기 환경에 따라 상이한 임계치를 미리 설정해야 하는 등의 제약사항이 있었으나, 본 발명은 임계치에 의존하지 않고, 결함 탐지 및 분석을 수행할 수 있는 방법상의 특징이 있다.
본 발명은, 다양한 성능지표를 고려한, 또는 다양한 성능지표를 추가/삭제할 수 있는 구조의 FDI 지표들을 제공하고, 측정 시간대, 대상 스마트 기기, 대상 응용 프로그램, 대상 이벤트 등에 따라 다양한 프로파일(Profile)을 평균값, 분산값 및 확률분산모델 종류와 같은 세 가지 데이터만을 통해 용이하게 구축할 수 있어, 방대한 프로파일(Profile)의 생성 및 관리가 가능해진다. 따라서, 이와 같은 방대한 프로파일(Profile)의 생성 및 관리는 스마트 기기를 포함하는 네트워크의 크기 및 상태 변화에 보다 민감하게 결함 탐지 및 분석을 수행할 수 있는 장점을 제공한다.
또한, 최초 결함 발생 유무를 결정하는 레벨 함수, 특정 FDI와 분석 객체간의 연관성 계산 함수 및 특정 FDI와 분석객체간의 적합성 추정 함수를 용이하게 구현할 수 있으며, 해당 함수의 계산 복잡도(Computational Complexity) 역시 낮은 장점을 제공한다.
더불어, 본 발명은 기존 시스템(Legacy System)의 변형 없이, 적용이 가능한 구조적 특징을 제공할 수 있어, 그 실효성이 높다. 결과적으로, 단말 결함은 기업의 오프라인 (Offline) 후속 조치에 따른 비용 부담뿐만 아니라, 기업 이미지 손상을 초래하게 되는데, 본 발명에서는 이와 같은 문제점을 실시간으로, 자동화된 기법에 의해 높은 정확도를 가지고 처리할 수 있다.
도 1은 일반적인 결함 탐지 및 분석 서비스 구조도이다.
도 2는 본 발명의 일 실시 예에 따른 스마트 기기 결함 관리 장치를 도시한 도면이다.
도 3은 본 발명의 일 실시 예에 따른 스마트 기기 결함 관리 방법을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시 예에 따른 FDI 프로파일 생성 단계를 설명하기 위한 순서도이다.
도 5는 본 발명의 일 실시 예에 따른 FDI 레벨 기반 결함 탐지 단계를 설명하기 위한 순서도이다.
도 6a 및 도 6b는 본 발명의 일 실시 예에 따른 결함 분석 단계를 설명하기 위한 순서도이다.
도 7은 본 발명의 일 실시 예에 따른 연관성 확인을 설명하기 위한 그래프이다.
이하, 첨부된 도면을 참조하여 기술되는 바람직한 실시 예를 통하여 본 발명을 당업자가 용이하게 이해하고 재현할 수 있도록 상세히 기술하기로 한다.
본 발명을 설명함에 있어 관련된 공지 기능 또는 구성에 대한 구체적인 설명이 본 발명 실시 예들의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명을 생략할 것이다.
명세서 전반에 걸쳐 사용되는 용어들은 본 발명 실시 예에서의 기능을 고려하여 정의된 용어들로서, 사용자 또는 운용자의 의도, 관례 등에 따라 충분히 변형될 수 있는 사항이므로, 이 용어들의 정의는 본 발명의 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.
다양한 스마트 기기로부터 결함이라고 의심되는 수치, 행위, 패턴 등의 탐지시, 이를 검증하기 위해 서비스 운영자가 직접 개입하여 수동으로 결함 탐지의 정확성, 원인 파악 및 대응책 등을 분석하는 것이 일반적인데, 이에 대해 도 1을 참조하여 설명하기로 한다.
도 1은 일반적인 결함 탐지 및 분석 서비스 구조도이다.
도 1을 참조하면, 결함 관리 DB(10)는 실제 결함으로 판정된 과거 데이터를 기반으로, 결함으로 확정된 수치, 행위 및 패턴 등을 기록하고 있는 참조(Reference) 데이터 집합이다.
서비스 운영자(20)는 서비스 또는 네트워크를 관리하는 운영자를 의미하며, 탐지된 결함의 실제 결함 여부, 결함 발생 원인 및 결함 발생 원인에 따른 대응책을 분석한다.
아이피 네트워크(IP Networks)(30)는 TCP/IP 프로토콜을 기반으로 하는 인터넷을 포함하는 통신 네트워크를 통칭한다.
스마트 기기(40)는 사용자가 보유한 개인 단말을 의미하며, 스마트 폰, 태블릿 PC, 탭 유형의 다양한 스마트 기기를 포함한다. 이와 같은 스마트 기기에서는 종래의 PC에서 수행되던 대부분의 서비스, 응용 프로그램 등이 운용될 수 있다.
결함 탐지(50)는 스마트 기기(40)가 특정 결함을 서비스 운영자(20)에게 알리는 수동적 모니터링(Passive Monitoring) 방식 또는 서비스 운영자(20)가 직접 각 스마트 기기(40)를 대상으로 결함 여부를 탐지할 수 있는 능동적 모니터링(Active Monitoring) 방식으로 수행될 수 있다.
수동 분석(60)은 서비스 운영자(20)가 직접 개입하여 수동으로 결함의 내용을 분석하는 과정을 의미한다.
리페어 수행(70)은 결함으로 확정된 사항에 대해서 원인을 해결하기 위한 대응책을 원격지에서 수행하는 것을 의미한다. 원격지에서의 결함 수리는 스마트 기기의 상태에 따라 불가능할 수도 있으므로, 선택적으로 수행될 수 있다.
그런데, 도 1에 도시된 바와 같은 수동적인 스마트 기기 결함 탐지 및 분석 방법은 단일 기기에서 많은 종류의 응용 프로그램이 처리할 수 있게 됨에 따라, 다양한 소프트웨어 결함(Software Fault) 문제를 관리하기에는 한계가 있다. 따라서, 본 발명은 단말 결함을 자동화 방식으로 관리하는 장치 및 방법을 제안한다.
도 2는 본 발명의 일 실시 예에 따른 스마트 기기 결함 관리 장치를 도시한 도면이다.
도 2를 참조하면, 스마트 기기 결함 관리 장치(200)는 스마트 기기(100)의 결함 탐지 및 분석의 전 과정을 수행하는 관리 프레임 워크를 의미한다.
네트워크 인터페이스(Network Interface)(210)는 스마트 기기(100)로부터 관측된 FDI 값들을 결함 관리 프레임워크(200)에 전달하기 위한 데이터 송수신용 네트워크 인터페이스이다.
FDI 수집부(FDI Collector)(220)는 스마트 기기(100)로부터 FDI 관측 값을 수집하는데, FDI1부터 FDIM을 포함하는 다수 개로 구성될 수 있다. 여기서, FDI는 결함 탐지 지시자(Fault Detection Indicator)를 의미하며, FDI의 일례는 네트워크 지연(Network Delay), 채널 대역폭(Channel Bandwidth), CPU 부하(Device CPU Load) 및 기기 배터리 소모(Device Battery Consumption) 등과 같은 성능 지표들(Performance Metrics)이 고려될 수 있다. 따라서, FDI는 전술한 바와 같은 결함 탐지를 위한 복수개의 성능 지표들을 포함하는 집합으로 정의될 수 있다.
FDI 레벨 산출부(FDI Level Calculator)(230)는 FDI 수집부(220)로부터 획득한 FDI 값들의 레벨을 산출한다. 여기서, FDI 레벨이란 정상 상태의 FDI 정규 분포 모델에 비해서, 현재 스마트 기기의 관측된 FDI 정규 분포 모델이 어느 정도 변이를 나타 내는지를 정량화하여 표기한 수치를 의미한다. 즉, 스마트 기기(100)가 정상적인 상태일 때 생성된 FDI 프로파일(FDI Profile)의 값과 현재 수집된 FDI값 간의 차이의 정도를 정규 분포 모델의 관점에서 산출하는 것이다. 이에 대해서는 도 5를 참조하여 하기에서 좀 더 상세히 설명하기로 한다.
리페어 준비부(Repair Listing Part)(240)는 특정 분석 객체(Diagnosis Object)(예: x 번째 Diagnosis Object: DOx)를 포함하는 모든 리페어(Repairs)를 리페어 DB(Repair Database)(290)로부터 검색하여 획득특정 기준(예: 리페어 생성일자)에 따라 정렬한다.
여기서, Repair는 (Repairi = (Fj sub , DOx))의 형태와 같이 FDI의 부분집합과 분석 객체(Diagnosis Object)의 쌍(Pair)으로 구성된다. Repairi은 DOx을 포함하는 i번째 Repair를 의미하며, i = 1, 2, 3,...,R 인 것으로 가정한다. 또한, Fj sub은 FDI의 j번째 부분집합을 의미하며, j = 1, 2, 3,...,2| FDI |-1 인 것으로 가정한다. 또한, DOx은 x번째 분석 객체(Diagnosis Object)를 의미하며, x = 1, 2, 3,...,Q 인 것으로 가정한다.
여기서, DOx은 Root Cause(s) 또는 Action(s)로 구성되어 있는데, Root Cause(s)는 해당 결함 발생의 주요한 원인(들)을 의미하며, Action(s)은 해당 결함을 해결하기 위한 대응책(들)을 의미한다. 일 실시 예로, DOx은 "DOx(Root Cause(s)), DOx(Action(s)), 또는 DOx(Root Cause(s), Action(s))"의 형태와 같이 구성될 수 있다. 단, 세 번째 유형의 DOx의 경우, Root Cause(s) 및 Action(s)과의 관계는 종래의 통상적인 결함 요인과 그 해결 방법에 준하여 사전에 구성될 수 있는 것으로 가정한다.
또한, 동일한 DOx에 대해서 상이한 Fj sub 와 쌍을 맺을 수 있으므로, DOx를 포함한 리페어(Repair)는 하나로 한정 지어질 필요는 없으며, 복수 개가 될 수 있다.
연관성 확인부(Association Degree Checker)(250)는 개별 FDI가 어떤 분석 객체(Diagnosis Object)와 연관성이 가장 높은지를 판단한다. 이를 위해, 해당 분석 객체(Diagnosis Object)를 포함하는 모든 리페어(Repair)에서 각 FDI의 상대적 출현 빈도를 계산한다. 이는 특정 분석 객체(Diagnosis Object)을 포함하는 모든 리페어(Repairs)를 대상으로 이상 변이가 관측된 모든 FDI의 연관성 값이 계산될 때까지 반복된다. 이에 대해서는 도 6a 및 도 6b를 참조하여 하기에서 좀 더 상세히 설명하기로 한다.
적합성 측정부(Relevance Estimator)(260)는 FDI 레벨 산출부(FDI Level Calculator)(230)에 의해 산출된 FDI 레벨 값과 연관성 확인부(Association Degree Checker)(250)에 의해 산출된 연관성 값을 이용하여, 최신 관측된 FDI 수치와 가장 관련성이 높은 분석 객체(Diagnosis Object)를 탐색하여 상호 적합성를 추정한다. 즉, FDI 레벨 값은 프로파일(Profile)과의 변이 차이를 의미하고, 연관성(Association Degree)은 가중치 값으로 기능한다. 이에 대해서는 도 6a 및 도 6b를 참조하여 하기에서 좀 더 상세히 설명하기로 한다.
프로파일 생성부(Profile Generator)(270)는 스마트 기기(100)가 정상일 때, 즉 결함이 없는 상태일 때 관측된 데이터를 근거로 각 FDI 값의 평균값, 분산 값 및 해당 FDI 값이 어떠한 확률 분포 모델에 가장 근접한 형태를 보이는지를 식별한다. 그리고, 상기 세 가지 데이터를 기반으로 FDI 프로파일(FDI Profile)을 생성한다. 특히, FDI 프로파일은 대상 FDI, 측정 시간대, 대상 기기, 대상 응용 프로그램, 대상 이벤트 등에 따라 동일한 FDI일 경우라도 복수개가 생성될 수 있어, 결함 분석의 정확도를 높일 수 있다. 이에 대해서는 도 4를 참조하여 하기에서 좀 더 상세히 설명하기로 한다.
FDI 프로파일 DB(FDI Profile Database)(280)는 프로파일 생성부(270)를 통해 생성된 복수개의 FDI 프로파일을 관리하는 데이터베이스를 의미한다. 본 발명에서 이와 같은 데이터베이스는 사전에 준비되어 있는 것으로 가정한다. 이러한 FDI 프로파일 DB(FDI Profile Database)(280)는 FDI 레벨 산출부(230)에 의해 검출되어 사용될 수 있다.
리페어 DB(Repair Database)(290)는 실제 결함으로 판정된 케이스에 대하여, 복수 개의 Repairi = (Fj sub , DOx)를 저장 관리하는 데이터베이스이다. 리페어 DB(Repair Database)(290)는 적합성 확인부(240)에 의해 검출되어 사용될 수 있다.
리페어 관리자(Repair Manager)(300)는 실제 결함으로 판정된 케이스에 대하여, 변이가 발견된 FDI, 이러한 FDI들의 변이를 유발한 핵심 원인(Root Cause),그리고 이를 해결하기 위한 대응책(Action)은 무엇인지 리페어 형태로 사전에 생성하여 관리한다.
도 3은 본 발명의 일 실시 예에 따른 스마트 기기 결함 관리 방법을 설명하기 위한 도면이다.
도 3을 참조하면, 스마트 기기 결함 관리 방법은 크게 결함 탐지 단계(S10) 및 결함 분석 단계 (S20)로 구성된다.
결함 탐지 단계(S10)를 수행한 결과로서, 결함이 확증(Fault Confirmation)되고, 결함 분석 단계(Diagnosis)(S20)를 수행한 결과값으로 적합 분석 객체(Relevant Diagnosis Object)가 출력될 수 있다.
결함 탐지 단계(S10)는 상세하게는 FDI 레벨 산출(FDI Level Calculation)(S11)을 통해 수행된다. 이에 대해서는 도 5를 참조하여 하기에서 좀 더 상세히 설명하기로 한다.
또한, 도면에는 도시되어 있지 않지만, FDI 레벨 산출(FDI Level Calculation)(S11)에 선행하여 개별 FDI에 해당하는 성능 지표를 사전에 준비하는 FDI 프로파일 생성이 수행되어야 한다. 이에 대해서는 도 4를 참조하여 하기에서 좀 더 상세히 설명하기로 한다.
결함 분석 단계(S20)는 상세하게는 리페어 준비(Repairs List)(S21), 연관성 확인(Association Check)(S22) 및 적합성 측정(Relevance Estimation)(S23)을 포함하는 세부 단계로 이루어진다.
리페어 준비(Repairs List)(S21)는 특정 분석 객체(Diagnosis Object)(예: x 번째 Diagnosis Object: DOx)를 포함하는 모든 리페어(Repairs)를 획득하고, 이를 특정 기준(예: 리페어 생성날짜)에 따라 정렬하는 단계이다.
연관성 확인(Association Check)(S22)은 결함 탐지 시점을 기준으로 가장 최근에 관측된 FDI 수치 및 특정 DOx을 포함하는 각 리페어(Repair)의 상호 연관성(Association Relationship)을 분석함으로써, 해당 결함에 대한 DOx의 적합성을 판별한다.
적합성 측정(Relevance Estimation)(S23)은 Root Cause(s) 및 Action(s)으로 구성된 특정 DOx가 결함에 대응하는 원인 분석 및 대응책으로서 어느 정도의 적합성(또는 적절성)을 가질 수 있는지를 측정한다. 그리고, 최대 적합성 수치를 보이는 DOx를 해당 스마트 기기 또는 해당 스마트 기기의 특정 이벤트 등에 가장 적합한 원인 분석 및 대응책으로 매핑시키는 과정이다.
연관성 확인(Association Check)(S22) 및 적합성 측정(Relevance Estimation)(S23)에 대해서는 하기 도 6a 및 도 6b를 참조하여 상세히 살펴보기로 한다.
즉, 본 발명에서는 특정 결함과 최적의 대응(Pair-Wise)을 이룰 수 있는 DOx을 선정하기 위한 기술에 관한 것이다. 최종적으로 서비스 운영자는 해당 결함에 가장 적합한 DOx을 획득할 수 있다.
즉, 본 발명에서는 특정 결함과 최적의 대응(Pair-Wise)을 이룰 수 있는 DOx을 선정하기 위한 기술에 관한 것이다. 최종적으로 서비스 운영자는 해당 결함에 가장 적합한 DOx을 획득할 수 있다.
도 4는 본 발명의 일 실시 예에 따른 FDI 프로파일 생성 단계를 설명하기 위한 순서도이다.
도 4를 참조하면, 단계 410에서, 리페어 관리부(300) 또는 운영자는 개별 FDI에 해당하는 성능 지표(Performance Metrics)를 사전에 준비한다.
단계 420에서, 프로파일 생성부(270)는 각 성능 지표가 정상 상태일 때 충분히 긴 시간 동안 FDI 값을 관측한다. 이는 하기의 <수학식 1>과 같이 n 시간주기를 간격으로 k번 만큼 관련 FDI 값들을 관측하는 것으로 표시될 수 있다.
<수학식 1>
Figure 112012086388347-pat00001
<수학식 1>에서 x1은 개별 FDI의 첫 번째로 관측값을 의미하므로, 총 kn개의 관측 값이 도출될 수 있다. a1은 x1부터 xn까지 관측된 데이터의 평균값을 의미하므로, k개의 데이터 평균값이 도출될 수 있다.
단계 420에서, 프로파일 생성부(270)는 관측치 x1 ~ xkn으로부터 k개의 평균치를 추출하고, 하기의 <수학식 2> 및 <수학식 3>을 이용하여 평균 및 분산 값을 계산한다.
<수학식 2>
Figure 112012086388347-pat00002
<수학식 2>에서
Figure 112012086388347-pat00003
는 특정 c번째 FDI에 대한 a1부터 ak까지의 산술 평균값을 의미하며, Y는 데이터 관측 값을 나타내는 확률 변수를 나타낸다.
<수학식 3>
Figure 112012086388347-pat00004
<수학식 3>에서
Figure 112012086388347-pat00005
은 c 번째 FDI에 대한 a1부터 ak까지의 분산 값을 의미한다.
여기서, xi 관측 샘플이 Independent and Identically Distributed(I.I.D)라면, 임의 aj은 n이 무한대로 커질수록 정규 분포(Normal Distribution)을 따르게 된다. 따라서, 각 xi 샘플이 상이한 사용자 또는 동일한 사용자 기기의 각기 다른 이벤트로부터 획득된 것이라면, xi 역시 I.I.D이므로, 확률 변수 Y 역시 <수학식 2> 및 <수학식 3>의 값을 갖는 정규 분포를 따르게 된다.
단계 430에서, 프로파일 생성부(270)는 관측치로부터 개별 FDI에 가장 적합한 확률 분포 모델(Probability Distribution Model)을 확인한다.
단계 440에서, 프로파일 생성부(270)는 조건을 변경할지를 결정한다. 이는, 각기 상이한 조건, 예컨대 측정 시간대, 대상 기기, 대상 응용 프로그램, 대상 이벤트에 대해 단계 430 및 단계 440을 반복 수행하여, 동일 FDI에 대하여 복수개의 프로파일(Profile)이 생성되도록 하기 위함이다.
440 단계에서 조건을 변경할 경우, 프로파일 생성부(270)는 430 단계로 진행한다. 그러나, 440 단계에서 조건을 변경하지 않을 경우, 즉 가능한 모든 조건에서 단계 430 및 단계 440가 수행되었을 경우, 프로파일 생성부(270)는 460 단계로 진행한다.
단계 460에서, 프로파일 생성부(270)는 생성된 프로파일(Profile)들을 FDI 프로파일 DB(280)에 저장한다.
도 5는 본 발명의 일 실시 예에 따른 FDI 레벨 기반 결함 탐지 단계를 설명하기 위한 순서도이다.
도 5를 참조하면, 단계 510에서 스마트 기기(300)의 하드웨어 및 소프트웨어가 활성화된다.
단계 520에서, 스마트 기기 결함 관리 장치(200)의 FDI 수집부(220)는 스마트 기기(100)의 모든 FDI 최신 값들을 모니터링한다.
단계 530에서, 스마트 기기 결함 관리 장치(200)의 FDI 수집부(220)는 소정 주기로 FDI1부터 FDIM까지 특정 FDI의 최근 관측치의 평균을 계산한다. 이는 하기의 <수학식 4>와 같이 표현될 수 있다.
<수학식 4>
Figure 112012086388347-pat00006
<수학식 4>에서 xt -n, xt -n+1,...,xt은 은 특정 c 번째 FDI의 최근 관측된 데이터 값들을 의미하고,
Figure 112012086388347-pat00007
는 특정 c 번째 FDI의 최근 관측된 값들의 평균값을 의미한다.
단계 540 단계에서, 스마트 기기 결함 관리 장치(200)의 FDI 레벨 산출부(230)는 관측된 c 번째 FDI의 시간대, 대상 응용 서비스, 또는 스마트 기기를 고려하여 적합한 프로파일(Profile)을 FDI 프로파일 DB(280)로부터 검색하여 획득한다.
단계 550에서, 스마트 기기 결함 관리 장치(200)의 FDI 레벨 산출부(230)는 상기 계산된 평균 Xc를 하기의 <수학식 5>을 이용하여 특정 확률 분포 모델의 확률 변수 Zc로 변환한다.
<수학식 5>
Figure 112012086388347-pat00008
<수학식 5>에서
Figure 112012086388347-pat00009
및 σc(Y)는 c 번째 FDI의 평균 및 표준 편차값을 의미한다. 상기 두 값들은 FDI 수치가 정상일 때 생성된 FDI 프로파일로부터 획득된다. Zc는 현재 관측된 데이터의 평균값과 FDI 프로파일의 평균값간의 차이 정도를 표준 편차의 관점으로 정규화한 것을 의미한다.
단계 560에서, 스마트 기기 결함 관리 장치(200)의 FDI 레벨 산출부(230)는 Zc 값을 이용하여 하기의 <수학식 6>와 같이 특정 c 번째 FDI 레벨을 계산한다.
<수학식 6>
Figure 112012086388347-pat00010
<수학식 6>에서 Flev(fc)은 특정 c 번째 FDI(fc)의 레벨을 평가하기 위한 레벨 함수를 의미한다. 이러한 레벨 함수는 특정 확률 분포의 CDF(Cumulative Distribution Function)의 형태, 즉,
Figure 112012086388347-pat00011
로 주어질 수 있다. 여기서, K는 임의 상수 값을 의미하며, 운영자에 의해서 조절될 수 있는 가정으로 가정한다. 또한, <수학식 6>은 FDI값의 증가가 결함 발생으로 판별될 수 있는 경우에 이용될 수 있는 레벨 함수를 정의한 것이다. 그러나, FDI값의 감소 또는 특정 값으로부터 멀어짐 등으로 결함이 발생할 경우에도 상기 과정을 쉽게 변형하여 적용할 수 있다.
단계 570에서, 스마트 기기 결함 관리 장치(200)의 FDI 레벨 산출부(230)는 c 번째 FDI 레벨의 절대값이 0인지를 판단한다. 이는 스마트 기기의 결함이 발생되었는지를 판단하는 단계이다.
단계 570의 판단 결과 FDI 레벨의 절대값이 0이 아닐 경우, 즉, 스마트 기기에 결함이 발생된 것으로 판단될 경우, 스마트 기기 결함 관리 장치(200)의 FDI 레벨 산출부(230)는 단계 580에서 분석 과정을 요청한다. 그러나, 단계 570의 판단 결과 FDI 레벨의 절대값이 0일 경우, 즉, 스마트 기기에 결함이 발생되지 않은 것으로 판단될 경우, 스마트 기기 결함 관리 장치(200)의 FDI 레벨 산출부(230)는 단계 520으로 진행한다.
상기 도 5에서 설명한 FDI 레벨 기반 결함 탐지 단계는 복수개의 FDI를 대상으로 동일하게 반복 수행될 수 있다.
도 6a 및 도 6b는 본 발명의 일 실시 예에 따른 결함 분석 단계를 설명하기 위한 순서도이다.
단계 610에서, 결함 분석 프로세스는 요청이 오기 전까지 대기 상태를 유지한다.
단계 620에서 분석 분석 요청이 수신됨에 따라, 단계 630에서 스마트 기기 결함 관리 장치(200)의 리페어 준비부(240)는 특정 분석 객체(Diagnosis Object)(예: x 번째 Diagnosis Object: DOx)를 포함하는 모든 리페어(Repairs)를 리페어 DB(290)으로부터 검색하여 획득하고, 이를 특정 기준(예: 리페어 생성날짜)에 따라 정렬한다.
단계 640에서, 스마트 기기 결함 관리 장치(200)의 연관성 확인부(250)는 특정 DOx를 포함한 리페어(Repairs)에서 특정 c 번째 FDI(fc)의 상대적 출현 빈도를 하기의 <수학식 7> 및 <수학식 8>을 이용하여 계산한다. 즉, 개별 FDI가 특정 분석 객체(Diagnosis Object)를 포함하는 모든 리페어(Repairs)를 대상으로 몇 번의 출현 빈도를 갖는지를 계산한다.
<수학식 7>
Figure 112012086388347-pat00012
<수학식 7>에서
Figure 112012086388347-pat00013
는 상대적 출현 빈도(Relative Frequency of Occurrence)를 나타내는 함수를 의미하며, fc는 c 번째 개별 FDI를 의미하고, DOx는 x 번째 분석 객체(Diagnosis Object)를 의미한다. Dox를 포함한 개별 리페어는 각기 상이한 FDI의 부분 집합(fj sub)을 또한 포함한다. 즉, 리페어는 DOx와 fj sub의 쌍으로 구성된다. 또한, |R(DOx)|는 DOx를 포함하는 모든 리페어들의 개수(Cardinality)를 의미한다.
<수학식 8>
Figure 112012086388347-pat00014
<수학식 8>에서 ind(fc, fj sub)은 fc가 fj sub 의 원소일 경우에는 1을 반환하고, fc가 fj sub 의 원소가 아닐 경우에는 0을 반환하는 지시자(Indicator)로서 기능한다. 따라서, rf(fc, DOx)은 DOx를 포함하는 모든 리페어에서 특정 FDI가 fj sub의 원소인 경우를 카운트하고, 이를 전체 Repair 개수로 나눔으로써, fc가 DOx와 관련된 리페어에서 출현하는 상대적 빈도가 계산될 수 있다.
단계 660에서, 연관성 확인부(240)는 하기의 <수학식 9>를 이용하여, DOx와 fc간의 연관성(Association Degree)를 계산한다.
<수학식 9>
Figure 112012086388347-pat00015
<수학식 9>에서
Figure 112012086388347-pat00016
는 DOx와 fc 간의 연계성(Association Degree)를 정량적으로 나타내는 함수를 의미한다. 또한, 이와 같은 상대적 출현 빈도를 확인하는 작업을 연관성 확인(Association Degree Check)라고 한다. 이러한 연관성 확인에 대해서는 도 7을 참조하여 하기에서 좀 더 상세히 살펴보기로 한다.
단계 670에서, 적합성 측정부(250)는 하기의 <수학식 10> 및 <수학식 11>을 이용하여 DOx와 fc간의 적합성(Relevance) 측정값을 계산한다.
하기의 <수학식 10> 및 <수학식 11>은 개별 FDI를 위해 특정 분석 객체(Diagnosis Object)가 주요 원인 및 대응책으로서 어느 정도의 적합성을 갖는지를 계산하고, 모든 FDI에 대해서 동일 분석 객체(Diagnosis Object)가 어느 정도의 적합성을 갖는지 상기 개별 적합성을 합산하여 산출하는데 필요한 수식의 실시 예이다.
<수학식 10>
Figure 112012086388347-pat00017
<수학식 10>에서 re(fc)은 적정성 측정 함수(Relevance Estimation Function)을 의미하며, 이러한 함수는 연관성 함수 Adeg(rf(fc, DOx)) 및 후술할 거리 함수(Distance Function)인 <수학식 11>의 곱으로 정의된다. 즉, Adeg(.) 함수는 <수학식 10>에서 가중치(Weight factor)로서 기능한다.
<수학식 11>
Figure 112012086388347-pat00018
<수학식 11>에서 FDI(fc,DOx)은 상대적 출현 빈도에 따라 fc와 프로파일의 fc간의 차이(deviation)를 다르게 평가하기 위해 고안된 거리 평가 함수(Distance Estimation Function)이다. 예컨대, 만약 fc의 상대적 출현 빈도가 0.5보다 크거나 같으면, 레벨 함수 Flev(fc)이 거리 값이 되고, 만약, fc의 상대적 출현 빈도가 0.5보다 작으면, 1 - Flev(fc)이 거리 값이 된다.
도 6b를 참조하면, 단계 680에서, 적합성 측정부(260)는 fc가 마지막인지를 판단한다.
단계 680의 판단 결과 fc가 마지막이 아닐 경우, 적합성 측정부(260)는 단계 690에서 다음 FDI(예: fc +1)을 선택한 후, 단계 650으로 진행한다.
그러나, 단계 680의 판단 결과 fc가 마지막일 경우, 적합성 측정부(260)는 단계 700에서 하기의 <수학식 12>을 이용하여 특정 분석(Diagnosis)에 대한 모든 FDI의 적합성 값을 합산하고 저장한다.
<수학식 12>
Figure 112012086388347-pat00019
<수학식 12>는 주어진 모든 FDI의 레벨을 계산하고, 특정 개별 DOx를 대상으로 각 FDI의 상대적 출현 빈도를 계산하고, 본 계산 수치를 가중치로 이용하여, fc와 개별 DOx간의 연관성를 측정하며, fc와 개별 DOx간의 적합성을 계산한 후, 모든 FDI의 특정 DOx에 대한 적합성 수치를 합산하면, FDI의 DOx과의 적정성을 정량적으로 평가할 수 있다.
단계 710에서, 적합성 측정부(260)는 DOx가 마지막인지를 판단한다.
단계 710의 판단 결과 DOx가 마지막이 아닐 경우, 적합성 측정부(260)는 단계 690에서 다음 분석 객체(예: DOx +1)를 선택한 후, 단계 640으로 진행한다.
그러나, 단계 710의 판단 결과 DOx가 마지막일 경우, 적합성 측정부(260)는 단계 730에서 서로 다른 마지막 분석 객체(Diagnosis Object)에 대해 합산된 FDI의 적합성 값들을 비교한다.
단계 740에서, 적합성 측정부(260)는 가장 높은 적합성 값을 갖는 특정 분석 객체(Diagnosis Object)를 해당 FDI들의 수치가 관측된 스마트 기기(100)의 최적 리페어로 결정한다. 즉, 가장 높은 정량적 수치를 보이는 DOx가 FDI를 위한 리페어로서 최종적으로 주어진다.
도 7은 본 발명의 일 실시 예에 따른 연관성 확인(Association Degree Check)를 설명하기 위한 그래프이다.
도 7을 참조하면, fc의 출현빈도가 높을수록(즉, rf(fc, DOx)) 값이 0.5보다 크거나 1에 가까워질수록) 또는 출현빈도가 현저히 낮을수록(즉, rf(fc, DOx) 값이 0.5보다 작거나 0에 가까울 수록) Adeg(rf(fc, DOx)) 연관성 값은 1에 근접하게 되어, fc와 DOx간의 높은 연관성를 나타낸다. 그러나, rf(fc, DOx) 값이 0.5인 경우는 50%의 리페어에서 fc가 포함되었고, 나머지 50% 리페어에서는 포함되지 않았으므로, 연관관계를 명확히 결정하기가 어려워진다. 따라서, 이 경우는 연관성 값을 0으로 표기하고, 연관이 없다고 가정한다.
이를 위해서 도 7에 도시된 그래프(y = 4 * (x-0.5)^2, x = rf(fc, DOx))를 이용하여 이와 같은 연관 관계를 정량화한다. 도 7에 도시된 그래프는 DOx와 fc 간의 연계 정도를 산출하기 위한 일 실시 예일 뿐, FDI의 특성에 따라 상이한 그래프 형태가 운영자의 선택에 의해서 적합하게 이용될 수 있다.

Claims (20)

  1. 스마트 기기에서 발생되는 하나 이상의 성능 지표들에 대한 결함을 탐지하는 지시자(Fault Detection Indicator: 이하 'FDI'로 기재함)의 정상 상태에서의 수치와 실시간 관측한 FDI 수치를 비교하고, 관측치의 상대적 변이 레벨을 산출하여 결함을 탐지하는 단계와,
    상기 탐지된 결함의 원인 및 대응책을 포함하는 분석 객체(Diagnosis Object: 이하 'DO'로 기재함)를 생성하여 결함을 분석하는 단계를 포함하고,
    상기 결함을 탐지하는 단계는
    상기 스마트 기기의 FDI 관측치를 수집하는 단계와,
    상기 수집된 FDI 관측치의 평균값을 계산하는 단계와,
    상기 관측된 FDI에 적합한 프로파일(Profile)을 검출하는 단계와,
    상기 계산된 관측치의 평균값을 상기 검출된 프로파일의 정보를 이용하여 특정 확률 분포 모델의 확률 변수로 변환하는 단계와,
    특정 확률 분포 모델의 확률 변수값을 이용하여 FDI 레벨을 계산하는 단계와,
    상기 계산된 FDI 레벨의 값에 따라 결함이 발생되었는지 여부를 판단하는 단계를 포함함을 특징으로 하는 스마트 기기 결함 관리 방법.
  2. 제 1항에 있어서, 상기 성능 지표들은
    네트워크 지연, 채널 대역폭 및 중앙 처리 장치의 부하 중 적어도 하나 이상을 포함하는 것을 특징으로 하는 스마트 기기 결함 관리 방법.
  3. 제 1항에 있어서,
    상기 탐지하는 단계 이전에, 정상 상태에서의 FDI 수치를 포함하는 프로파일을 생성하는 단계를 더 포함하는 것을 특징으로 하는 스마트 기기 결함 관리 방법.
  4. 제 3항에 있어서, 상기 프로파일을 생성하는 단계는
    각 성능 지표가 정상 상태일 때 FDI 수치를 모니터링하는 단계와,
    상기 모니터링된 FDI 수치의 평균값 및 분산값을 계산하는 단계와,
    상기 계산된 평균값 및 분산값들을 분석하여 개별 FDI에 가장 적합한 확률 분포 모델(Probability Distribution Model)을 확인하는 단계와,
    상기 FDI 수치의 평균값, 분산값 및 확률 분포 모델을 포함하는 프로파일(Profile)을 저장하는 단계를 포함하는 것을 특징으로 하는 스마트 기기 결함 관리 방법.
  5. 제 4항에 있어서,
    상기 모니터링하는 단계 이후에, 상기 FDI 수치를 모니터링한 결과값들의 소정 주기별 평균값들을 추출하는 단계를 더 포함하고,
    상기 계산하는 단계는
    상기 FDI 수치를 모니터링한 결과값들의 소정 주기별 평균값들의 평균을 계산함을 특징으로 하는 스마트 기기 결함 관리 방법.
  6. 제 4항에 있어서, 상기 프로파일을 생성하는 단계는
    측정 시간대, 대상 기기, 대상 응용 프로그램, 대상 이벤트를 포함하는 각기 상이한 조건에서 반복 수행됨을 특징으로 하는 스마트 기기 결함 관리 방법.
  7. 삭제
  8. 제 1항에 있어서, 상기 프로파일을 검출하는 단계는
    상기 FDI가 관측된 시간대, 대상 응용 서비스 또는 스마트 기기 중 적어도 하나를 고려하여, 그에 상응하는 프로파일을 검출함을 특징으로 하는 스마트 기기 결함 관리 방법.
  9. 제 1항에 있어서, 상기 결함이 발생되었는지 여부를 판단하는 단계는
    상기 계산된 FDI 레벨 값의 절대값이 0이 아닐 경우, 결함이 발생된 것으로 판단함을 특징으로 하는 스마트 기기 결함 관리 방법.
  10. 제 1항에 있어서, 상기 분석하는 단계는
    상기 FDI의 부분 집합과 상기 분석 객체의 쌍(Pair)으로 구성된 하나 이상의 리페어(Repairs)을 준비하는 단계와,
    상기 하나 이상의 분석 객체의 연관성을 확인하는 단계와,
    상기 하나 이상의 분석 객체들 중에서 최대 적합성 수치를 갖는 분석 객체를 선정하는 단계를 포함하는 것을 특징으로 하는 스마트 기기 결함 관리 방법.
  11. 제 10항에 있어서, 상기 연관성을 확인하는 단계는
    특정 분석 객체를 포함한 리페어(Repairs)에서 FDI 레벨의 상대적 출현 빈도를 계산하는 단계와,
    상기 계산된 상대적 출현 빈도에 따라 특정 분석 객체와 FDI간의 연관성(Association Degree)을 계산하는 단계를 포함하는 것을 특징으로 하는 스마트 기기 결함 관리 방법.
  12. 스마트 기기의 결함 관리 장치에 있어서,
    상기 스마트 기기에서 발생되는 하나 이상의 성능 지표들에 대한 결함을 탐지하는 지시자(Fault Detection Indicator: 이하 'FDI'로 기재함)의 정상 상태에서의 수치와 실시간 관측한 FDI 수치를 비교하고, 관측치의 상대적 변이 레벨을 산출하여 결함을 탐지하는 FDI 레벨 산출부와,
    상기 탐지된 결함의 원인 및 대응책을 포함하는 분석 객체(Diagnosis Object: 이하 'DO'로 기재함)와의 연관성을 확인하며, 특정 분석 객체를 포함한 리페어(Repairs)에서 FDI 레벨의 상대적 출현 빈도를 계산하고, 상기 계산된 상대적 출현 빈도에 따라 특정 분석 객체와 FDI간의 연관성(Association Degree)를 계산하는 연관성 확인부와,
    상기 연관성 확인부에 의해 확인된 연관성 수치를 비교하여 최대 적합성 수치를 갖는 분석 객체를 생성하는 적합성 측정부를 포함함을 특징으로 하는 스마트 기기 결함 관리 장치.
  13. 제 12항에 있어서,
    상기 정상 상태에서의 FDI 수치를 포함하는 프로파일을 생성하는 프로파일 생성부와,
    상기 생성된 FDI 프로파일을 저장하는 FDI 프로파일 DB를 더 포함하되,
    상기 FDI 레벨 산출부는 상기 FDI 프로파일 DB로부터 정상 상태에서의 FDI 수치를 검출하여 사용함을 특징으로 하는 스마트 기기 결함 관리 장치.
  14. 제 13항에 있어서, 상기 프로파일 생성부는
    각 성능 지표가 정상 상태일 때 모니터링된 FDI 수치의 평균값 및 분산값을 계산하고, 상기 계산된 평균값 및 분산값들을 분석하여 개별 FDI에 가장 적합한 확률 분포 모델(Probability Distribution Model)을 확인하고, 상기 FDI 수치의 평균값, 분산값 및 확률 분포 모델을 포함하는 프로파일(Profile)을 FDI 프로파일 DB에 저장함을 특징으로 하는 스마트 기기 결함 관리 장치.
  15. 제 14항에 있어서, 상기 프로파일 생성부는
    상기 FDI 수치를 모니터링한 결과값들의 소정 주기별 평균값들을 추출한 후, 상기 소정 주기별 평균값들의 평균을 계산함을 특징으로 하는 스마트 기기 결함 관리 장치.
  16. 제 14항에 있어서, 상기 프로파일 생성부는
    측정 시간대, 대상 기기, 대상 응용 프로그램, 대상 이벤트를 포함하는 각기 상이한 조건에서 프로파일 생성을 반복 수행함을 특징으로 하는 스마트 기기 결함 관리 장치.
  17. 제 12항에 있어서, 상기 FDI 레벨 산출부는
    상기 스마트 기기의 FDI 관측치를 수집하고, 상기 수집된 FDI 관측치의 평균을 계산하고, 관측된 FDI에 적합한 프로파일(Profile)을 검출하고, 상기 계산된 평균을 상기 검출된 프로파일의 값을 이용하여 특정 확률 분포 모델의 확률 변수로 변환하고, 특정 확률 분포 모델의 확률 변수값을 이용하여 FDI 레벨을 계산하고, 상기 계산된 FDI 레벨의 값에 따라 결함이 발생되었는지 여부를 판단함을 특징으로 하는 스마트 기기 결함 관리 장치.
  18. 제 12항에 있어서,
    상기 FDI의 부분 집합과 상기 분석 객체의 쌍(Pair)으로 구성된 하나 이상의 리페어들을 준비하는 리페어 준비부를 더 포함함을 특징으로 하는 스마트 기기 결함 관리 장치.
  19. 제 18항에 있어서, 상기 리페어 준비부는
    상기 준비된 하나 이상의 리페어들을 특정 기준(예: 리페어 생성날짜)에 따라 정렬함을 특징으로 하는 스마트 기기 결함 관리 장치.
  20. 삭제
KR1020120117988A 2012-10-23 2012-10-23 스마트 기기 결함 관리 장치 및 방법 KR101953558B1 (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020120117988A KR101953558B1 (ko) 2012-10-23 2012-10-23 스마트 기기 결함 관리 장치 및 방법
US14/028,486 US9235463B2 (en) 2012-10-23 2013-09-16 Device and method for fault management of smart device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020120117988A KR101953558B1 (ko) 2012-10-23 2012-10-23 스마트 기기 결함 관리 장치 및 방법

Publications (2)

Publication Number Publication Date
KR20140051678A KR20140051678A (ko) 2014-05-02
KR101953558B1 true KR101953558B1 (ko) 2019-03-04

Family

ID=50486491

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020120117988A KR101953558B1 (ko) 2012-10-23 2012-10-23 스마트 기기 결함 관리 장치 및 방법

Country Status (2)

Country Link
US (1) US9235463B2 (ko)
KR (1) KR101953558B1 (ko)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6387777B2 (ja) * 2014-06-13 2018-09-12 富士通株式会社 評価プログラム、評価方法、および評価装置
CN105527511A (zh) * 2015-11-27 2016-04-27 小米科技有限责任公司 一种设备自动修复的方法、装置和***
CN105956734B (zh) * 2016-04-15 2020-01-21 广东轩辕网络科技股份有限公司 动态设置it设备的性能的指标阈值的方法及***
CN106254158A (zh) * 2016-09-22 2016-12-21 安徽云图信息技术有限公司 信息***智能监控管理平台
CN110326179B (zh) * 2017-02-28 2022-04-01 开利公司 用于检测运输冷藏单元中的电流过载及泄漏的设备和方法
CN108599977B (zh) * 2018-02-13 2021-09-28 南京途牛科技有限公司 基于统计方法监控***可用性的***及方法
CN114815642A (zh) * 2022-03-30 2022-07-29 青岛海尔科技有限公司 智能设备的控制方法和装置、存储介质及电子装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6138122A (en) * 1998-03-02 2000-10-24 Agilent Technologies Modeling of internet services
US20060136104A1 (en) * 2004-12-22 2006-06-22 Snap-On Incorporated Distributed diagnostic system
US20070083513A1 (en) * 2005-10-12 2007-04-12 Ira Cohen Determining a recurrent problem of a computer resource using signatures

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6697969B1 (en) * 1999-09-01 2004-02-24 International Business Machines Corporation Method, system, and program for diagnosing a computer in a network system
US6654816B1 (en) * 2000-05-31 2003-11-25 Hewlett-Packard Development Company, L.P. Communication interface systems for locally analyzing computers
KR20020057047A (ko) 2000-12-30 2002-07-11 엘지전자 주식회사 디지털 기기의 장애 복구 방법
US7171670B2 (en) * 2001-02-14 2007-01-30 Ricoh Co., Ltd. Method and system of remote diagnostic, control and information collection using multiple formats and multiple protocols with verification of formats and protocols
US7302469B2 (en) * 2001-09-17 2007-11-27 Ricoh Company, Ltd. System, method, and computer program product for transferring remote device support data to a monitor using e-mail
KR100405967B1 (ko) 2001-10-18 2003-11-14 엘지전자 주식회사 홈 네트워크 시스템에서의 디바이스 장애관리 방법
US7610372B2 (en) * 2004-01-27 2009-10-27 Ricoh Company, Ltd. Method and system for managing vendor and model information in a multi-protocol remote monitoring system
KR101021657B1 (ko) 2009-01-07 2011-03-17 (주)유비더스시스템 디바이스 장애 원격관리 시스템
US8792879B2 (en) * 2011-09-01 2014-07-29 Scott A. Finberg System and method of performing remote diagnostics on a computing device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6138122A (en) * 1998-03-02 2000-10-24 Agilent Technologies Modeling of internet services
US20060136104A1 (en) * 2004-12-22 2006-06-22 Snap-On Incorporated Distributed diagnostic system
US20070083513A1 (en) * 2005-10-12 2007-04-12 Ira Cohen Determining a recurrent problem of a computer resource using signatures

Also Published As

Publication number Publication date
US20140115400A1 (en) 2014-04-24
KR20140051678A (ko) 2014-05-02
US9235463B2 (en) 2016-01-12

Similar Documents

Publication Publication Date Title
KR101953558B1 (ko) 스마트 기기 결함 관리 장치 및 방법
US6973415B1 (en) System and method for monitoring and modeling system performance
US7082381B1 (en) Method for performance monitoring and modeling
CN110880984A (zh) 基于模型的流量异常监测方法、装置、设备及存储介质
CN111309539A (zh) 一种异常监测方法、装置和电子设备
JP6564799B2 (ja) 閾値決定装置、閾値決定方法及びプログラム
CN102713861A (zh) 操作管理装置、操作管理方法以及程序存储介质
US7197428B1 (en) Method for performance monitoring and modeling
WO2018184304A1 (zh) 一种网元健康状态的检测方法及设备
US7369967B1 (en) System and method for monitoring and modeling system performance
CN106940678B (zh) 一种***实时健康度评估分析方法及装置
US7617313B1 (en) Metric transport and database load
KR20070080313A (ko) 클라이언트 단말로 제공되는 서비스 성능 분석 방법 및시스템
CN116611712A (zh) 基于语义推断的电网工作票评估***
CN113849774A (zh) 基于寿命分析和健康监测的设备智能维护平台
CN116345700A (zh) 一种用于储能电站的能耗监测方法及监测***
CN108072858A (zh) 电能表质量管理方法、***及终端设备
CN117171366B (zh) 用于电网调度运行态势的知识图谱构建方法及***
CN115801538A (zh) 场站服务器应用资产深度识别方法、***及设备
CN108390790B (zh) 路由设备故障诊断方法及装置
CN111176931A (zh) 一种运营监控方法、装置、服务器及存储介质
CN111651753A (zh) 用户行为分析***及方法
CN115225455B (zh) 异常设备检测方法及装置、电子设备、存储介质
CN113032227B (zh) 一种异常网元检测方法、装置、电子设备及存储介质
CN117406007B (zh) 一种充电桩充电数据检测方法及***

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant