KR20190070728A - 시계열 데이터의 에러를 확인하는 방법 및 장치 - Google Patents

시계열 데이터의 에러를 확인하는 방법 및 장치 Download PDF

Info

Publication number
KR20190070728A
KR20190070728A KR1020170171551A KR20170171551A KR20190070728A KR 20190070728 A KR20190070728 A KR 20190070728A KR 1020170171551 A KR1020170171551 A KR 1020170171551A KR 20170171551 A KR20170171551 A KR 20170171551A KR 20190070728 A KR20190070728 A KR 20190070728A
Authority
KR
South Korea
Prior art keywords
value
data
series data
component
time
Prior art date
Application number
KR1020170171551A
Other languages
English (en)
Inventor
이정준
류구현
정수길
Original Assignee
주식회사 케이티
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 케이티 filed Critical 주식회사 케이티
Priority to KR1020170171551A priority Critical patent/KR20190070728A/ko
Publication of KR20190070728A publication Critical patent/KR20190070728A/ko

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic
    • H04L63/1425Traffic logging, e.g. anomaly detection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computer Security & Cryptography (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Algebra (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Telephonic Communication Services (AREA)

Abstract

본 발명은 시계열 데이터의 에러를 확인하는 방법 및 장치에 관한 것으로, 전자장치가 시계열 데이터를 수집하는 단계, 시계열 데이터 중에서 현재 데이터에 포함된 계절 성분, 추세 성분 및 잔여 성분을 분류하는 단계, 잔여 성분에 대한 수치값을 이용하여 현재 데이터에 대한 가중평균값 및 가중분산값을 산출하는 단계 및 잔여 성분에 대한 수치값, 가중평균값 및 가중분산값을 기반으로 산출된 결과값을 기준값과 비교하여 현재 데이터에 에러 발생을 확인하는 단계를 포함할 수 있고, 다른 실시 예로도 적용이 가능하다.

Description

시계열 데이터의 에러를 확인하는 방법 및 장치{Method and Apparatus for Checking of Error of Time Series Data}
본 발명은 시계열 데이터의 에러를 확인하는 방법 및 장치에 관한 것으로, 실시간으로 시계열 데이터를 수집하고, 수집된 데이터에서 확인된 성분에 대한 평균값 및 분산값을 산출하여 시계열 데이터의 에러를 확인하는 방법 및 장치에 관한 것이다.
인터넷 사용이 일반화되고, 스마트 폰 등의 휴대용 장치가 보편화되면서 인터넷을 통한 다양한 서비스가 확산되고, 특히 전자상거래 등의 서비스 확산에 따라 보안 문제의 중요성이 향상되고 있다. 이러한 보안 문제를 해결하기 위해 이상 트래픽에 대한 감지를 하기 위한 침입방지 시스템(IPS; intrusion prevention system) 등과 같은 다양한 방법들이 개발되고 있다.
그러나, 이러한 침입방지 시스템은 일정 규모 이상의 사업자 또는 기업이 네트워크 방어 체제를 구축하기 위해 설치하는 것으로서, 시스템 구축에 상당한 비용 및 시간이 소요되는 문제점이 발생한다. 따라서, 보다 쉽고 간단한 방법으로 이상 트래픽을 감지할 수 있는 방법 개발의 필요성이 요구되고 있다.
이러한 종래의 문제점을 해결하기 위한 본 발명의 다양한 실시 예들은 시계열 데이터에 포함된 성분을 확인하고, 확인된 성분을 기반으로 산출된 평균값 및 분산값을 기준값과 비교하여 시계열 데이터의 에러를 확인할 수 있는 시계열 데이터의 에러를 확인하는 방법 및 장치를 제공하는 것이다.
본 발명의 일 실시 예에 따른 시계열 데이터의 에러를 확인하는 방법은, 전자장치가 시계열 데이터를 수집하는 단계, 상기 시계열 데이터 중에서 현재 데이터에 포함된 계절 성분, 추세 성분 및 잔여 성분을 분류하는 단계, 상기 잔여 성분에 대한 수치값을 이용하여 상기 현재 데이터에 대한 가중평균값 및 가중분산값을 산출하는 단계 및 상기 잔여 성분에 대한 수치값, 가중평균값 및 가중분산값을 기반으로 산출된 결과값을 기준값과 비교하여 상기 현재 데이터에 에러 발생을 확인하는 단계를 포함하는 것을 특징으로 한다.
또한, 계절 성분, 추세 성분 및 잔여 성분을 분류하는 단계는, 상기 현재 데이터를 상기 현재 데이터에 포함된 상기 계절 성분, 상기 추세 성분 및 상기 잔여 성분에 대한 수치값으로 분류하는 단계인 것을 특징으로 한다.
또한, 가중평균값은, 제1 수학식
Figure pat00001
을 이용하여 산출하는 것을 특징으로 한다.
또한, 가중분산값은 제2 수학식
Figure pat00002
을 이용하여 산출하는 것을 특징으로 한다.
또한, 에러 발생을 확인하는 단계는, 제3 수학식
Figure pat00003
를 이용하여 상기 결과값이 상기 기준값보다 크면 상기 현재 데이터에 에러 발생을 확인하는 단계인 것을 특징으로 한다.
또한, 기준값은, 상기 현재 데이터 이전 시점의 과거 데이터들의 잔여 성분에 대한 수치값들을 상기 제1 수학식, 제2 수학식 및 제3 수학식에 적용하여 산출된 상기 결과값들에 대한 평균값인 것을 특징으로 한다.
아울러, 본 발명의 일 실시 예에 따른 시계열 데이터의 에러를 확인하는 장치는, 적어도 하나의 사용자 장치와 관련된 시계열 데이터를 수집하는 통신부 및 상기 시계열 데이터 중에서 현재 데이터에 포함된 계절 성분, 추세 성분 및 잔여 성분을 분류하고, 상기 잔여 성분에 대한 수치값을 이용하여 상기 현재 데이터에 대한 가중평균값 및 가중분산값을 산출하고, 상기 잔여 성분에 대한 수치값, 가중평균값 및 가중분산값을 기반으로 산출된 결과값을 기준값과 비교하여 상기 현재 데이터에 에러 발생을 확인하는 제어부를 포함하는 것을 특징으로 한다.
또한, 제어부는, 상기 계절 성분, 상기 추세 성분 및 상기 잔여 성분에 대한 수치값으로 분류하는 것을 특징으로 한다.
또한, 제어부는, 제1 수학식
Figure pat00004
을 이용하여 상기 가중평균값을 산출하는 것을 특징으로 한다.
또한, 제어부는, 제2 수학식
Figure pat00005
을 이용하여 상기 가중분산값을 산출하는 것을 특징으로 한다.
또한, 제어부는, 제3 수학식
Figure pat00006
를 이용하여 상기 결과값이 상기 기준값보다 크면 상기 현재 데이터에 에러 발생을 확인하는 것을 특징으로 한다.
또한, 제어부는, 상기 현재 데이터 이전 시점의 과거 데이터들의 잔여 성분에 대한 수치값들을 상기 제1 수학식, 제2 수학식 및 제3 수학식에 적용하여 산출된 상기 결과값들에 대한 평균값으로 상기 기준값을 산출하는 것을 특징으로 한다.
상술한 바와 같이 본 발명의 시계열 데이터의 에러를 확인하는 방법 및 장치는, 시계열 데이터에 포함된 성분을 확인하고, 확인된 성분을 기반으로 산출된 평균값 및 분산값을 기준값과 비교함으로써, 적은 부하로 빠르게 시계열 데이터의 에러를 확인할 수 있는 효과가 있다.
도 1은 본 발명의 실시 예에 따른 시계열 데이터의 에러를 확인하는 시스템을 나타낸 도면이다.
도 2는 본 발명의 실시 예에 따른 시계열 데이터의 에러를 확인하는 전자장치를 나타낸 도면이다.
도 3은 본 발명의 실시 예에 따른 시계열 데이터의 에러를 확인하는 방법을 설명하기 위한 순서도이다.
이하, 본 발명에 따른 바람직한 실시 형태를 첨부된 도면을 참조하여 상세하게 설명한다. 첨부된 도면과 함께 이하에 개시될 상세한 설명은 본 발명의 예시적인 실시형태를 설명하고자 하는 것이며, 본 발명이 실시될 수 있는 유일한 실시형태를 나타내고자 하는 것이 아니다. 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략할 수 있고, 명세서 전체를 통하여 동일 또는 유사한 구성 요소에 대해서는 동일한 참조 부호를 사용할 수 있다.
본 발명의 일 실시 예에서, “또는”, “적어도 하나” 등의 표현은 함께 나열된 단어들 중 하나를 나타내거나, 또는 둘 이상의 조합을 나타낼 수 있다. 예를 들어, “A 또는 B”, “A 및 B 중 적어도 하나”는 A 또는 B 중 하나만을 포함할 수 있고, A와 B를 모두 포함할 수도 있다.
도 1은 본 발명의 실시 예에 따른 시계열 데이터의 에러를 확인하는 시스템을 나타낸 도면이다.
도 1을 참조하면, 본 발명에 따른 시스템(10)은 복수의 사용자 장치(100) 및 전자장치(200)를 포함한다.
사용자 장치(100)는 통신사업자에서 운영하는 전자장치(200)에 접속하여 인터넷 서비스를 이용하기 위한 장치로, 사용자가 사용하는 스마트 폰, 태블릿 PC, 컴퓨터 등 다양한 전자장치를 포함할 수 있다. 이를 위해, 사용자 장치(100)는 WiFi(wireless fidelity), LTE(long term evolution), LTE-A(long term evolution-advanced) 등의 무선 통신 및 케이블을 이용한 유선 통신을 통해 전자장치(200)와의 통신을 수행할 수 있다.
전자장치(200)는 통신사업자에서 운영하는 서버 등의 장치로, 제1 사용자 장치(100a), 제2 사용자 장치(100b), .., 제n 사용자 장치(100n)를 포함하는 사용자 장치(100)와의 통신을 통해 사용자 장치(100)에서 인터넷 서비스를 이용할 수 있도록 한다. 이를 위해, 전자장치(200)는 사용자 장치(100)와 WiFi(wireless fidelity), LTE(long term evolution), LTE-A(long term evolution-advanced) 등의 무선 통신 및 케이블을 이용한 유선 통신을 수행할 수 있다.
보다 구체적으로, 전자장치(200)는 사용자 장치(100)에서 전자장치(200)에 접속하여 인터넷 서비스를 이용할 때 발생되는 트래픽 데이터를 실시간으로 수집한다. 이때, 트래픽 데이터는, 시계열 데이터일 수 있다. 전자장치(200)는 수집된 시계열 데이터에서 현재 시점에 대응되는 현재 데이터의 성분을 확인하여 성분별로 분류하고, 분류된 각 성분의 수치값을 확인할 수 있다. 이때, 현재 데이터의 성분은 계절 성분, 추세 성분, 순환 성분 및 불규칙 성분을 포함할 수 있다. 전자장치(200)는 현재 데이터를 계절 성분, 추세 성분 및 잔여 성분으로 분류한다. 이때, 잔여 성분은 계절 성분과 추세 성분을 제외한 성분을 의미한다.
전자장치(200)는 계절 성분에 대한 수치값을 이용하여 현재 데이터에 대한 가중평균값과 가중분산값을 산출한다. 전자장치(200)는 잔여 성분에 대한 수치값, 산출된 가중평균값 및 가중분산값을 이용하여 결과값을 산출한다. 결과값은, 현재 데이터에 에러가 발생했는지를 확인하기 위한 값이다. 전자장치(200)는 산출된 결과값과 기저장된 기준값을 비교한다. 이때, 기준값은, 현재 데이터 이전 시점의 과거 데이터들의 잔여 성분들에 대하여 산출된 결과값들에 대한 평균값일 수 있다. 전자장치(200)는 산출된 결과값이 기준값을 초과하면 현재 데이터에 에러가 발생한 것으로 확인할 수 있다.
도 2는 본 발명의 실시 예에 따른 시계열 데이터의 에러를 확인하는 전자장치를 나타낸 도면이다.
도 2를 참조하면, 본 발명에 따른 전자장치(200)는 통신부(210), 입력부(220), 표시부(230), 메모리(240) 및 제어부(250)를 포함한다.
통신부(210)는 사용자 단말(100)과 통신을 수행한다. 이를 위해, 통신부(210)는 사용자 단말(100)과 WiFi(wireless fidelity), LTE(long term evolution), LTE-A(long term evolution-advanced) 등의 무선 통신을 수행할 수 있다.
입력부(220)는 전자장치(200)를 운영하는 운영자 입력에 대응하여 입력 데이터를 발생시킨다. 입력부(220)는 적어도 하나의 입력수단을 포함한다. 입력부(220)는 키패드(key pad), 돔 스위치(dome switch), 터치 패널(touch panel), 터치 키(touch key) 및 버튼(button)을 포함한다.
표시부(230)는 전자장치(200)의 동작에 따른 출력 데이터를 출력한다. 이를 위해, 표시부(230)는 액정 디스플레이(LCD; liquid crystal display), 발광 다이오드(LED; light emitting diode) 디스플레이, 유기 발광 다이오드(OLED; organic LED) 디스플레이, 마이크로 전자기계 시스템(MEMS; micro electro mechanical systems) 디스플레이 및 전자 종이(electronic paper) 디스플레이를 포함할 수 있다. 표시부(230)는 입력부(220)와 결합되어 터치 스크린(touch screen)으로 구현될 수 있다.
메모리(240)는 전자장치(200)의 동작 프로그램들을 저장한다. 메모리(240)는 과거 시점에 획득된 데이터의 결과값을 기반으로 한 평균값을 기준값으로 저장한다. 메모리(240)는 결과값을 획득하기 위한 수학식을 저장한다.
제어부(250)는 사용자 장치(100)에 의해 발생되는 시계열 데이터를 수집하고, 수집된 시계열 데이터 중에서 현재 데이터에 포함된 성분을 분류한다. 제어부(250)는 분류된 성분 중 잔여 성분을 이용하여 현재 데이터에 대한 가중평균 및 가중분산을 산출하고, 잔여 성분, 가중평균 및 가중분산을 기반으로 결과값을 산출한다. 제어부(250)는 산출된 결과값을 메모리(240)에 저장된 기준값과 비교하여 현재 데이터에 에러 발생여부를 확인한다.
보다 구체적으로, 제어부(250)는 전자장치(200)에 접속한 사용자 장치(100)와 관련된 시계열 데이터를 수집한다. 이때, 시계열 데이터는, 사용자 장치(100)가 전자장치(200)에 접속하여 인터넷을 통한 서비스 이용 시에 발생하는 트래픽을 의미할 수 있다. 제어부(250)는 수집된 시계열 데이터 중에서 현재 시점에 대응되는 현재 데이터를 분석하여 이에 대한 오류 발생여부를 확인할 수 있다.
제어부(250)는 현재 데이터를 구성하는 성분을 확인하여 성분별로 분류한다. 보다 구체적으로, 시계열 데이터는 계절 성분, 추세 성분, 순환 성분 및 불규칙 성분을 포함할 수 있다. 계절 성분은 1년, 1달과 같이 특정 주기를 단위로 발생하는 변동하는 성분을 의미한다. 추세 성분은, 시계열 데이터의 증감 형태를 나타내는 성분을 의미한다. 순환 성분은, 계절 성분보다 긴 주기를 단위로 발생하는 성분을 의미한다. 불규칙 성분은 측정 및 예측이 어려운 오차를 갖는 성분을 의미한다. 제어부(250)는 현재 데이터를 계절 성분, 추세 성분 및 잔여 성분으로 분류한다. 이때, 잔여 성분은 계절 성분과 추세 성분을 제외한 성분을 의미한다. 제어부(250)는 STL(seasonal-trend decomposition using loess)을 이용하여 현재 데이터를 성분별로 분류하고, 각 성분에 대한 수치값을 확인한다.
제어부(250)는 분류된 잔여 성분에 대한 수치값을 이용하여 현재 데이터에 대한 가중평균값 및 가중분산값을 산출한다. 제어부는 하기의 수학식 1을 이용하여 가중평균값을 산출하고, 수학식 2를 이용하여 가중분산값을 산출한다. 이때, 가중평균값(
Figure pat00007
)은 현재 데이터를 획득한 현재 시점(T) 바로 이전의 시점(T-1)에 획득한 데이터에 가장 높은 가중치를 적용하여 산출한 가중평균값이며, 가중분산값(
Figure pat00008
) 역시 현재 데이터를 획득한 현재 시점(T) 바로 이전의 시점(T-1)에 획득한 데이터에 가장 높은 가중치를 적용하여 산출한 가중분산값이다.
Figure pat00009
(단,
Figure pat00010
는 데이터의 형태 등에 의해 설정되는 상수값이다.)
Figure pat00011
제어부(250)는 잔여 성분에 대한 수치값, 수학식 1에 의해 산출된 가중평균값 및 수학식 2에 의해 산출된 가중분산값을 이용하여 결과값을 산출한다. 제어부(250)는 하기의 수학식 3을 이용하여 결과값을 산출할 수 있다. 결과값은, 현재 데이터에 에러가 발생했는지를 확인하기 위한 값이다.
Figure pat00012
제어부(250)는 수학식 3에서 산출된 결과값과 메모리(240)에 기저장된 기준값을 비교한다. 이때, 기준값은, 현재 데이터 이전 시점의 과거 데이터들의 잔여 성분에 대한 수치값들을 수학식 1, 수학식 2 및 수학식 3에 적용하여 산출된 결과값들에 대한 평균값일 수 있다. 제어부(250)는 산출된 결과값이 기준값을 초과하면 현재 데이터에 에러가 발생한 것으로 확인할 수 있다. 아울러, 본 발명의 실시 예에서는 네트워크 트래픽에 발생되는 에러를 확인하는 것을 예로 설명하고 있으나, 반드시 이에 한정되는 것은 아니다. 예컨대, 주가지수 변화, 온도 변화, 습도 변화 등 시계열 데이터의 분석을 통해 현재 시점에 획득된 데이터에 에러가 발생하였음을 확인하는 분야에 적용될 수 있다.
도 3은 본 발명의 실시 예에 따른 시계열 데이터의 에러를 확인하는 방법을 설명하기 위한 순서도이다.
도 3을 참조하면, 301단계에서 제어부(250)는 전자장치(200)에 접속한 사용자 장치(100)와 관련된 시계열 데이터를 수집한다. 이때, 시계열 데이터는, 사용자 장치(100)가 전자장치(200)에 접속하여 인터넷을 통한 서비스 이용 시에 발생하는 트래픽을 의미할 수 있다. 제어부(250)는 시간에 따라 변화하는 연속적인 시계열 데이터의 분석을 통해 현재 시점에서 획득된 현재 데이터에 대한 오류 여부를 확인할 수 있다.
이를 위해, 303단계에서 제어부(250)는 현재 데이터를 구성하는 성분을 확인하여 성분별로 분류한다. 보다 구체적으로, 시계열 데이터는 계절 성분, 추세 성분, 순환 성분 및 불규칙 성분을 포함할 수 있다. 계절 성분은 1년, 1달과 같이 특정 주기를 단위로 발생하는 변동하는 성분을 의미한다. 추세 성분은, 시계열 데이터의 증감 형태를 나타내는 성분을 의미한다. 순환 성분은, 계절 성분보다 긴 주기를 단위로 발생하는 성분을 의미한다. 불규칙 성분은 측정 및 예측이 어려운 오차를 갖는 성분을 의미한다. 제어부(250)는 현재 데이터를 계절 성분, 추세 성분 및 잔여 성분으로 분류한다. 이때, 잔여 성분은 계절 성분과 추세 성분을 제외한 성분을 의미한다. 제어부(250)는 STL(seasonal-trend decomposition using loess)을 이용하여 현재 데이터를 성분별로 분류하고, 각 성분에 대한 수치값을 확인한다.
305단계에서 제어부(250)는 분류된 잔여 성분에 대한 수치값을 이용하여 현재 데이터에 대한 가중평균값 및 가중분산값을 산출한다. 제어부(250)는 상기의 수학식 1을 이용하여 가중평균값을 산출하고, 수학식 2를 이용하여 가중분산값을 산출한다. 가중평균값은 현재 데이터를 획득한 현재 시점 바로 이전의 시점에 획득한 데이터에 가장 높은 가중치를 적용하여 산출한 가중평균값이며, 가중분산값 역시 현재 데이터를 획득한 현재 시점 바로 이전의 시점에 획득한 데이터에 가장 높은 가중치를 적용하여 산출한 가중분산값이다. 아울러, 본 발명은 이와 같이 재귀적 알고리즘을 사용하기 때문에 부하가 적고, 계산이 빠른 장점이 있다. 아울러, 본 발명은 계절 성분이나 추세 성분을 제외한 잔여 성분에 대한 수치값만을 이용하여 가중평균값 및 가중분산값을 산출하는 것을 예로 설명하고 있으나, 반드시 이에 한정되는 것은 아니며, 데이터를 구성하는 성분 중 적어도 하나의 성분에 대한 수치값을 이용할 수도 있다.
307단계에서 제어부(250)는 잔여 성분에 대한 수치값, 산출된 가중평균값 및 가중분산값을 이용하여 결과값을 산출한다. 이때, 제어부(250)는 상기의 수학식 3을 이용하여 결과값을 산출한다. 결과값은, 현재 데이터에 에러가 발생했는지를 확인하기 위한 값이다. 309단계에서 제어부(250)는 산출된 결과값과 메모리(240)에 기저장된 기준값을 비교한다. 이때, 기준값은, 현재 데이터 이전 시점의 과거 데이터들의 잔여 성분들에 대한 수치값들을 수학식 1, 수학식 2 및 수학식 3에 적용하여 산출된 결과값들에 대한 평균값일 수 있다. 311단계에서 제어부(250)는 산출된 결과값이 기준값을 초과하면 313단계를 수행하고, 313단계에서 제어부(250)는 현재 데이터에 에러가 발생한 것으로 확인할 수 있다. 반대로, 311단계에서 제어부(250)는 산출된 결과값이 기준값을 초과하지 않는 것으로 확인되면 301단계로 회귀하여 상기의 단계들을 재수행한다.
본 명세서와 도면에 개시된 본 발명의 실시 예들은 본 발명의 기술 내용을 쉽게 설명하고 본 발명의 이해를 돕기 위해 특정 예를 제시한 것일 뿐이며, 본 발명의 범위를 한정하고자 하는 것은 아니다. 따라서 본 발명의 범위는 여기에 개시된 실시 예들 이외에도 본 발명의 기술적 사상을 바탕으로 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (12)

  1. 전자장치가 시계열 데이터를 수집하는 단계;
    상기 시계열 데이터 중에서 현재 데이터에 포함된 계절 성분, 추세 성분 및 잔여 성분을 분류하는 단계;
    상기 잔여 성분에 대한 수치값을 이용하여 상기 현재 데이터에 대한 가중평균값 및 가중분산값을 산출하는 단계; 및
    상기 잔여 성분에 대한 수치값, 가중평균값 및 가중분산값을 기반으로 산출된 결과값을 기준값과 비교하여 상기 현재 데이터에 에러 발생을 확인하는 단계;
    를 포함하는 것을 특징으로 하는 시계열 데이터의 에러 확인 방법.
  2. 제1항에 있어서,
    상기 계절 성분, 추세 성분 및 잔여 성분을 분류하는 단계는,
    상기 현재 데이터를 상기 현재 데이터에 포함된 상기 계절 성분, 상기 추세 성분 및 상기 잔여 성분에 대한 수치값으로 분류하는 단계인 것을 특징으로 하는 시계열 데이터의 에러 확인 방법.
  3. 제2항에 있어서,
    상기 가중평균값은,
    제1 수학식
    Figure pat00013
    을 이용하여 산출하는 것을 특징으로 하는 시계열 데이터의 에러 확인 방법.
  4. 제3항에 있어서,
    상기 가중분산값은
    제2 수학식
    Figure pat00014
    을 이용하여 산출하는 것을 특징으로 하는 시계열 데이터의 에러 확인 방법.
  5. 제4항에 있어서,
    상기 에러 발생을 확인하는 단계는,
    제3 수학식
    Figure pat00015
    를 이용하여 상기 결과값이 상기 기준값보다 크면 상기 현재 데이터에 에러 발생을 확인하는 단계인 것을 특징으로 하는 시계열 데이터의 에러 확인 방법.
  6. 제5항에 있어서,
    상기 기준값은,
    상기 현재 데이터 이전 시점의 과거 데이터들의 잔여 성분에 대한 수치값들을 상기 제1 수학식, 제2 수학식 및 제3 수학식에 적용하여 산출된 상기 결과값들에 대한 평균값인 것을 특징으로 하는 시계열 데이터의 에러 확인 방법.
  7. 적어도 하나의 사용자 장치와 관련된 시계열 데이터를 수집하는 통신부; 및
    상기 시계열 데이터 중에서 현재 데이터에 포함된 계절 성분, 추세 성분 및 잔여 성분을 분류하고, 상기 잔여 성분에 대한 수치값을 이용하여 상기 현재 데이터에 대한 가중평균값 및 가중분산값을 산출하고, 상기 잔여 성분에 대한 수치값, 가중평균값 및 가중분산값을 기반으로 산출된 결과값을 기준값과 비교하여 상기 현재 데이터에 에러 발생을 확인하는 제어부;
    를 포함하는 것을 특징으로 하는 시계열 데이터의 에러 확인 장치.
  8. 제7항에 있어서,
    상기 제어부는,
    상기 계절 성분, 상기 추세 성분 및 상기 잔여 성분에 대한 수치값으로 분류하는 것을 특징으로 하는 시계열 데이터의 에러 확인 장치.
  9. 제8항에 있어서,
    상기 제어부는,
    제1 수학식
    Figure pat00016
    을 이용하여 상기 가중평균값을 산출하는 것을 특징으로 하는 시계열 데이터의 에러 확인 장치.
  10. 제9항에 있어서,
    상기 제어부는,
    제2 수학식
    Figure pat00017
    을 이용하여 상기 가중분산값을 산출하는 것을 특징으로 하는 시계열 데이터의 에러 확인 장치.
  11. 제10항에 있어서,
    상기 제어부는,
    제3 수학식
    Figure pat00018
    를 이용하여 상기 결과값이 상기 기준값보다 크면 상기 현재 데이터에 에러 발생을 확인하는 것을 특징으로 하는 시계열 데이터의 에러 확인 장치.
  12. 제11항에 있어서,
    상기 제어부는,
    상기 현재 데이터 이전 시점의 과거 데이터들의 잔여 성분에 대한 수치값들을 상기 제1 수학식, 제2 수학식 및 제3 수학식에 적용하여 산출된 상기 결과값들에 대한 평균값으로 상기 기준값을 산출하는 것을 특징으로 하는 시계열 데이터의 에러 확인 방법.
KR1020170171551A 2017-12-13 2017-12-13 시계열 데이터의 에러를 확인하는 방법 및 장치 KR20190070728A (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020170171551A KR20190070728A (ko) 2017-12-13 2017-12-13 시계열 데이터의 에러를 확인하는 방법 및 장치

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020170171551A KR20190070728A (ko) 2017-12-13 2017-12-13 시계열 데이터의 에러를 확인하는 방법 및 장치

Publications (1)

Publication Number Publication Date
KR20190070728A true KR20190070728A (ko) 2019-06-21

Family

ID=67056720

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020170171551A KR20190070728A (ko) 2017-12-13 2017-12-13 시계열 데이터의 에러를 확인하는 방법 및 장치

Country Status (1)

Country Link
KR (1) KR20190070728A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380044A (zh) * 2020-12-04 2021-02-19 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备和存储介质
CN116341016A (zh) * 2023-05-31 2023-06-27 济南大陆机电股份有限公司 一种大数据安全存储方法及***

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112380044A (zh) * 2020-12-04 2021-02-19 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备和存储介质
CN112380044B (zh) * 2020-12-04 2024-05-28 腾讯科技(深圳)有限公司 数据异常检测方法、装置、计算机设备和存储介质
CN116341016A (zh) * 2023-05-31 2023-06-27 济南大陆机电股份有限公司 一种大数据安全存储方法及***
CN116341016B (zh) * 2023-05-31 2023-08-11 济南大陆机电股份有限公司 一种大数据安全存储方法及***

Similar Documents

Publication Publication Date Title
US11019114B2 (en) Method and system for application security evaluation
AU2017228584B2 (en) Multi-data analysis based proactive defect detection and resolution
US10021130B2 (en) Network state information correlation to detect anomalous conditions
JP6355683B2 (ja) リスク早期警報方法、装置、記憶媒体およびコンピュータプログラム
US10346249B2 (en) Resolving and preventing computer system failures caused by changes to the installed software
US9369364B2 (en) System for analysing network traffic and a method thereof
WO2017087440A1 (en) Anomaly fusion on temporal casuality graphs
CN111726341B (zh) 一种数据检测方法、装置、电子设备及存储介质
CN103563293A (zh) 检测web应用中的安全漏洞
US20200134504A1 (en) System and method of training behavior labeling model
US11946919B2 (en) System for integrating multiple chemical sensor data to detect an unmeasured compound
CN110138637B (zh) 测试数据处理方法、装置、计算机设备和存储介质
US20190354991A1 (en) System and method for managing service requests
JP2016192185A (ja) なりすまし検出システムおよびなりすまし検出方法
KR20190070728A (ko) 시계열 데이터의 에러를 확인하는 방법 및 장치
CN105825130B (zh) 一种信息安全预警方法及装置
JP7274162B2 (ja) 異常操作検知装置、異常操作検知方法、およびプログラム
Habib et al. Trust4App: automating trustworthiness assessment of mobile applications
EP3664057B1 (en) Sensor management unit, sensing data distribution system, sensing data evaluation method, and sensing data evaluation program
EP3664056B1 (en) Sensor device, background noise data transmission method, and background noise data transmission program
TWI696401B (zh) 基地台之障礙辨識伺服器及方法
Kumar Bhoi A Cloud Based Framework for Identification of IoT Devices at Smart Home Using Supervised Machine Intelligence Model
JP7235109B2 (ja) 評価装置、システム、制御方法、及びプログラム
WO2021070216A1 (ja) 脆弱性管理装置、脆弱性管理方法、及びプログラム
US20210344577A1 (en) Determination device, gateway, determination method, and determination program