KR101901654B1 - 전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체 - Google Patents

전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체 Download PDF

Info

Publication number
KR101901654B1
KR101901654B1 KR1020150184798A KR20150184798A KR101901654B1 KR 101901654 B1 KR101901654 B1 KR 101901654B1 KR 1020150184798 A KR1020150184798 A KR 1020150184798A KR 20150184798 A KR20150184798 A KR 20150184798A KR 101901654 B1 KR101901654 B1 KR 101901654B1
Authority
KR
South Korea
Prior art keywords
data
prediction
model
time series
prediction data
Prior art date
Application number
KR1020150184798A
Other languages
English (en)
Other versions
KR20170075312A (ko
Inventor
안도훈
이기천
이운섭
Original Assignee
(주) 우림인포텍
한양대학교 산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주) 우림인포텍, 한양대학교 산학협력단 filed Critical (주) 우림인포텍
Priority to KR1020150184798A priority Critical patent/KR101901654B1/ko
Publication of KR20170075312A publication Critical patent/KR20170075312A/ko
Application granted granted Critical
Publication of KR101901654B1 publication Critical patent/KR101901654B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • Human Resources & Organizations (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Data Mining & Analysis (AREA)
  • Operations Research (AREA)
  • Mathematical Optimization (AREA)
  • Tourism & Hospitality (AREA)
  • Mathematical Physics (AREA)
  • General Business, Economics & Management (AREA)
  • Quality & Reliability (AREA)
  • Development Economics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Game Theory and Decision Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Marketing (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Algebra (AREA)
  • Educational Administration (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

시계열 데이터 입력부, 정방향 아리마 분석 모델 구축부, 제 1 예측 데이터 산출부, 역방향 아리마 모델 구축부, 학습 데이터 산출부, 근접 예측 모델 구축부, 제 2 예측 데이터 산출부, 및 최종 예측 데이터 산출부를 포함한다. 시계열 데이터 입력부는 시계열 데이터를 입력받고, 정방향 아리마 분석 모델 구축부는 시계열 데이터를 이용하여 정방향 아리마 분석 모델을 구축하고, 제 1 예측 데이터 산출부는 정방향 아리마 분석 모델을 이용하여 미리 설정된 미래에 대한 제 1 예측 데이터를 산출하고, 역방향 아리마 모델 구축부가 시계열 데이터를 역방향으로 이용하여 역방향 아리마 분석 모델을 구축하고, 학습 데이터 산출부가 역방향 아리마 분석 모델을 이용하여 학습(fitted) 데이터를 산출하고, 근접 예측 모델 구축부가 학습 데이터를 역방향으로 이용하여 비모수적 분석 방법을 이용하는 근접 예측 모델을 구축하고, 제 2 예측 데이터 산출부는 근접 예측 모델을 이용해 미리 설정된 미래 시점에 대한 제 2 예측 데이터를 산출하며, 최종 예측 데이터 산출부는 제 1 예측 데이터와 제 2 예측 데이터를 조합하여 최종 예측 데이터를 산출한다.

Description

전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체 {SYSTEM AND METHOD FOR TIME-SERIES PREDICTING USING INTEGRATED FORWARD AND BACKWARD TRENDS, AND A RECORDING MEDIUM HAVING COMPUTER READABLE PROGRAM FOR EXECUTING THE METHOD}
본 발명은 시계열 분석 방법 및 시스템에 관한 것으로서, 더욱 상세하게는 시계열 분석을 이용하여 미래 데이터를 예측하는 방법 및 시스템에 관한 것이다.
시계열 분석은 시간과 더불어 관측된 자료를 분석하는 분야이다. 시계열 분석 목적 중 일반적으로 가장 관심이 많은 부분은 예측으로서, 시계열 분석은 과거의 자료로부터 얻어진 변화의 패턴이 미래에도 유지될 것이라는 가정을 하고 과학적으로 예측을 하는 분석이다. 현재, 인구통계, 금융시장 또는 기상예측 등 시간과 관련된 자료가 사용되는 여러 산업에서 활용되고 있다.
시계열 예측으로 가장 널리 사용되는 분석 모형은 아리마(AutoRegressive Integrated Moving Average; ARIMA) 모형이다. 아리마 모형은 보편적으로 단기예측에서 좋은 성능이 보이며 시계열의 구성요소가 시간의 흐름에 따라 빠르게 변동할 때 유용하여 여러 산업에서 사용하고 있다.
하지만, 아리마(ARIMA) 모형에서는 농수산물 가격처럼 이상기후나 공휴일 등 갑작스럽게 변하는 요인이 있을 경우, 이런 영향을 반영하기 위하여 새롭게 모형을 구축하더라도 그 모형의 예측이 실제 변화를 뒤늦게 따라가는 현상이 있어서 예측력이 낮아지는 문제점이 있다.
본 발명은 상술한 종래의 문제점을 해결하기 위해 안출된 것으로서, 농수산물 가격처럼 이상기후나 공휴일 등 갑작스럽게 변하는 요인이 있을 경우에도, 모형의 예측이 실제 변화를 빠르게 추종하여 예측력을 높여줄 수 있도록 하는 시스템 및 방법을 제공하는 것을 목적으로 한다.
상기 목적을 달성하기 위해 본 발명에 따른 시계열 예측 시스템은, 시계열 데이터 입력부, 정방향 아리마 분석 모델 구축부, 제 1 예측 데이터 산출부, 역방향 아리마 모델 구축부, 적합 데이터 산출부, 근접 예측 모델 구축부, 제 2 예측 데이터 산출부, 및 최종 예측 데이터 산출부를 포함한다.
시계열 데이터 입력부는 시계열 데이터를 입력받고, 정방향 아리마 분석 모델 구축부는 시계열 데이터를 이용하여 정방향 아리마 분석 모델을 구축하고, 제 1 예측 데이터 산출부는 정방향 아리마 분석 모델을 이용하여 미리 설정된 미래에 대한 제 1 예측 데이터를 산출하고, 역방향 아리마 모델 구축부는 시계열 데이터를 역방향으로 이용하여 역방향 아리마 분석 모델을 구축하고, 적합 데이터 산출부는 역방향 아리마 분석 모델을 이용하여 적합(fitted) 데이터를 산출하고, 근접 예측 모델 구축부는 적합 데이터를 역방향으로 이용하여 비모수적 분석 방법을 이용하는 근접 예측 모델을 구축하고, 제 2 예측 데이터 산출부는 근접 예측 모델을 이용해 미리 설정된 미래 시점에 대한 제 2 예측 데이터를 산출하며, 최종 예측 데이터 산출부는 제 1 예측 데이터와 제 2 예측 데이터를 조합하여 최종 예측 데이터를 산출한다.
이와 같은 구성에 의하면, 정방향 아리마(ARIMA) 모형에, 시간의 역순으로 가는 아리마(ARIMA) 모형의 미래 예측의 영향을 더해줌으로써, 농수산물 가격처럼 이상기후나 공휴일 등 갑작스럽게 변하는 요인이 있을 경우에도, 모형의 예측이 실제 변화를 빠르게 추종하여 예측력을 높일 수 있게 된다.
이때, 비모수적 분석 방법을 이용하는 근접 예측 모델은 지역가중다항식(Locally weighted polynomial regression; LOESS) 분석 모델일 수 있다. 이러한 구성에 의하면, 인접한 구간의 데이터에 많은 가중치를 두는 LOESS 모델의 특징을 이용하여, 역방향 아리마 분석 모델의 예측 추세를 반영하여 미래 예측을 할 수 있게 된다.
또한, 최종 예측 데이터는 제 1 예측 데이터와 제 2 예측 데이터의 가중 평균을 이용하여 산출될 수 있다.
또한, 시계열 예측 시스템은, 최종 예측 데이터를 평가하는 예측 데이터 평가부, 및 최종 예측 데이터가 미리 설정된 평가 기준을 벗어나는 경우 지역가중다항식 분석 모델의 평활 파라미터(smoothing parameter)를 변경하는 평활 파라미터 변경부를 더 포함할 수 있다. 이러한 구성에 의하면, 예측 결과에 따라 예측 모델의 설정을 조정하여 최적의 예측 모델을 구축할 수 있게 된다.
이때, 예측 데이터 평가부는 최종 예측 데이터와 제 1 예측 데이터를 비교할 수 있고, 서로 다른 평활 파라미터(smoothing parameter)를 이용하여 각각 산출된 최종 예측 데이터를 서로 비교할 수 있다.
또한, 시계열 데이터로부터 최종 예측 데이터의 산출에 사용되는 데이터와 최종 예측 데이터의 평가에 사용되는 평가 데이터를 분리하는 시계열 데이터 분리부를 더 포함할 수 있다. 이러한 구성에 의하면, 입력된 시계열 데이터를 이용하여 미래의 예측은 물론 예측 결과의 평가도 수행할 수 있게 된다.
또한, 입력된 시계열 데이터에서 이상치를 검출하고 대체하는 시계열 데이터 전처리부를 더 포함할 수 있고, 시계열 데이터에서의 이상치 검출 및 대체는 스플라인(spline) 방법에 의해 수행될 수 있다. 이와 같은 구성에 의하면, 입력된 시계열 데이터에서 예측 결과에 큰 영향을 미치는 이상치를 배제함으로써, 더욱 효과적인 예측을 수행할 수 있게 된다.
아울러, 상기 시스템을 방법의 형태로 구현한 발명과 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램이 함께 개시된다.
본 발명에 의하면, 정방향 아리마(ARIMA) 모형에, 시간의 역순으로 가는 아리마(ARIMA) 모형의 미래 예측의 영향을 더해줌으로써, 농수산물 가격처럼 이상기후나 공휴일 등 갑작스럽게 변하는 요인이 있을 경우에도, 모형의 예측이 실제 변화를 빠르게 추종하여 예측력을 높일 수 있게 된다.
또한, 인접한 구간의 데이터에 많은 가중치를 두는 LOESS 모델의 특징을 이용하여, 역방향 아리마 분석 모델의 예측 추세를 반영하여 미래 예측을 할 수 있게 된다.
또한, 예측 결과에 따라 예측 모델의 설정을 조정하여 최적의 예측 모델을 구축할 수 있게 된다.
또한, 입력된 시계열 데이터를 이용하여 미래의 예측은 물론 예측 결과의 평가도 수행할 수 있게 된다.
또한, 입력된 시계열 데이터에서 예측 결과에 큰 영향을 미치는 이상치를 배제함으로써, 더욱 효과적인 예측을 수행할 수 있게 된다.
도 1은 본 발명의 일 실시예에 따른 시계열 예측 시스템의 개략적인 블록도.
도 2는 도 1의 시스템에 의해 수행되는 시계열 예측 방법의 개략적인 흐름도.
도 3은 도 2의 더욱 구체적인 흐름도.
도 4는 입력의 오류로 인한 이상치를 스플라인(spline) 값으로 대체하는 예가 도시된 그래프.
도 5는 정방향 아리마(Forward ARIMA) 분석을 하고 5일을 예측한 예의 그래프.
도 6은 시간의 역방향으로 역방향 아리마(Backward ARIMA) 분석을 시행한 예의 그래프.
도 7은 도 6의 모형에서 학습된 적합 데이터를 다시 시간순으로 바꾸어 저장한 예의 그래프.
도 8은 서로 다른 모수 α(span)를 이용하여 LOESS 분석을 반복 시행하는 결과가 도시된 그래프.
이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예를 설명한다.
도 1은 본 발명의 일 실시예에 따른 시계열 예측 시스템의 개략적인 블록도이다.
도 1에서, 시계열 예측 시스템은(100), 시계열 데이터 입력부(110), 시계열 데이터 전처리부(120), 시계열 데이터 분리부(130), 정방향 아리마 분석 모델 구축부(140), 제 1 예측 데이터 산출부(150), 역방향 아리마 모델 구축부(160), 적합 데이터 산출부(170), 근접 예측 모델 구축부(180), 제 2 예측 데이터 산출부(190), 최종 예측 데이터 산출부(200), 예측 데이터 평가부(210), 및 파라미터 변경부(220)를 포함한다.
도 1에서 시계열 예측 시스템(100)의 각 구성 요소들은 하드웨어로 구현될 수도 있으나, 하드웨어상에서 동작하는 소프트웨어로 구현되는 것이 더욱 일반적일 것이다.
시계열 데이터 입력부(110)는 시계열 데이터를 입력받고, 시계열 데이터 전처리부(120)는 입력된 시계열 데이터에서 이상치를 검출하고 대체한다.
농수산물 경매가격 데이터와 같이 사람에 의해 자료입력되는 데이터에는 이상치 값들이 많이 발생할 수 있다. 시계열 데이터 전처리부(120)에 의하면, 입력된 시계열 데이터에서 예측 결과에 큰 영향을 미치는 이상치를 배제함으로써, 더욱 효과적인 예측을 수행할 수 있게 된다.
이상치 탐색을 위해, 시계열의 추세와 비슷하게 스플라인(spline) 분석을 한 후 실제 데이터 값과 스플라인(spline)의 값의 차이가 임계값 이상인 데이터를 찾고, 찾아진 데이터를 이상치 값으로 결정하고 스플라인(spline) 값으로 대체할 수 있다.
시계열 데이터 분리부(130)는 입력된 시계열 데이터로부터 최종 예측 데이터의 산출에 사용되는 데이터와 최종 예측 데이터의 평가에 사용되는 평가 데이터를 분리한다. 이러한 구성에 의하면, 입력된 시계열 데이터를 이용하여 미래 시점의 예측은 물론 예측 결과의 평가도 수행할 수 있게 된다.
정방향 아리마 분석 모델 구축부(140)는 시계열 데이터를 이용하여 정방향 아리마 분석 모델을 구축하며, 제 1 예측 데이터 산출부(150)는 정방향 아리마 분석 모델을 이용하여 미리 설정된 미래에 대한 제 1 예측 데이터를 산출한다.
정방향 아리마(Forward ARIMA)는 종래와 동일하게 시계열 분석을 할 때 과거에서 미래방향의 시간순으로 아리마(ARIMA) 분석을 하는 것을 의미한다. 아리마(ARIMA) 모형은 크게 모형의 식별(Identification), 모수의 추정(Estimation), 모형 진단(Diagnotic), 그리고 예측(Forecasting), 이렇게 4가지 단계를 통해 추정된다.
식별 단계에서 주어진 농수산물 시계열 자료의 특성을 파악하여 ARIMA(p,d,q) 모형의 형태를 결정하게 되는 각 항들의 차수와 차분의 횟수, 시계열 자료의 주기인 p,q를 선택한다. 차분의 횟수를 결정하기 전에 원시계열 자료에서 단위근 검정을 하여 안정적이지 않으면 차분을 한다.
그 다음 추정 단계에서는 최소제곱 추정법(Least Squares Estimation Method), 최대우도 추정법(Maximum Likelihood Estimation Method) 등으로 추정하고 AIC(Akaike Information Ciriterion), BIC(Bayesian Information Criterion)의 값들이 가장 작은 모형으로 추정하게 된다.
진단의 단계는 주어진 시계열을 추정된 모형이 얼마나 잘 설명하고 있는가를 파악하고 얼마나 적합한지를 진단하는데, 잔차분석을 통해 판단한다. 만약 적합하지 않으면 식별 또는 추정의 단계로 돌아가 다시 모형 추정의 과정을 반복하고, 적합하다고 판단되면 실제 예측을 하게 된다.
역방향 아리마 모델 구축부(160)는 시계열 데이터를 역방향으로 이용하여 역방향 아리마 분석 모델을 구축하고, 적합 데이터 산출부(170)는 역방향 아리마 분석 모델을 이용하여 학습(fitted) 데이터를 산출한다.
역방향 아리마(Backward ARIMA)는 원시계열자료를 미래에서 과거방향인 시간의 역순으로 아리마(ARIMA) 분석을 하는 것을 의미한다. 시간의 역순으로 아리마(ARIMA) 모형을 만들게 되면 그 모형의 과거 예측 값이 결국 원시계열자료의 미래 예측값이 되는 형태가 된다. 즉, 역방향 아리마(Backward ARIMA)는 원시계열자료를 역방향으로 하여 종래의 아리마(ARIMA) 분석 과정을 똑같이 시행하는 것이다.
Figure 112015126293104-pat00001
그런데, 역방향 아리마(Backward ARIMA) 모형으로는 원시계열자료의 과거를 예측할 수 있지만, 원시계열자료의 미래는 시간 역순 데이터 입장에서 과거 예측이기 때문에 예측이 어렵다.
이에 따라, 근접 예측 모델 구축부(180)는 적합 데이터를 역방향으로 이용하여 비모수적 분석 방법을 이용하는 근접 예측 모델을 구축하고, 제 2 예측 데이터 산출부(190)는 근접 예측 모델을 이용해 미리 설정된 미래 시점에 대한 제 2 예측 데이터를 산출한다.
이때, 비모수적 분석 방법을 이용하는 근접 예측 모델은 지역가중다항식(Locally weighted polynomial regression; LOESS) 분석 모델일 수 있다. 이러한 구성에 의하면, 인접한 구간의 데이터에 많은 가중치를 두는 LOESS 모델의 특징을 이용하여, 역방향 아리마 분석 모델의 예측 추세를 반영하여 미래 예측을 할 수 있게 된다.
즉, 시간 역순 데이터 입장에서 과거 예측(즉, 원시계열자료의 미래 예측)을 하기 위해 역방향 아리마(Backward ARIMA) 모형으로 학습된 데이터(ARIMA Fitted data)를 가지고 LOESS(Locally Weighted Polynomial Regression)를 통해 근접 예측을 한다.
LOESS는 역방향 아리마(Backward ARIMA) 모형으로 학습된 데이터를 가지고 역방향(Backward) 모형의 추세에 최대한 맞도록 예측을 한다. 비모수적 회귀분석인 LOESS로 역방향 아리마(Backward ARIMA) 모형의 과거예측을 할 수 있게 되는 것이다. 이때, 역방향 아리마(Backward ARIMA)의 분석 목적은 정방향 아리마(Forward ARIMA)의 예측에 역방향의 아리마(Backward ARIMA) 모형의 영향을 주기 위함이다.
최종 예측 데이터 산출부(200)는 제 1 예측 데이터와 제 2 예측 데이터를 조합하여 최종 예측 데이터를 산출한다. 이때, 최종 예측 데이터는 제 1 예측 데이터와 제 2 예측 데이터의 가중 평균을 이용하여 산출될 수 있다.
이와 같은 구성에 의하면, 정방향 아리마(ARIMA) 모형에, 시간의 역순으로 가는 아리마(ARIMA) 모형의 미래 예측의 영향을 더해줌으로써, 농수산물 가격처럼 이상기후나 공휴일 등 갑작스럽게 변하는 요인이 있을 경우에도, 모형의 예측이 실제 변화를 빠르게 추종하여 예측력을 높일 수 있게 된다. 이를 위한, Forward-Backward Loess 알고리즘의 예는 다음과 같다.
Figure 112015126293104-pat00002
예측 데이터 평가부(210)는 최종 예측 데이터를 평가하고, 파라미터 변경부(220)는 최종 예측 데이터가 미리 설정된 평가 기준을 벗어나는 경우 지역가중다항식 분석 모델의 평활 파라미터(smoothing parameter)를 변경한다. 이러한 구성에 의하면, 예측 결과에 따라 예측 모델의 설정을 조정하여 최적의 예측 모델을 구축할 수 있게 된다.
이때, 예측 데이터 평가부(220)는 최종 예측 데이터와 제 1 예측 데이터를 비교할 수 있고, 서로 다른 평활 파라미터(smoothing parameter)를 이용하여 각각 산출된 최종 예측 데이터를 서로 비교할 수 있다.
예를 들어, LOESS 모형의 모수 α(span)는 (λ+1)/n < α < 1 (λ: polynomial degree, n: 전체 관측치)에서 정해지는데 학습 자료를 반복 내부 테스트한 결과를 종합하여 최고의 예측력을 가져오는 값을 정하거나 사용자의 경험에 의해 정할 수 있다. 예를 들어, 농수산물의 일별 예측을 하는 경우 대략 1~2주일의 근접 과거 데이터가 중요하다는 경험에 기반하여 α를 정할 수 있다.
도 2는 도 1의 시스템에 의해 수행되는 시계열 예측 방법의 개략적인 흐름도이고, 도 3은 도 2의 보다 구체적인 흐름도이다.
도 2 및 도 3에서, 시계열 시스템은 먼저, 시계열 데이터를 입력받고(S100), 입력된 시계열 데이터에 대한 전처리를 수행한다(S110). 이를 위해, 입력된 시계열 데이터에서 이상치를 검출하고 대체하며(S112), 최종 예측 데이터의 산출에 사용되는 트레인 데이터(Train data)와 최종 예측 데이터의 평가에 사용되는 테스트 데이터(test data)를 분리한다(114). 이상치 탐지 및 결측값 처리는 스플라인(spline) 분석 방법이 바람직하지만, 대체 가능한 다른 분석 방법에 의해서도 가능하다.
도 4는 입력의 오류로 인한 이상치를 스플라인(spline) 값으로 대체하는 예가 도시된 그래프이다. 도 4의 상단에는 이상치가 도시되어 있지만, 도 4의 하단에는 스플라인 분석을 통해 특정값이상인 값이 스플라인 값으로 대체된 것을 확인할 수 있다.
또한, 트레인 데이터(Train data)의 길이는 사용자 등에 의해 미리 설정될 수 있으며, 예를 들어, 전체 시계열 데이터의 2/3 또는 3/4 정도로 결정할 수 있다.
이어서, 시계열 데이터를 이용하여 정방향 아리마 분석을 수행하여 예측 데이터를 생성한다(S120). 보다 구체적으로 트레인 타임 시리즈 데이터(train time series data)로 아리마(ARIMA) 분석 모델을 구축하고(S122), 향후 미래 데이터 n개를 예측하고(S124), 정방향 아리마 예측 데이터를 저장하며(S126), 정방향 아리마 예측과 테스트 데이터의 예측값(MSE)을 저장한다(S128). 도 5는 정방향 아리마(Forward ARIMA) 분석을 하고 5일을 예측한 예의 그래프이다. 정방향 아리마 분석 후 원시도표에 적합값을 함께 도시한 플롯(plot)이 도시되어 있다.
다음으로, 시계열 데이터를 이용하여 역방향 아리마 분석을 수행하여(S130) 역방향 적합 예측 데이터를 생성한다(S140). 보다 구체적으로, 트레인 타임 시리즈 데이터에 대해 역방향(Reverse)을 취한 후, 아리마 분석 모델을 구축(Backward ARIMA)하고(S132), 아리마 모델의 적합 데이터(fitted data)를 다시 역방향을 취하여(S134) 역방향 적합 데이터(Reversed fitted data)를 생성하는 것이다(S140).
도 6은 시간의 역방향으로 역방향 아리마(Backward ARIMA) 분석을 시행한 예의 그래프이고, 도 7은 도 6의 모형에서 학습된 적합 데이터를 다시 시간순으로 바꾸어 저장한 예의 그래프이다. 도 6에서 역방향 아리마 분석으로 산출된 모형의 예는 다음과 같다.
Figure 112015126293104-pat00003
다음으로, 역방향 아리마(Backward ARIMA) 모형의 예측을 비모수적 분석 방법으로 근접 예측한다(S150). 비모수적 분석 방법으로는 Local Weighted Polynomial Regression(LOESS)를 사용하는 것이 바람직하나 다른 방법을 사용할 수도 있다. 이때, Local 데이터는 평활 파라미터(smoothing parameter)를 결정하는 근접 데이터의 수이다.
보다 구체적으로, 로컬(Local) 데이터 수인 'near' 값을 결정하고(S152), 역방향 적합(Reversed fitted) 데이터로 LOESS 분석 모델을 구축한 후 향후 미래 데이터 n개를 예측하며(S154), 역방향 아리마 예측 데이터를 저장한다(S156). 이때, 역방향 아리마(Backward ARIMA) 모형의 학습된 예측데이터에서 LOESS 분석을 반복 시행하여 모수 α(span)를 결정할 수 있다.
모수 α(span)는 다음과 같이 표현할 수 있는데,
α(span; 평활 파라미터) = near(로컬 데이터 수) / all data(총 데이터 수)
이는 near 값을 α(span)와 총 데이터의 곱으로 나타낼 수 있다는 것을 의미한다. 따라서, 모수 α(span)를 입력하는 대신 서로 다른 near 값을 이용하여 LOESS 분석을 반복시행할 수 있다. 도 8은 서로 다른 모수 α(span)를 이용하여 LOESS 분석을 반복 시행하는 결과가 도시된 그래프이다.
다음으로, 정방향 아리마 모형의 예측값과 역방향 아리마 LOESS 예측값 각각에 가중치를 적용하여 최종 예측값을 구한다(S160). 이때, 가중치값은 단순 평균이나 다른 다양한 앙상블 기법을 이용할 수 있다.
마지막으로, 최종 예측 데이터를 평가하고(S170), 평가 완료된 최종 예측 데이터를 출력한다(S180). 평가를 위해, 기존의 단순 아리마(ARIMA) 분석을 한 후 향후 5일 예측을 하여 구한 MSE 값과 같은 구간을 FBLOESS 분석을 한 후 5일을 예측을 하여 구한 MSE값을 비교할 수 있다.
본 발명에서는, 농수산물 경매 가격을 시계열 분석을 통해 단기예측을 하기 위한 모형을 제안하였다. 기존 시계열 예측으로 가장 널리 사용되는 분석 모형이자 농수산물 경매가격데이터에 적합한 아리마(ARIMA) 모형에서 전방향 아리마(Forward ARIMA) 모형과 후방향 아리마(Backward ARIMA) 모형을 통합하여 예측력을 더욱 향상시켜주는 알고리즘을 제시 하였다.
종래 아리마(ARIMA) 분석으로 농수산물 가격예측을 하게 되면, 예측 값이 시간상의 차이를 보이며 보여진 변화의 패턴을 늦게 따라가기 때문에, 예측 수준이 낮은 경우가 자주 발생하는데, 본 발명에서는 이러한 차이를 극복하기 위해 전후방향 통합 아리마(ARIMA) 근접 예측(Forward-Backward Loess) 알고리즘을 제시한 것이다.
이 모델의 기본 아이디어는 기존의 아리마(ARIMA) 모형에서 시간의 역순으로 가는 아리마(ARIMA) 모형의 미래 예측의 영향을 더해줌으로써 뒤늦게 예측되는 문제를 보완해주고 더 나은 예측 결과를 기대할 수 있도록 하는 것이다. 다시 말해, 역방향 아리마(ARIMA) 모델을 구축하여 단순히 과거 값을 예측하기 위해서만 사용하는 것이 아니라 다시 미래값 예측을 위해 사용한다는 점이다. 이를 위해, 기존의 아리마(ARIMA) 모형에서의 예측 값과 시간의 역순으로 가는 아리마(ARIMA) 모형의 미래 예측 값들을 앙상블을 하여 예측을 한다.
본 발명을 통한 시계열 분석은 종래의 아리마(ARIMA) 시계열 분석의 문제점인 뒤늦은 예측의 문제를 해결해 주고 변동이 큰 데이터에서 더욱 향상된 예측력을 보여준다. 본 발명은 농수산물 경매가격과 같이 매일 자료가 업데이트가 되는 일별 또는 시간별 자료나 빅데이터에 대한 시계열 분석이 필요한 어떠한 산업에서도 적용 가능하다. 특히 단기 예측을 할때 유용하게 사용될 수 있다.
본 발명이 비록 일부 바람직한 실시예에 의해 설명되었지만, 본 발명의 범위는 이에 의해 제한되어서는 아니 되고, 특허청구범위에 의해 뒷받침되는 상기 실시예의 변형이나 개량에도 미쳐야 할 것이다.
100: 시계열 예측 시스템
110: 시계열 데이터 입력부
120: 시계열 데이터 전처리부
130: 시계열 데이터 분리부
140: 정방향 아리마 분석 모델 구축부
150: 제 1 예측 데이터 산출부
160: 역방향 아리마 모델 구축부
170: 적합 데이터 산출부
180: 근접 예측 모델 구축부
190: 제 2 예측 데이터 산출부
200: 최종 예측 데이터 산출부
210: 예측 데이터 평가부
220: 파라미터 변경부

Claims (17)

  1. 시계열 데이터를 입력받는 시계열 데이터 입력부;
    상기 시계열 데이터를 이용하여 정방향 아리마 분석 모델을 구축하는 아리마 분석 모델 구축부;
    상기 정방향 아리마 분석 모델을 이용하여 미리 설정된 미래 시점에 대한 제 1 예측 데이터를 산출하는 제 1 예측 데이터 산출부;
    상기 시계열 데이터를 역방향으로 이용하여 역방향 아리마 분석 모델을 구축하는 역방향 아리마 모델 구축부;
    상기 역방향 아리마 분석 모델을 이용하여 학습결과(fitted) 데이터를 산출하는 학습 데이터 산출부;
    상기 학습결과 데이터를 역방향으로 이용하여 상기 역방향 아리마 분석 모델의 과거 예측을 수행하고 비모수적 분석 방법을 이용하는 근접 예측 모델을 구축하는 근접 예측 모델 구축부;
    상기 근접 예측 모델을 이용해 상기 미리 설정된 미래 시점에 대한 제 2 예측 데이터를 산출하는 제 2 예측 데이터 산출부; 및
    상기 제 1 예측 데이터와 상기 제 2 예측 데이터를 조합하여 최종 예측 데이터를 산출하는 최종 예측 데이터 산출부를 포함하며,
    상기 비모수적 분석 방법을 이용하는 근접 예측 모델은 지역가중다항식(Locally weighted polynomial regression; LOESS) 분석 모델인 것을 특징으로 하는 시계열 예측 시스템.
  2. 삭제
  3. 제 1항에 있어서,
    상기 최종 예측 데이터는 상기 제 1 예측 데이터와 제 2 예측 데이터의 가중 평균을 이용하여 산출되는 것을 특징으로 하는 시계열 예측 시스템.
  4. 제 1항에 있어서,
    상기 최종 예측 데이터를 평가하는 예측 데이터 평가부; 및
    상기 최종 예측 데이터가 미리 설정된 평가 기준을 벗어나는 경우, 상기 지역가중다항식 분석 모델의 평활 파라미터(smoothing parameter)를 변경하는 평활 파라미터 변경부를 더 포함하는 것을 특징으로 하는 시계열 예측 시스템.
  5. 제 4항에 있어서,
    상기 예측 데이터 평가부는,
    상기 최종 예측 데이터와 상기 제 1 예측 데이터를 비교하는 것을 특징으로 하는 시계열 예측 시스템.
  6. 제 4항에 있어서,
    상기 예측 데이터 평가부는,
    서로 다른 평활 파라미터(smoothing parameter)를 이용하여 각각 산출된 상기 최종 예측 데이터를 서로 비교하는 것을 특징으로 하는 시계열 예측 시스템.
  7. 제 4항에 있어서,
    상기 시계열 데이터로부터 상기 최종 예측 데이터의 산출에 사용되는 데이터와 상기 최종 예측 데이터의 평가에 사용되는 평가 데이터를 분리하는 시계열 데이터 분리부를 더 포함하는 것을 특징으로 하는 시계열 예측 시스템.
  8. 제 1항에 있어서,
    상기 입력된 시계열 데이터에서 이상치를 검출하고 대체하는 시계열 데이터 전처리부를 더 포함하는 것을 특징으로 하는 시계열 예측 시스템.
  9. 시계열 예측 시스템이,
    시계열 데이터를 입력받는 시계열 데이터 입력 단계;
    상기 시계열 데이터를 이용하여 정방향 아리마 분석 모델을 구축하는 정방향 아리마 분석 모델 구축 단계;
    상기 정방향 아리마 분석 모델을 이용하여 미리 설정된 미래 시점에 대한 제 1 예측 데이터를 산출하는 제 1 예측 데이터 산출 단계;
    상기 시계열 데이터를 역방향으로 이용하여 역방향 아리마 분석 모델을 구축하는 역방향 아리마 분석 모델 구축 단계;
    상기 역방향 아리마 분석 모델을 이용하여 학습결과(fitted) 데이터를 산출하는 학습 데이터 산출 단계;
    상기 학습결과 데이터를 역방향으로 이용하여 상기 역방향 아리마 분석 모델의 과거 예측을 수행하고 비모수적 분석 방법을 이용하는 근접 예측 모델을 구축하는 근접 예측 모델 구축 단계;
    상기 근접 예측 모델을 이용해 상기 미리 설정된 미래 시점에 대한 제 2 예측 데이터를 산출하는 제 2 예측 데이터 산출 단계; 및
    상기 제 1 예측 데이터와 상기 제 2 예측 데이터를 조합하여 최종 예측 데이터를 산출하는 최종 예측 데이터 산출 단계를 포함하며,
    상기 비모수적 분석 방법을 이용하는 근접 예측 모델은 지역가중다항식(Locally weighted polynomial regression; LOESS) 분석 모델인 것을 특징으로 하는 시계열 예측 방법.
  10. 삭제
  11. 제 9항에 있어서,
    상기 최종 예측 데이터는 상기 제 1 예측 데이터와 제 2 예측 데이터의 가중 평균을 이용하여 산출되는 것을 특징으로 하는 시계열 예측 방법.
  12. 제 9항에 있어서,
    상기 최종 예측 데이터를 평가하는 예측 데이터 평가 단계; 및
    상기 최종 예측 데이터가 미리 설정된 평가 기준을 벗어나는 경우, 상기 지역가중다항식 분석 모델의 평활 파라미터(smoothing parameter)를 변경하는 평활 파라미터 변경 단계를 더 포함하는 것을 특징으로 하는 시계열 예측 방법.
  13. 제 12항에 있어서,
    상기 예측 데이터 평가 단계는,
    상기 최종 예측 데이터와 상기 제 1 예측 데이터를 비교하는 것을 특징으로 하는 시계열 예측 방법.
  14. 제 12항에 있어서,
    상기 예측 데이터 평가 단계는,
    서로 다른 평활 파라미터(smoothing parameter)를 이용하여 각각 산출된 상기 최종 예측 데이터를 비교하는 것을 특징으로 하는 시계열 예측 방법.
  15. 제 12항에 있어서,
    상기 시계열 데이터로부터 상기 최종 예측 데이터의 산출에 사용되는 데이터와 상기 최종 예측 데이터의 평가에 사용되는 평가 데이터를 분리하는 단계를 시계열 데이터 분리 단계를 더 포함하는 것을 특징으로 하는 시계열 예측 방법.
  16. 제 9항에 있어서,
    상기 입력된 시계열 데이터에서 이상치를 검출하고 대체하는 시계열 데이터 전처리 단계를 더 포함하는 것을 특징으로 하는 시계열 예측 방법.
  17. 제 9항, 제 11항 내지 제 16항 중 어느 한 항의 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체.
KR1020150184798A 2015-12-23 2015-12-23 전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체 KR101901654B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020150184798A KR101901654B1 (ko) 2015-12-23 2015-12-23 전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020150184798A KR101901654B1 (ko) 2015-12-23 2015-12-23 전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체

Publications (2)

Publication Number Publication Date
KR20170075312A KR20170075312A (ko) 2017-07-03
KR101901654B1 true KR101901654B1 (ko) 2018-09-27

Family

ID=59358082

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020150184798A KR101901654B1 (ko) 2015-12-23 2015-12-23 전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체

Country Status (1)

Country Link
KR (1) KR101901654B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110020374B (zh) * 2017-12-28 2021-06-08 ***通信集团陕西有限公司 一种发布信息的转发量预测方法和装置
KR102078654B1 (ko) * 2018-05-17 2020-04-07 정규식 전동차의 고장을 예측하는 시스템 및 방법
KR102134682B1 (ko) * 2018-06-25 2020-07-17 (주) 우림인포텍 실시간 시계열 데이터를 위한 예측 모형 생성 시스템 및 방법
KR102574461B1 (ko) * 2021-01-29 2023-09-04 인하대학교 산학협력단 탄소 배출권 가격 추이와 시계열 분석을 이용한 탄소 배출권 가격 예측 시스템 및 그 방법
KR102622917B1 (ko) * 2021-06-15 2024-01-10 한국전력공사 이중 시계열 분석을 통한 계통측정정보 상태 판정 방법 및 상태 판정 장치

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4230975B2 (ja) * 2004-09-17 2009-02-25 キヤノンItソリューションズ株式会社 データ予測装置及びデータ予測方法並びにプログラム
JP2010276848A (ja) * 2009-05-28 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 双方向予測符号化装置、双方向予測復号装置、それらの方法、それらのプログラム及びその記録媒体
JP4673828B2 (ja) * 2006-12-13 2011-04-20 日本電信電話株式会社 音声信号区間推定装置、その方法、そのプログラム及び記録媒体

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100344640B1 (ko) * 2001-03-24 2002-07-25 주식회사 엑셈 데이터베이스 성능 모니터링 장치 및 그 방법
KR100865939B1 (ko) * 2006-12-29 2008-10-30 포스데이타 주식회사 교통정보 안내 시스템 및 방법
KR20150096103A (ko) * 2014-02-14 2015-08-24 한국전자통신연구원 농산물 수확량 예측 장치 및 방법

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4230975B2 (ja) * 2004-09-17 2009-02-25 キヤノンItソリューションズ株式会社 データ予測装置及びデータ予測方法並びにプログラム
JP4673828B2 (ja) * 2006-12-13 2011-04-20 日本電信電話株式会社 音声信号区間推定装置、その方法、そのプログラム及び記録媒体
JP2010276848A (ja) * 2009-05-28 2010-12-09 Nippon Telegr & Teleph Corp <Ntt> 双方向予測符号化装置、双方向予測復号装置、それらの方法、それらのプログラム及びその記録媒体

Also Published As

Publication number Publication date
KR20170075312A (ko) 2017-07-03

Similar Documents

Publication Publication Date Title
KR101901654B1 (ko) 전후방향 동향 통합 시계열 예측 시스템, 방법, 및 상기 방법을 실행시키기 위한 컴퓨터 판독 가능한 프로그램을 기록한 기록 매체
CN107765347B (zh) 一种高斯过程回归和粒子滤波的短期风速预测方法
US20200371491A1 (en) Determining Operating State from Complex Sensor Data
US7778715B2 (en) Methods and systems for a prediction model
Carr et al. An approximate algorithm for prognostic modelling using condition monitoring information
US20190251458A1 (en) System and method for particle swarm optimization and quantile regression based rule mining for regression techniques
KR101876051B1 (ko) 기계 학습 시스템 및 그의 사용자 제어 패턴 학습 방법
Guthke Defensible Model Complexity: A Call for Data-Based and Goal-Oriented Model Choice.
US9286573B2 (en) Cost-aware non-stationary online learning
JP2015230727A (ja) 時系列データ内の異常を検出する方法
KR102225370B1 (ko) 학습을 통한 파라미터 개선 기반의 예측 시스템 및 방법
JP6896590B2 (ja) 予知モデル維持システム、予知モデル維持方法及び予知モデル維持プログラム
Shi et al. A comparison of single and multiple changepoint techniques for time series data
WO2012117966A1 (ja) データ判別装置、方法及びプログラム
EP3899758A1 (en) Methods and systems for automatically selecting a model for time series prediction of a data stream
KR102533460B1 (ko) 시계열 예측을 위한 어텐션 기반 스태킹 방법
KR101785547B1 (ko) 주기성 시계열 데이터의 변동 추정 장치 및 방법
CN113537630B (zh) 业务预测模型的训练方法及装置
US20220108184A1 (en) Method and device for training a machine learning system
CN108665052A (zh) 果蝇算法优化广义回归神经网络的方法和装置
Chang et al. A comparison of classifiers for intelligent machine usage prediction
Park et al. On the long-term predictive capability of data-driven software reliability model: an empirical evaluation
CN108984851B (zh) 一种带时延估计的加权高斯模型软测量建模方法
Herrema et al. Evaluation of feasible machine learning techniques for predicting the time to fly and aircraft speed profile on final approach
CN108009859A (zh) 农产品价格波动预警方法及设备

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
X701 Decision to grant (after re-examination)
GRNT Written decision to grant