KR102499412B1 - 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법 - Google Patents

데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법 Download PDF

Info

Publication number
KR102499412B1
KR102499412B1 KR1020210127493A KR20210127493A KR102499412B1 KR 102499412 B1 KR102499412 B1 KR 102499412B1 KR 1020210127493 A KR1020210127493 A KR 1020210127493A KR 20210127493 A KR20210127493 A KR 20210127493A KR 102499412 B1 KR102499412 B1 KR 102499412B1
Authority
KR
South Korea
Prior art keywords
data
cluster
clustering
industrial process
process data
Prior art date
Application number
KR1020210127493A
Other languages
English (en)
Inventor
김정환
조형태
한인수
임종구
Original Assignee
한국생산기술연구원
지에스칼텍스 주식회사
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생산기술연구원, 지에스칼텍스 주식회사 filed Critical 한국생산기술연구원
Priority to KR1020210127493A priority Critical patent/KR102499412B1/ko
Application granted granted Critical
Publication of KR102499412B1 publication Critical patent/KR102499412B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/067Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0633Workflow analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • G06Q10/06375Prediction of business process outcome or impact based on a proposed change
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Development Economics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계; (b) 군집화된 상기 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계; (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계; (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계; (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및 (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 포함하는 산업 공정 데이터 예측 방법에 관한 것이다. 본 발명에 따른 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법은 공정에서 실시간으로 수집되는 공정 데이터를 이용한 데이터 기반 예측 모델을 개발함으로써, 훈련 및 테스트 데이터를 공통된 특성을 가지는 군집으로 분류하여 예측 모델을 개발하고 평가할 수 있어 높은 예측 성능을 보이는 일반화 모델을 개발할 수 있다.

Description

데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법{DEVELOPMENT OF INDUSTRIAL PROCESS PREDICTIVE MODEL BASED ON DATA CHARACTERISTIC AND PREDICTION METHOD OF INDUSTRIAL PROCESS DATA USING SAME}
본 발명은 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법에 관한 것으로서, 보다 상세하게는 공정에서 실시간으로 수집되는 공정 데이터를 이용한 데이터 기반 예측 모델을 개발할 수 있는 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법에 관한 것이다.
일반적으로 산업 공정의 생산 규모는 연간 수백톤에서 수십만톤으로 크기 때문에 하나의 제품을 생산하기 위해 많은 단위 공정이 필요하고, 각 단위 공정에도 수많은 장치와 센서들이 설치되어 있다.
하지만 센서에서 수집되는 데이터들은 다양한 운전 외란 (온도, 습도, 제품 품질) 등에 따라 달라질 수 있으며, 계기에 물리적인 오차에 의해 정확한 운전 조건에 대한 정보를 갖고 있지 않다. 따라서 작업자가 수집된 공정 데이터를 판단하여 경험적으로 공정 운전 조건을 변경하기 때문에 작업자의 숙련도에 따라 공정의 운전 효율이 달라진다. 또한 외란 뿐만 아니라 장치의 오류 및 노후, 정기 유지보수 여부 등에 시간에 따라 데이터의 특성이 달라지기 때문에 작업자의 경험이 적용되지 않는 경우도 발생하며, 이에 따라 데이터의 분석을 통해 작업자가 공정을 수동으로 운전 및 제어를 수행하면 변화에 즉각적으로 대응하지 못하며 효율적이지 못하다. 또한 공정의 원시 데이터는 이전 시간의 운전 조건이 추후 다른 시간의 데이터에 영향을 주는 시계열 특성을 갖고 있으며, 공정의 운전 상태(공정 가동운전(Start-up), 예비 운전, 실제 운전, 운전중지(Shut-down))와 외란에 의해 같은 조건의 데이터를 사용하더라도 동일한 데이터가 존재할 수 없다.
따라서 이런 공정의 특성(외란, 운전조건, 제품 품질) 등을 고려하여 일반적인 예측 모델을 개발하기 위해서는 데이터의 특성에 따라 분류하고 예측할 수 있는 모델을 개발하여야 한다.
본 발명의 목적은 상기의 문제점을 해결하기 위한 것으로, 공정에서 실시간으로 수집되는 공정 데이터를 이용한 데이터 기반 예측 모델을 개발함으로써, 훈련 및 테스트 데이터를 공통된 특성을 가지는 군집으로 분류하여 예측 모델을 개발하고 평가할 수 있어 높은 예측 성능을 보이는 일반화 모델을 개발할 수 있는 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법을 제공하는데 있다.
또한 본 발명의 다른 목적은 시간의 흐름에 따라 연속적으로 생성되는 공정 중, 외부 운전 변수 및 환경에 의해 공정 데이터가 일정한 반복적인 패턴을 갖지 않고 데이터의 범위가 운전 상황(공정 가동운전(Start-up), 정상운전(Steay-state), 중지운전(Shut-down) 등)에 따라 넓은 범위를 범위를 갖는 데이터들에 대해 공정 데이터 자체가 갖는 데이터 특성을 기반으로 하여 높은 정밀도의 예측 모델을 개발할 수 있는 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법을 제공하는데 있다.
또한 본 발명의 다른 목적은 공정 데이터의 시간에 상관없이 데이터 자체의 특성을 기반으로 예측 모델을 개발하기 때문에 공정의 대표적인 특징들을 파악할 수 있는 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법을 제공하는데 있다.
본 발명의 일 측면에 따르면, (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계; (b) 상기 군집화된 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계; (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계; (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계; (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및 (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 포함하는 산업 공정 데이터 예측 방법이 제공된다.
단계 (a)에서, 상기 군집화 방법이 K-평균 군집화(K-means Clustering), 디비스캔 군집화(DBSCAN Clustering), 유사도 전파 군집화(Affinity Propagation Clustering), 계층적 군집화(Hierarchical Clustering) 및 스펙트럴 군집화(Spectral Clustering)로 이루어진 군으로부터 선택된 어느 하나에 의해 수행될 수 있다.
상기 단계 (c)의 상기 군집화가 단계 (a)의 상기 군집화와 동일한 조건으로 수행될 수 있다.
상기 단계 (b)의 상기 군집별 후보 예측 모델이 초매개 변수를 추가로 적용하여 개발된 것일 수 있다.
상기 초매개 변수가 최적화기(Optimizer), 활성화 함수(Activation function), 학습 속도(Learning rate), 배치 크기(Batch size), 및 에포크(Epoch), 드랍 아웃(Drop-out), 조기 종료(Early-stopping)로 이루어진 군으로부터 선택된 1종 이상을 포함할 수 있다.
상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 지도학습, 비지도 학습 및 강화학습으로 이루어진 군으로부터 선택된 어느 하나에 의해 개발될 수 있다.
상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 LSTM(Long Short Term Memory), GRU(Gated Recurrent Units) 및 RNN(Recurrent Neural Networks)로 이루어진 군으로부터 선택된 어느 하나를 사용해 개발될 수 있다.
상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 Adam, SGD, Adagrad, Adadelta, Momentum, 및 RMSprop로 이루어진 군으로부터 선택된 어느 하나의 최적화 함수를 사용하여 손실함수(error)가 최소가 되도록 수행될 수 있다.
상기 단계 (d)의 상기 검증이 아래 식 1로 표시되는 정확도(R2) 및 아래 식 2로 표시되는 정밀도(RMSE, root mean square error)로 이루어진 군으로부터 선택된 1종 이상을 사용하여 수행될 수 있다.
[식 1]
Figure 112021110857571-pat00001
[식 2]
Figure 112021110857571-pat00002
상기 식 1 및 식 2에서
N은 데이터 갯수이고,
Figure 112021110857571-pat00003
는 실제 데이터이고,
Figure 112021110857571-pat00004
는 실제 데이터의 평균값이고,
Figure 112021110857571-pat00005
는 군집별 후보 예측 모델을 이용하여 예측한 값이다.
단계 (d)의 상기 정확도(R2)가 C1 내지 1 (C1은 정확도 기준치)의 범위에 속하는 지 및/또는 상기 정밀도(NRMSE)가 0 내지 C2(C2는 정밀도 기준치)의 범위에 속하는 지를 기준으로 수행될 수 있다.
상기 C1이 0.9≤C1≤1이고, C2가 0≤C2≤0.1일 수 있다.
단계 (d)의 상기 정확도가 기준치 미만인 경우 및/또는 상기 정밀도가 기준치 초과인 경우, 상기 군집별 후보 예측 모델의 초매개 변수를 변경하여 상기 군집별 후보 예측 모델을 개선하는 단계 (d ')를 추가로 포함하고, 상기 개선된 군집별 후보 예측 모델로 단계 (b) 내지 (d)를 다시 수행할 수 있다.
단계 (a) 이전에, (a-1) 공정데이터를 수집하는 단계; 및 (a-2) 상기 공정데이터를 전처리하여 훈련 데이터 및 테스트 데이터를 도출하는 단계;를 포함할 수 있다.
단계 (a-2)에서, 상기 전처리가 상기 공정데이터의 잡음 제거 (Noise), 이상값 탐지(Outlier (or anomaly detection), 결측치 (Missing value, Na(Not Available) 제거를 수행하는 단계일 수 있다.
상기 공정데이터가 원료조성, 원료의 유량속도, 원료 중 조성성분의 함량, 제품순도, 공정수율, 스팀의 유량속도, 리플럭스(reflux) 유량속도, 냉각수 유량속도, 증류탑의 각 m번째 단의 온도(m은 1 내지 500 중에서 선택된 어느 하나의 정수), 증류탑의 하부(bottom) 압력, 증류탑의 상부(overhead) 압력, 증류탑 상부(overhead)에서 나가는 제품의 유량속도, 증류탑 하부(bottom)에서 나가는 제품의 유량속도 및 증류탑 측면(side)에서 나가는 제품의 유량속도로 이루어진 군으로부터 선택된 1종 이상을 포함할 수 있다.
본 발명의 다른 일 측면에 따르면, 산업 공정 데이터 예측하기 위한 컴퓨터가 (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계; (b) 상기 군집화된 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계; (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계; (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계; (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및 (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 포함하는 산업 공정 데이터 예측 방법을 수행하도록 하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체가 제공된다.
본 발명의 다른 일 측면에 따르면, 공정데이터를 포함하는 변수를 수신하는 통신부; 상기 군집별 후보 예측 모델을 학습시키고 검증하여 산업 공정 데이터를 예측하는 프로세서; 및 상기 프로세서가 미래의 산업 공정 데이터를 예측함에 따라 필요한 저장 공간을 제공하는 저장부;를 포함하는 산업 공정 데이터 예측 시스템이 제공된다.
본 발명에 따른 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법은 공정에서 실시간으로 수집되는 공정 데이터를 이용한 데이터 기반 예측 모델을 개발함으로써, 훈련 및 테스트 데이터를 공통된 특성을 가지는 군집으로 분류하여 예측 모델을 개발하고 평가할 수 있어 높은 예측 성능을 보이는 일반화 모델을 개발할 수 있다.
또한 본 발명은 시간의 흐름에 따라 연속적으로 생성되는 공정 중, 외부 운전 변수 및 환경에 의해 공정 데이터가 일정한 반복적인 패턴을 갖지 않고 데이터의 범위가 운전 상황(공정 가동운전(Start-up), 정상운전(Steay-state), 중지운전(Shut-down) 등)에 따라 넓은 범위를 범위를 갖는 데이터들에 대해 공정 데이터 자체가 갖는 데이터 특성을 기반으로 하여 높은 정밀도의 예측 모델을 개발할 수 있다.
또한 본 발명은 공정 데이터의 시간에 상관없이 데이터 자체의 특성을 기반으로 예측 모델을 개발하기 때문에 공정의 대표적인 특징들을 파악할 수 있다. 특히 이전 공정 데이터인 훈련 데이터의 특성과 동일하게 현재 또는 미래 데이터인 테스트 데이터를 군집화하는 경우, 나타나는 특성에 따라 공정의 특성 변화를 파악할 수 있다. 예를 들면 공정의 정기보수, 노후화, 특정 설비의 고장 유무에 따라 공정 데이터가 달라지기 때문에 데이터 특성 기반 예측 모델 개발시 공정의 특성 변화를 파악할 수 있다.
또한 본 발명은 센서를 통해 공정 데이터를 수집하는 공정에 적용 가능하며 그 중에서, 공정 규모가 크고 외란에 의해 운전 조건이 크게 달라지는 대형 산업 공정에 효과적으로 적용할 수 있다.
도 1은 본 발명의 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법의 단계를 보여주는 알고리즘이다.
도 2는 본 발명의 군집화 방법 중 하나로서, K 평균 군집화를 보여주는 도면이다(군집 개수(K) = 2).
도 3은 본 발명의 실시예 1에 사용된 2,3-Butanediol(BDO) 증류 공정의 모식도이다.
도 4는 본 발명의 실시예 1에 사용된 2,3-Butanediol(BDO) 공정 데이터이다.
도 5는 군집 개수(K)가 1인 경우의 훈련 및 테스트 데이터 군집 결과 및 예측 결과이다.
도 6은 군집 개수(K)가 5인 경우의 훈련 및 테스트 데이터 군집 결과 및 예측 결과이다.
도 7은 군집 개수(K)가 10인 경우의 훈련 및 테스트 데이터 군집 결과 및 예측 결과이다.
도 8은 군집 개수(K)가 20인 경우의 훈련 및 테스트 데이터 군집 결과 및 예측 결과이다.
본 발명은 다양한 변환을 가할 수 있고 여러 가지 실시예를 가질 수 있는 바, 특정 실시예들을 예시하고 상세한 설명에 상세하게 설명하고자 한다. 그러나, 이는 본 발명을 특정한 실시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변환, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다. 본 발명을 설명함에 있어서 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우 그 상세한 설명을 생략한다.
또한, 이하에서 사용된 제1, 제 2등과 같이 서수를 포함하는 용어는 다양한 구성 요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되지는 않는다. 상기 용어들은 하나의 구성 요소를 다른 구성요소로부터 구별하는 목적으로만 사용된다. 예를 들어, 본 발명의 권리 범위를 벗어나지 않으면서 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.
또한, 어떤 구성요소가 다른 구성요소 상에 "형성되어" 있다거나 "적층되어" 있다고 언급될 때에는, 그 다른 구성요소의 표면 상의 전면 또는 일면에 직접 부착되어 형성되어 있거나 적층되어 있을 수도 있지만, 중간에 다른 구성요소가 더 존재할 수도 있다고 이해되어야 할 것이다.
단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서 "포함하다" 또는 "가지다" 등의 용어는 명세서상에 기재된 특징, 숫자, 단계, 동작, 구성요서, 부품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.
도 1은 본 발명의 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법의 단계를 보여주는 알고리즘이다. 이하, 도 1을 참조하여 본 발명의 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법에 대해 설명하도록 한다.
본 발명은 (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계; (b) 상기 군집화된 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계; (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계; (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계; (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및 (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 포함하는 산업 공정 데이터 예측 방법이 제공된다.
단계 (a)에서, 상기 군집화 방법이 K-평균 군집화(K-means Clustering), 디비스캔 군집화(DBSCAN Clustering), 유사도 전파 군집화(Affinity Propagation Clustering), 계층적 군집화(Hierarchical Clustering) 및 스펙트럴 군집화(Spectral Clustering)로 이루어진 군으로부터 선택된 어느 하나에 의해 수행될 수 있고, 바람직하게는 K-평균 군집화(K-means Clustering)에 의해 수행될 수 있다.
본 발명은 훈련 데이터에 포함된 데이터들은 시간에 따라 특성이 다른 데이터들이기 때문에, 각 데이터들의 특성에 따라 분류하여야 한다. 따라서 훈련 데이터들을 분류하기 위해 K개의 군집 중심을 설정하여 각 데이터를 가장 가까운 군집 중심으로 할당하여 분류하는 K 평균 군집화 기법을 사용하였다. 예를 들어 훈련 데이터를 2개의 군집으로 분류를 시키고자 할 때, 도 2와 같이 군집화할 수 있다. 도 2를 참조하면, 먼저 군집화하고자 하는 데이터를 가장 가까운 초기 중심 위치로 할당하며, 모든 데이터를 할당한 후 각 군집 내의 중심위치를 군집의 데이터의 평균값이 되도록 수정하고, 다시 모든 데이터를 가장 가까운 군집에 이동시키는 작업을 반복하여 더 이상 군집 중심이 이동하지 않을 때 최종적으로 데이터를 군집별로 분류시킨다. 또한 이 때 최종적인 군집 중심의 정보를 저장하여 군집화 모델로 저장한다. 이는 데이터의 특성이 훈련 데이터와 다르게 나타나는 테스트 데이터들에 대해서도 동일한 조건의 군집으로 분류하기 위함이다.
상기 단계 (b)의 상기 군집별 후보 예측 모델이 초매개 변수를 추가로 적용하여 개발된 것일 수 있다.
구체적으로 단계 (b)는 군집별로 분류된 훈련 데이터를 이용하여, 각 군집별 후보 예측 모델을 개발한다. 이 때 예측 모델을 개발하기 위한 모델 알고리즘 및 초매개변수 설정은 각 군집별로 동일하게 사용할 수도 있고, 각 군집 데이터에 최적화된 다른 값들을 사용할 수 있다.
상기 초매개 변수가 최적화기(Optimizer), 활성화 함수(Activation function), 학습 속도(Learning rate), 배치 크기(Batch size), 및 에포크(Epoch) 드랍 아웃(Drop-out), 조기 종료(Early-stopping)로 이루어진 군으로부터 선택된 1종 이상을 포함할 수 있다.
상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 지도학습, 비지도 학습 및 강화학습으로 이루어진 군으로부터 선택된 어느 하나에 의해 개발될 수 있다.
상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 LSTM(Long Short Term Memory), GRU(Gated Recurrent Units) 및 RNN(Recurrent Neural Networks)로 이루어진 군으로부터 선택된 어느 하나를 사용해 개발될 수 있다.
상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 Adam, SGD, Adagrad, Adadelta, Momentum, 및 RMSprop로 이루어진 군으로부터 선택된 어느 하나의 최적화 함수를 사용하여 손실함수(error)가 최소가 되도록 수행될 수 있다.
상기 단계 (c)의 상기 군집화가 단계 (a)의 상기 군집화와 동일한 조건으로 수행될 수 있다.
구체적으로 단계 (c)는 단계 (a)에서 개발한 군집화 모델을 바탕으로 다른 기간의 공정 데이터인 테스트 데이터를 분류시킨다. 이 때 군집화 모델은 훈련데이터를 분류시킬 때 사용했던 군집 중심에 대한 정보를 가지고 있기 때문에 테스트 데이터들은 반드시 훈련 데이터가 가지고 있는 특성과 최대한 비슷한 특성을 갖도록 분류된다. 예를 들어 훈련 데이터를 A,B,C,D,E의 5개의 군집으로 분류를 시키는 군집화 모델을 개발하고, 이 군집화 모델을 이용하여 테스트 데이터를 분류시킬 때, 테스트 데이터가 정확하게 A,B,C,D,E의 특성과 동일하지 않더라도, 그 중에서 가장 가까운 특성으로 분류되며, 분류된 테스트 데이터의 특성은 훈련 데이터의 일부일 수도 있다. 예를 들어 A,B,C,D,E로 훈련 데이터를 분류하는 군집화 모델을 사용하여 테스트 데이터를 분류할 경우, 테스트 데이터는 A,D,E의 군집으로 분류될 수 있으며, B나 C의 특성으로 나누어지지 않을 수도 있다.
또한 단계 (c)에서 다른 기간의 공정 데이터인 테스트 데이터는 훈련 데이터와 다른 공정 특성을 가질 수 있다. 하지만 공정 특성 기반으로 예측 모델을 개발하기 위해 테스트 데이터는 훈련 데이터와 동일한 조건으로 군집화 시킬 필요가 있다.
상기 군집화된 훈련 데이터 및 군집별 후보 예측 모델이 k개 (k는 1 이상의 정수) 일 수 있고, 상기 군집화된 테스트 데이터가 n개 (n은 1 이상의 정수) 일 수 있고, n은 k보다 작거나 같을 수 있다.
상기 단계 (d)의 상기 검증이 아래 식 1로 표시되는 정확도(R2) 및 아래 식 2로 표시되는 정밀도(RMSE, root mean square error)로 이루어진 군으로부터 선택된 1종 이상을 사용하여 수행될 수 있다.
[식 1]
Figure 112021110857571-pat00006
[식 2]
Figure 112021110857571-pat00007
상기 식 1 및 식 2에서
N은 데이터 갯수이고,
Figure 112021110857571-pat00008
는 실제 데이터이고,
Figure 112021110857571-pat00009
는 실제 데이터의 평균값이고,
Figure 112021110857571-pat00010
는 군집별 후보 예측 모델을 이용하여 예측한 값이다.
단계 (d)의 상기 정확도(R2)가 C1 내지 1 (C1은 정확도 기준치)의 범위에 속하는 지 및/또는 상기 정밀도(NRMSE)가 0 내지 C2(C2는 정밀도 기준치)의 범위에 속하는 지를 기준으로 수행될 수 있다.
상기 C1이 0.9≤C1≤1이고, C2가 0≤C2≤0.1일 수 있다.
단계 (d)의 상기 정확도가 기준치 미만인 경우 및/또는 상기 정밀도가 기준치 초과인 경우, 상기 군집별 후보 예측 모델의 초매개 변수를 변경하여 상기 군집별 후보 예측 모델을 개선하는 단계 (d ')를 추가로 포함하고, 상기 개선된 군집별 후보 예측 모델로 단계 (b) 내지 (d)를 다시 수행할 수 있다.
구체적으로 단계 (d)는 특정한 군집으로 분류된 테스트 데이터(예를 들어 A 군집)는 동일한 특성을 갖는 훈련 데이터(예를 들어 A 군집)로 개발한 후보 예측 모델을 이용하여 예측을 수행한다. 모든 테스트 데이터의 군집에 대응하는 군집별 후보 예측 모델을 사용하여 예측을 수행한 후 모든 테스트 데이터에 대한 예측 성능을 비교하여 예측 모델의 성능을 평가한다. 성능 평가 지표로 결정계수(Determinant Coefficient, R2)와 평균제곱근오차(Root mean squared error, RMSE)를 사용하였다. 평가 지표는 다른 지표를 사용하여도 무방하다.
R2 는 예측 모델이 얼마나 설명력이 높은지 판단하는 지표로써, 0과 1사이의 값을 가지며 1에 가까울수록 높은 설명력을 갖는다.
또한 RMSE는 평균제곱근편차 (Root mean square error)로써 예측값과 실제값의 차이인 잔차의 제곱합을 산술평균한 값의 제곱근으로써 예측값이 얼마나 실제값과 다른지를 나타낸다. R2과 반대로 RMSE는 예측값과 실제값의 잔차를 나타내기 때문에 0에 가까울수록 예측 모델의 성능이 높다.
구체적으로 단계 (e) 및 (f)는 단계 (d)에서 군집별 후보 예측 모델의 성능 평가를 통과한 군집별 선정 예측 모델을 포함하는 k개의 군집별 선정 예측 모델 pool을 도출하고, 상기 개의 군집별 선정 예측 모델 pool을 사용하여 미래의 산업 공정 데이터를 예측할 수 있다.
단계 (a) 이전에, (a-1) 공정데이터를 수집하는 단계; 및 (a-2) 상기 공정데이터를 전처리하여 훈련 데이터 및 테스트 데이터를 도출하는 단계;를 포함할 수 있다.
단계 (a-2)에서, 상기 전처리가 상기 공정데이터의 잡음 제거 (Noise), 이상값 탐지(Outlier (or anomaly detection), 결측치 (Missing value, Na(Not Available) 제거를 수행하는 단계일 수 있다.
구체적으로 단계 (a-1) 및 (a-2)는 모델에 사용하는 공정 원시 데이터(Raw data)가 잡음, 이상값, 결측치 등을 포함하기 때문에 예측 모델 개발에 사용하기 전에 적절한 데이터 전처리를 수행해야 한다. 또한 예측 모델에 불필요한 데이터들을 제외하고, 예측 모델에 긍정적인 영향을 주는 데이터들만을 선택하여 예측 모델을 개발에 사용하였다. 또한 데이터 전처리 및 특성 선택을 통해 선택된 데이터는 예측 모델을 개발하기 위한 훈련 데이터와 개발된 모델을 검증하기 위한 테스트 데이터로 나누어 사용하였다. 모델을 개발할 때 훈련 데이터의 정보를 제외한 정보가 사용되는 것을 방지하기 위해 두 데이터는 다른 기간의 데이터 세트를 사용하여야 한다.
상기 공정데이터가 원료조성, 원료의 유량속도, 원료 중 조성성분의 함량, 제품순도, 공정수율, 스팀의 유량속도, 리플럭스(reflux) 유량속도, 냉각수 유량속도, 증류탑의 각 m번째 단의 온도(m은 1 내지 500 중에서 선택된 어느 하나의 정수), 증류탑의 하부(bottom) 압력, 증류탑의 상부(overhead) 압력, 증류탑 상부(overhead)에서 나가는 제품의 유량속도, 증류탑 하부(bottom)에서 나가는 제품의 유량속도 및 증류탑 측면(side)에서 나가는 제품의 유량속도로 이루어진 군으로부터 선택된 1종 이상을 포함할 수 있다.
본 발명의 다른 일 측면에 따르면, 산업 공정 데이터 예측하기 위한 컴퓨터가 (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계; (b) 상기 군집화된 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계; (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계; (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계; (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및 (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 수행하도록 하기 위한 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체가 제공된다.
본 발명의 다른 일 측면에 따르면, 공정데이터를 포함하는 변수를 수신하는 통신부; 상기 군집별 후보 예측 모델을 학습시키고 검증하여 산업 공정 데이터를 예측하는 프로세서; 및 상기 프로세서가 미래의 산업 공정 데이터를 예측함에 따라 필요한 저장 공간을 제공하는 저장부;를 포함하는 산업 공정 데이터 예측 시스템이 제공된다.
[실시예]
실시예 1: 증류탑 단의 온도 예측
본 발명의 하나의 실시예로서 2,3-BDO(2,3-butanediol) 증류 공정에 적용하였으며 자세한 내용은 다음과 같다.
도 3은 본 발명의 실시예 1에 사용된 2,3-BDO 증류 공정의 모식도이고, 2,3-BDO(2,3-butanediol) 증류 공정은 50wt%의 2,3-BDO 원료를 증류탑을 이용하여 고순도(99%이상)의 2,3-BDO 제품으로 증류하는 것을 목표로 하며, 실시예 1에서 사용한 데이터의 종류는 총 7개로, 도 2의 A-G로 구분하여 표기하였으며, 예측 모델 입력(Input), 출력(Output) 변수는 표 1과 같다. 예측 모델을 개발할 때 훈련 데이터에서 입력 및 출력 변수를 모두 사용하여 예측 모델을 개발하며, 개발된 모델에 테스트 데이터의 입력 변수들을 사용하여 출력 변수를 예측하였다.
변수 구분 설명 단위
출력 A 2,3-BDO 생산단 온도 °C
입력 B 스팀 유량 kg/hr
C 증류탑 하단 수위 %
D 환류량 L/hr
E 원료 온도 °C
F 증류탑 내부 온도 °C
G 환류 드럼 온도 °C
또한 도 4는 본 발명의 실시예 1에 사용된 2,3-BDO의 실제 공정 데이터이고, 도 4를 참조하면, 2,3-BDO 공정의 운전 데이터를 월에 따라 4개의 데이터 세트로 사용하였으며, 훈련 데이터로 7월, 10월, 11월의 데이터를 사용하고, 테스트 데이터로 12월의 데이터를 사용하였다.
실제 공정 데이터를 사용함으로써, 훈련 데이터의 군집 개수(K=1, 5, 10, 20)에 따른 훈련 및 테스트 데이터의 군집 결과 및 테스트 데이터의 예측 결과를 분석하였으며, 그 결과를 도 5 내지 8 및 표 2에서 확인할 수 있다.
군집개수 (K) 성능 평가 지표
R2 NRMSE
1 (도 5) 0.750 0.500
5 (도 6) 0.319 0.825
10 (도 7) 0.951 0.220
20 (도 8) 0.948 0.228
도 5 내지 8 및 표 2를 참조하면, 테스트 데이터에 대한 예측 성능은 군집 개수에 따라 향상되었다. 하지만 군집 개수가 많아질 경우 (K=20), 군집의 개수가 데이터가 가질 수 있는 특성의 개수보다 많아지게 되어 예측 성능이 일부 하락하는 모습을 보인다. 따라서 데이터 특성 기반 산업 공정 예측을 개발하기 위해서는 공정의 특성을 파악하여 알맞은 군집 수를 제시하여야 한다.
본 발명의 범위는 상기 상세한 설명보다는 후술하는 특허 청구 범위에 의하여 나타내어지며, 특허 청구 범위의 의미 및 범위 그리고 그 균등 개념으로부터 도출되는 모든 변경 또는 변형된 형태가 본 발명의 범위에 포함되는 것으로 해석되어야 한다.

Claims (17)

  1. 컴퓨터가 하기 단계를 수행하는 산업 공정 데이터 예측 방법에 있어서,
    (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계;
    (b) 상기 군집화된 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계;
    (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계;
    (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계;
    (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및
    (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 포함하고,
    상기 단계 (d)의 상기 검증이 아래 식 1로 표시되는 정확도(R2) 및 아래 식 2로 표시되는 정밀도(RMSE, root mean square error)로 이루어진 군으로부터 선택된 1종 이상을 사용하여 수행되는 것인, 산업 공정 데이터 예측 방법.
    [식 1]
    Figure 112022139076958-pat00024

    [식 2]
    Figure 112022139076958-pat00025

    상기 식 1 및 식 2에서
    N은 데이터 갯수이고,
    Figure 112022139076958-pat00026
    는 실제 데이터이고,
    Figure 112022139076958-pat00027
    는 실제 데이터의 평균값이고,
    Figure 112022139076958-pat00028
    는 군집별 후보 예측 모델을 이용하여 예측한 값이다.
  2. 제1항에 있어서,
    단계 (a)에서, 상기 군집화 방법이 K-평균 군집화(K-means Clustering), 디비스캔 군집화(DBSCAN Clustering), 유사도 전파 군집화(Affinity Propagation Clustering), 계층적 군집화(Hierarchical Clustering) 및 스펙트럴 군집화(Spectral Clustering)로 이루어진 군으로부터 선택된 어느 하나에 의해 수행되는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  3. 제1항에 있어서,
    상기 단계 (c)의 상기 군집화가 단계 (a)의 상기 군집화와 동일한 조건으로 수행되는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  4. 제1항에 있어서,
    상기 단계 (c)의 상기 군집별 후보 예측 모델이 초매개 변수를 추가로 적용하여 개발된 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  5. 제4항에 있어서,
    상기 초매개 변수가 최적화기(Optimizer), 활성화 함수(Activation function), 학습 속도(Learning rate), 배치 크기(Batch size), 및 에포크(Epoch) 드랍 아웃(Drop-out), 조기 종료(Early-stopping), 로 이루어진 군으로부터 선택된 1종 이상을 포함하는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  6. 제1항에 있어서,
    상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 지도학습, 비지도 학습 및 강화학습으로 이루어진 군으로부터 선택된 어느 하나에 의해 개발되는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  7. 제1항에 있어서,
    상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 LSTM(Long Short Term Memory), GRU(Gated Recurrent Units) 및 RNN(Recurrent Neural Networks)로 이루어진 군으로부터 선택된 어느 하나를 사용해 개발되는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  8. 제1항에 있어서,
    상기 군집별 후보 예측 모델 또는 상기 군집별 선정 예측 모델이 Adam, SGD, Adagrad, Adadelta, Momentum, 및 RMSprop로 이루어진 군으로부터 선택된 어느 하나의 최적화 함수를 사용하여 손실함수(error)가 최소가 되도록 수행되는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  9. 삭제
  10. 제1항에 있어서,
    단계 (d)의 상기 정확도(R2)가 C1 내지 1 (C1은 정확도 기준치)의 범위에 속하는 지 및/또는 상기 정밀도(RMSE)가 0 내지 C2(C2는 정밀도 기준치)의 범위에 속하는 지를 기준으로 수행되는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  11. 제10항에 있어서,
    상기 C1이 0.9≤C1≤1이고, C2가 0≤C2≤0.1인 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  12. 제1항에 있어서,
    단계 (d)의 상기 정확도가 기준치 미만인 경우 및/또는 상기 정밀도가 기준치 초과인 경우,
    상기 군집별 후보 예측 모델의 초매개 변수를 변경하여 상기 군집별 후보 예측 모델을 개선하는 단계 (d ')를 추가로 포함하고,
    상기 개선된 군집별 후보 예측 모델로 단계 (b) 내지 (d)를 다시 수행하는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  13. 제1항에 있어서,
    단계 (a) 이전에,
    (a-1) 공정데이터를 수집하는 단계;
    (a-2) 상기 공정데이터를 전처리하여 훈련 데이터 및 테스트 데이터를 도출하는 단계;를 포함하는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  14. 제13항에 있어서,
    단계 (a-2)에서,
    상기 전처리가 상기 공정데이터의 잡음 제거 (Noise), 이상값 탐지(Outlier (or anomaly detection), 결측치 (Missing value, Na(Not Available) 제거를 수행하는 단계인 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  15. 제13항에 있어서,
    상기 공정데이터가 원료조성, 원료의 유량속도, 원료 중 조성성분의 함량, 제품순도, 공정수율, 스팀의 유량속도, 리플럭스(reflux) 유량속도, 냉각수 유량속도, 증류탑의 각 m번째 단의 온도(m은 1 내지 500 중에서 선택된 어느 하나의 정수), 증류탑의 하부(bottom) 압력, 증류탑의 상부(overhead) 압력, 증류탑 상부(overhead)에서 나가는 제품의 유량속도, 증류탑 하부(bottom)에서 나가는 제품의 유량속도 및 증류탑 측면(side)에서 나가는 제품의 유량속도로 이루어진 군으로부터 선택된 1종 이상을 포함하는 것을 특징으로 하는 산업 공정 데이터 예측 방법.
  16. 산업 공정 데이터 예측하기 위한 컴퓨터가
    (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계;
    (b) 상기 군집화된 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계;
    (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계;
    (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계;
    (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및
    (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 수행하도록 하기 위한 것이고,
    상기 단계 (d)의 상기 검증이 아래 식 1로 표시되는 정확도(R2) 및 아래 식 2로 표시되는 정밀도(RMSE, root mean square error)로 이루어진 군으로부터 선택된 1종 이상을 사용하여 수행되는 것인, 프로그램을 기록한 컴퓨터로 읽을 수 있는 매체.
    [식 1]
    Figure 112022139076958-pat00029

    [식 2]
    Figure 112022139076958-pat00030

    상기 식 1 및 식 2에서
    N은 데이터 갯수이고,
    Figure 112022139076958-pat00031
    는 실제 데이터이고,
    Figure 112022139076958-pat00032
    는 실제 데이터의 평균값이고,
    Figure 112022139076958-pat00033
    는 군집별 후보 예측 모델을 이용하여 예측한 값이다.
  17. 공정데이터를 포함하는 변수를 수신하는 통신부;
    군집별 후보 예측 모델을 학습시키고 검증하여 산업 공정 데이터를 예측하는 프로세서; 및
    상기 프로세서가 미래의 산업 공정 데이터를 예측함에 따라 필요한 저장 공간을 제공하는 저장부;를 포함하고,
    상기 프로세서가
    (a) 군집화 방법을 사용하여 훈련 데이터를 복수의 군집으로 군집화하는 군집화 모델을 개발하고, 상기 군집화 모델을 사용하여 군집화된 훈련 데이터를 도출하는 단계;
    (b) 상기 군집화된 훈련 데이터를 사용하여 복수의 군집별 후보 예측 모델을 포함하는 군집별 후보 예측 모델 풀(pool)을 개발하는 단계;
    (c) 상기 군집화 모델을 사용하여 테스트 데이터를 복수의 군집으로 군집화하여 군집화된 테스트 데이터를 도출하는 단계;
    (d) 상기 군집화된 테스트 데이터를 사용하여 복수의 상기 군집별 후보 예측 모델의 성능을 각각 검증하는 단계;
    (e) 상기 검증을 통과한 군집별 선정 예측 모델을 포함하는 군집별 선정 예측 모델 풀(pool)을 도출하는 단계; 및
    (f) 상기 군집별 선정 예측 모델 풀을 이용하여 산업 공정 데이터를 예측하는 단계;를 포함하고,
    상기 단계 (d)의 상기 검증이 아래 식 1로 표시되는 정확도(R2) 및 아래 식 2로 표시되는 정밀도(RMSE, root mean square error)로 이루어진 군으로부터 선택된 1종 이상을 사용하여 수행되는 것인, 산업 공정 데이터 예측 시스템.
    [식 1]
    Figure 112022139076958-pat00034

    [식 2]
    Figure 112022139076958-pat00035

    상기 식 1 및 식 2에서
    N은 데이터 갯수이고,
    Figure 112022139076958-pat00036
    는 실제 데이터이고,
    Figure 112022139076958-pat00037
    는 실제 데이터의 평균값이고,
    Figure 112022139076958-pat00038
    는 군집별 후보 예측 모델을 이용하여 예측한 값이다.
KR1020210127493A 2021-09-27 2021-09-27 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법 KR102499412B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020210127493A KR102499412B1 (ko) 2021-09-27 2021-09-27 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020210127493A KR102499412B1 (ko) 2021-09-27 2021-09-27 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법

Publications (1)

Publication Number Publication Date
KR102499412B1 true KR102499412B1 (ko) 2023-02-13

Family

ID=85202819

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210127493A KR102499412B1 (ko) 2021-09-27 2021-09-27 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법

Country Status (1)

Country Link
KR (1) KR102499412B1 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102644147B1 (ko) 2023-08-10 2024-03-06 (주)인터웹 대규모 클래스 분류가 가능한 인공지능 예측 시스템 및 그 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100987168B1 (ko) * 2008-10-31 2010-10-11 한국전력공사 원격계측 전력 부하패턴의 분류 및 예측 방법
JP2015082259A (ja) * 2013-10-23 2015-04-27 本田技研工業株式会社 時系列データ予測装置、時系列データ予測方法、及びプログラム
KR102139358B1 (ko) * 2020-04-22 2020-07-29 한국생산기술연구원 머신러닝 기반 플랫폼을 이용한 공정제어방법, 그를 수행하기 위한 컴퓨터 프로그램 매체 및 공정제어장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100987168B1 (ko) * 2008-10-31 2010-10-11 한국전력공사 원격계측 전력 부하패턴의 분류 및 예측 방법
JP2015082259A (ja) * 2013-10-23 2015-04-27 本田技研工業株式会社 時系列データ予測装置、時系列データ予測方法、及びプログラム
KR102139358B1 (ko) * 2020-04-22 2020-07-29 한국생산기술연구원 머신러닝 기반 플랫폼을 이용한 공정제어방법, 그를 수행하기 위한 컴퓨터 프로그램 매체 및 공정제어장치

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102644147B1 (ko) 2023-08-10 2024-03-06 (주)인터웹 대규모 클래스 분류가 가능한 인공지능 예측 시스템 및 그 방법

Similar Documents

Publication Publication Date Title
US10809153B2 (en) Detecting apparatus, detection method, and program
CN115270956B (zh) 基于持续学习的跨设备增量轴承故障诊断方法
CN109840362B (zh) 一种基于多目标优化的集成即时学习工业过程软测量建模方法
US20110295777A1 (en) Method for building adaptive soft sensor
CN113723010A (zh) 一种基于lstm温度-位移相关模型的桥梁损伤预警方法
CN110571792A (zh) 一种电网调控***运行状态的分析评估方法及***
CN107403196B (zh) 基于谱聚类分析的即时学习建模对脱丁烷塔底丁烷浓度进行预测的方法
US20120016824A1 (en) Method for computer-assisted analyzing of a technical system
Gao et al. A process fault diagnosis method using multi‐time scale dynamic feature extraction based on convolutional neural network
KR102499412B1 (ko) 데이터 특성 기반 산업 공정 예측모델 개발 및 그를 사용한 산업 공정 데이터의 예측 방법
CN111459094A (zh) 机床主轴热误差建模中温度敏感点组合的分区域选取方法
CN112434390A (zh) 基于多层网格搜索的pca-lstm轴承剩余寿命预测方法
CN112257745A (zh) 基于隐马尔可夫的煤矿井下***健康度预测方法及装置
Addeh et al. Control chart patterns detection using COA based trained MLP neural network and shape features
CN110490496A (zh) 一种基于分步约简筛选复杂工业过程中影响产品质量的敏感变量的方法
CN114692507A (zh) 基于堆叠泊松自编码器网络的计数数据软测量建模方法
CN108470699B (zh) 一种半导体制造设备和工艺的智能控制***
Gellrich et al. Deep transfer learning for improved product quality prediction: a case study of aluminum gravity die casting
Gu et al. Study on intelligent diagnosis of rotor fault causes with the PSO‐xgboost algorithm
Corrêa et al. Data-driven approach for labelling process plant event data
CN110348005B (zh) 配网设备状态数据处理方法、装置、计算机设备及介质
CN114943281B (zh) 一种热管冷却反应堆智能决策方法及***
CN112949524B (zh) 一种基于经验模态分解与多核学习的发动机故障检测方法
KR20220097252A (ko) 스마트 플랜트에 관한 머신러닝 기반 설비 관리 방법 및 시스템
KR102510647B1 (ko) 데이터 군집화 기반 공정 예측 모델 개발을 위한 훈련 데이터 선택 방법

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant