KR101549349B1 - 데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법 - Google Patents

데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법 Download PDF

Info

Publication number
KR101549349B1
KR101549349B1 KR1020140129247A KR20140129247A KR101549349B1 KR 101549349 B1 KR101549349 B1 KR 101549349B1 KR 1020140129247 A KR1020140129247 A KR 1020140129247A KR 20140129247 A KR20140129247 A KR 20140129247A KR 101549349 B1 KR101549349 B1 KR 101549349B1
Authority
KR
South Korea
Prior art keywords
data
model
building
unit
predetermined
Prior art date
Application number
KR1020140129247A
Other languages
English (en)
Inventor
박철수
안기언
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR1020140129247A priority Critical patent/KR101549349B1/ko
Application granted granted Critical
Publication of KR101549349B1 publication Critical patent/KR101549349B1/ko

Links

Images

Landscapes

  • Testing And Monitoring For Control Systems (AREA)

Abstract

본 발명은 데이터 기반 모델을 이용하여 건물 에너지 모델을 구축하는 방법과, 이를 이용한 건물 운영 방법 및 시스템을 제공한다. 보다 구체적으로, 가우시안 프로세스를 이용한 건물 에너지 모델을 구축하는데 있어서, RANSAC 기법을 적용하여 보다 정확한 데이터를 필터링함으로써 정확하고 효과적인 근사 모델 및 예측 모델을 확보하는 방법을 제공한다.

Description

데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법{Method for building energy modeling based on data driven model and Method and system for optimal energy management and control}
본 발명은 데이터 기반 모델을 구축하는 방법과, 이를 이용한 건물 운영 방법 및 시스템에 관한 것이다. 보다 구체적으로, 가우시안 프로세스를 이용해 건물 에너지 모델을 구축하는데 있어서, RANSAC 기법을 적용하여 보다 정확한 데이터를 필터링함으로써 정확하고 효과적인 근사 모델 및 예측 모델을 확보하는 방법에 관한 것이다.
시뮬레이션 툴은 열역학, 수치해석 이론에 기반한 수학식을 활용하여 건물에서 발생하는 유기적인 열전달 현상을 모사한다. 시뮬레이션 툴의 정확성 및 신뢰성은 많은 연구를 통해 검증되어 왔다. 하지만, 시뮬레이션 모델의 정확성은 정보의 수준 및 모델링 가정 그리고 툴의 활용능력 등에 의해 좌우된다. 더불어, 시뮬레이션 모델의 구조는 직접적으로 측정될 수 없는 변수를 지니며, 이들은 실제 데이터를 통해 보정(calibration)될 수밖에 없다. 따라서, 설계단계에서 시뮬레이션 모델을 활용한 건물에너지 성능 분석은 필수적인 요소로 자리매김하였음에도 불구하고, 불확실하지만 적절한 가정의 사용을 전제로 한다.
더불어, 최근에는 기존 건축물의 운영에 시뮬레이션 모델을 활용한 모델 기반 예측제어(Model Predictive Control)가 시도되고 있다. 하지만, 실시간 건물의 운영 및 제어를 위하여 주관적인 판단과 가정, 불확실한 요소가 내재된 시뮬레이션 모델을 활용하고, 또한 상당한 연산시간을 거쳐 결과를 도출하는 것은 비현실적일 수 있다.
따라서, 시뮬레이션 모델의 연산시간을 단축시키면서도 실제 혹은 모델의 거동을 근사하게 모사할 수 있는 대리 모델(surrogate model)의 활용이 주목받고 있다. 모델의 모델(model of model)로 표현될 수 있는 대리 모델은 어떠한 모델의 입력과 출력의 상관관계를 설명하는 통계적 모델이다. 또한, 대리 모델은 시뮬레이션 모델과 달리 불확실한 변수를 정의하지 않고도, 실제 계측된 데이터만을 활용하여 모델의 불확실성을 표현할 수 있다. 이와 같은 장점을 기반으로, 대리 모델은 수문학, 항공학, 지질학, 기계공학 등 다양한 분야에서 널리 활용되고 있다. 대리 모델은 데이터 기반 모델(data-driven model), 감소순서 모델(reduced-order model), 계층 모형(hierarchical model) 등이 있으며, 입력 값과 출력 값 사이의 상관관계가 블랙박스(black-box)일 경우, 데이터 기반(data-driven) 모델이 사용될 수 있다.
한편 BEMS(Building Energy Management System)는 건물의 효율적인 에너지 사용을 위해, 다수의 센서와 계측 장비를 통해 건물의 데이터를 실시간으로 수집한다. 하지만, 실제 대부분의 데이터는 노이즈(noise)의 영향을 받으며, 센서 혹은 데이터 처리 시스템의 오류로 인하여 이상치(outlier)가 수집될 수도 있다. 이러한 이상치는 데이터 기반 모델의 신뢰성을 저해할 수 있다. 따라서 이상치를 제거하면서도 올바른 데이터를 확보하는 것이 중요하며, 이를 위해 노이즈 필터링 기법들이 적용되고 있다.
건물의 설비시스템들은 자동제어 혹은 최적제어를 통해 운영되기도 하지만, 최종적인 건물의 운영에 대한 종합적인 결정은 운영자의 주관적 판단에 절대적인 권한을 부여하는 경우가 대부분이다. 이때 운영자는 자신의 경험과 직관으로 능동적으로 운영전략을 수립하기도 하지만, 건물에서 발생하는 실내외 환경적 조건에 따라 설비시스템들의 운전을 수동적으로 제어하기도 한다. 하지만, 이와 같은 주관적인 운영은 건물 내에서 발생하는 다양한 상황에 대해 항상 정확한 진단 및 대처를 하고 있다고 설명하기 힘들다. 따라서 시뮬레이션 툴이 사람의 역할을 대신하여 건물의 성능을 정밀히 진단하고, 운영전략을 수립하며, 다양한 상황에 대해 대처할 수 있을 것으로 주목받고 있다.
비특허문헌으로 후술하는 Ahn et al.(2013) 등에 기술된 바와 같이, 본 발명자들은 EnergyPlus 6.0을 활용하여 주어진 환경적 조건(정보, 데이터, 시간 등)에 따라 실제 건물의 거동과 유사하도록 최대한 정밀하게 모델링한 바 있다. 연간 에너지 사용량에 있어서 시뮬레이션 모델과 실제 측정데이터의 오차가 5% 이내일 경우, 혹은 월별데이터가 5%의 MBE(Mean Bias Error)와 15%의 CVRMSE(Coefficient of Variation of the Root Mean Squared Error) 이내일 경우를 실제에 근사한 모델(ASHRAE, 2002)이라 한다. 전술한 논문에서 본 발명자들이 구축한 시뮬레이션 모델은 문헌에서 제시하는 오차범위를 만족하는 신뢰할만한 수준의 모델이었다.
그럼에도, 시뮬레이션 모델의 구축과정 및 결과에서 발생하는 아래의 쟁점들은 건물의 운영관리를 위한 시뮬레이션 모델의 적용을 어렵게 했다.
● 주관적 판단과 가정(indispensable subjective assumptions and judgment): 시뮬레이션 모델은 냉동기의 효율, 성능곡선 등 보정을 통해서만 추정 가능한 변수를 포함한다. 더불어, 시뮬레이션 툴은 건물에서 발생하는 열전달 과정의 함축적인 표현을 위한 도구이므로, 해당 도구를 활용하기 위해서는 사용자의 주관적인 판단과 가정이 필연적으로 개입된다.
● 시뮬레이션 연산 시간(computation time): 대상 건물의 크기, 존의 수, 기계설비 계통 등에 따라 시뮬레이션 모델의 연산시간은 상이하지만, 모델의 정밀성과 복잡성에 따라 연산시간은 급격히 증가된다. (대상건물의 EnergyPlus 시뮬레이션 모델은 연간 시뮬레이션 시, 약 30시간 소요됨.)
● 불확실성(uncertainty): 시뮬레이션 모델은 1)건축자재의 밀도 및 비열, 기계설비의 효율 등 속성 값의 불확실성, 2)사용자의 가정에 따른 불확실성, 3)수치해석의 불확실성, 4)시나리오의 불확실성 등이 존재한다. 이를 표현하기 위한 몬테카를로 기법의 적용은 수천 번의 시뮬레이션 연산을 요구한다.
● 신뢰성 낮은 데이터(dirty data): 계측되는 BEMS 데이터들은 노이즈가 포함되거나, 센서의 오류로 인해 이상치가 존재한다. 또한, 기록되지 않는 시기가 존재하는 등 신뢰할 수 없는 수준의 불완전한 데이터일 수 있다. 따라서 데이터에 대한 진단 및 올바른 데이터를 선별하기 위한 별도의 작업이 필요하다.
물리적 현상의 원인과 결과 혹은 시스템의 입력과 출력 사이의 상관관계는 다양한 방법으로 설명이 가능하다. 건물의 경우 1)대수방정식 모델, 2)동적 시뮬레이션 모델, 3)상태공간 방정식 모델, 4)데이터 기반 모델로 표현할 수 있다. 현재 상기 모델 가운데, 비교적 사용하기 간편한 대수방정식 모델과 건물에서 발생하는 물리적 거동을 시변으로 정밀하게 표현할 수 있는 동적 시뮬레이션 모델의 활용이 지배적이다. 그럼에도, 여전히 전술한 쟁점들은 해결되지 못하고, 그 실용성에 대한 의구심이 남아 있다.
한편, 데이터 기반 모델은 물리 역학적 수식에 의거하지 않은 경우에도 활용할 수 있는 블랙박스 모델이다. 즉, 데이터의 상관관계를 표현하는 일종의 회귀모델이기 때문에, 물리 역학적 수식에 대한 이해와 실제 현상을 수식으로 함축적으로 표현하기 위한 가정이 불필요하다. 더불어, 실제 데이터를 기반으로 구축되는 모델이기 때문에, 입력변수에 대한 추정 및 보정이 불필요하다. 따라서 실제 데이터를 확보할 수 있는 기존 건축물이라면, 전술한 쟁점들을 극복할 수 있는 데이터 기반 모델이 시뮬레이션 모델에 비해 효과적으로 사용될 수 있다.
데이터 기반 모델로는 일반적인 회귀 모델(regression model)과 기계학습 모델(machine learning model)이 있다. 회귀 모델은 기저함수(basis function)의 유형 및 매개변수를 정의하고, 데이터의 패턴을 추정하기 위하여(fitting) 해당 기저함수의 매개변수를 조절한다. 하지만, 선형의 기저함수만으로 비선형성이 강한 실제 현상을 모사하기 불가능하며, 데이터가 없는 미래에 대한 예측이 어렵다. 반면, 기계학습 모델은 훈련 데이터(training data)를 이용하여 데이터가 없는 미래에 대한 예측이 가능한 모델을 개발하는 통계적 기술이다. 기계학습 모델로는 인공 신경망(ANN: Artificial Neural Network), 서포트 벡터 머신(SVM: Support Vector Machine), 가우시안 프로세스 모델(GPM: Gaussian Process Model) 등이 있다.
인공신경망 모델은 초기 기계학습 모델로서 많이 활용되어 왔다. 단, 인공신경망 모델을 구축하는 과정에서 많은 시간과 데이터가 필요하며, 가장 큰 단점으로는 예측 기간에 대해 과적합(overfitting) 현상이 발생하는 경향을 보인다는 것이다. 서포트 벡터 머신은 상기 단점을 극복하기 위해 개발되었다. 비선형 형태의 실제 시스템 거동을 표현하기 위한 기저함수를 억지로 정의하지 않기 위해, 커널 함수(kernel function)를 도입했다. 하지만, 인공신경망과 서포트 벡터 머신은 모델은 불확실성이 표현되지 않는 단점이 있다.
한편, 가우시안 프로세스 모델은 비선형의 동적 시스템의 거동을 표현하기 위해 제안된 모델로서, 서포트 벡터 머신처럼 커널 함수를 이용하며, 불확실성에 대한 예측이 결과에 함께 표현된다. 따라서, 본 발명에서는 시뮬레이션 모델의 쟁점들을 극복하고자 가우시안 프로세스가 적용된 모델을 그 예로 들어 설명하고자 한다.
<종래기술>
한국등록특허 제10-0921495호
김영진, 박철수, 가우시안 프로세스 모델과 냉동기 실시간 최적 제어, 대한건축학회논문집 제30권 제7호, pp.211-220, 2014
Ahn K.U., Kim Y.J., Kim D.W., Yoon S.H., and Park C.S., Difficulties and Issues in Simulation of a High-rise Office Building, in Proceedings of BS2013, Chambry, France, August 26-28, pp.824-831, 2013
본 발명은 상기와 같은 문제점들을 해결하고자 안출된 것이다.
구체적으로, 건물의 실시간 에너지 운영 및 관리를 위한 데이터 기반 모델의 개발 과정을 개선하고자 한다.
특히, 동적 시뮬레이션 모델에 내재된 한계를 해결하고자, 대안 모델로서 실제 BEMS 데이터 기반의 가우시안 프로세스(Gaussian Process)로서 근사 모델과 예측모델을 구축하고자 하는데, 여기에서 가우시안 프로세스 모델의 정확성 및 신뢰성을 향상시키고자 Fischler와 Bolles가 제안한 RANSAC(RANdom SAmple Consensus) 기법을 적용하고자 한다.
상기와 같은 과제를 해결하기 위하여, 본 발명의 일 실시예는, (a) 데이터 수집부(100)가, BEMS(Building Energy Management System) 데이터들을 수집하는 단계; (b) 상기 데이터 수집부(100)가, 상기 수집된 BEMS 데이터들 중 상관성을 지닌 미리 결정된 둘 이상의 종류의 데이터를 선택하는 단계; (c) 데이터 필터링부(200)가, 데이터 필터링 기법을 적용하여 상기 둘 이상의 종류의 데이터들 중에서 이상치를 제거하는 단계; 및 (d) 근사 모델 설정부(300)가, 상기 이상치가 제거된 둘 이상의 종류의 데이터들을 이용하여 근사 모델을 구축하는 단계를 포함하며, 상기 (c) 단계에서 적용된 데이터 필터링 기법은 RANSAC(Random Sample Consensus) 기법인, 데이터 기반 모델의 건물 에너지 모델링 방법을 제공한다.
또한, 상기 (d) 단계는, (d') 근사 모델 설정부(300)가, 상기 이상치가 제거된 둘 이상의 종류의 데이터들을 이용하여 가우시안 프로세스(Gaussian Process)로서 근사 모델을 구축하는 단계인 것이 바람직하다.
또한, 상기 (c) 단계는, (c1) 상기 데이터 필터링부(200)가, 상기 (b) 단계에서 선택된 상기 미리 결정된 둘 이상의 종류의 데이터들을 원본 데이터(O)로 설정하는 단계; (c2) 상기 데이터 필터링부(200)가, 상기 원본 데이터(O)로부터 무작위의 샘플 데이터(S)를 k개 추출하는 단계; (c3) 상기 데이터 필터링부(200)가, 상기 추출된 k개의 샘플 데이터(S)를 이용하여 미리 결정된 형식의 모델의 매개변수를 연산함으로써 모델(M)을 연산하는 단계; 및 (c4) 상기 데이터 필터링부(200)가, 상기 모델(M)을 상기 원본 데이터(O)에 대입하여, 미리 결정된 오차 허용범위 내에 위치하는 데이터(S*)를 설정하고 그 개수를 확인하는 단계를 포함하는 것이 바람직하다.
또한, 상기 (c4) 단계 이후, (c5) 상기 데이터 필터링부(200)가, 상기 데이터(S*)의 개수가 미리 결정된 문턱값보다 큰 경우, 상기 데이터(S*)를 원본 데이터(O)로 설정하여 상기 (c2) 내지 (c4) 단계를 반복하고, 상기 데이터(S*)의 개수가 미리 결정된 문턱값보다 크지 않은 경우, 상기 데이터(S*)를 폐기하고 상기 (c1) 단계에서 설정된 원본 데이터(O)로 상기 (c2) 내지 (c4)단계를 반복하는 단계를 더 포함하는 것이 바람직하다.
또한, 상기 (c5) 단계에서, 미리 결정된 반복횟수만큼 상기 (c2) 내지 (c4) 단계가 반복되는 것이 바람직하다.
이 경우, 상기 미리 결정된 반복횟수만큼 상기 (c2) 내지 상기 (c4) 단계가 반복된 후 마지막 설정된 데이터(S*)가 이상치가 제거된 데이터인 것이 바람직하다.
또한, 상기 미리 결정된 형식의 모델의 차원수가 n인 경우, 상기 (c2) 단계에서 추출되는 샘플 데이터의 개수인 k는 n+1보다 큰 것이 바람직하다.
상기와 같은 과제를 해결하기 위하여, 본 발명의 다른 실시예는, 전술한 건물 에너지 모델링 방법을 이용하여 근사 모델을 구축하는 단계; (e) 건물 운영부(400)가, 상기 데이터 수집부(100)로부터 상기 결정된 종류인 둘 이상의 종류 중 일부 종류의 데이터를 실시간으로 수집하고, 상기 수집된 일부를 상기 근사 모델에 적용하여, 예측 모델을 구축하는 단계를 포함하는, 에너지 최적관리와 제어 방법을 제공한다.
또한, 상기 (e) 단계 이후, (f) 상기 건물 운영부(400)가, 상기 예측 모델을 이용하여 상기 둘 이상의 종류 중 다른 종류의 데이터를 예측하는 단계를 더 포함하는 것이 바람직하다.
상기와 같은 과제를 해결하기 위하여, 본 발명의 또 다른 실시예는, 전술한 건물 운영 방법을 수행하는 시스템으로서, 상기 데이터 수집부(100), 상기 데이터 필터링부(200), 상기 근사 모델 설정부(300) 및 상기 건물 운영부(400)를 포함하는, 시스템을 제공한다.
또한, 상기 데이터 수집부(100)는 건물(10)에 구비된 다수의 센서(11)로부터 상기 BEMS 데이터들을 수집하며, 상기 건물 운영부(400)는 상기 예측된 다른 종류의 데이터를 이용하여 미리 결정된 방식에 의하여 제어 신호를 생성하여 상기 건물(10)을 운영하는 것이 바람직하다.
본 발명에 의하여 정확성과 신뢰성이 향상된 건물 모델, 구체적으로 가우시안 프로세스가 적용된 근사 모델과 예측 모델을 확보할 수 있다.
이에 따라 보다 효과적이고 정확한 건물 운영이 가능하다.
도 1은 본 발명에 따른 건물 에너지 모델링 방법을 설명하기 위한 개념도이다.
도 2는 본 발명에 따른 건물 에너지 모델링 방법을 설명하기 위한 순서도이다.
도 3은 본 발명에 따른 건물 에너지 모델링 방법에서 데이터 필터링 기법을 설명하기 위한 순서도이다.
도 4, 도 5a 및 도 5b는 가우시안 프로세스에 따른 모델의 분포 예시이다.
도 6a는 일 실시예에서 가우시안 프로세스에 의하여 구축된 근사 모델이며, 도 6b는 상기 근사 모델을 이용한 예측 모델이다. 데이터 필터링 기법이 적용되지 않은 모델이다.
도 7은 상기의 실시예에서 구축된 가우시안 프로세스의 정확도를 확인하기 위한 인풋과 아웃풋의 산점도이다.
도 8은 RANSAC 기법에 의하여 이상치가 제거되는 과정을 설명하기 위한 도면이다.
도 9a는 일 실시예에서 RANSAC 기법에 의한 데이터 필터링 기법을 적용한 가우시안 프로세스에 의하여 구축된 근사 모델이며, 도 9b는 상기 근사 모델을 이용한 예측 모델이다.
이하, 도면을 참조하여 본 발명에 대하여 상세히 설명한다.
1. 건물 에너지 모델링 방법의 설명
도 1에 도시된 바와 같이, 본 발명에 따른 건물 에너지 모델링 방법을 수행하기 위한 시스템은, 데이터 수집부(100), 데이터 필터링부(200), 근사 모델 설정부(300) 및 건물 운영부(400)를 포함한다.
도 2를 함께 참조하여 건물 에너지 모델링 방법을 설명한다.
데이터 수집부(100)는 건물(10)에 구비된 다수의 센서(11)를 이용하여 건물(10)로부터 BEMS 데이터들을 수집한다(S100).
데이터 수집부(100)는 상기 수집된 BEMS 데이터들 중에서 상관성을 지닌 미리 결정된 둘 이상의 종류의 데이터들을 선택한다(S200). 예를 들어, 아래의 실시예에서 설명할 바와 같이, 다양한 종류의 BEMS 데이터들 중에서 "공조기 팬 풍량"과 "공조기 팬 전력"의 종류의 데이터만을 선택할 수 있다. 선택되는 종류에 제한이 없음은 물론이다.
다음, 데이터 필터링부(200)가 데이터 필터링 기법을 적용함으로써 이상치를 제거한다(S300). 데이터 필터링 기법은 RANSAC 기법인 것이 바람직한데, 아래에서 상세히 설명한다.
다음, 근사 모델 설정부(300)는 이상치가 제거된 데이터들을 이용하여 근사 모델을 구축한다(S400). 구축 방법은 가우시안 프로세스를 적용하는 것이 바람직한데, 이는 아래에서 상세히 설명한다.
다음, 건물 운영부(400)는 구축된 근사 모델을 이용하여 예측 모델을 구축함으로써, 어느 한 종류의 데이터만 확보하여도 다른 종류의 데이터를 예측할 수 있다(S500). 예를 들어, 아래의 실시예에서 설명할 바와 같이, 공조기 팬 풍량의 데이터만을 확보하여도 공조기 팬 전력에 대한 데이터를 예측할 수 있다.
이를 이용하여 미리 결정된 방법에 의하여 제어 신호를 생성하고 건물(10)을 운영한다. 예를 들어, 공조기 팬 전력에 대한 데이터를 예측할 수 있다면 건물 전체의 에너지 소비량을 예측하여 다른 전력 소비를 조절하는 등 효과적으로 건물을 운영할 수 있다. 제어 신호에 따라 건물(10)을 운영하는 것 자체는 종래 기술인바 구체적인 신호 설정 및 운영 방법에 대한 설명은 생략한다.
2. 가우시안 프로세스
2.1 가우시안 프로세스의 설명
가우시안 프로세스는 공지된 기술인바, 아래에서는 가우시안 프로세스의 일반론과 건물 에너지 모델링에 적용할 경우의 장단점을 설명한다. 아래의 다수의 수학식들에 사용되는 기호, 변수 등은 종래 기술 상의 가우시안 프로세스의 일반론에 사용되는 기호, 변수 등이므로 각각에 대한 상세한 설명은 생략한다.
가우시안 프로세스는 [수학식 1]과 같이 표현되며, 평균 함수(mean function, [수학식 2])와 공분산 함수(covariance function, [수학식 3])에 의해 기술될 수 있다.
Figure 112014091998139-pat00001
Figure 112014091998139-pat00002
Figure 112014091998139-pat00003
특히, 공분산 함수는 가우시안 프로세스의 핵심이 되는 요소로서, 서로 다른 데이터 사이의 상관관계에 대해 정의한다. 이때, 많은 데이터들의 공분산을 표현하기 위하여 공분산 커널 함수(covariance kernel function)를 활용할 수 있다. 공분산 커널 함수의 종류로는 SE(Squared Exponential) 커널, RQ(Rational Quadratic) 커널, Matrn 커널 등이 있으며, 시변(timeseries) 데이터를 모델링 하는 경우 SE 커널이 데이터 사이의 공분산을 충분히 표현할 수 있다. 따라서, [수학식 3]은 공분산 매트릭스(covariance matrix)인 [수학식 4]와 SE 커널인 [수학식 5]로 표현될 수 있다.
Figure 112014091998139-pat00004
Figure 112014091998139-pat00005
[수학식 5]의 h와 λ는 모델의 형태를 결정하는 하이퍼파라미터(hyperparameter)이며, 공분산 커널 함수에 따라 종류와 개수가 달라질 수 있다.
도 4는 가우시안 프로세스 분포 예시다. 평균이 0이며, -10내지 10인 인풋의 공분산을 분산으로 갖는 가우시안 프로세스 분포 중, 임의로 10개를 나타냈다. 여기서 인풋 λ는 훈련 데이터(training data)를 알기 전, 임의의 샘플 데이터(Sample data)다. 훈련 데이터가 주어지지 않았으므로, 이때의 가우시안 프로세스 분포는 데이터 및 모델의 정보를 알기 이전의 사전 분포(prior distribution)다. 특히, 모델에 대한 사전 정보 및 지식이 없을 경우, 각 샘플 데이터 λ의 f(x)는 평균을 0으로 가정한다. 즉, [수학식 1]의 평균 함수인 [수학식 2]가 0이 된다.
한편, 가우시안 프로세스는 훈련 데이터 세트 D([수학식 6])가 주어졌을 때 사후 분포(posterior distribution)를 얻을 수 있다. 사후 분포는 훈련 데이터 대한 근사 모델(regression model)과 시험용 값에 대한 예측 모델(prediction model)로 활용된다. f*가 훈련 데이터 X*에 따른 근사 모델이라면, 사후 분포는 평균 함수([수학식 8])와 공분산 함수([수학식 9])를 정규분포로 하는 [수학식 7]을 통해 구할 수 있다.
Figure 112014091998139-pat00006
Figure 112014091998139-pat00007
Figure 112014091998139-pat00008
Figure 112014091998139-pat00009
도 5a는 훈련데이터 12개로 얻을 수 있는 사후 분포 중 임의로 10개를 표현했다. 또한, 도 5b의 실선은 사후 분포의 평균이며, 점선은 사후 분포 분산의 95% 신뢰 범위(confidence interval)다. 즉, 가우시안 프로세스 모델은 훈련 데이터에 대한 근사화(regression)와 훈련 데이터가 없는 구간 혹은 시험 데이터에 대한 예측(predictiion)이 가능하다. 특히, 분산을 통해 모델의 불확실성이 표현되는 확률적 접근은 타 기계 학습 모델이 갖고 있지 않는 가우시안 프로세스만의 장점이다.
그런데 도 5b의 Case 1과 Case 2를 비교하면, 훈련 데이터 사이의 간격에 따라 모델의 불확실성이 차이가 있다. 즉, 훈련 데이터의 양과 질에 따라 예측 모델의 정확성 및 신뢰성이 차이가 있음을 알 수 있다.
한편, 전술한 바와 같이, 공분산 커널 함수는 모델의 형태를 결정하는 하이퍼파라미터로 구성된다. SE커널의 h값에 따라 모델의 진폭(signal variance)이 변화하며, λ에 따라 모델의 구불거리는(wiggly) 정도가 변화한다.
이처럼 하이퍼파라미터는 가우시안 프로세스 모델의 형태와 불확실성에 영향을 미친다. 결국 하이퍼파라미터는 모델의 정확성에 영향을 미치기 때문에, 하이퍼파라미터의 결정은 가우시안 프로세스 모델의 핵심요소이다.
하이퍼파라미터는 훈련 데이터를 통해 추정될 수 있으며, 그 방법으로는 MLE(Maximum Likelihood Estimation), MAP(Maximum a Posteriori), MCMC(Markov Chain Monte Carlo)가 있다. MLE와 MAP는 점 추정(Point Estimation)이며, MCMC는 확률분포 추정(Probability Estimation)이다.
MLE가 일반적으로 사용되며, 이를 위해 [수학식 10]과 같이 로그를 취하여 음수가 되는 우도함수(likelihood function)를 최소화한다.
Figure 112014091998139-pat00010
노이즈를 고려하기 위해서는 [수학식 1]과 [수학식 4]에 노이즈 항이 추가되며, 가우시안 프로세스의 노이즈는 평균이 0이고, 하이퍼파라미터를 분산으로 하는 정규분포를 따른다. 따라서, 노이즈 또한 전술한 MLE를 통해 추정한다.
요컨대, 가우시안 프로세스를 적용하여 근사 모델을 생성한다면, 정확한 데이터를 이용하여 근사 모델을 생성하는 것은, 도 4, 도 5a 및 도 5b에 도시되는 바와 같은 진폭 내지 구불거림의 변화를 줄일 수 있어서 근사 모델의 정확도 형상에 매우 도움이 됨을 알 수 있다.
2.2 가우시안 프로세스의 적용
여기에서는 데이터 필터링 기법을 적용하지 않고 가우시안 프로세스를 적용한 경우를 예를 들어 설명한다.
대한민국 서울시에 위치하며 2004년에 준공된 A사옥을 대상 건물(10)로 설정하고 1,500개의 센서(11)를 건물(10)에 설치하여 BEMS 데이터를 수집하였다.
1일차에 수집한 BEMS 데이터들 중에서 "공조기 팬 풍량"과 "공조기 팬 전력"이라는 특정 종류를 선택하였으며, 전자를 인풋으로, 후자를 아웃풋으로 설정하여 가우시안 프로세스로서 근사 모델을 구축하였다.
2일차에도 동일 종류의 데이터를 수집하였는데, "공조기 팬 풍량(2일차)" 데이터만을 가우시안 프로세스 근사 모델의 인풋으로 대입하여 "공조기 팬 전력"을 예측하였으며, 2일차에 실재 수집된 "공조기 팬 전력"을 예측한 데이터와 비교하여 근사 모델의 정확도를 확인하였다.
물론, 풍량 외에도 공조기의 급기팬 전력량에 영향을 미치는 요소가 있을 수 있으나, 여기에서는 타 요소에 비해 풍량과 전력량 사이의 상관성(correlation)이 지배적으로 높을 것으로 가정하고, 풍량만을 인풋으로 활용하였다. 가우시안 프로세스 근사 모델은 SE 커널을 적용하였으며, 하이퍼파라미터의 추정을 위해 MLE를 수행했다.
도 6a는 1일차 데이터들을 토대로 구축한 가우시안 프로세스의 근사 모델이다. 실제 데이터와의 오차는 가우시안 프로세스 근사 모델의 평균값을 기준으로 MBE: 1.17% CVRMSE: 12.45%였다. 도시된 바와 같이, 근사 모델은 실제 데이터의 패턴을 어느 정도 추정하는 것으로 보이나, 많은 구간에서 오차가 발생하는 것을 확인할 수 있다.
도 6b는 근사 모델(도 6a)에 시험용 값인 2일차의 풍량 데이터를 인풋으로 대입한 예측 모델이며, 명백한 센서의 오류가 발생하기 이전의 데이터를 정확하게 추정하지 못하고 있다. 더불어, 근사 모델과 예측 모델은 전반적으로 모델의 신뢰범위(CI, Confidence Interval) 폭이 넓으며, 이는 모델의 불확실성이 크다는 것을 의미한다.
결론적으로, 데이터 필터링 기법의 적용 없이 원본 데이터를 그대로 사용하는 경우 가우시안 프로세스에 의하여 구축된 근사 모델에 있어서 그 정확도가 낮음이 확인되었다.
3. RANSAC 기법의 설명
앞서 구축된 가우시안 프로세스 근사 모델은 정확성과 불확실성의 정도를 고려하면, 모델의 성능이 우수하다고 말하기 어렵다. 구축된 가우시안 프로세스 근사 모델의 인풋과 아웃풋으로 활용한 데이터의 질(quality)과 상관성(correlation)을 확인하기 위하여, 도 7과 같이 두 데이터를 산점도로 표현해 보았다. 그림8을 살펴보면 두 데이터간의 상관성을 저해하는 이상치가 상당히 개입되어 있는 것으로 유추된다. 따라서, 이상치를 걸러낼 수 있는 데이터 필터링 기법을 적용하여, 신뢰성 있는 데이터를 기반으로 정확성 및 예측력이 향상된 가우시안 프로세스 적용 근사 모델을 구축하고자 한다.
데이터 필터링 기법은 여러 종류가 있으나, 건물 운영에 필요한 최적의 근사 모델에 적용될 수 있으며 건물 관련 시뮬레이션에 사용된 적이 없었던 RANSAC 기법을 적용하고자 한다.
RANSAC은 많은 이상치(Outlier)가 포함된 원본 데이터 세트로부터 참 데이터(Inlier)로 구성된 모델의 매개변수를 추정하기 위한 방법이다. RANSAC으로 추정할 수 있는 이상치의 비율은 원본 데이터의 50%보다 높다. 이와 같은 장점을 기반으로, RANSAC은 영상처리, 로봇공학, 음향처리 등에서 활발히 적용되고 있었으나, 건물 에너지 모델링을 비롯한 건물 시뮬레이션에 적용된 사례는 없었다.
이에, 본 발명자들은 이러한 RANSAC 기법을 응용하여 건물 에너지 모델링, 특히 정확도가 중요한 가우시안 프로세스에 의한 근사 모델의 구축에 적용하였으며, 이를 도 3을 참조하여 설명하면 다음과 같다. 이하의 과정들은 데이터 필터링부(200)가 수행함을 언급해둔다.
먼저, BEMS 데이터들 중에서 미리 결정된 둘 이상의 종류의 데이터들을 원본 데이터(O)로 설정한다(S310).
다음, 원본 데이터(O)로부터 무작위의 샘플 데이터(S)를 k개 추출하고(S320). 추출된 k개의 샘플 데이터(S)를 이용하여 미리 결정된 형식의 모델의 매개변수를 연산함으로써(S330) 모델(M)을 연산한다(S340).
여기에서, 미리 결정된 형식의 모델의 차원수가 n인 경우, 추출되는 샘플 데이터의 개수인 k는 n+1보다 크다. n과 k는 정수이다. 예를 들어, 모델의 미리 결정된 형식이 1차원의 직선 즉 y=ax+b의 형식이라면 2개 이상의 데이터가 필요하며, 2차원의 곡선이라면 3개 이상의 데이터가 필요하다.
이제 모델(M)이 결정되었으므로, 모델(M)을 상기 원본 데이터(O)에 대입하여, 미리 결정된 오차 허용범위 내에 위치하는 데이터(S*)를 설정하고 그 개수를 확인하다(S350).
확인된 데이터(S*)의 개수가 미리 결정된 문턱값보다 큰 경우라면(S360) 데이터(S*)들이 정확도가 높은 데이터들이므로 원본 데이터(O)로 설정하여 위의 절차들을 반복하게 되며(S371), 반대로 미리 결정된 문턱값보다 크지 않은 경우라면 데이터(S*)를 폐기하고 기존의 원본 데이터(O)로 절차를 반복한다(S372).
반복횟수 역시 미리 결정되어 있으므로, 미리 결정된 반복횟수에 이르렀는지 여부를 확인하여(S380) 반복 여부를 결정한다.
반복횟수만큼 반복이 완료되었다면 마지막에 설정된 데이터(S*)가 이상치가 제거된 데이터이다.
이러한 RANSAC 기법을 적용하여 앞선 예시에서의 BEMS 데이터에서 이상치를 제거하는 작업을 실시하였으며, 그 결과가 도 8에 도시된다.
전술한 바와 같이, 풍량 외에도 전력량에 영향을 미칠 수 있는 요소가 있을 수 있으며, 이는 두 데이터의 상관성(correlation)을 저해할 수 있다. 즉, 올바르게 측정된 데이터임에도 불구하고 이상치로 판별될 수 있다. 따라서, 도 8과 같이 데이터의 신뢰 범위(CI: Confidence Interval)가 99%에 이르도록 모델의 차원수 및 반복횟수를 설정하였다. 도시된 바와 같이 수집된 BEMS 데이터인 1일차 풍량과 전력량 데이터는 각각 96개(15분 간격으로 24시간 동안 수집)였는데 그 중 11개가 이상치임을 확인했다.
이제, 이상치가 제거된 데이터들을 토대로 다시 가우시안 프로세스를 적용하여 근사 모델을 구축하였으며, 그 결과가 도 9a에 도시된다. 이를 토대로 예측 모델을 구축하였으며, 이는 도 9b에 도시된다.
데이터 필터링 기법이 적용되지 않았던 도 6b에 도시된 예측 모델과 비교해보면 실재값과의 오차가 현저히 감소하였음을 확인할 수 있다.
상기에서는 본 발명의 바람직한 실시 예를 참조하여 설명하였지만, 당업계에서 통상의 지식을 가진 자라면 이하의 특허 청구범위에 기재된 본 발명의 사상 및 영역을 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.
10: 건물
11: 센서
100: 데이터 수집부
200: 데이터 필터링부
300: 근사 모델 설정부
400: 건물 운영부

Claims (11)

  1. (a) 데이터 수집부(100)가, BEMS(Building Energy Management System) 데이터들을 수집하는 단계;
    (b) 상기 데이터 수집부(100)가, 상기 수집된 BEMS 데이터들 중 상관성을 지닌 것으로 미리 결정된 둘 이상의 종류의 데이터들을 선택하는 단계;
    (c) 데이터 필터링부(200)가, 데이터 필터링 기법을 적용하여 상기 둘 이상의 종류의 데이터들 중에서 이상치를 제거하는 단계; 및
    (d) 근사 모델 설정부(300)가, 상기 이상치가 제거된 둘 이상의 종류의 데이터들을 이용하여 근사 모델을 구축하는 단계를 포함하며,
    상기 (c) 단계에서 적용된 데이터 필터링 기법은 RANSAC(Random Sample Consensus) 기법이며,
    상기 (d) 단계는,
    (d') 근사 모델 설정부(300)가, 상기 이상치가 제거된 둘 이상의 종류의 데이터들을 이용하여 가우시안 프로세스(Gaussian Process)로서 근사 모델을 구축하는 단계인,
    데이터 기반 모델의 건물 에너지 모델링 방법.
  2. 삭제
  3. 제 1 항에 있어서,
    상기 (c) 단계는,
    (c1) 상기 데이터 필터링부(200)가, 상기 (b) 단계에서 선택된 상기 상관성을 지닌 미리 결정된 둘 이상의 종류의 데이터들을 원본 데이터(O)로 설정하는 단계;
    (c2) 상기 데이터 필터링부(200)가, 상기 원본 데이터(O)로부터 무작위의 샘플 데이터(S)를 k개 추출하는 단계;
    (c3) 상기 데이터 필터링부(200)가, 상기 추출된 k개의 샘플 데이터(S)를 이용하여 미리 결정된 형식의 모델의 매개변수를 연산함으로써 모델(M)을 연산하는 단계; 및
    (c4) 상기 데이터 필터링부(200)가, 상기 모델(M)을 상기 원본 데이터(O)에 대입하여, 미리 결정된 오차 허용범위 내에 위치하는 데이터(S*)를 설정하고 그 개수를 확인하는 단계를 포함하는,
    데이터 기반 모델의 건물 에너지 모델링 방법.
  4. 제 3 항에 있어서,
    상기 (c4) 단계 이후,
    (c5) 상기 데이터 필터링부(200)가,
    상기 데이터(S*)의 개수가 미리 결정된 문턱값보다 큰 경우, 상기 데이터(S*)를 원본 데이터(O)로 설정하여 상기 (c2) 내지 (c4) 단계를 반복하고,
    상기 데이터(S*)의 개수가 미리 결정된 문턱값보다 크지 않은 경우, 상기 데이터(S*)를 폐기하고 상기 (c1) 단계에서 설정된 원본 데이터(O)로 상기 (c2) 내지 (c4)단계를 반복하는 단계를 더 포함하는,
    데이터 기반 모델의 건물 에너지 모델링 방법.
  5. 제 4 항에 있어서,
    상기 (c5) 단계에서, 미리 결정된 반복횟수만큼 상기 (c2) 내지 (c4) 단계가 반복되는,
    데이터 기반 모델의 건물 에너지 모델링 방법.
  6. 제 5 항에 있어서,
    상기 미리 결정된 반복횟수만큼 상기 (c2) 내지 상기 (c4) 단계가 반복된 후 마지막 설정된 데이터(S*)가 이상치가 제거된 데이터인,
    데이터 기반 모델의 건물 에너지 모델링 방법.
  7. 제 3 항에 있어서,
    상기 미리 결정된 형식의 모델의 차원수가 n인 경우, 상기 (c2) 단계에서 추출되는 샘플 데이터의 개수인 k는 n+1보다 크며, 여기에서 n과 k는 정수인,
    데이터 기반 모델의 건물 에너지 모델링 방법.
  8. 제 1, 3, 4, 5, 6, 7 항 중 어느 한 항에 따른 데이터 기반 모델의 건물 에너지 모델링 방법을 이용하여 근사 모델을 구축하는 단계;
    (e) 건물 운영부(400)가, 상기 데이터 수집부(100)로부터 상기 결정된 종류인 둘 이상의 종류 중 일부 종류의 데이터를 실시간으로 수집하고, 상기 수집된 일부를 상기 근사 모델에 적용하여, 예측 모델을 구축하는 단계를 포함하는,
    에너지 최적관리와 제어 방법.
  9. 제 8 항에 있어서,
    상기 (e) 단계 이후,
    (f) 상기 건물 운영부(400)가, 상기 예측 모델을 이용하여 상기 둘 이상의 종류 중 다른 종류의 데이터를 예측하는 단계를 더 포함하는,
    에너지 최적관리와 제어 방법.
  10. 제 9 항에 따른 에너지 최적관리와 제어 방법을 수행하는 시스템으로서, 상기 데이터 수집부(100), 상기 데이터 필터링부(200), 상기 근사 모델 설정부(300) 및 상기 건물 운영부(400)를 포함하는,
    시스템.
  11. 제 10 항에 있어서,
    상기 데이터 수집부(100)는 건물(10)에 구비된 다수의 센서(11)로부터 상기 BEMS 데이터들을 수집하며,
    상기 건물 운영부(400)는 상기 예측된 다른 종류의 데이터를 이용하여 미리 결정된 방식에 의하여 제어 신호를 생성하여 상기 건물(10)을 운영하는,
    시스템.
KR1020140129247A 2014-09-26 2014-09-26 데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법 KR101549349B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020140129247A KR101549349B1 (ko) 2014-09-26 2014-09-26 데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020140129247A KR101549349B1 (ko) 2014-09-26 2014-09-26 데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법

Publications (1)

Publication Number Publication Date
KR101549349B1 true KR101549349B1 (ko) 2015-09-02

Family

ID=54246956

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020140129247A KR101549349B1 (ko) 2014-09-26 2014-09-26 데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법

Country Status (1)

Country Link
KR (1) KR101549349B1 (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190118896A (ko) * 2018-04-11 2019-10-21 주식회사 케이티 건물 에너지 제어 시스템 및 방법
CN115096359A (zh) * 2022-06-17 2022-09-23 北京航空航天大学 一种金属屋面健康监测***及方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100921495B1 (ko) 2009-03-24 2009-10-13 삼성탈레스 주식회사 파티클 필터링을 이용한 가우시안 혼합 모델링 업데이트 방법
KR101173823B1 (ko) * 2011-07-01 2012-08-20 연세대학교 산학협력단 공동주택의 에너지 사용량 예측 시스템 및 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100921495B1 (ko) 2009-03-24 2009-10-13 삼성탈레스 주식회사 파티클 필터링을 이용한 가우시안 혼합 모델링 업데이트 방법
KR101173823B1 (ko) * 2011-07-01 2012-08-20 연세대학교 산학협력단 공동주택의 에너지 사용량 예측 시스템 및 방법

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190118896A (ko) * 2018-04-11 2019-10-21 주식회사 케이티 건물 에너지 제어 시스템 및 방법
KR102168669B1 (ko) * 2018-04-11 2020-10-22 주식회사 케이티 건물 에너지 제어 시스템 및 방법
CN115096359A (zh) * 2022-06-17 2022-09-23 北京航空航天大学 一种金属屋面健康监测***及方法

Similar Documents

Publication Publication Date Title
Le Son et al. Remaining useful lifetime estimation and noisy gamma deterioration process
Hutton et al. Dealing with uncertainty in water distribution system models: A framework for real-time modeling and data assimilation
Ye et al. A Bayesian approach to condition monitoring with imperfect inspections
Huerta et al. Time-varying models for extreme values
Shamsi et al. A framework for uncertainty quantification in building heat demand simulations using reduced-order grey-box energy models
CN106227906B (zh) 一种基于性能退化分析的智能制造装备可靠性的评估方法
Parker Whose probabilities? Predicting climate change with ensembles of models
AU2016361466B2 (en) Environmental monitoring systems, methods and media
Kobayashi et al. A Bayesian estimation method to improve deterioration prediction for infrastructure system with Markov chain model
CN107423496B (zh) 一种新的降雨事件随机生成方法
CN105809264B (zh) 电力负载预测方法和装置
JP2010522376A (ja) 3次元パレートフロント遺伝的プログラミングを使用して作成した推論センサ
Ng et al. Uncertainty analysis of rainfall depth duration frequency curves using the bootstrap resampling technique
Karimi et al. Bayesian spatial regression models with closed skew normal correlated errors and missing observations
Song et al. A multistep chaotic model for municipal solid waste generation prediction
Chen et al. Combining stochastic weather generation and ensemble weather forecasts for short-term streamflow prediction
CN109034225A (zh) 一种结合随机变量灰性和贝叶斯模型修正的不确定性参数估计方法
Jiang et al. Model correction and updating of a stochastic degradation model for failure prognostics of miter gates
JP2021193563A (ja) 資産の予測健全性解析を実行するための方法およびコンピューティングシステム
KR101549349B1 (ko) 데이터 기반 모델의 건물 에너지 모델링 방법과 이를 이용한 에너지 최적관리와 제어 방법
Tran et al. A Bayesian network framework for statistical characterisation of model parameters from accelerated tests: application to chloride ingress into concrete
CN117436318B (zh) 基于物联网的智慧楼宇管理方法及***
Wang et al. Lifecycle energy consumption prediction of residential buildings by incorporating longitudinal uncertainties
Baraldi et al. Prognostics under different available information
CN113743022B (zh) 一种高精度气候变化数据的存储和可视化方法

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20180820

Year of fee payment: 4