KR102439038B1 - 미세먼지 및 악취 예측 시스템 및 방법 - Google Patents

미세먼지 및 악취 예측 시스템 및 방법 Download PDF

Info

Publication number
KR102439038B1
KR102439038B1 KR1020190178098A KR20190178098A KR102439038B1 KR 102439038 B1 KR102439038 B1 KR 102439038B1 KR 1020190178098 A KR1020190178098 A KR 1020190178098A KR 20190178098 A KR20190178098 A KR 20190178098A KR 102439038 B1 KR102439038 B1 KR 102439038B1
Authority
KR
South Korea
Prior art keywords
air quality
prediction
prediction model
information
spatial
Prior art date
Application number
KR1020190178098A
Other languages
English (en)
Other versions
KR20210086786A (ko
Inventor
양재경
배성훈
김성태
Original Assignee
전북대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 전북대학교산학협력단 filed Critical 전북대학교산학협력단
Priority to KR1020190178098A priority Critical patent/KR102439038B1/ko
Publication of KR20210086786A publication Critical patent/KR20210086786A/ko
Application granted granted Critical
Publication of KR102439038B1 publication Critical patent/KR102439038B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/049Temporal neural networks, e.g. delay elements, oscillating neurons or pulsed inputs
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01WMETEOROLOGY
    • G01W1/00Meteorology
    • G01W1/02Instruments for indicating weather conditions by measuring two or more variables, e.g. humidity, pressure, temperature, cloud cover or wind speed
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Strategic Management (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Environmental & Geological Engineering (AREA)
  • Marketing (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Business, Economics & Management (AREA)
  • Mathematical Physics (AREA)
  • Educational Administration (AREA)
  • Game Theory and Decision Science (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Primary Health Care (AREA)
  • Atmospheric Sciences (AREA)
  • Biodiversity & Conservation Biology (AREA)
  • Ecology (AREA)
  • Environmental Sciences (AREA)
  • Sampling And Sample Adjustment (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 미세먼지 및 악취 농도 예측 시스템에 관한 것으로, 이는 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델; 및 예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 대기질 예측부를 포함하며, 상기 대기질 정보는 미세먼지 정보와 악취 정보로 구성되는 것을 특징으로 한다.

Description

미세먼지 및 악취 예측 시스템 및 방법{System and method for predicting fine dust and odor}
본 발명은 대기질 측정소가 없는 지역의 대기질을 보다 정확하게 예측할 수 있도록 하며, 또한 미세먼지와 악취를 함께 분석 및 예측할 수 있는 새로운 방식의 미세먼지 및 악취 예측 시스템 및 방법에 관한 것이다.
현재 기상 예측 분야에서 사용되고 있는 대부분의 대기질 예측 방법은 오염원, 지형, 풍향, 풍속 등을 고려하려 대기확산 모델을 기반으로 하고 있다.
이런 부류의 모델은 오염원 발생 지점으로부터 대기 변화를 고려하여 예측을 하고 있어, 공간적인 특성에 따른 미세먼지, 악취 등의 예측치 변화를 반영하기에는 근본적인 한계가 존재한다.
반면 최근에 기계 학습을 이용한 시계열 모델이 개발되고 있는데, 이 역시 공간 정보를 소홀히 다루고 있다는 점에서 비슷한 한계가 있다 할 수 있다.
특히, 도시 지역의 경우, 인접 지역이라도 대기질에 확연한 차이가 발생할 가능성이 매우 커지게 된다. 예를 들어, 도 1 및 표 1에 도시된 바와 같이, 1km 정도 떨어진 두 개의 측정소(셀 12, 1)의 미세 먼지 PM10의 차이가 거의 2배이며, 바로 인접한 셀인 12와 22의 복합악취(OU : H2S, NH3, VOS의 가중 합)의 차이는 약 19배가 될 수 있음을 알 수 있다.

Cell No.

PM2.5

PM10

OU

2

52.53

311.67

0.02

12

50.74

*184.94

*0.11

22

49.82

127.66

*1.95

13

87.84

*92.27

0.06

41

57.21

147.15

0.03

46

62.49

90.05

2.20

74

42.80

117.83

0.00

80

51.05

134.66

0.01
이와 같이, 도시 지역에서의 대기질 농도는 공간적인 특성에 특히 많은 영향을 받음을 알 수 있다. 따라서 대기질 측정소가 없는 지역의 대기질 예측은 기본적으로 공간 정보를 반영해야할 필요가 있음을 추측할 수 있다.
이에 상기와 같은 문제점을 해결하기 위한 것으로서, 본 발명은 대기질의 시계열 속성과 공간적 속성까지 함께 고려한 예측 동작을 수행할 수 있도록 하는 미세먼지 및 악취 예측 시스템 및 방법을 제공하고자 한다.
또한 미세먼지와 악취를 함께 분석 및 예측할 수 있도록 하는 미세먼지 및 악취 예측 시스템 및 방법을 제공하고자 한다.
본 발명의 목적은 이상에서 언급한 목적으로 제한되지 않으며, 언급되지 않은 또 다른 목적들은 아래의 기재로부터 본 발명이 속하는 통상의 지식을 가진 자에게 명확하게 이해될 수 있을 것이다.
상기 과제를 해결하기 위한 수단으로서, 본 발명의 일 실시 형태에 따르면 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델; 및 예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 대기질 예측부를 포함하며, 상기 대기질 정보는 미세먼지 정보와 악취 정보로 구성되는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템을 제공한다.
상기 미세먼지 및 악취 농도 예측 시스템은 상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 학습시킨 후, 이에 연속하여 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 추가 학습시키는 예측 모델 학습부를 더 포함하는 것을 특징으로 한다.
상기 시계열 예측모델은 순환신경망(RNN)의 LSTM(Long Short Term Memory)으로 구현되는 것을 특징으로 한다.
상기 미세먼지 및 악취 농도 예측 시스템은 대기질 정보, 기상 정보 및 공간 정보를 지역 단위로 획득 및 저장하되, 공간 속성에 기반하여 지역 클러스터링을 수행한 후, 대기질 측정소를 통해 측정한 대기질 정보 및 기상 정보를 클러스터 단위로 공유하는 데이터 수집부를 더 포함하는 것을 특징으로 한다.
상기 과제를 해결하기 위한 수단으로서, 본 발명의 다른 실시 형태에 따르면 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 및 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델를 구비하는 앙상블 예측모델을 이용한 미세먼지 및 악취 농도 예측 방법은 상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 반복 학습시키고, 이와 동시에 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 반복 학습시키는 단계; 및 예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 단계를 포함할 수 있다.
본 발명은 정확한 농도 예측을 위한 시계열 모델과 공간속성 기반 모델을 스택킹 구조로 결합한 앙상블 모델을 새롭게 제안하고, 이를 통해 대기질의 시계열 속성을 공간적 속성에 따라 보정한 후, 최종의 대기질 예측치를 획득 및 출력할 수 있도록 한다. 즉, 시계열 속성 뿐 아니라 공간 속성까지 충분히 고려한 대기질 변화 패턴을 예측할 수 있게 되고, 그 결과 대기질 측정소가 없는 지역의 대기질까지도 보다 정확하게 예측할 수 있도록 한다.
또한 본 발명에서는 또한 미세먼지와 악취도 함께 분석 및 예측할 수 있도록 함으로써, 보다 다양한 정보를 가지는 대기질 예측 정보를 획득 및 제공할 수도 있도록 한다.
도 1은 도시 지역의 지역별로 상이해지는 대기질 측정 결과를 설명하기 위한 도면이다.
도 2는 본 발명의 일 실시예에 따른 미세먼지 및 악취 농도 예측 시스템을 설명하기 위한 도면이다.
도 3은 본 발명의 일 실시예에 따른 미세먼지 및 악취 농도 예측 방법의 개념을 설명하기 위한 도면이다.
도 4는 본 발명의 일 실시예에 따른 시계열 예측모델을 설명하기 위한 도면이다.
도 5는 본 발명의 일 실시예에 따른 지역별 대기질 및 기상 정보를 획득을 위한 지역 클러스터링 방법을 설명하기 위한 도면이다.
이하의 내용은 단지 본 발명의 원리를 예시한다. 그러므로 당업자는 비록 본 명세서에 명확히 설명되거나 도시되지 않았지만 본 발명의 원리를 구현하고 본 발명의 개념과 범위에 포함된 다양한 장치를 발명할 수 있는 것이다. 또한, 본 명세서에 열거된 모든 조건부 용어 및 실시예들은 원칙적으로, 본 발명의 개념이 이해되도록 하기 위한 목적으로만 명백히 의도되고, 이와 같이 특별히 열거된 실시예들 및 상태들에 제한적이지 않는 것으로 이해되어야 한다.
또한, 본 발명의 원리, 관점 및 실시예들 뿐만 아니라 특정 실시예를 열거하는 모든 상세한 설명은 이러한 사항의 구조적 및 기능적 균등물을 포함하도록 의도되는 것으로 이해되어야 한다. 또한 이러한 균등물들은 현재 공지된 균등물뿐만 아니라 장래에 개발될 균등물 즉 구조와 무관하게 동일한 기능을 수행하도록 발명된 모든 소자를 포함하는 것으로 이해되어야 한다.
따라서, 예를 들어, 본 명세서의 블럭도는 본 발명의 원리를 구체화하는 예시적인 회로의 개념적인 관점을 나타내는 것으로 이해되어야 한다. 이와 유사하게, 모든 흐름도, 상태 변환도, 의사 코드 등은 컴퓨터가 판독 가능한 매체에 실질적으로 나타낼 수 있고 컴퓨터 또는 프로세서가 명백히 도시되었는지 여부를 불문하고 컴퓨터 또는 프로세서에 의해 수행되는 다양한 프로세스를 나타내는 것으로 이해되어야 한다.
프로세서 또는 이와 유사한 개념으로 표시된 기능 블럭을 포함하는 도면에 도시된 다양한 소자의 기능은 전용 하드웨어뿐만 아니라 적절한 소프트웨어와 관련하여 소프트웨어를 실행할 능력을 가진 하드웨어의 사용으로 제공될 수 있다. 프로세서에 의해 제공될 때, 상기 기능은 단일 전용 프로세서, 단일 공유 프로세서 또는 복수의 개별적 프로세서에 의해 제공될 수 있고, 이들 중 일부는 공유될 수 있다.
또한 프로세서, 제어 또는 이와 유사한 개념으로 제시되는 용어의 명확한 사용은 소프트웨어를 실행할 능력을 가진 하드웨어를 배타적으로 인용하여 해석되어서는 아니되고, 제한 없이 디지털 신호 프로세서(DSP) 하드웨어, 소프트웨어를 저장하기 위한 롬(ROM), 램(RAM) 및 비 휘발성 메모리를 암시적으로 포함하는 것으로 이해되어야 한다. 주지관용의 다른 하드웨어도 포함될 수 있다.
본 명세서의 청구범위에서, 상세한 설명에 기재된 기능을 수행하기 위한 수단으로 표현된 구성요소는 예를 들어 상기 기능을 수행하는 회로 소자의 조합 또는 펌웨어/마이크로 코드 등을 포함하는 모든 형식의 소프트웨어를 포함하는 기능을 수행하는 모든 방법을 포함하는 것으로 의도되었으며, 상기 기능을 수행하도록 상기 소프트웨어를 실행하기 위한 적절한 회로와 결합된다. 이러한 청구범위에 의해 정의되는 본 발명은 다양하게 열거된 수단에 의해 제공되는 기능들이 결합되고 청구항이 요구하는 방식과 결합되기 때문에 상기 기능을 제공할 수 있는 어떠한 수단도 본 명세서로부터 파악되는 것과 균등한 것으로 이해되어야 한다.
상술한 목적, 특징 및 장점은 첨부된 도면과 관련한 다음의 상세한 설명을 통하여 보다 분명해질 것이며, 그에 따라 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기술적 사상을 용이하게 실시할 수 있을 것이다. 또한, 본 발명을 설명함에 있어서 본 발명과 관련된 공지 기술에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우에 그 상세한 설명을 생략하기로 한다.
도 2는 본 발명의 일 실시예에 따른 미세먼지 및 악취 농도 예측 시스템을 설명하기 위한 도면이다.
도 2에 도시된 바와 같이, 본 발명의 시스템은 대기질의 시계열 속성을 예측하는 시계열 예측모델(111) 및 대기질의 공간 속성을 예측하는 공간속성 기반 예측모델(112)을 통해 두 개의 예측치를 생성한 후, 이들을 다시 시공간 예측모델(113)의 입력으로 사용하는 스택킹(stacking) 형태의 앙상블 예측 모델(110), 각 지역의 대기질 정보 및 기상 정보 이외에 공간 정보를 추가 획득 및 저장하는 데이터 수집부(120), 각 지역의 대기질 정보, 기상 정보, 및 공간 정보를 통해 시계열 예측모델(111)과 공간속성 기반 예측모델(112)을 동시 학습시키되, 이들의 출력값을 이용하여 시공간 예측모델(113)을 추가 훈련시키는 과정을 반복 수행하는 예측 모델 학습부(130), 및 예측 대상 지역이 선택되면, 예측 대상 지역의 대기질 정보, 기상 정보, 및 공간 정보를 통해 시계열 예측모델(111)과 공간속성 기반 예측모델(112), 그리고 시공간 예측모델(113)을 통해 순차 이용하여 대기질 최종 예측지를 획득 및 출력하는 대기질 예측부(140)로 구성된다.
즉, 본 발명은 대기질의 시계열 속성을 예측하는 시계열 예측모델(111) 및 대기질의 공간 속성을 예측하는 공간속성 기반 예측모델(112)을 통해 두 개의 예측치를 생성한 후, 이들을 다시 시공간 예측모델(113)의 입력으로 사용하는 스택킹(stacking) 형태의 앙상블 예측 모델(110)을 구현하여, 대기질의 시계열 속성 뿐 아니라 공간 속성까지 고려한 대기질 예측 동작을 수행하도록 한다.
다시 말해, 본 발명은 도 3에서와 같이 대기질의 시계열 예측 방법과 지리적 가중 회귀모델을 이용한 공간속성 기반 예측 방법을 혼합하여, 대기 측정소가 없는 지역의 대기질 또한 정확하게 예측할 수 있도록 한다.
이하, 각 구성요소를 기능 및 동작을 보다 상세히 설명하면 다음과 같다.
시계열 예측모델(111)은 대기질 및 기상 정보에 대응되는 대기질 예측치(즉, 기상 정보에 따라 대기질 정보가 시간별로 변화하는 패턴)를 획득 및 출력하기 위한 것으로, 도 4에서와 같이, 입력층, 은닉층, 출력층으로 구성되는 순환신경망(Recurrent Neural Network, RNN)의 LSTM(Long Short Term Memory)으로 구현될 수 있다.
대기질 정보는 미세먼지 2종(PM2.5, PM10), 악취의 원인 물질인 황화수소(H2S), 암모니아(NH3), 휘발성 유기화합물(VOC)이라는 총 5개의 속성으로 정의되고, 기상 정보는 풍속 및 풍향이라는 총 2개의 속성으로 정의되는 것이 바람직하나, 이는 차후 실제의 적용예에서 다양하게 변화될 수 있음은 물론 당연하다.
이에 표 2에서와 같이 입력층은 대기질 정보와 기상 정보를 입력받기 위한 7개의 노드들을 가지고, 출력층은 기상 정보를 제외한 대기질 예측치를 출력하기 위한 5개의 노드들을 가지고, 은닉층은 8개 또는 10개의 노드를 가질 수 있다.
그리고 입력층 및 은닉 노드 상태, 3가지 게이트, 출력층 각각의 활성 함수(activation function)로는 하이퍼볼릭탄젠트(tanh), 로지스틱 시그모이트(logistic sigmoid), 소프트맥스(softmax)가 적용되고, 에포크(Epoch) 및 미니 배치 사이즈(mini batch size)는 10과 100으로 설정될 수 있다. 다만, 한정 사항 또한 차후 실제의 적용예에서 다양하게 변화될 수 있음은 물론 당연하다.
Parameters Description
No. of Inputs 7 (PM2.5, PM10, H2S,NH3,WindDirection,WinSpeed)
No. of hidden nodes 10
No. of output nodes 5
Input activation function tanh
Gate activation function logistic sigmoid
Hidden state activation function tanh
Output activation function softmax
Mini batch size 100
No. of epochs 10
공간속성 기반 예측모델(112)은 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하기 위한 것으로, 이는 공간적 변이를 분석하는 회귀모형의 하나인 지리적 가중 회귀모델(GWR)로 구현될 수 있다.
지리적 가중 회귀분석의 핵심은 회귀계수를 상수가 아니라 위치의 함수로 간주하는 것이다. 즉, 회귀계수가 모든 지역에서 동일한 것이 아니라 공간적 위치에 따라 달라지도록 모형화하는 것이다. 알려진 어떤 위치(ui, vi)에 대해 종속변수 y와 j개의 독립변수 x가 있고, 회귀계수와 오차항이 각각 β, ε인 경우, 회귀식은 수학식1과 같이 표현될 수 있다.
Figure 112019135589881-pat00001
이때, yi는 i번째 지역의 종속 변수, xij는 i번째 지역에서의 j번째 설명 변수, (ui, vi)는 i번째 지역의 공간좌표, β0(ui, vi)는 절편계수, βj(ui, vi)는 i번째 지역의 j번째 회귀계수이다.
최소제곱추정모델과 달리 해당 모델의 특징은 지역적으로 개별 회귀계수를 추정함으로써 지역적 영향력을 파악할 수 있다는 장점이 있다. 해당 모형의 회귀계수를 추정하기 위해서는 지리적 위치 i 지역을 기준으로 거리가 가까울수록 거리가 먼 곳 보다 공간적으로 더 많은 영향을 받는 것을 가정으로 한다. 따라서 회귀계수
Figure 112019135589881-pat00002
의 추정은 다음의 수학식2로 계산되어진다.
Figure 112019135589881-pat00003
이때, 지리적 가중치 행렬 W의 각 요소는 가중함수인 커널(kernel)에 따라 계산된다.
커널은 다양한 형태를 취할 수 있지만 일반적으로 가우스 형태인 수학식3이 사용된다.
Figure 112019135589881-pat00004
이때, 공간좌표(ui, vi)에서 측정치 i에 대한 가중치, di,(ui, vi)는 측정치 i와 공간좌표(ui, vi)간의 거리, h는 대역폭이다.
커널은 가중치를 만드는 대역폭(Bandwidth)이 고정되어있는 고정방식(Fixed spatial kernel)과 측정치의 수에 따라 다른 대역폭을 적용하는 가변방식(Adaptive spatial kernel)이 있다. 측정치가 조사지역에 규칙적으로 분포할 경우 고정방식을 사용하고, 조사지역 주위에 측정치의 분포가 다양할 경우는 가변방식을 사용한다. 그러나 이에 대한 판단이 확실치 않을 경우, 대개 가변방식을 채택한다. 또한, 적정 대역폭을 설정하기 위해 AIC(Akaike Information Criterion) 또는 CV(Cross Validation)가 사용되는데, 측정치과 추정치의 차이 및 모형의 복합성을 고려하는 AIC방식이 선호된다.
지리적 가중 회귀모델의 입력 변수는 표 3과 같이 공간 속성과 대기질 측정치인 것이 바람직하고, m개의 대기질 정보에 대해 각각 모델을 생성하였다.
지역별로 수집 가능한 공간속성은 공장 수, 공사 중 건수, 건물 수, 건물의 평균 면적, 녹지 면적, 공원 면적, 거주지 면적, 상업지구 면적, 도로 길이, 도로 넓이, 교차로 수, 거주 인구 수 등이 있을 수 있으나, 본 발명은 공간속성 데이터와 대기질 측정치를 이용한 상관분석기반의 속성선택 방법(Correlation Based Feature Selection)을 적용함으로써, 최종적으로 5개의 변수를 선택해 사용하였다.
즉, 본 발명의 지리적 가중 회귀모델(GWR)는 각 지역의 공간정보와 대기질 정보를 입력받아, 각 지역의 공간 속성을 고려한 대기질 정보의 공간적 변이값을 획득 및 출력하도록 한다.
Attributes Mean Min Max Standard Deviation
Green Zone Size 109310 0 250000 98469
Residential Area Size 16107 0 132301 31733
Road Length 1185 0 4908 1117
Averaged Road Width 14229 0 49259 12825
Residential Population 430 0 3977 906
시공간 예측모델(113)은 딥 러닝 방식으로 시계열 예측모델과 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하기 위한 것으로, 시계열 예측모델(111)과 공간속성 기반 예측모델(112)의 결과를 시간 단위로 데이터를 생성한 후 다시 LSTM 모델의 입력값으로 사용해 최종 대기질 예측치를 산출한다.
시공간 예측모델(113) 또한 순환신경망의 LSTM로 구현되나, 입력 노드 수는 시계열 모델의 출력 값 m개, 공간속성 기반 예측모델의 출력 값 m개로 구성된 2ㅧm개가 되며 은닉 노드는 2ㅧl개로 구성되며, 나머지 파라메타는 앞서 설명된 표1와 동일하게 설정될 수 있다. 이 모델(113)은 시간 및 일 단위의 예측치를 생성 및 제공할 수 있으나, 이에 한정되지는 않는다.
데이터 수집부(120)는 대기질 정보, 기상 정보 및 공간 정보를 지역 단위로 획득하고 저장 관리하도록 한다. 즉, 분석 대상 지역 전체를 다수의 지역으로 분할한 후, 지역 단위로 대기질 및 기상 정보, 공간속성 정보를 각각 획득 및 저장하도록 한다.
다만, 다수의 지역 모두에 대기질 측정소를 설치하여, 다수의 지역 각각의 대기질 및 기상 정보를 직접 획득하는 것은 현실적으로 불가능한 문제가 발생한다.
이에 본 발명에서는 도 5에서와 같이 대기질 측정소의 공간 속성과 나머지 셀 영역의 공간 속성들을 비교 분석하여, 유사 공간 특성을 가지는 셀 영역들을 동일 그룹으로 클러스터링한 후, 대기질 측정소의 측정값을 클러스터 단위(빨간, 초록, 노란, 파란)로 공유할 수 있도록 한다. 즉, 대기질 측정소가 없는 셀 영역은 자신과 유사한 공간 특성을 가지는 셀 영역에 설치된 대기질 측정소의 측정치를 공유받아 이용할 수 있도록 한다.
이때, 클러스터링은 K-means 방식으로 수행되며, 엘보우 기법(Elbow)을 알고리즘을 통해 클러스터 수가 결정 및 조정될 수 있으나, 이에 한정될 필요는 없다.
예측 모델 학습부(130)는 시계열 예측모델(111) 및 공간속성 기반 예측모델(112)을 1차 훈련시킨 후, 이들의 출력값을 이용하여 시공간 예측모델(113)을 추가 훈련시키는 일련의 과정을 반복 수행함으로써, 앙상블 예측모델(110)이 대기질 정보와 기상 정보 이외에 공간 정보까지 추가 고려한 대기질 예측 동작을 수행될 수 있도록 한다.
보다 상세하게는, 먼저 예측 모델 학습부(130)는 데이터 수집부(120)에 저장된 정보에 기반하여 대기질 정보 및 기상 정보를 입력 조건으로 가지고 대기질 예측치를 출력 조건으로 가지는 1차 학습 데이터를 다수개 생성하도록 한다.
그리고 1차 학습 데이터를 통해 시계열 예측모델(111)을 반복 학습함과 동시에 시계열 예측모델(111)에 제공되는 대기질 정보 또한 공간속성 기반 예측모델(112)에도 동시 제공함으로써, 시계열 예측모델(111)의 출력값에 대응되는 대기질 정보의 공간적 변이값을 또한 동시 획득하도록 한다.
그리고 시계열 예측모델(111)의 대기질 예측치와 공간속성 기반 예측모델(112)의 대기질 정보의 공간적 변이값을 입력 조건으로 가지고, 대기질 최종 예측치를 출력 조건으로 가지는 2차 학습 데이터를 추가 생성하고, 이들을 통해 시공간 예측모델(113)을 반복적으로 기계 학습시키도록 한다.
그리고 시공간 예측모델(113)의 출력 편차가 기 설정값 이하로 수렴되면, 예측 모델 학습을 종료하도록 한다.
예측부(140)는 다수의 지역 중 어느 하나가 예측 대상 지역으로 결정되면, 데이터 수집부(120)를 통해 예측 대상 지역의 현재 대기질 정보 및 기상 정보, 그리고 공간속성 정보를 획득하도록 한다.
이때, 예측 대상 지역에 대기질 측정소가 존재하는 경우에는, 해당 대기질 측정소의 대기질 정보 및 기상 정보를 이용하되, 대기질 측정소가 존재하지 않는 경우에는 예측 대상 지역이 속한 클러스터에 존재하는 대기질 측정소의 측정치를 공유받아 이용할 수 있도록 한다.
그리고 대기질 정보 및 기상 정보는 시계열 예측모델(111)에 입력하고, 대기질 정보 및 공간속성 정보는 공간속성 기반 예측모델(112)에 입력하여, 시계열 예측모델(111) 및 공간속성 기반 예측모델(112)을 통해서 대기질 예측치와 대기질 정보의 공간적 변이값을 동시 획득하도록 한다.
그리고 대기질 예측치와 대기질 정보의 공간적 변이값을 다시 시공간 예측모델(113)에 입력함으로써, 시공간 예측모델(113)이 대기질 정보, 기상 정보 및 공간 정보 모두를 고려한 대기질 최종 예측치를 획득 및 출력하도록 한다.
상술한 본 발명에 따른 방법은 컴퓨터에서 실행되기 위한 프로그램으로 제작되어 컴퓨터가 읽을 수 있는 기록 매체에 저장될 수 있으며, 컴퓨터가 읽을 수 있는 기록 매체의 예로는 ROM, RAM, CD-ROM, 자기 테이프, 플로피디스크, 광 데이터 저장장치 등이 있으며, 또한 캐리어 웨이브(예를 들어 인터넷을 통한 전송)의 형태로 구현되는 것도 포함한다.
컴퓨터가 읽을 수 있는 기록 매체는 네트워크로 연결된 컴퓨터 시스템에 분산되어, 분산방식으로 컴퓨터가 읽을 수 있는 코드가 저장되고 실행될 수 있다. 그리고, 상기 방법을 구현하기 위한 기능적인(function) 프로그램, 코드 및 코드 세그먼트들은 본 발명이 속하는 기술분야의 프로그래머들에 의해 용이하게 추론될 수 있다.
이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 의해 다양한 변형 실시가 가능한 것은 물론이고, 이러한 변형 실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어서는 안될 것이다.

Claims (5)

  1. 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델;
    지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 및
    딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델;
    예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 대기질 예측부를 포함하며,
    상기 대기질 정보는
    미세먼지 정보와 악취 정보로 구성되는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
  2. 제1항에 있어서,
    상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 학습시킨 후, 이에 연속하여 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 추가 학습시키는 예측 모델 학습부를 더 포함하는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
  3. 제2항에 있어서, 상기 시계열 예측모델은
    순환신경망(RNN)의 LSTM(Long Short Term Memory)으로 구현되는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
  4. 제2항에 있어서,
    대기질 정보, 기상 정보 및 공간 정보를 지역 단위로 획득 및 저장하되, 공간 속성에 기반하여 지역 클러스터링을 수행한 후, 대기질 측정소를 통해 측정한 대기질 정보 및 기상 정보를 클러스터 단위로 공유하는 데이터 수집부를 더 포함하는 것을 특징으로 하는 미세먼지 및 악취 농도 예측 시스템.
  5. 딥 러닝 방식으로 대기질 정보 및 기상 정보에 대응되는 대기질 예측치를 획득 및 출력하는 시계열 예측모델; 지리적 가중 회귀모델(GWR)을 통해 상기 대기질 정보의 공간적 변이값을 지역 단위로 획득 및 출력하는 공간속성 기반 예측모델; 및 딥 러닝 방식으로 상기 시계열 예측모델과 상기 공간속성 기반 예측모델의 출력들에 대응되는 대기질 최종 예측치를 획득 및 출력하는 시공간 예측모델를 구비하는 앙상블 예측모델을 이용한 미세먼지 및 악취 농도 예측 방법에 있어서,
    상기 대기질 정보 및 기상 정보와 상기 대기질 예측치간의 상관관계를 상기 시계열 예측모델에 반복 학습시키고, 이와 동시에 상기 시계열 예측모델 및 공간속성 기반 예측모델의 출력과 상기 대기질 최종 예측치간의 상관관계를 상기 시공간 예측모델에 반복 학습시키는 단계; 및
    예측 대상 지역이 선택되면, 상기 시계열 예측모델과 상기 공간속성 기반 예측모델을 통해 상기 예측 대상 지역의 대기질 예측치와 대기질 정보의 공간적 변이값을 우선 획득한 후, 상기 시공간 예측모델을 통해 상기 대기질 예측치와 대기질 정보의 공간적 변이값에 대응되는 대기질 최종 예측지를 최종 획득 및 출력하는 단계를 포함하는 미세먼지 및 악취 농도 예측 방법.
KR1020190178098A 2019-12-30 2019-12-30 미세먼지 및 악취 예측 시스템 및 방법 KR102439038B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020190178098A KR102439038B1 (ko) 2019-12-30 2019-12-30 미세먼지 및 악취 예측 시스템 및 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020190178098A KR102439038B1 (ko) 2019-12-30 2019-12-30 미세먼지 및 악취 예측 시스템 및 방법

Publications (2)

Publication Number Publication Date
KR20210086786A KR20210086786A (ko) 2021-07-09
KR102439038B1 true KR102439038B1 (ko) 2022-09-02

Family

ID=76865184

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020190178098A KR102439038B1 (ko) 2019-12-30 2019-12-30 미세먼지 및 악취 예측 시스템 및 방법

Country Status (1)

Country Link
KR (1) KR102439038B1 (ko)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102537964B1 (ko) * 2021-09-06 2023-05-30 인하대학교 산학협력단 실내 재난환경에서 건물 기본구조요소 별 기계학습 모델을 이용한 재난확산 영역의 앙상블 예측 방법 및 장치
KR102374002B1 (ko) * 2021-10-08 2022-03-15 주식회사 에어핏 위성이미지를 통한 미세먼지농도 측정 장치, 방법 및 프로그램
KR20230123574A (ko) 2022-02-16 2023-08-24 경희대학교 산학협력단 인공지능 전이학습을 이용한 미세먼지 예측, 환기제어시스템 및 방법
KR102642421B1 (ko) * 2022-12-30 2024-02-28 건국대학교 산학협력단 인공지능 기반의 대기질 모델링 장치 및 방법
CN117196109B (zh) * 2023-09-15 2024-04-05 中煤科工集团重庆研究院有限公司 一种基于多源信息融合的煤矿井下粉尘浓度预测修正方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101610595B1 (ko) 2015-07-16 2016-04-07 김승우 긴급 폭풍해일 예측 시스템 및 그 방법
WO2018214060A1 (zh) 2017-05-24 2018-11-29 北京质享科技有限公司 一种城市小尺度空气质量指数预测方法与***
KR101945314B1 (ko) 2018-07-27 2019-04-17 딥클라우드 주식회사 인공지능 알고리즘을 기반으로 한 미세먼지 예측모듈을 이용한 미세먼지 저감장치

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20190030403A (ko) * 2017-09-14 2019-03-22 주식회사 케이티 가격과 비용의 신경망 학습을 기반으로 수직 농장의 작물의 출하를 예측하는 장치 및 방법
KR102042165B1 (ko) * 2018-01-29 2019-11-07 성균관대학교산학협력단 미세먼지의 농도 예측 방법 및 장치

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101610595B1 (ko) 2015-07-16 2016-04-07 김승우 긴급 폭풍해일 예측 시스템 및 그 방법
WO2018214060A1 (zh) 2017-05-24 2018-11-29 北京质享科技有限公司 一种城市小尺度空气质量指数预测方法与***
KR101945314B1 (ko) 2018-07-27 2019-04-17 딥클라우드 주식회사 인공지능 알고리즘을 기반으로 한 미세먼지 예측모듈을 이용한 미세먼지 저감장치

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
이종영 외 3인, "미세먼지, 악취 농도 예측을 위한 앙상블 방법", J. Soc. Korea Ind. Syst. Eng Vol. 42, No. 4 : 203-210 (2019.12.16)*

Also Published As

Publication number Publication date
KR20210086786A (ko) 2021-07-09

Similar Documents

Publication Publication Date Title
KR102439038B1 (ko) 미세먼지 및 악취 예측 시스템 및 방법
Seyedzadeh et al. Tuning machine learning models for prediction of building energy loads
Nutkiewicz et al. Data-driven Urban Energy Simulation (DUE-S): A framework for integrating engineering simulation and machine learning methods in a multi-scale urban energy modeling workflow
Velo et al. Wind speed estimation using multilayer perceptron
Dutot et al. A 24-h forecast of ozone peaks and exceedance levels using neural classifiers and weather predictions
Augustin et al. The role of simulation in modelling spatially correlated data
Kocabas et al. Bayesian networks and agent-based modeling approach for urban land-use and population density change: a BNAS model
Jia et al. Bootstrapped artificial neural networks for synthetic flow generation with a small data sample
Ghosh et al. Modeling uncertainty resulting from multiple downscaling methods in assessing hydrological impacts of climate change
Amara et al. Household electricity demand forecasting using adaptive conditional density estimation
Körner et al. Introducing Gradient Boosting as a universal gap filling tool for meteorological time series
Chari et al. Building energy performance prediction using neural networks
Saavedra-Moreno et al. Very fast training neural-computation techniques for real measure-correlate-predict wind operations in wind farms
Amirabadizadeh et al. Downscaling daily precipitation and temperatures over the Langat River Basin in Malaysia: a comparison of two statistical downscaling approaches
Van Doren et al. Automated acoustic monitoring captures timing and intensity of bird migration
Pahlavani et al. Evaluation of residential land use compatibilities using a density-based IOWA operator and an ANFIS-based model: A case study of Tehran, Iran
Parishwad et al. Investigating machine learning for simulating urban transport patterns: A comparison with traditional macro-models
Zhao et al. LandSys II: Agent-based land use–forecast model with artificial neural networks and multiagent model
Haviluddin et al. Comparing of ARIMA and RBFNN for short-term forecasting
Mezhoud et al. Hybrid Kriging and multilayer perceptron neural network technique for coverage prediction in cellular networks
Fallah-Ghalhary et al. Spring rainfall prediction based on remote linkage controlling using adaptive neuro-fuzzy inference system (ANFIS)
Fekih et al. On the regression and assimilation for air quality mapping using dense low-cost wsn
ZiaeeVafaeyan et al. Land use change model based on bee colony optimization, Markov chain and a neighborhood decay cellular automata
Aman et al. Influence-driven model for time series prediction from partial observations
De Aquino et al. Echo state networks, artificial neural networks and fuzzy systems models for improve short-term wind speed forecasting

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant