KR102504381B1 - Smart farm data processing system and smart farm data processing method - Google Patents

Smart farm data processing system and smart farm data processing method Download PDF

Info

Publication number
KR102504381B1
KR102504381B1 KR1020200064995A KR20200064995A KR102504381B1 KR 102504381 B1 KR102504381 B1 KR 102504381B1 KR 1020200064995 A KR1020200064995 A KR 1020200064995A KR 20200064995 A KR20200064995 A KR 20200064995A KR 102504381 B1 KR102504381 B1 KR 102504381B1
Authority
KR
South Korea
Prior art keywords
data
value
outlier
missing
threshold
Prior art date
Application number
KR1020200064995A
Other languages
Korean (ko)
Other versions
KR20210147568A (en
Inventor
이재수
백정현
김태현
이명훈
최인찬
이상규
홍영신
원진호
Original Assignee
대한민국
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국 filed Critical 대한민국
Priority to KR1020200064995A priority Critical patent/KR102504381B1/en
Publication of KR20210147568A publication Critical patent/KR20210147568A/en
Application granted granted Critical
Publication of KR102504381B1 publication Critical patent/KR102504381B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/50Information retrieval; Database structures therefor; File system structures therefor of still image data
    • G06F16/51Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Health & Medical Sciences (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Primary Health Care (AREA)
  • Agronomy & Crop Science (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Animal Husbandry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mining & Mineral Resources (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 서버는, 재배지로부터 수신되는 환경 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집부; 수집부에서 수신되는 환경 데이터 및 작물 데이터 중 결측치 혹은 이상치를 검출하여 정제하는 정제부; 및 정제부를 통해 정제된 환경 데이터 및 작물 데이터와, 수집부로부터 수신된 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성부를 포함하며, 수집부는 비관계형 시스템을 이용하여 환경 데이터를 저장한다.A smart farm data processing server according to an embodiment of the present invention includes a collection unit that classifies and collects environmental data, crop data, and image data received from a cultivation area; a purification unit that detects and refines missing values or outliers among the environmental data and crop data received from the collection unit; and a compositing unit that integrates the environmental data and crop data refined through the refining unit and the image data received from the collection unit, arranges them according to time series, and synthesizes them. The collection unit stores the environmental data using a non-relational system.

Description

스마트 팜 데이터 처리 시스템 및 스마트 팜 데이터 처리 방법{SMART FARM DATA PROCESSING SYSTEM AND SMART FARM DATA PROCESSING METHOD}Smart farm data processing system and smart farm data processing method {SMART FARM DATA PROCESSING SYSTEM AND SMART FARM DATA PROCESSING METHOD}

본 발명은 스마트 팜 데이터 처리 시스템 및 스마트 팜 데이터 처리 방법에 관한 것이다.The present invention relates to a smart farm data processing system and a smart farm data processing method.

최근 정보통신기술을 농업 기술에 접목하여 원격에서 자동으로 작물의 생육 환경을 관리하고 생산 효율성을 높일 수 있도록 하는 스마트 팜(smart farm)이 각광받고 있다.Recently, smart farms that combine information and communication technology with agricultural technology to remotely and automatically manage crop growth environments and increase production efficiency have been in the limelight.

하지만, 기존 스마트 팜의 데이터 처리 시스템의 경우, 환경측정 센서의 손상 또는 통신 지연 등으로 저장 DB의 로우(raw)데이터의 결측치 및 오류치가 발생하는 문제점이 있어 왔다.However, in the case of existing data processing systems of smart farms, there has been a problem in that missing values and error values of raw data in a storage DB occur due to damage to environmental measurement sensors or communication delays.

이에, 실시간 결측 데이터 감지와 센싱 데이터의 읽기/쓰기에 최적화된 데이터베이스 플랫폼 구조를 개선하여 데이터의 결측치 및 오류치의 발생을 방지할 수 있는 기술의 필요성이 제기되었다.Accordingly, the need for a technology capable of preventing the occurrence of missing values and error values in data by improving a database platform structure optimized for real-time detection of missing data and reading/writing of sensed data has been raised.

본 발명은 데이터의 유실을 방지할 수 있는 스마트 팜 데이터 처리 시스템 및 데이터 처리 방법을 제공하는 것을 목적으로 한다.An object of the present invention is to provide a smart farm data processing system and data processing method capable of preventing data loss.

또한, 본 발명은 데이터 정제 기술 적용을 통해 데이터 전처리에 대한 비용 감소 및 데이터 분석 효율을 극대화할 수 있는 스마트 팜 데이터 처리 시스템 및 데이터 처리 방법을 제공하는 것을 목적으로 한다.In addition, an object of the present invention is to provide a smart farm data processing system and data processing method that can maximize data analysis efficiency and cost reduction for data preprocessing through the application of data purification technology.

본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 서버는, 재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집부; 제1 환경 측정 센서 데이터 중 결측치 혹은 이상치를 검출하여 정제하여 제2 환경 측정 센서 데이터를 생성하는 정제부; 및 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성부를 포함하며, 수집부는 비관계형 데이터베이스에 제1 환경 측정 센서 데이터를 분리 저장하는 환경 데이터 저장부를 포함한다.A smart farm data processing server according to an embodiment of the present invention includes a collection unit that classifies and collects first environmental measurement sensor data, crop data, and image data received from a cultivation area; a refiner configured to generate second environmental sensor data by detecting and refining missing values or outliers in the first environmental sensor data; and a synthesizing unit that integrates second environmental measurement sensor data, crop data, and image data, arranges them according to time series, and synthesizes them, wherein the collection unit includes an environmental data storage unit that separates and stores the first environmental measurement sensor data in a non-relational database. do.

본 발명의 일 실시예에 있어서, 수집부는, 관계형 데이터베이스에 작물 데이터를 저장하는 작물 데이터 저장부; 및 이미지 데이터를 저장하는 이미지 데이터 저장부를 더 포함한다. In one embodiment of the present invention, the collection unit, crop data storage unit for storing crop data in a relational database; and an image data storage unit that stores image data.

본 발명의 일 실시예에 있어서, 정제부는, 수집부로부터 수신된 제1 환경 측정 센서 데이터 중 결측치를 판단하고 검출하는 결측치 검출부; 결측치를 제외한 제1 환경 측정 센서 데이터 중 이상치를 판단하고 검출하는 이상치 검출부; 및 결측치 및 이상치를 예측하여 데이터를 보정하는 데이터 보정부를 포함한다. In one embodiment of the present invention, the refining unit may include: a missing value detector determining and detecting a missing value among the first environment measurement sensor data received from the collecting unit; an outlier detecting unit for determining and detecting an outlier among the first environmental measurement sensor data excluding missing values; and a data compensator correcting data by predicting missing values and outliers.

본 발명의 일 실시예에 있어서, 합성부는, 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 시계열에 따라 각각 정렬하는 시계열 정렬부; 제2 환경 측정 센서 데이터를 기설정된 컬럼 인덱스를 기준으로 저장하여 관계형 센서 데이터 테이블을 생성하는 관계형 테이블 생성부; 및 관계형 센서 데이터 테이블에 작물 데이터 및 이미지 데이터를 매칭시켜 분산 저장하는 분산 저장부를 포함한다. In one embodiment of the present invention, the synthesizing unit may include: a second environmental measurement sensor data, crop data, and a time series aligning unit arranging image data according to time series; a relational table creation unit generating a relational sensor data table by storing the second environment measurement sensor data based on a preset column index; and a distributed storage unit that distributes and stores crop data and image data by matching them to a relational sensor data table.

본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 서버는, 결측치 혹은 이상치가 기설정된 개수 혹은 기설정된 임계값을 초과하는 경우, 관리자 단말에 센서 교체 알람 신호를 전송하는 알람부를 더 포함한다. The smart farm data processing server according to an embodiment of the present invention further includes an alarm unit for transmitting a sensor replacement alarm signal to an administrator terminal when the missing value or the abnormal value exceeds a preset number or preset threshold.

본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 시스템은, 작물 재배 환경의 제1 환경 측정 센서 데이터를 측정하는 환경 센서; 작물의 생육량을 포함하는 작물 데이터를 측정하는 작물 센서; 작물의 영상을 포함하는 이미지 데이터를 촬영하는 카메라; 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 수신하여 스마트 팜 데이터를 생성하는 제1항의 스마트 팜 데이터 처리 서버; 스마트 팜 데이터 처리 서버로부터 수신된 스마트 팜 데이터를 저장하는 저장 DB; 및 스마트 팜 데이터 처리 서버와 통신 가능하도록 제공된 관리자 단말을 포함한다. A smart farm data processing system according to an embodiment of the present invention includes an environmental sensor for measuring first environmental measurement sensor data of a crop growing environment; Crop sensors for measuring crop data including the growth rate of crops; a camera for taking image data including an image of a crop; The smart farm data processing server of claim 1 generating smart farm data by receiving first environmental measurement sensor data, crop data, and image data; A storage DB for storing the smart farm data received from the smart farm data processing server; and a manager terminal provided to communicate with the smart farm data processing server.

본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 방법은, 재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집 단계; 제1 환경 측정 센서 데이터 중 결측치 혹은 이상치를 검출하여 정제하여 제2 환경 측정 센서 데이터를 생성하는 정제 단계; 및 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성 단계를 포함하며, 수집부는 비관계형 데이터베이스에 제1 환경 측정 센서 데이터를 분리 저장하는 환경 데이터 저장 단계를 포함한다. A smart farm data processing method according to an embodiment of the present invention includes a collection step of classifying and collecting first environmental measurement sensor data, crop data, and image data received from a cultivation area; a purification step of generating second environmental sensor data by detecting and refining missing values or outliers in the first environmental sensor data; and a synthesizing step of integrating the second environmental measurement sensor data, crop data, and image data, arranging them according to time series, and combining them, wherein the collecting unit separates and stores the first environmental measurement sensor data in a non-relational database. includes

본 발명의 일 실시예에 있어서, 정제 단계는, 수집부로부터 수신된 제1 환경 측정 센서 데이터 중 결측치를 판단하고 검출하는 결측치 검출 단계; 결측치를 제외한 제1 환경 측정 센서 데이터 중 이상치를 판단하고 검출하는 이상치 검출 단계; 및 결측치 및 이상치를 예측하여 데이터를 보정하는 데이터 보정 단계를 포함한다. In one embodiment of the present invention, the refining step may include a missing value detection step of determining and detecting a missing value among the first environment measurement sensor data received from the collection unit; an outlier detection step of determining and detecting an outlier among the first environmental measurement sensor data excluding missing values; and a data correction step of correcting data by predicting missing values and outliers.

본 발명의 일 실시예에 있어서, 데이터 보정 단계에서, 결측치 혹은 이상치가 제1 임계값 이하인 경우, 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 결측치 혹은 이상치의 예측값을 도출한다.In one embodiment of the present invention, in the data correction step, when the missing value or outlier is equal to or less than the first threshold value, an average value, mode, or median value is calculated using an interpolation method to derive a predicted value of the missing value or outlier.

본 발명의 일 실시예에 있어서, 데이터 보정 단계에서, 결측치 혹은 이상치가 제1 임계값을 초과하며 제2 임계값을 초과하지 않는 경우, 회귀 알고리즘을 이용하여 결측치 혹은 이상치의 예측값을 도출한다.In an embodiment of the present invention, in the data correction step, when the missing value or outlier exceeds the first threshold and does not exceed the second threshold, a predicted value of the missing value or outlier is derived using a regression algorithm.

본 발명의 일 실시예에 있어서, 데이터 보정 단계에서, 결측치 혹은 이상치가 제2 임계값을 초과하는 경우, 관리자 단말로 알람 신호를 송신한다. In one embodiment of the present invention, in the data correction step, when the missing value or the outlier exceeds the second threshold, an alarm signal is transmitted to the manager terminal.

본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록매체에 있어서, 스마트 팜 데이터 처리 방법은, 재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집 단계; 제1 환경 측정 센서 데이터 중 결측치 혹은 이상치를 검출하여 정제하여 제2 환경 측정 센서 데이터를 생성하는 정제 단계; 및 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성 단계를 포함하며, 수집부는 비관계형 데이터베이스에 제1 환경 측정 센서 데이터를 분리 저장하는 환경 데이터 저장 단계를 포함한다.In the computer-readable recording medium containing a program for executing the smart farm data processing method according to an embodiment of the present invention, the smart farm data processing method includes first environmental measurement sensor data received from a plantation, crop data, and a collecting step of classifying and collecting image data. a purification step of generating second environmental sensor data by detecting and refining missing values or outliers in the first environmental sensor data; and a synthesizing step of integrating the second environmental measurement sensor data, crop data, and image data, arranging them according to time series, and combining them, wherein the collecting unit separates and stores the first environmental measurement sensor data in a non-relational database. includes

본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 서버를 이용하는 경우, 데이터 정제 기술 적용을 통해 데이터 전처리에 대한 비용 감소 및 데이터 분석 효율을 극대화할 수 있는 효과가 있다.In the case of using the smart farm data processing server according to an embodiment of the present invention, there is an effect of reducing the cost of data preprocessing and maximizing the efficiency of data analysis through the application of data purification technology.

또한, 센서 고장 및 정전 등으로 인한 데이터 결측치 및 오류를 검출하여 데이터를 예측 및 보정할 수 있으며, 데이터를 테이블화하거나 이동하면서 발생하는 쓰기 지연에 따른 데이터 유실을 최소화할 수 있는 효과가 있다.In addition, it is possible to predict and correct data by detecting data missing values and errors due to sensor failures and power outages, and to minimize data loss due to writing delays occurring while tabulating or moving data.

도 1은 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 서버를 도시한 것이다.
도 2a는 종래의 관계형 데이터베이스를 이용한 환경 데이터를 나타낸 예시이다.
도 2b는 본 발명의 비관계형 데이터베이스를 이용한 제1 환경 측정 센서 데이터를 나타낸 예시이다.
도 3은 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 시스템을 도시한 것이다.
도 4는 본 발명의 다른 실시예에 따른 스마트 팜 데이터 처리 시스템을 도시한 것이다.
도 5는 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 방법을 도시한 것이다.
도 6은 도 5의 정제 단계에서 결측치 검출 단계 및 데이터 보정 단계를 나타낸 순서도이다.
도 7은 도 5의 정제 단계에서 이상치 검출 단계 및 데이터 보정 단계를 나타낸 순서도이다.
1 illustrates a smart farm data processing server according to an embodiment of the present invention.
2a is an example of environmental data using a conventional relational database.
2B is an example of first environment measurement sensor data using the non-relational database of the present invention.
3 illustrates a smart farm data processing system according to an embodiment of the present invention.
4 illustrates a smart farm data processing system according to another embodiment of the present invention.
5 illustrates a smart farm data processing method according to an embodiment of the present invention.
FIG. 6 is a flowchart illustrating a missing value detection step and a data correction step in the refinement step of FIG. 5 .
FIG. 7 is a flowchart illustrating an outlier detection step and a data correction step in the refinement step of FIG. 5 .

이하, 본 발명의 일부 실시예들을 예시적인 도면을 통해 상세하게 설명한다. 각 도면의 구성요소들에 참조부호를 부가함에 있어서, 동일한 구성요소들에 대해서는 비록 다른 도면상에 표시되더라도 가능한 한 동일한 부호를 가지도록 하고 있음에 유의해야 한다. 또한, 본 발명을 설명함에 있어, 관련된 공지 구성 또는 기능에 대한 구체적인 설명이 본 발명의 요지를 흐릴 수 있다고 판단되는 경우에는 그 상세한 설명은 생략한다.Hereinafter, some embodiments of the present invention will be described in detail through exemplary drawings. In adding reference numerals to components of each drawing, it should be noted that the same components have the same numerals as much as possible even if they are displayed on different drawings. In addition, in describing the present invention, if it is determined that a detailed description of a related known configuration or function may obscure the gist of the present invention, the detailed description will be omitted.

본 발명의 스마트 팜 데이터 처리 시스템 및 스마트 팜 데이터 처리 방법은 작물 재배 환경에서 사용하기 위한 발명으로서, 데이터 정제 기술을 적용하여 센서의 손상 또는 통신 지연 등으로 발생하는 저장 DB의 로우(raw)데이터 결측치와 오류치를 감지하고 전처리함으로써, 데이터 분석 효율을 향상시키기 위한 것이다.The smart farm data processing system and smart farm data processing method of the present invention are inventions for use in a crop growing environment, by applying data purification technology, missing raw data of the storage DB caused by sensor damage or communication delay It is to improve the efficiency of data analysis by detecting and preprocessing error values and errors.

본 발명은 주로 농산물 재배지, 특히 스마트 온실 내부에서 사용될 수 있으나 그 사용처가 이에 한정되는 것은 아니며 다양한 분야에서 활용이 가능하다.The present invention can be mainly used in agricultural plantations, especially inside smart greenhouses, but its use is not limited thereto and can be used in various fields.

도 1은 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 서버를 도시한 것이다.1 illustrates a smart farm data processing server according to an embodiment of the present invention.

도 1을 참조하면, 스마트 팜 데이터 처리 서버(100)는, 수집부(110), 정제부(120) 및 합성부(140)를 포함한다.Referring to FIG. 1 , the smart farm data processing server 100 includes a collection unit 110 , a purification unit 120 and a synthesis unit 140 .

먼저, 수집부(110)는, 재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집한다. First, the collection unit 110 classifies and collects first environment measurement sensor data, crop data, and image data received from a plantation site.

여기서, 제1 환경 측정 센서 데이터는 재배지의 환경 센서로부터 측정되어 수신되는 측정 값으로 대기 온도, 대기 습도, 토양 온도, 토양 습도, 토양 pH, 토양 EC, 일사량, 조도(광량) 등을 포함하는 것일 수 있다. 작물 데이터는 생장점, 줄기 두께, 및 화방 높이 등을 포함하는 생육 데이터일 수 있다. 이미지 데이터는 개화속도, 개화거리, 화방 간 거리, 화방 줄기 형상, 엽색, 화색, 개화 균일성, 착과수 등을 포함하는 영상 데이터일 수 있다. 상술한 데이터들은 이해의 편의를 위한 예시로서, 그 종류가 이에 한정되는 것은 아니다.Here, the first environmental measurement sensor data is a measurement value measured and received from an environmental sensor of a cultivation field, and includes air temperature, air humidity, soil temperature, soil humidity, soil pH, soil EC, solar radiation, illuminance (light intensity), and the like. can The crop data may be growth data including a growth point, stem thickness, flower bed height, and the like. The image data may be image data including flowering speed, flowering distance, distance between flower beds, flower stem shape, leaf color, flower color, flowering uniformity, number of fruits, and the like. The above data are examples for convenience of understanding, and the types are not limited thereto.

수집부(110)는 상기 데이터를 각각 분류하여 저장하기 용이하도록, 작물 데이터 저장부, 환경 데이터 저장부, 및 이미지 데이터 저장부의 구성으로 구분될 수 있다.The collection unit 110 may be divided into configurations of a crop data storage unit, an environment data storage unit, and an image data storage unit so as to easily classify and store the data.

작물 데이터 저장부는 관계형 데이터베이스에 작물 데이터를 저장한다. 이 때, 관계형 데이터베이스(Relational database, RDBMS)란, 상호 관련성을 가진 테이블(Table)들의 집합을 말한다. 관계형 데이터베이스를 사용하면, 처음 데이터베이스를 만든 후 관련 응용 프로그램을 변경하지 않고도, 새로운 작물 데이터를 추가할 수 있어서 확장에 용이한 이점이 있다.The crop data storage unit stores crop data in a relational database. At this time, a relational database (RDBMS) refers to a set of tables having interrelationships. When using a relational database, it is easy to expand because new crop data can be added without changing related applications after the database is initially created.

환경 데이터 저장부는 비관계형 데이터베이스에 상기 제1 환경 측정 센서 데이터를 분리 저장하는 기능을 한다. 비관계형 데이터베이스(NoSQL; Not only SQL)란, 정형화된 데이터를 정해진 테이블 속에서 관리하는 관계형 DB와는 달리 비정형화 데이터를 유연한 구조 속에서 관리하는 데이터베이스를 의미한다. 비관계형 데이터베이스로는, 몽고DB(Mongo DB), 카산드라(Cassandra), 혹은 아파치 HBase(Apache  HBase) 등이 사용될 수 있다. 이러한 비관계형 데이터베이스를 사용하는 경우, 데이터를 테이블화하지 않고 실시간으로 누적 저장되도록 처리할 수 있다.The environment data storage unit functions to separate and store the first environment measurement sensor data in a non-relational database. A non-relational database (NoSQL; Not only SQL) is a database that manages unstructured data in a flexible structure, unlike a relational DB that manages standardized data in a set table. As a non-relational database, Mongo DB, Cassandra, or Apache HBase may be used. In the case of using such a non-relational database, data can be accumulated and stored in real time without being tabulated.

반면, 종래에는 환경 데이터를 관계형 데이터베이스를 사용하여 저장하도록 설정되어 도시된 테이블과 같은 형태로 처리하였다. On the other hand, conventionally, environmental data is set to be stored using a relational database and processed in the form of a table shown.

도 2a는 종래의 관계형 데이터베이스를 이용한 환경 데이터를 나타낸 예시이다.2a is an example of environmental data using a conventional relational database.

도 2a를 참조하면, 환경 데이터를 5분 단위로 수신하여 온도, 습도, 풍향, 풍속, 일사, 누적일사와 같은 컬럼의 순서를 갖는 인덱스 값으로 테이블화하여 처리한 것을 확인할 수 있다.Referring to FIG. 2A , it can be confirmed that environmental data is received every 5 minutes and processed into a table with index values having the order of columns such as temperature, humidity, wind direction, wind speed, solar radiation, and cumulative solar radiation.

이러한 종래의 관계형 데이터베이스 시스템은 다음과 같은 문제점을 가진다.Such a conventional relational database system has the following problems.

일반적으로, 재배지의 재배 시스템 상에서 이벤트가 발생하는 경우, 혹은 외적 물리적 요인에 의해 노이즈가 형성되는 문제점이 있어 왔다. 예를 들어, 재배지의 펌프와 같은 가동 장치가 작동될 때, 일시적으로 특정 센서의 측정값이 누락되거나 왜곡되어 저장될 우려가 있다.In general, there has been a problem in that noise is formed when an event occurs on a cultivation system of a cultivation field or due to external physical factors. For example, when a moving device such as a pump in a plantation is operated, there is a concern that a measurement value of a specific sensor is temporarily omitted or stored in a distorted manner.

여기서, 특히 종래와 같이 관계형 DB를 사용하는 경우, 데이터의 저장 주기를 분 단위, 시간 단위 등으로 설정하여 해당 주기마다 측정되는 환경 데이터를 저장하게 되므로, 측정 데이터 개수가 한정적이게 된다.Here, in particular, when using a relational DB as in the prior art, since the storage period of data is set to units of minutes, units of time, etc., and environment data measured for each period are stored, the number of measurement data is limited.

이 경우, 누락된 결측치 혹은 오류로 인한 이상치를 정확하게 보정하기에 충분한 데이터가 확보되지 못하여 데이터의 보정이 어렵고, 데이터 정확도가 저하되는 문제점이 있다.In this case, since data sufficient to accurately correct missing values or outliers due to errors is not secured, data correction is difficult and data accuracy is degraded.

또한, 데이터를 수신하여 테이블화하거나 데이터를 이동시키는 과정에서 쓰기 지연 등의 문제로 인해 데이터가 유실되는 문제가 발생하게 된다.In addition, a problem of data loss occurs due to problems such as write delay in the process of receiving data and converting it into a table or moving data.

본 발명은 이와 같은 문제점을 해결하기 위한 것으로, 환경 데이터를 비관계형 데이터베이스에 저장하도록 구현한 것이다.The present invention is to solve this problem, and is implemented to store environmental data in a non-relational database.

도 2b는 본 발명의 비관계형 데이터베이스를 이용한 제1 환경 측정 센서 데이터를 나타낸 예시이다.2B is an example of first environment measurement sensor data using the non-relational database of the present invention.

도 2b를 참조하면, 환경 측정 센서들 각각이 측정하는 제1 환경 측정 센서 데이터들을 정형화된 테이블이 아닌 유연한 형태로 수신하여 실시간 누적 저장되는 것을 확인할 수 있다.Referring to FIG. 2B , it can be confirmed that the first environmental measurement sensor data measured by each of the environmental measurement sensors is received in a flexible form rather than a standardized table and accumulated and stored in real time.

즉, 본 발명과 같이 데이터를 비관계형 데이터베이스에 저장하는 경우, 테이블을 생성할 필요가 없어지므로 실시간으로 입력되는 데이터를 그대로 저장할 수 있는 이점이 있다. 이에 따라, 데이터 이동 시 발생하는 쓰기 지연을 최소화하여 결측치의 발생을 방지할 수 있는 효과가 있다.That is, when data is stored in a non-relational database as in the present invention, there is an advantage in that data input in real time can be stored as it is because there is no need to create a table. Accordingly, there is an effect of preventing the occurrence of a missing value by minimizing a writing delay that occurs during data movement.

또한, 최대한의 실시간 누적 데이터를 확보할 수 있게 됨에 따라, 데이터 보정 단계에서 보정이 용이해지며, 결측치 및 이상치의 예측 정확도를 높일 수 있는 이점이 있게 된다.In addition, as maximum real-time cumulative data can be secured, correction becomes easy in the data correction step, and there is an advantage in that prediction accuracy of missing values and outliers can be increased.

이어서, 이미지 데이터 저장부는 파일 시스템(File System)의 저장 방식을 이용하여 이미지 데이터를 저장하는 기능을 한다. 여기서, 파일 시스템(File System)이란 데이터가 하나의 폴더에 누적 적재되는 시스템을 말한다. 이미지 데이터는 센서 데이터와 같이 실시간으로 측정되는 것이 아닌 작물 생육의 이벤트 발생시, 관리자 원격 제어시, 혹은 기설정된 촬영시간을 기반으로 촬영되어 적재되도록 처리될 수 있다.Next, the image data storage unit functions to store image data using a storage method of a file system. Here, the file system refers to a system in which data is accumulated and loaded into one folder. Image data may not be measured in real time like sensor data, but may be captured and loaded when a crop growth event occurs, when a manager remotely controls the image, or based on a predetermined shooting time.

이어서, 정제부(120)는, 제1 환경 측정 센서 데이터 중 결측치 혹은 이상치를 검출하여 정제하여 제2 환경 측정 센서 데이터를 생성한다. 정제부(120)는, 결측치 검출부(121), 이상치 검출부(122), 및 데이터 보정부(123)로 구성된다.Subsequently, the refiner 120 detects and refines missing values or outliers in the first environmental measurement sensor data to generate second environmental measurement sensor data. The refining unit 120 is composed of a missing value detecting unit 121, an outlier detecting unit 122, and a data compensating unit 123.

먼저, 결측치 검출부(121)는, 수집부로부터 수신된 제1 환경 측정 센서 데이터 중 결측치를 판단하고 검출한다. 여기서 결측치란, 센서 고장, 통신 지연, 재배지의 정전 발생 등으로 유실되어 누락된 데이터를 의미한다. First, the missing value detection unit 121 determines and detects a missing value among the first environment measurement sensor data received from the collecting unit. Here, the missing value refers to data that is lost due to sensor failure, communication delay, power outage in the cultivation area, and the like.

이상치 검출부(122)는, 결측치를 제외한 제1 환경 측정 센서 데이터 중 이상치를 판단하고 검출한다. 여기서, 이상치는 센서 고장, 통신 지연 등으로 인해 측정 오류가 발생하여 연속된 값이 지속적으로 측정되거나 터무니 없이 크고 작은 값으로 측정된 데이터를 의미한다.The outlier detection unit 122 determines and detects an outlier among the first environment measurement sensor data excluding missing values. Here, the outlier refers to data where a measurement error occurs due to a sensor failure, communication delay, etc., so that continuous values are continuously measured or values are measured with absurdly large and small values.

데이터 보정부(123)는, 상기 결측치 및 이상치를 예측하여 데이터를 보정하는 기능을 한다. 데이터 보정 방법으로는 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 결측치 혹은 이상치의 예측값을 도출할 수 있으며, 회귀 알고리즘을 이용하여 예측값을 도출할 수도 있다. 데이터 보정 방법과 관련된 자세한 설명은 후술한다.The data correction unit 123 functions to correct data by predicting the missing value and the abnormal value. As a data correction method, an average value, a mode value, or a median value may be calculated using an interpolation method to derive a predicted value of a missing value or an outlier, or a predicted value may be derived using a regression algorithm. A detailed description related to the data correction method will be described later.

이어서, 합성부(130)는, 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성한다. 합성부는, 다음과 같은 구성들을 포함하도록 제공될 수 있다.Subsequently, the synthesis unit 130 integrates the second environment measurement sensor data, crop data, and image data, arranges them according to time series, and synthesizes them. The synthesis unit may be provided to include the following components.

시계열 정렬부(131)는, 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 시계열에 따라 각각 정렬하는 기능을 수행한다.The time series aligning unit 131 performs a function of aligning the second environment measurement sensor data, crop data, and image data according to time series.

관계형 테이블 생성부(132)는, 제2 환경 측정 센서 데이터를 기설정된 컬럼 인덱스를 기준으로 저장하여 관계형 센서 데이터 테이블을 생성한다.The relational table creation unit 132 generates a relational sensor data table by storing the second environment measurement sensor data based on a preset column index.

데이터베이스 관리 시스템(DBMS)에서 데이터들은 데이터 저장소에 저장될 수 있다. 관계형 데이터베이스 관리 시스템(RDBMS)에서는 이러한 데이터 저장소는 테이블로 지칭될 수 있다. 이러한 테이블은 관리자에 의해 기설정된 특정 컬럼 및 인덱스를 기반으로 구현될 수 있다.In a database management system (DBMS), data can be stored in a data store. In a relational database management system (RDBMS), these data stores can be referred to as tables. Such a table may be implemented based on specific columns and indexes preset by an administrator.

컬럼 및 인덱스는 다수로 이루어질 수 있으며, 파티셔닝된 컬럼 집합 내에서의 해당 컬럼의 인덱스 정보를 이용하여 테이블을 형성할 수 있다.A number of columns and indexes may be formed, and a table may be formed using index information of a corresponding column in a partitioned column set.

예를 들어, 제1 컬럼을 대기 온도, 대기 습도, 제2 컬럼을 토양 온도, 토양 습도, 토양 EC로 설정하는 경우, 상기 제1 및 제2 컬럼의 블록 데이터를 순서대로 포함하는 인덱스가 형성될 수 있다. 인덱스는 크게 측정 센서에 따라 분류될 수 있으며, 측정 날짜 및 시간에 따라 하위 분류로 저장될 수도 있다. For example, when the first column is set to air temperature, air humidity, and the second column is set to soil temperature, soil moisture, and soil EC, an index including block data of the first and second columns in order is formed. can Indexes can be largely classified according to the measurement sensor, and can be stored in sub-categories according to the measurement date and time.

분산 저장부(133)는, 관계형 센서 데이터 테이블에 작물 데이터 및 이미지 데이터를 매칭시켜 분산 저장하여 스마트 팜 데이터를 생성하는 기능을 수행한다. The distributed storage unit 133 performs a function of generating smart farm data by matching and storing crop data and image data in a relational sensor data table.

이 때, 분산 저장부(133)는 하둡(Hadoop Distributed File System; HDFS)과 같은 분산 저장 시스템을 사용하여 작물 데이터 및 이미지 데이터를 데이터베이스화 할 수 있다.At this time, the distributed storage unit 133 may database crop data and image data using a distributed storage system such as Hadoop Distributed File System (HDFS).

또한 분산 저장부(133)는, 데이터를 복수의 저장소에 저장하여 분산 병렬 처리하도록 구현될 수 있다. 예를 들면, 분산 저장부(133)는 수신되는 데이터를 작물별, 객체별로 분류하여 저장하거나, 시간별, 일별, 월별로 테이블화하여 분산 저장하도록 제공될 수 있다. 이에 따라, 복수의 저장소에 저장된 데이터를 이용하여 원하는 결과 데이터를 빠르게 도출할 수 있는 이점이 있다.In addition, the distributed storage unit 133 may be implemented to store data in a plurality of storages and perform distributed parallel processing. For example, the distributed storage unit 133 may be provided to classify and store received data by crop or object, or form a table by hour, day, or month to distribute and store received data. Accordingly, there is an advantage in that desired result data can be rapidly derived using data stored in a plurality of storages.

더하여, 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 서버(100)는, 결측치 혹은 이상치가 기설정된 개수 혹은 기설정된 임계값을 초과하는 경우, 관리자 단말에 센서 교체 알람 신호를 전송하는 알람부(140)를 더 포함하도록 제공될 수 있다.In addition, the smart farm data processing server 100 according to an embodiment of the present invention, when the missing value or the abnormal value exceeds a preset number or preset threshold, an alarm unit for transmitting a sensor replacement alarm signal to the manager terminal ( 140) may be provided to further include.

연속적으로 발생하는 결측치가 임계값을 초과하는 경우, 재배지의 환경 제어 시스템에 문제가 발생하였거나, 혹은 재배지 환경을 측정하는 센서의 고장이 발생하였을 가능성이 있는 것으로 해석될 수 있다. 이에, 알람부(140)가 관리자 단말에 센서 교체 알람 신호 혹은 환경 점검 알람 신호를 전송하도록 제공됨으로써, 센서 고장, 정전 등에 기인하는 지속적인 결측치 및 이상치의 발생을 방지하고, 관리자로 하여금 신속한 대처가 가능한 이점이 있다.If the continuously occurring missing value exceeds the threshold value, it can be interpreted that there is a possibility that a problem has occurred in the environmental control system of the plantation field or a failure of a sensor measuring the plantation environment. Accordingly, the alarm unit 140 is provided to transmit a sensor replacement alarm signal or an environment inspection alarm signal to the manager terminal, thereby preventing the continuous occurrence of missing values and outliers due to sensor failures, power outages, etc., and allowing the manager to respond promptly. There is an advantage.

이외에도, 알람부(140)는 환경 데이터, 작물 데이터, 및 이미지 데이터에 기초한 환경 제어 알람 신호를 생성하여 관리자 단말에 송신하는 기능을 수행하도록 제공될 수도 있다. 이에 따라, 관리자 단말 상에서 재배지의 환경을 모니터링할 수 있게 되며, 재배지에 구비된 환경 제어기의 원격 제어가 가능한 이점이 있다.In addition, the alarm unit 140 may be provided to perform a function of generating and transmitting an environment control alarm signal based on environment data, crop data, and image data to a manager terminal. Accordingly, it is possible to monitor the environment of the plantation site on the manager terminal, and there is an advantage in that the environment controller provided in the plantation area can be remotely controlled.

이상에서는 이해의 편의를 위해, 본 발명의 스마트 팜 데이터 처리 서버가 재배지의 측정 센서들로부터 실시간으로 수신되는 데이터들을 처리하는 경우를 예로 들어 설명하였으나, 이에 한정되는 것은 아니다.In the above, for convenience of understanding, a case in which the smart farm data processing server of the present invention processes data received in real time from measurement sensors in a cultivation area has been described as an example, but is not limited thereto.

스마트 팜 데이터 처리 서버는, 지난 작기의 측정 센서들로부터 측정되어 논리스키마로 저장된 데이터들을 저장 DB로부터 다시 수신하여 위에서 설명한 서버의 동일한 구성들의 동일한 기능을 통해 데이터의 보정 및 분류 저장 가능하도록 제공될 수도 있다.The smart farm data processing server may be provided to correct and classify data through the same function of the same components of the server described above by receiving the data stored in the logical schema measured from the previous measurement sensors and stored in the logical schema again from the storage DB. there is.

예를 들면, 지난 작기의 논리스키마를 통해 저장되었던 데이터들을 서버 내에 물리스키마로 구현함으로써 데이터 개선이 가능하고, 이렇게 개선된 데이터들은 다시 저장DB에 저장되어 빅데이터를 구축하도록 구현될 수 있다.For example, it is possible to improve data by implementing the data stored through the logical schema of the previous work as a physical schema in the server, and the improved data in this way can be stored again in the storage DB and implemented to build big data.

상술한 발명의 스마트 팜 데이터 처리 서버를 이용하는 경우, 환경 측정 센서 데이터를 실시간으로 누적하여 비관계형 데이터베이스에 저장함으로써, 최대한의 데이터량을 확보할 수 있다. 따라서, 재배지의 외적 요인에 따른 노이즈 발생시 결측 혹은 왜곡되는 데이터의 비율을 최소화할 수 있는 이점이 있다. In the case of using the smart farm data processing server of the above-described invention, the maximum amount of data can be secured by accumulating environmental measurement sensor data in real time and storing them in a non-relational database. Therefore, there is an advantage in minimizing the ratio of missing or distorted data when noise is generated due to external factors in the cultivation area.

또한, 데이터의 테이블화 혹은 데이터 이동 시 발생하는 데이터 유실 및 왜곡을 최소화할 수 있으며, 이로 인해, 데이터 전처리에 대한 비용을 절감하고 데이터 분석 효율을 극대화할 수 있는 이점이 있다.In addition, it is possible to minimize data loss and distortion that occur during data tabulation or data movement, thereby reducing the cost of data preprocessing and maximizing data analysis efficiency.

또한, 정제 알고리즘을 사용하여 데이터를 정제함에 따라, 유실된 데이터 혹은 오류로 인해 왜곡된 데이터들의 예측값을 도출하여 데이터의 보정이 가능해지며, 이로 인해 보다 정확한 데이터 처리가 가능한 이점이 있다.In addition, as data is refined using a refinement algorithm, it is possible to correct data by deriving predicted values of lost data or data distorted due to errors, thereby enabling more accurate data processing.

이상에서는 스마트 팜 데이터 처리 서버에 대해 살펴보았다. 이하에서는 상술한 스마트 팜 데이터 처리 서버를 이용하는 스마트 팜 데이터 처리 시스템에 대해 설명한다. 설명의 편의를 위해, 도 1 내지 도 2b를 참조하여 설명한 부분과 중복되는 내용은 생략하거나 간단히 기재한다.In the above, we looked at the smart farm data processing server. Hereinafter, a smart farm data processing system using the above-described smart farm data processing server will be described. For convenience of description, the overlapping contents of the parts described with reference to FIGS. 1 to 2B are omitted or briefly described.

도 3은 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 시스템을 도시한 것이다.3 illustrates a smart farm data processing system according to an embodiment of the present invention.

도 3을 참조하면, 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 시스템(10)은, 스마트 팜 데이터 처리 서버(100), 저장 DB(200), 재배지(300), 관리자 단말(400)을 포함한다.Referring to FIG. 3, the smart farm data processing system 10 according to an embodiment of the present invention includes a smart farm data processing server 100, a storage DB 200, a plantation 300, and a manager terminal 400. include

먼저, 재배지(300)는 작물이 재배되는 공간으로서, 환경 센서(310), 작물 센서(320), 및 카메라(330)가 구비되도록 제공된다.First, the cultivation area 300 is a space in which crops are grown, and is provided with an environment sensor 310, a crop sensor 320, and a camera 330.

환경 센서(310)는 작물 재배 환경의 제1 환경 측정 센서 데이터를 측정한다. 여기서, 제1 환경 측정 센서 데이터는 대기 온도, 대기 습도, 토양 온도, 토양 습도, 토양 pH, 토양 EC, 일사량, 조도(광량) 등을 포함한다.The environment sensor 310 measures first environment measurement sensor data of a crop growing environment. Here, the first environment measurement sensor data includes air temperature, air humidity, soil temperature, soil humidity, soil pH, soil EC, solar radiation, illuminance (amount of light), and the like.

작물 센서(320)는 작물의 생육량을 포함하는 작물 데이터를 측정한다. 여기서, 작물의 생육량은, 작물의 생장 크기에 따라 결정되는 생장 강도를 나타내는 것으로, 생장점, 줄기 두께, 및 화방 높이 등을 포함한다. 생장점은 수직 방향으로 작물의 가장 높은 위치를 의미한다.The crop sensor 320 measures crop data including the growth rate of crops. Here, the growth rate of crops represents the growth intensity determined according to the growth size of crops, and includes a growth point, stem thickness, flower bed height, and the like. The growing point refers to the highest position of a crop in the vertical direction.

카메라(330)는 작물의 사진, 영상을 포함하는 이미지 데이터를 촬영한다. 카메라(330)는 재배지(300) 내의 작물의 객체를 자동을 인지하고 작물 영상을 촬영할 수 있도록 구현될 수도 있다. 객체는 꽃, 줄기, 잎, 열매, 화방, 몽우리 및 생장점 중 적어도 하나 이상을 포함한다.The camera 330 captures image data including photos and videos of crops. The camera 330 may be implemented to automatically recognize crop objects in the plantation field 300 and capture images of crops. The object includes at least one or more of flowers, stems, leaves, fruits, flowers, buds, and growing points.

이렇게 촬영된 이미지 데이터는 작물의 생식 생장 혹은 영양 생장 정도에 따라 결정되는 생장상을 의미한다. 예를 들면, 이미지 데이터는 개화속도, 개화거리, 화방 간 거리, 화방 줄기 형상, 엽색, 화색, 개화 균일성, 착과수 등을 포함할 수 있다. 이를 기초로 하면, 과일의 발달속도, 및 과일의 품질이 결정된다.The image data captured in this way means a growth phase determined according to the degree of reproductive growth or vegetative growth of crops. For example, the image data may include flowering speed, flowering distance, distance between flower beds, stem shape of flower beds, leaf color, flower color, flowering uniformity, number of fruits set, and the like. Based on this, the development rate of the fruit and the quality of the fruit are determined.

재배지(300)에는 재배 환경을 제어할 수 있는 환경 제어기가 더 마련될 수 있다. 환경 제어기는 후술할 관리자 단말(400)을 통해 원격으로 제어되어, 재배지(300)의 온도 및 습도와 조도(광량)의 조절이 가능하도록 제공될 수 있다.An environment controller capable of controlling the cultivation environment may be further provided in the cultivation area 300 . The environment controller may be remotely controlled through a manager terminal 400 to be described later, and may be provided to enable adjustment of temperature and humidity and illumination (amount of light) of the plantation site 300 .

이어서, 스마트 팜 데이터 처리 서버(100)는 재배지(300)로부터 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 수신하여 스마트 팜 데이터를 생성한다.Then, the smart farm data processing server 100 receives the first environment measurement sensor data, crop data, and image data from the cultivation area 300 to generate smart farm data.

이어서, 저장 DB(200)는 스마트 팜 데이터 처리 서버(100)로부터 수신된 스마트 팜 데이터를 저장한다. 도면에서는 저장 DB(200)가 스마트 팜 데이터 처리 서버(100)의 외부에 제공되는 것으로 도시되었으나, 서버의 내부에 마련될 수도 있으며, 그 제공 형태가 도면에 한정되는 것은 아니다.Subsequently, the storage DB 200 stores the smart farm data received from the smart farm data processing server 100 . In the drawing, the storage DB 200 is shown as being provided outside the smart farm data processing server 100, but may be provided inside the server, and the form of provision is not limited to the drawing.

예를 들면, 저장 DB(200)는 오라클(Oracle), 인포믹스(Infomix), 사이베이스(Sybase), DB2, MySQL과 같은 관계형 데이터베이스 관리 시스템(RDBMS)이나, 비관계형 데이터베이스 관리 시스템(NoSQL), 겜스톤(Gemston), 오리온(Orion), O2 등과 같은 객체 지향 데이터베이스 관리 시스템(OODBMS)을 이용하여 본 출원의 목적에 맞게 구현될 수 있고, 자신의 기능을 달성하기 위하여 적당한 필드(field)들을 가지고 있다.For example, the storage DB 200 is a relational database management system (RDBMS) such as Oracle, Informix, Sybase, DB2, or MySQL, a non-relational database management system (NoSQL), or a game It can be implemented for the purpose of this application using an object-oriented database management system (OODBMS) such as Gemston, Orion, O2, etc., and has appropriate fields to achieve its function. .

저장 DB(200)에는 지난 작기 스마트 팜 데이터와 실시간으로 누적되는 스마트 팜 데이터가 시계열에 따라 누적 저장될 수 있다. 또한, 저장 DB(200)내에는 작물의 품목 및 객체에 따른 스마트 팜 데이터가 필드별로 데이터베이스화되어 누적 저장됨에 따라 빅데이터가 구축될 수도 있다.In the storage DB 200, smart farm data accumulated in the past and smart farm data accumulated in real time may be accumulated and stored according to time series. In addition, in the storage DB 200, big data may be built as smart farm data according to items and objects of crops are databased for each field and accumulated and stored.

이어서, 스마트 팜 데이터 처리 서버(100)에 연결이 가능한 관리자 단말(400)이 별도로 제공될 수 있다.Subsequently, a manager terminal 400 capable of connecting to the smart farm data processing server 100 may be provided separately.

관리자 단말(400)은 통상의 웹브라우저(Web Browser)가 구비되고, 스마트 팜 데이터 처리 서버(100)에 접속하여 다양한 웹서비스(Web Service)를 이용할 수 있는 모든 종류의 유무선 통신 장치로 제공될 수 있다.The administrator terminal 400 is provided with a normal web browser and can be provided as all kinds of wired and wireless communication devices capable of accessing the smart farm data processing server 100 and using various web services. there is.

이에 따라, 관리자 단말(400)상에서 작물이 재배되는 환경을 모니터링 할 수 있으며, 재배지(300)에 구비된 환경 제어기를 수동 제어하는 것이 가능하도록 구현될 수 있다.Accordingly, the environment in which crops are grown can be monitored on the manager terminal 400, and the environment controller provided in the cultivation area 300 can be manually controlled.

상기에서 살펴본 스마트 팜 데이터 처리 시스템(10)은 아래와 같은 형태로 구현될 수도 있다.The smart farm data processing system 10 discussed above may be implemented in the form below.

도 4는 본 발명의 다른 실시예에 따른 스마트 팜 데이터 처리 시스템을 도시한 것이다.4 illustrates a smart farm data processing system according to another embodiment of the present invention.

도 4를 참조하면, 스마트 팜 데이터 처리 서버(100)는 클라우드 서버(100)의 형태로 제공되어 관리자 단말(400)과 통신 가능하도록 제공될 수 있다.Referring to FIG. 4 , the smart farm data processing server 100 may be provided in the form of a cloud server 100 to communicate with the manager terminal 400 .

클라우드 서버(100)는 IaaS(Infrastructure as Service), PaaS(Platform as a Service), SaaS(Software as a Service) 등 다양한 형태로 제공될 수 있다.The cloud server 100 may be provided in various forms such as Infrastructure as Service (IaaS), Platform as a Service (PaaS), and Software as a Service (SaaS).

관리자 단말(400)은 스마트 팜 데이터 처리 시스템을 관리하기 위해 관리자가 소지한 단말로서, 클라우드 서버(100)와 연결되어 데이터 송수신이 가능하도록 핸드폰, PDA, PC, 랩탑, 태블릿 PC 등의 통신 기능과 출력 기능을 갖춘 장치일 수 있다.The manager terminal 400 is a terminal possessed by the manager to manage the smart farm data processing system, and is connected to the cloud server 100 to transmit and receive data, and has communication functions such as a mobile phone, PDA, PC, laptop, tablet PC, etc. It can be a device with an output function.

클라우드 서버(100)를 활용하면 본 발명의 스마트 팜 데이터 처리 서버(100)를 다수의 재배지(300)와 연결되도록 구현할 수 있다. 이에 따라, 하나의 관리자 단말(400)로부터 다수개의 재배지(300)에 구비된 재배 환경 제어기를 동시에 원격 제어하는 것이 가능해진다.By utilizing the cloud server 100, the smart farm data processing server 100 of the present invention can be implemented to be connected to a plurality of plantations 300. Accordingly, it is possible to simultaneously remotely control the cultivation environment controllers provided in a plurality of cultivation sites 300 from one manager terminal 400 .

클라우드 서버(100)는 외부에 제공되는 별도의 저장 DB(200)와 연결될 수 있다. 이에 따라, 클라우드 서버(100)는 저장 DB(200)로부터 적절한 데이터를 로드하여 관리자 단말(400)로 송신할 수 있게 되므로, 데이터 처리 속도와 효율을 더욱 높일 수 있는 효과가 있다. 또한, 클라우드 서버(100)는 재배지(300)로부터 수신한 데이터를 저장 DB(200) 누적 저장하도록 제공될 수도 있다.The cloud server 100 may be connected to a separate storage DB 200 provided externally. Accordingly, since the cloud server 100 can load appropriate data from the storage DB 200 and transmit the data to the manager terminal 400, data processing speed and efficiency can be further increased. In addition, the cloud server 100 may be provided to accumulate and store data received from the plantation site 300 in the storage DB 200 .

예를 들면, 재배지(300)로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터가 저장 DB(200)에 누적 저장되고 최종적으로 합성된 스마트 팜 데이터가 저장 DB(200)에 저장될 수 있다. For example, the first environmental measurement sensor data, crop data, and image data received from the cultivation area 300 are accumulated and stored in the storage DB 200, and finally synthesized smart farm data is stored in the storage DB 200. can

이외에도, 데이터의 결측치와 이상치를 대체하기 위한 예측값 도출 알고리즘과 이에 따라 도출된 예측값이 저장되어 데이터 보정을 위한 빅데이터를 구축할 수 있다. 따라서, 데이터 보정 시 이러한 빅데이터를 적용하면 데이터 보정 정확도를 보다 향상 시킬 수 있는 이점이 있다.In addition, a predictive value derivation algorithm for replacing missing values and outliers in data and the predicted values derived according to the predictive value are stored to build big data for data correction. Therefore, applying such big data in data correction has the advantage of further improving data correction accuracy.

이상에서는 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 시스템의 구성을 살펴보았다. 이하에서는 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 방법에 대해 설명한다.In the above, the configuration of the smart farm data processing system according to an embodiment of the present invention has been looked at. Hereinafter, a smart farm data processing method according to an embodiment of the present invention will be described.

도 5는 본 발명의 일 실시예에 따른 스마트 팜 데이터 처리 방법을 도시한 것이다.5 illustrates a smart farm data processing method according to an embodiment of the present invention.

이하, 각 단계를 설명하는 과정에서 도 1 내지 도 3을 참조하여 설명한 부분과 중복되는 내용은 생략하거나 간단히 기재하며, 설명의 이해를 돕기 위해, 도 1 내지 도 3을 함께 참조한다. 또한, 특별히 언급하지 않는 한, 각 단계의 수행 주체는 도 1 내지 도 3에 도시한 스마트 팜 데이터 처리 서버로 가정한다.Hereinafter, in the process of describing each step, overlapping contents with those described with reference to FIGS. 1 to 3 are omitted or simply described, and FIGS. 1 to 3 are referred to together to help understanding of the description. In addition, unless otherwise specified, it is assumed that the subject performing each step is the smart farm data processing server shown in FIGS. 1 to 3.

도 5를 참조하면, 먼저, 재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집 단계가 수행된다(S110). 수집 단계에서는 제1 환경 측정 센서 데이터 수집부가 비관계형 데이터베이스를 이용하여 제1 환경 측정 센서 데이터를 수집하고, 작물 데이터 수집부가 관계형 데이터베이스를 이용하여 작물 데이터를 수집한다. 또한, 이미지 데이터 수집부가 파일 시스템을 이용하여 이미지 데이터를 수집한다.Referring to FIG. 5 , first, a collection step of classifying and collecting first environmental measurement sensor data, crop data, and image data received from a plantation site is performed (S110). In the collecting step, the first environmental measurement sensor data collection unit collects the first environmental measurement sensor data using a non-relational database, and the crop data collection unit collects crop data using a relational database. Also, the image data collecting unit collects image data using a file system.

이후, 수집 단계에서 수신되는 제1 환경 측정 센서 데이터 및 작물 데이터 중 결측치 혹은 이상치를 검출하여 정제하는 정제 단계가 수행된다(S120). 정제 단계는, 다음과 같은 단계들로 구성될 수 있다.Thereafter, a refinement step of detecting and refining missing values or outliers among the first environmental measurement sensor data and crop data received in the collection step is performed (S120). The purification step may consist of the following steps.

먼저, 제1 환경 측정 센서 데이터 중 결측치를 판단하고 검출하는 결측치 검출 단계가 수행된다(S121). 여기서 결측치란, 센서 고장, 통신 지연, 재배지의 정전 발생 등으로 유실되어 누락된 데이터를 의미한다. First, a missing value detection step of determining and detecting a missing value among the first environment measurement sensor data is performed (S121). Here, the missing value refers to data that is lost due to sensor failure, communication delay, power outage in the cultivation area, and the like.

결측치 검출 단계 이후, 제1 환경 측정 센서 데이터 중 이상치를 판단하고 검출하는 이상치 검출 단계가 수행된다(S122). 이 단계는 상기에서 검출된 결측치를 제외한 나머지 데이터들에 한해 수행된다. 이 때, 이상치는 센서 고장, 통신 지연 등으로 인해 측정 오류가 발생하여 연속된 값이 지속적으로 측정되거나 터무니 없이 크고 작은 값으로 측정된 데이터를 의미한다.After the missing value detection step, an outlier detection step of determining and detecting an outlier in the first environment measurement sensor data is performed (S122). This step is performed only for the remaining data excluding the missing values detected above. In this case, the outlier refers to data in which a measurement error occurs due to a sensor failure, communication delay, etc., so that continuous values are continuously measured or values are measured with absurdly large and small values.

이후, 검출된 결측치 및 이상치를 예측하여 데이터를 보정하는 데이터 보정 단계가 수행된다(S123). 해당 단계에서는, 결측치와 이상치의 개수 혹은 발생 기간에 따라 다음과 같은 방법으로 데이터를 보정될 수 있다.Thereafter, a data correction step of correcting data by predicting the detected missing values and outliers is performed (S123). In this step, the data can be corrected in the following way according to the number or occurrence period of missing values and outliers.

아래에서는 상술한 정제 단계(S120)에 대해 더욱 자세히 설명한다.Below, the above-described purification step (S120) will be described in more detail.

도 6은 도 5의 정제 단계에서 결측치 검출 단계 및 데이터 보정 단계를 나타낸 순서도이다.FIG. 6 is a flowchart illustrating a missing value detection step and a data correction step in the refinement step of FIG. 5 .

도 6을 참조하면, 결측치를 검출하는 단계(S120)는 아래와 같은 하위 단계들을 포함하도록 제공될 수 있다.Referring to FIG. 6 , the step of detecting a missing value ( S120 ) may include the following sub-steps.

먼저, 수집부로부터 제1 환경 측정 센서 데이터를 수신하여 데이터의 누락 여부를 판단한다(S121_1).First, first environment measurement sensor data is received from the collection unit and it is determined whether or not data is missing (S121_1).

누락된 결측치가 검출되지 않는 경우, 데이터를 저장한다(S123_3).When missing missing values are not detected, data is stored (S123_3).

누락된 결측치가 검출되는 경우, 해당 결측치가 제1 임계값을 초과하는지 여부를 판단한다(S121_2). When the missing missing value is detected, it is determined whether the missing value exceeds a first threshold value (S121_2).

여기서, 임계값이란, 연속적으로 발생된 결측치의 발생 개수, 혹은 결측치가 연속적으로 발생된 기간을 의미하는 것일 수 있다. 도면에서는 제1 임계값을 1개로 설정하여 결측치가 1개 존재하는지 여부를 판단하는 예시를 도시하였으나 이에 한정되는 것은 아니다. Here, the threshold value may mean the number of continuously occurring missing values or a period in which missing values are continuously generated. In the drawing, an example of determining whether there is one missing value by setting the first threshold to one is shown, but is not limited thereto.

예를 들면, 제1 임계값을 5개의 개수로 설정할 수 있으며, 5시간과 같이 기간으로 설정할 수도 있다. 임계값은 관리자 단말에 의해 다양한 형태로 설정되도록 제공될 수 있다.For example, the first threshold may be set to a number of 5, or may be set to a period such as 5 hours. The threshold value may be provided to be set in various forms by an administrator terminal.

S121_2 단계에서, 결측치가 제1 임계값을 초과하지 않는 경우, 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 결측치의 예측값을 도출한다(S123_1).In step S121_2, when the missing value does not exceed the first threshold value, a predicted value of the missing value is derived by calculating an average value, a mode value, or a median value using an interpolation method (S123_1).

보간법이란, 알고 있는 데이터 값들을 이용하여 모르는 값을 추정하는 방법으로, 예를 들면, 다항식 보간법, 스플라인 보간법, k-평균(K-means Clustering) 알고리즘 등 다양한 방식이 사용될 수 있다.Interpolation is a method of estimating an unknown value using known data values, and various methods such as polynomial interpolation, spline interpolation, and k-means clustering algorithm may be used.

이후, 도출된 예측값을 저장하는 단계가 수행된다(S123_3).Then, a step of storing the derived prediction value is performed (S123_3).

다시 S121_2 단계에서, 결측치가 제1 임계값을 초과하는 경우, 결측치가 제2 임계값을 초과하는지 여부를 판단하는 단계가 수행된다(S121_3).In step S121_2 again, when the missing value exceeds the first threshold, a step of determining whether the missing value exceeds the second threshold is performed (S121_3).

만약, 결측치가 제1 임계값을 초과하며 제2 임계값을 초과하지 않으면, 회귀 알고리즘을 이용하여 결측치의 예측값을 도출한다(S123_2). If the missing value exceeds the first threshold and does not exceed the second threshold, a predicted value of the missing value is derived using a regression algorithm (S123_2).

이 경우, 검출된 결측치는 선형 회귀(linear regression), 로지스틱 회귀(logistic regression),  k-최근접 이웃 알고리즘(k-NN) 등을 비롯한 회귀 알고리즘을 이용하여 예측값을 도출하도록 구현될 수 있다. In this case, the detected missing value may be implemented to derive a predicted value using a regression algorithm including linear regression, logistic regression, k-nearest neighbor algorithm (k-NN), and the like.

이후, 도출된 예측값을 저장하는 단계가 수행된다(S123_3).Then, a step of storing the derived prediction value is performed (S123_3).

다시 S121_3 단계에서, 결측치가 제2 임계값을 초과하는 경우, 관리자 단말로 알람 신호를 송신하는 단계가 수행된다(S140). 연속적으로 발생하는 결측치가 제2 임계값을 초과하는 경우, 재배지의 환경 제어 시스템에 문제가 발생하였거나, 혹은 재배지 환경을 측정하는 센서의 고장이 발생하였을 가능성이 있는 것으로 해석될 수 있다. 이에, 상술한 예측값 도출 방법에 따르지 않고, 관리자 단말에 알람 신호를 송신하는 알람 단계(S140)가 수행될 수 있다. 이로 인해, 관리자에 의한 실체적인 재배지 환경의 점검이 이루어지도록 하여, 비상 상황에 대한 신속한 대처가 가능해진다.In step S121_3 again, when the missing value exceeds the second threshold, an alarm signal is transmitted to the manager terminal (S140). If the continuously occurring missing value exceeds the second threshold, it can be interpreted as a possibility that a problem has occurred in the environmental control system of the plantation field or a failure of a sensor measuring the plantation environment. Accordingly, an alarm step (S140) of transmitting an alarm signal to the manager terminal may be performed without following the above-described prediction value derivation method. As a result, it is possible to quickly cope with emergency situations by allowing the manager to inspect the actual plantation environment.

실시예에 따르면, 전술한 S121_1 단계에서, 누락된 결측치가 존재하지 않는 경우, 아래와 같은 이상치 검출 단계(S122)를 더 수행할 수 있다.According to the embodiment, if there is no missing value in step S121_1 described above, the following outlier detection step (S122) may be further performed.

도 7은 도 5의 정제 단계에서 이상치 검출 단계 및 데이터 보정 단계를 나타낸 순서도이다.FIG. 7 is a flowchart illustrating an outlier detection step and a data correction step in the refinement step of FIG. 5 .

도 7을 참조하면, S121_1 단계에서, 누락된 결측치가 존재하지 않는 경우, 이상치의 존재 여부를 판단하는 단계가 수행된다(S122_1)Referring to FIG. 7 , in step S121_1, if there is no missing value, a step of determining whether an outlier exists is performed (S122_1).

이상치가 존재하지 않는 경우, 데이터를 저장한다(S123_3).When there is no outlier, data is stored (S123_3).

이상치가 존재하는 경우, 검출된 이상치가 제1 임계값을 초과하는지 여부를 판단한다(S122_2). When an outlier exists, it is determined whether the detected outlier exceeds a first threshold (S122_2).

S121_2 단계에서, 이상치가 제1 임계값을 초과하지 않는 경우, 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 이상치의 예측값을 도출한다(S123_1). In step S121_2, when the outlier does not exceed the first threshold, an average value, a mode, or a median value is calculated using an interpolation method to derive a predicted value of the outlier (S123_1).

이후, 도출된 예측값을 저장하는 단계가 수행된다(S123_3).Then, a step of storing the derived prediction value is performed (S123_3).

다시 S122_2 단계에서, 이상치가 제1 임계값을 초과하는 경우, 이상치가 제2 임계값을 초과하는지 여부를 판단하는 단계가 수행된다(S122_3).Again in step S122_2, if the outlier exceeds the first threshold, a step of determining whether the outlier exceeds the second threshold is performed (S122_3).

만약, 이상치가 제1 임계값을 초과하며 제2 임계값을 초과하지 않으면, 회귀 알고리즘을 이용하여 이상치의 예측값을 도출한다(S123_2). If the outlier exceeds the first threshold and does not exceed the second threshold, a predicted value of the outlier is derived using a regression algorithm (S123_2).

이후, 도출된 예측값을 저장하는 단계가 수행된다(S123_3).Then, a step of storing the derived prediction value is performed (S123_3).

다시 S122_3 단계에서, 이상치가 제2 임계값을 초과하는 경우, 해당 이상치를 삭제하고(S123_4), 관리자 단말로 알람 신호를 송신하는 단계가 수행된다(S140).Again in step S122_3, when the outlier exceeds the second threshold, the outlier is deleted (S123_4), and an alarm signal is transmitted to the manager terminal (S140).

다시 도 5를 참조하면, 상술한 정제 단계(S120)가 수행된 이후, 정제된 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성 단계가 수행된다(S130). 이 단계를 통해 최종적으로 스마트 팜 데이터가 도출되며, 저장 DB에 저장된다. Referring back to FIG. 5 , after the above-described refining step (S120) is performed, a synthesizing step of integrating the refined second environmental measurement sensor data, crop data, and image data and aligning and synthesizing them according to time series is performed ( S130). Through this step, the smart farm data is finally derived and stored in the storage DB.

합성 단계(S130)는 아래와 같은 단계들을 포함하도록 구성될 수 있다. The synthesis step (S130) may be configured to include the following steps.

먼저, 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 시계열에 따라 각각 정렬하는 시계열 정렬 단계가 수행된다(S131). First, a time series alignment step of aligning the second environment measurement sensor data, crop data, and image data according to time series is performed (S131).

이후, 제2 환경 측정 센서 데이터를 기설정된 컬럼 인덱스를 기준으로 저장하여 관계형 센서 데이터 테이블을 생성하는 관계형 테이블 생성 단계가 수행된다(S132). Thereafter, a relational table creation step of generating a relational sensor data table by storing the second environment measurement sensor data based on a preset column index is performed (S132).

이후, 관계형 센서 데이터 테이블에 작물 데이터 및 이미지 데이터를 매칭시켜 분산 저장하는 분산 저장 단계가 수행된다(S133).Thereafter, a distributed storage step of matching and storing crop data and image data in relational sensor data tables is performed (S133).

이후, 제2 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터에 기초한 제어 신호를 생성하여 재배지의 환경 제어기를 제어하도록 제어 신호를 관리자 단말에 송신하는 알람 단계가 추가적으로 더 수행될 수도 있다(S140).Thereafter, an alarm step of generating a control signal based on the second environment measurement sensor data, crop data, and image data and transmitting the control signal to the manager terminal to control the environment controller of the plantation field may be additionally performed (S140).

상술한 본 발명의 스마트 팜 데이터 처리 방법을 사용하면, 데이터 정제 알고리즘을 사용하여 데이터를 정제함에 따라, 유실된 데이터 혹은 오류로 인해 왜곡된 데이터들의 예측값을 도출하고 보정함으로써, 보다 정확한 데이터 처리가 가능한 이점이 있다.Using the above-described smart farm data processing method of the present invention, as data is purified using a data purification algorithm, by deriving and correcting predicted values of lost data or data distorted due to errors, more accurate data processing is possible. There is an advantage.

나아가, 본 발명의 일 실시예에 따르면, 상술한 스마트 팜 데이터 처리 방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록매체가 구현될 수 있다.Furthermore, according to one embodiment of the present invention, a computer-readable recording medium containing a program for executing the above-described smart farm data processing method may be implemented.

이 때, 스마트 팜 데이터 처리 방법은, 재배지로부터 수신되는 환경 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집 단계; 수집 단계에서 수신되는 환경 데이터 및 작물 데이터 중 결측치 혹은 이상치를 검출하여 정제하는 정제 단계; 및 정제 단계를 통해 정제된 환경 데이터 및 작물 데이터와, 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성 단계를 포함하며, 수집 단계에서 환경 데이터는 비관계형 시스템을 이용하여 저장되도록 구현될 수 있다.At this time, the smart farm data processing method includes a collection step of classifying and collecting environmental data, crop data, and image data received from the cultivation area; A refinement step of detecting and refining missing values or outliers among environmental data and crop data received in the collection step; And a synthesizing step of integrating the purified environmental data and crop data through the refining step and the image data and arranging and synthesizing them according to a time series. In the collecting step, the environmental data may be implemented to be stored using a non-relational system. .

이상에서, 본 발명의 실시예를 구성하는 모든 구성 요소들이 하나로 결합되거나 결합되어 동작하는 것으로 설명되었다고 해서, 본 발명이 반드시 이러한 실시예에 한정되는 것은 아니다. 즉, 본 발명의 목적 범위 안에서라면, 그 모든 구성 요소들이 하나 이상으로 선택적으로 결합하여 동작할 수도 있다.In the above, even though all the components constituting the embodiment of the present invention have been described as being combined or operated as one, the present invention is not necessarily limited to these embodiments. That is, within the scope of the object of the present invention, all of the components may be selectively combined with one or more to operate.

또한, 이상에서 기재된 "포함하다", "구성하다" 또는 "가지다" 등의 용어는, 특별히 반대되는 기재가 없는 한, 해당 구성 요소가 내재될 수 있음을 의미하는 것이므로, 다른 구성 요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것으로 해석되어야 한다. 기술적이거나 과학적인 용어를 포함한 모든 용어들은, 다르게 정의되지 않는 한, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 가진다. 사전에 정의된 용어와 같이 일반적으로 사용되는 용어들은 관련 기술의 문맥 상의 의미와 일치하는 것으로 해석되어야 하며, 본 발명에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.In addition, terms such as "include", "comprise" or "have" described above mean that the corresponding component may be inherent unless otherwise stated, excluding other components. It should be construed as being able to further include other components. All terms, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which the present invention belongs, unless defined otherwise. Commonly used terms, such as terms defined in a dictionary, should be interpreted as consistent with the meaning in the context of the related art, and unless explicitly defined in the present invention, they are not interpreted in an ideal or excessively formal meaning.

이상의 설명은 본 발명의 기술 사상을 예시적으로 설명한 것에 불과한 것으로서, 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자라면 본 발명의 본질적인 특성에서 벗어나지 않는 범위에서 다양한 수정 및 변형이 가능할 것이다. 따라서, 본 발명에 개시된 실시예들은 본 발명의 기술 사상을 한정하기 위한 것이 아니라 설명하기 위한 것이고, 이러한 실시예에 의하여 본 발명의 기술 사상의 범위가 한정되는 것은 아니다. 본 발명의 보호 범위는 아래의 청구범위에 의하여 해석되어야 하며, 그와 동등한 범위 내에 있는 모든 기술 사상은 본 발명의 권리범위에 포함되는 것으로 해석되어야 할 것이다.The above description is merely an example of the technical idea of the present invention, and various modifications and variations can be made to those skilled in the art without departing from the essential characteristics of the present invention. Therefore, the embodiments disclosed in the present invention are not intended to limit the technical idea of the present invention, but to explain, and the scope of the technical idea of the present invention is not limited by these embodiments. The protection scope of the present invention should be construed according to the claims below, and all technical ideas within the equivalent range should be construed as being included in the scope of the present invention.

10 : 스마트 팜 데이터 처리 시스템
100 : 스마트 팜 데이터 처리 서버
110 : 수집부
120 : 정제부
121 : 결측치 검출부
122 : 이상치 검출부
123 : 데이터 보정부
130 : 합성부
131 : 시계열 정렬부
132 : 관계형 테이블 생성부
133 : 분산 저장부
140 : 알람부
200 : 저장DB
300 : 재배지
310 : 환경 센서
320 : 작물 센서
330 : 카메라
400 : 관리자 단말
10: Smart Farm Data Processing System
100: smart farm data processing server
110: collection unit
120: purification unit
121: missing value detection unit
122: outlier detection unit
123: data correction unit
130: synthesis unit
131: time series alignment unit
132: relational table creation unit
133: distributed storage unit
140: alarm unit
200: storage DB
300: Plantation
310: environmental sensor
320: crop sensor
330: camera
400: administrator terminal

Claims (12)

재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집부;
상기 제1 환경 측정 센서 데이터 중 결측치 혹은 이상치를 검출하여 정제하여 제2 환경 측정 센서 데이터를 생성하는 정제부;
상기 제2 환경 측정 센서 데이터, 상기 작물 데이터, 및 상기 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성부; 및
상기 정제부의 동작에 따라 관리자 단말에 센서 교체 알람 신호를 전송하는 알람부를 포함하며,
상기 수집부는 비관계형 데이터베이스에 상기 제1 환경 측정 센서 데이터를 분리 저장하는 환경 데이터 저장부를 포함하고,
상기 정제부는,
상기 수집부로부터 수신된 상기 제1 환경 측정 센서 데이터 중 상기 결측치를 판단하고 검출하는 결측치 검출부;
상기 결측치를 제외한 상기 제1 환경 측정 센서 데이터 중 상기 이상치를 판단하고 검출하는 이상치 검출부; 및
상기 결측치 및 상기 이상치를 예측하여 데이터를 보정하는 데이터 보정부를 포함하고,
상기 데이터 보정부는,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 제1 임계값 이하인 경우, 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제1 임계값을 초과하며 제2 임계값을 초과하지 않는 경우, 회귀 알고리즘을 이용하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 알람부는,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제2 임계값을 초과하는 경우 상기 센서 교체 알람 신호를 전송하고,
상기 제1 임계값 및 상기 제2 임계값은 상기 결측치 혹은 상기 이상치의 발생개수 및 상기 결측치 혹은 상기 이상치가 연속적으로 발생된 기간 중 하나로 정의되는 스마트 팜 데이터 처리 서버.
a collection unit that classifies and collects first environment measurement sensor data, crop data, and image data received from a plantation site;
a refiner configured to generate second environmental sensor data by detecting and refining missing values or outliers among the first environmental sensor data;
a compositing unit integrating the second environment measurement sensor data, the crop data, and the image data, arranging them according to time series, and synthesizing them; and
An alarm unit for transmitting a sensor replacement alarm signal to a manager terminal according to the operation of the refiner,
The collecting unit includes an environmental data storage unit separately storing the first environmental measurement sensor data in a non-relational database;
The purification unit,
a missing value detector configured to determine and detect the missing value among the first environment measurement sensor data received from the collection unit;
an outlier detecting unit determining and detecting the outlier among the first environment measurement sensor data excluding the missing value; and
A data compensating unit correcting data by predicting the missing values and the outliers;
The data correction unit,
When the number or occurrence period of the missing value or the outlier value is less than or equal to a first threshold value, an average value, a mode value, or a median value is calculated using an interpolation method to derive a predicted value of the missing value or the outlier value;
When the number or generation period of the missing value or the outlier exceeds the first threshold and does not exceed a second threshold, a predicted value of the missing value or the outlier is derived using a regression algorithm;
The alarm unit,
Transmitting the sensor replacement alarm signal when the number or occurrence period of the missing value or the abnormal value exceeds the second threshold value;
The first threshold and the second threshold are defined as one of the number of occurrences of the missing value or the outlier and a period in which the missing value or the outlier continuously occurs.
제1항에 있어서,
상기 수집부는,
관계형 데이터베이스에 상기 작물 데이터를 저장하는 작물 데이터 저장부; 및
상기 이미지 데이터를 저장하는 이미지 데이터 저장부를 더 포함하는 스마트 팜 데이터 처리 서버.
According to claim 1,
The collection unit,
a crop data storage unit for storing the crop data in a relational database; and
Smart farm data processing server further comprising an image data storage unit for storing the image data.
삭제delete 제1항에 있어서,
상기 합성부는,
상기 제2 환경 측정 센서 데이터, 상기 작물 데이터, 및 상기 이미지 데이터를 시계열에 따라 각각 정렬하는 시계열 정렬부;
상기 제2 환경 측정 센서 데이터를 기설정된 컬럼 인덱스를 기준으로 저장하여 관계형 센서 데이터 테이블을 생성하는 관계형 테이블 생성부; 및
상기 관계형 센서 데이터 테이블에 상기 작물 데이터 및 상기 이미지 데이터를 매칭시켜 분산 저장하는 분산 저장부를 포함하는 스마트 팜 데이터 처리 서버.
According to claim 1,
The synthetic part,
a time-series alignment unit arranging the second environment measurement sensor data, the crop data, and the image data according to time-series;
a relational table creation unit generating a relational sensor data table by storing the second environment measurement sensor data based on a predetermined column index; and
A smart farm data processing server comprising a distributed storage unit for matching and storing the crop data and the image data in the relational sensor data table.
삭제delete 작물 재배 환경의 제1 환경 측정 센서 데이터를 측정하는 환경 센서;
상기 작물의 생육량을 포함하는 작물 데이터를 측정하는 작물 센서;
상기 작물의 영상을 포함하는 이미지 데이터를 촬영하는 카메라;
상기 제1 환경 측정 센서 데이터, 상기 작물 데이터, 및 상기 이미지 데이터를 수신하여 스마트 팜 데이터를 생성하는 제1항의 스마트 팜 데이터 처리 서버;
상기 스마트 팜 데이터 처리 서버로부터 수신된 상기 스마트 팜 데이터를 저장하는 저장 DB; 및
상기 스마트 팜 데이터 처리 서버와 통신 가능하도록 제공된 관리자 단말을 포함하고,
상기 스마트 팜 데이터 처리 서버는,
상기 제1 환경 측정 센서 데이터 중 상기 결측치를 판단하고 검출하고,
상기 결측치를 제외한 상기 제1 환경 측정 센서 데이터 중 상기 이상치를 판단하고 검출하고,
상기 결측치 및 상기 이상치를 예측하여 데이터를 보정하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 제1 임계값 이하인 경우, 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제1 임계값을 초과하며 제2 임계값을 초과하지 않는 경우, 회귀 알고리즘을 이용하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제2 임계값을 초과하는 경우 상기 관리자 단말에 센서 교체 알람 신호를 전송하고,
상기 제1 임계값 및 상기 제2 임계값은 상기 결측치 혹은 상기 이상치의 발생개수 및 상기 결측치 혹은 상기 이상치가 연속적으로 발생된 기간 중 하나로 정의되는 스마트 팜 데이터 처리 시스템.
an environmental sensor that measures first environmental measurement sensor data of a crop growing environment;
a crop sensor for measuring crop data including a growth rate of the crop;
a camera for capturing image data including an image of the crop;
The smart farm data processing server of claim 1 generating smart farm data by receiving the first environment measurement sensor data, the crop data, and the image data;
a storage DB for storing the smart farm data received from the smart farm data processing server; and
Including an administrator terminal provided to communicate with the smart farm data processing server,
The smart farm data processing server,
determining and detecting the missing value among the first environmental measurement sensor data;
determining and detecting the anomaly value among the first environmental measurement sensor data excluding the missing value;
correcting data by predicting the missing value and the outlier;
When the number or occurrence period of the missing value or the outlier value is less than or equal to a first threshold value, an average value, a mode value, or a median value is calculated using an interpolation method to derive a predicted value of the missing value or the outlier value;
When the number or generation period of the missing value or the outlier exceeds the first threshold and does not exceed a second threshold, a predicted value of the missing value or the outlier is derived using a regression algorithm;
Transmitting a sensor replacement alarm signal to the manager terminal when the number or occurrence period of the missing value or the abnormal value exceeds the second threshold value;
The first threshold and the second threshold are defined as one of the number of occurrences of the missing value or the outlier and a period in which the missing value or the outlier continuously occurs.
수집부가, 재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집 단계;
정제부가, 상기 제1 환경 측정 센서 데이터 중 결측치 혹은 이상치를 검출하여 정제하여 제2 환경 측정 센서 데이터를 생성하는 정제 단계; 및
합성부가, 상기 제2 환경 측정 센서 데이터, 상기 작물 데이터, 및 상기 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성 단계를 포함하며,
상기 수집 단계는 비관계형 데이터베이스에 상기 제1 환경 측정 센서 데이터를 분리 저장하는 환경 데이터 저장 단계를 포함하고,
상기 정제 단계는,
상기 수집부로부터 수신된 상기 제1 환경 측정 센서 데이터 중 상기 결측치를 판단하고 검출하는 결측치 검출 단계;
상기 결측치를 제외한 상기 제1 환경 측정 센서 데이터 중 상기 이상치를 판단하고 검출하는 이상치 검출 단계; 및
상기 결측치 및 상기 이상치를 예측하여 데이터를 보정하는 데이터 보정 단계를 포함하고,
상기 데이터 보정 단계에서,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 제1 임계값 이하인 경우, 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제1 임계값을 초과하며 제2 임계값을 초과하지 않는 경우, 회귀 알고리즘을 이용하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제2 임계값을 초과하는 경우, 관리자 단말로 센서 교체 알람 신호를 송신하고,
상기 제1 임계값 및 상기 제2 임계값은 상기 결측치 혹은 상기 이상치의 발생개수 및 상기 결측치 혹은 상기 이상치가 연속적으로 발생된 기간 중 하나로 정의되는 스마트 팜 데이터 처리 방법.
a collection step of classifying and collecting, by a collection unit, first environmental measurement sensor data, crop data, and image data received from the plantation site;
a refining step of generating second environmental sensor data by a refiner by detecting and refining missing values or outliers among the first environmental sensor data; and
A synthesizing step in which the synthesizing unit integrates the second environment measurement sensor data, the crop data, and the image data, arranges them according to time series, and synthesizes them,
The collecting step includes an environmental data storing step of separately storing the first environmental measurement sensor data in a non-relational database,
The purification step is
a missing value detection step of determining and detecting the missing value among the first environmental measurement sensor data received from the collecting unit;
an outlier detection step of determining and detecting the outlier among the first environmental measurement sensor data excluding the missing value; and
A data correction step of correcting data by predicting the missing value and the outlier,
In the data correction step,
When the number or occurrence period of the missing value or the outlier value is less than or equal to a first threshold value, an average value, a mode value, or a median value is calculated using an interpolation method to derive a predicted value of the missing value or the outlier value;
When the number or generation period of the missing value or the outlier exceeds the first threshold and does not exceed a second threshold, a predicted value of the missing value or the outlier is derived using a regression algorithm;
When the number or occurrence period of the missing value or the abnormal value exceeds the second threshold value, a sensor replacement alarm signal is transmitted to an administrator terminal;
The first threshold and the second threshold are defined as one of the number of occurrences of the missing value or the outlier and a period in which the missing value or the outlier continuously occurs.
삭제delete 삭제delete 삭제delete 삭제delete 스마트 팜 데이터 처리 방법을 실행하기 위한 프로그램을 포함하는 컴퓨터 판독가능 기록매체에 있어서,
상기 스마트 팜 데이터 처리 방법은,
재배지로부터 수신되는 제1 환경 측정 센서 데이터, 작물 데이터, 및 이미지 데이터를 분류하여 수집하는 수집 단계;
상기 제1 환경 측정 센서 데이터 중 결측치 혹은 이상치를 검출하여 정제하여 제2 환경 측정 센서 데이터를 생성하는 정제 단계; 및
상기 제2 환경 측정 센서 데이터, 상기 작물 데이터, 및 상기 이미지 데이터를 통합하고 시계열에 따라 정렬하여 합성하는 합성 단계를 포함하며,
상기 수집 단계는 비관계형 데이터베이스에 상기 제1 환경 측정 센서 데이터를 분리 저장하는 환경 데이터 저장 단계를 포함하고,
상기 정제 단계는,
상기 제1 환경 측정 센서 데이터 중 상기 결측치를 판단하고 검출하는 결측치 검출 단계;
상기 결측치를 제외한 상기 제1 환경 측정 센서 데이터 중 상기 이상치를 판단하고 검출하는 이상치 검출 단계; 및
상기 결측치 및 상기 이상치를 예측하여 데이터를 보정하는 데이터 보정 단계를 포함하고,
상기 데이터 보정 단계에서,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 제1 임계값 이하인 경우, 보간법을 이용하여 평균값, 최빈값, 혹은 중간값을 산출하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제1 임계값을 초과하며 제2 임계값을 초과하지 않는 경우, 회귀 알고리즘을 이용하여 상기 결측치 혹은 상기 이상치의 예측값을 도출하고,
상기 결측치 혹은 상기 이상치의 개수 또는 발생 기간이 상기 제2 임계값을 초과하는 경우, 관리자 단말로 센서 교체 알람 신호를 송신하고,
상기 제1 임계값 및 상기 제2 임계값은 상기 결측치 혹은 상기 이상치의 발생개수 및 상기 결측치 혹은 상기 이상치가 연속적으로 발생된 기간 중 하나로 정의되는 컴퓨터 판독가능 기록매체.
In the computer-readable recording medium containing a program for executing a smart farm data processing method,
The smart farm data processing method,
a collection step of classifying and collecting first environmental measurement sensor data, crop data, and image data received from the plantation;
a purification step of generating second environmental sensor data by detecting and refining missing values or outliers in the first environmental sensor data; and
A synthesizing step of integrating the second environmental measurement sensor data, the crop data, and the image data and aligning and synthesizing them according to time series,
The collecting step includes an environmental data storing step of separately storing the first environmental measurement sensor data in a non-relational database,
The purification step is
a missing value detection step of determining and detecting the missing value among the first environment measurement sensor data;
an outlier detection step of determining and detecting the outlier among the first environmental measurement sensor data excluding the missing value; and
A data correction step of correcting data by predicting the missing value and the outlier,
In the data correction step,
When the number or occurrence period of the missing value or the outlier value is less than or equal to a first threshold value, an average value, a mode value, or a median value is calculated using an interpolation method to derive a predicted value of the missing value or the outlier value;
When the number or generation period of the missing value or the outlier exceeds the first threshold and does not exceed a second threshold, a predicted value of the missing value or the outlier is derived using a regression algorithm;
When the number or occurrence period of the missing value or the abnormal value exceeds the second threshold value, a sensor replacement alarm signal is transmitted to an administrator terminal;
The first threshold value and the second threshold value are defined as one of the number of occurrences of the missing value or the abnormal value and a period in which the missing value or the abnormal value continuously occurs.
KR1020200064995A 2020-05-29 2020-05-29 Smart farm data processing system and smart farm data processing method KR102504381B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200064995A KR102504381B1 (en) 2020-05-29 2020-05-29 Smart farm data processing system and smart farm data processing method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200064995A KR102504381B1 (en) 2020-05-29 2020-05-29 Smart farm data processing system and smart farm data processing method

Publications (2)

Publication Number Publication Date
KR20210147568A KR20210147568A (en) 2021-12-07
KR102504381B1 true KR102504381B1 (en) 2023-03-03

Family

ID=78867953

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200064995A KR102504381B1 (en) 2020-05-29 2020-05-29 Smart farm data processing system and smart farm data processing method

Country Status (1)

Country Link
KR (1) KR102504381B1 (en)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20240017694A (en) 2022-08-01 2024-02-08 한국전자기술연구원 Electric device for quality verification of time series data and method for performing the same
KR20240038480A (en) 2022-09-16 2024-03-25 한국전자기술연구원 Electric device for mathcing a plurality of time series data and method for performing the same

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102219955B1 (en) * 2018-05-15 2021-02-24 농업회사법인 렛츠팜 주식회사 Behavior-based platform system using the bigdata
KR20190143680A (en) * 2018-06-21 2019-12-31 주식회사 에스에스엘 System for real-time monitoring groth state of crop in green house based on internet of things
KR102130506B1 (en) * 2018-09-11 2020-07-06 주식회사 이쓰리 Air Quality Monitoring System

Also Published As

Publication number Publication date
KR20210147568A (en) 2021-12-07

Similar Documents

Publication Publication Date Title
KR102504381B1 (en) Smart farm data processing system and smart farm data processing method
CN103472789B (en) A kind of agricultural intelligent information long distance control system
CN111263920A (en) System and method for controlling the growing environment of a crop
KR20220143954A (en) Method and apparatus, device and storage medium for determining an operating state of a photovoltaic array
CN104104921A (en) Plant disease and insect pest detecting system and method
KR20190143680A (en) System for real-time monitoring groth state of crop in green house based on internet of things
CN210570820U (en) Agricultural detection early warning system
US20150296024A1 (en) Wireless Sensor Mesh Network with Dual-Homed Router and Control through Mobile Devices
CN105163089A (en) Wifi-based family courtyard intelligent nursing device
US20200344297A1 (en) Data Transformation and Synchronization Between Devices
CN109408331A (en) Log alarming system based on user individual feature
CN108805942A (en) A kind of infrared image dynamic range compression method
KR20210074509A (en) Cloud-based real-time greenhouse environment decision support server and real-time greenhouse environment decision support system using the same
CN112914141A (en) Intelligent tobacco leaf baking and collecting system based on Internet of things
AU2020100249A4 (en) Method and device for predicting product price and computer medium
KR20160076317A (en) Apparatus and method for predicting disease and pest of crops
CN114493553A (en) Intelligent factory system with 5G communication management
EP2882139B1 (en) System and method for IT servers anomaly detection using incident consolidation
CN110672143A (en) Sensor calibration method
CN102914328A (en) Method for automatically regulating alarm thresholds of computer room temperature and humidity monitoring system
CN108829049A (en) A kind of method of liquid crystal glass base manufacture real time monitoring rate of feeding and inventory
CN114221979B (en) Intelligent planting factory lentinus edodes growth prediction module evaluation system and method based on comprehensive environmental factors
CN205691245U (en) A kind of Intellectual Thermal Transmitter of wireless calibration
CN111256836A (en) Infrared temperature measurement real-time recording sensing system based on phase-locked capture technology
Huang Research on the application of Internet of Things monitoring system in greenhouse flowers

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right