KR102230538B1 - Method and apparatus for generating gan-based virtual data to prevent the spread of avian influenza - Google Patents

Method and apparatus for generating gan-based virtual data to prevent the spread of avian influenza Download PDF

Info

Publication number
KR102230538B1
KR102230538B1 KR1020200125028A KR20200125028A KR102230538B1 KR 102230538 B1 KR102230538 B1 KR 102230538B1 KR 1020200125028 A KR1020200125028 A KR 1020200125028A KR 20200125028 A KR20200125028 A KR 20200125028A KR 102230538 B1 KR102230538 B1 KR 102230538B1
Authority
KR
South Korea
Prior art keywords
virtual data
missing
data
miss
real
Prior art date
Application number
KR1020200125028A
Other languages
Korean (ko)
Inventor
최대우
송유한
한예지
강태훈
이원빈
박선일
Original Assignee
한국외국어대학교 연구산학협력단
강원대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국외국어대학교 연구산학협력단, 강원대학교산학협력단 filed Critical 한국외국어대학교 연구산학협력단
Priority to KR1020200125028A priority Critical patent/KR102230538B1/en
Application granted granted Critical
Publication of KR102230538B1 publication Critical patent/KR102230538B1/en

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/50ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for simulation or modelling of medical disorders
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/80ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for detecting, monitoring or modelling epidemics or pandemics, e.g. flu

Abstract

Disclosed are a GAN-based virtual data generation method for preventing the spread of avian influenza and a device thereof. The method of the present invention generates and provides virtual data and missing virtual data so that conditions similar to real data are matched to a predictive model, so as to improve the learning accuracy of the predictive model.

Description

조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법 및 그 장치{METHOD AND APPARATUS FOR GENERATING GAN-BASED VIRTUAL DATA TO PREVENT THE SPREAD OF AVIAN INFLUENZA}GAN-based virtual data generation method and device for preventing the spread of avian influenza {METHOD AND APPARATUS FOR GENERATING GAN-BASED VIRTUAL DATA TO PREVENT THE SPREAD OF AVIAN INFLUENZA}

본 발명은 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법 및 그 장치에 관한 발명으로서, 더욱 상세하게는 예측 모델에 실제 데이터와 유사한 조건이 매칭되도록 가상 데이터와 결측 가상 데이터를 생성하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법 및 그 장치에 관한 것이다.The present invention relates to a GAN-based virtual data generation method and apparatus for preventing the spread of avian influenza, and more particularly, avian influenza spread that generates virtual data and missing virtual data so that conditions similar to real data are matched to a predictive model. It relates to a method and apparatus for generating virtual data based on GAN for prevention.

조류인플루엔자는 조류의 급성 전염병을 일으켜 닭, 칠면조 및 오리 등의 가금류에서 피해가 심하게 나타나고 있는 것으로 보고되고 있다. It is reported that avian influenza causes an acute infectious disease of birds, causing severe damage to poultry such as chickens, turkeys and ducks.

특히 H5N1과 H7N9의 경우 인체에 감염되어 사망에까지 이르게 하고 있다. 최근 중국에서는 조류인플루엔자 H7N9의 감염으로 인한 사람의 치사율이 36%에 이르고 있어 공중보건상 매우 큰 위해가 되고 있다.In particular, in the case of H5N1 and H7N9, humans are infected and lead to death. Recently, in China, the mortality rate of humans due to avian influenza H7N9 infection reaches 36%, which is a very serious public health hazard.

최근 들어, 조류인플루엔자가 해마다 광범위한 지역에서 빈번하게 발생하고 있는 추세에 있다. In recent years, avian influenza is a trend that occurs frequently in a wide area every year.

더욱이, 가금류를 밀집 사육하고 있는 경우, 조류인플루엔자가 발생하게 되면 그 피해가 매우 크게 나타나고 있으며, 고병원성 조류인플루엔자(HPAI: Highly Pathogenic Avian Influenza)는 100%에 가까운 높은 폐사율과 산란율 저하로 농가에 막대한 경제적 피해를 야기한다.Moreover, when poultry is densely reared, the damage is very large when avian influenza occurs, and HPAI (Highly Pathogenic Avian Influenza) has a high mortality rate close to 100% and a low spawning rate, making it a huge economic for farms. Cause damage.

따라서, 고병원성 조류인플루엔자 발생시 주변 지역으로의 전염을 신속하고 완벽하게 차단해야만 한다.Therefore, when highly pathogenic avian influenza occurs, transmission to surrounding areas must be quickly and completely blocked.

최근에는 인공지능(AI: Artificial Intelligence)을 이용하여 고병원성 조류인플루엔자의 발생시 주변 지역의 위험도를 예측하고, 그에 따른 방역 조치가 신속하게 이루어질 수 있도록 다양한 예측 모델들이 개발되고 있다.Recently, various predictive models have been developed to predict the risk of a surrounding area in the event of an outbreak of highly pathogenic avian influenza using artificial intelligence (AI), and to take quarantine measures accordingly.

이러한 예측 모델들은 주로 머신 러닝을 기반으로 하고, 복잡한 시스템이 명시적으로 프로그래밍되지 않고서 경험으로부터 자동으로 학습하고 개선할 수 있게 한다.These predictive models are primarily based on machine learning, and allow complex systems to automatically learn and improve from experience without explicitly being programmed.

머신 러닝을 기반으로 하는 예측 모델들의 정확도 및 유효성은 그들 모델들을 훈련 시키는데 사용되는 데이터에 부분적으로 의존할 수 있다.The accuracy and validity of predictive models based on machine learning can depend in part on the data used to train those models.

고병원성 조류인플루엔자(HPAI)는 특정 농장에서 발생되면, 다른 농장으로 고병원성 조류인플루엔자의 감염이 확산되는 것을 방지하기 위해 검역 본부가 지정한 범위내에 있는 모든 가금류를 폐기시켜야만 한다.If highly pathogenic avian influenza (HPAI) occurs on a specific farm, all poultry within the range specified by the quarantine headquarters must be disposed of to prevent the spread of highly pathogenic avian influenza infection to other farms.

그리고 그 폐기된 사항은 고병원성 조류인플루엔자(HPAI) 실제 데이터에 결측 데이터로 표시되어 저장된다.And the discarded items are displayed and stored as missing data in the actual data of highly pathogenic avian influenza (HPAI).

이러한 특성으로 인해 고병원성 조류인플루엔자(HPAI)와 관련하여 현재 적재되어 있는 데이터에서 결측 데이터(또는 결측치)가 가지는 의미는 고병원성 조류인플루엔자(HPAI)의 존재에 의해 생기는 패턴에 대한 정보와, 단순 오작동으로 인한 결측 발생을 함께 포함하는 것이다.Due to these characteristics, the meaning of missing data (or missing values) in the currently loaded data in relation to highly pathogenic avian influenza (HPAI) is information on patterns caused by the presence of highly pathogenic avian influenza (HPAI) and simple malfunctions. It includes the occurrence of missing together.

또한, 고병원성 조류인플루엔자(HPAI)는 연중으로 발생되기 보다는 겨울철에 집중하여 발생되는 양상을 보이며, 얼마의 기간 동안에는 아예 발생되지 않는 경우도 있다.In addition, highly pathogenic avian influenza (HPAI) shows a pattern that is concentrated in winter rather than year-round, and does not occur at all for a certain period of time.

시뮬레이션을 통해 향상된 예측 모델의 학습을 위해서는 충분한 양의 실제 데이터가 축적되어 있어야 하지만, 위와 같은 고병원성 조류인플루엔자(HPAI)의 특성으로 인해 그렇지 못한 문제점이 있다.In order to learn the predictive model improved through simulation, a sufficient amount of actual data must be accumulated, but there is a problem that is not the case due to the characteristics of the highly pathogenic avian influenza (HPAI) as described above.

따라서, 실제 데이터와 유사한 가상 데이터를 생성하여 예측 모델의 학습에 필요한 충분한 양의 데이터를 확보하는 것이 필요하다.Therefore, it is necessary to secure a sufficient amount of data necessary for learning a predictive model by generating virtual data similar to real data.

그러나 종래에는 결측 데이터를 포함한 가상 데이터를 생성하지 못해, 예측 모델의 예측 결과가 왜곡되는 문제점이 있다.However, there is a problem in that the prediction result of the prediction model is distorted because it is not possible to generate virtual data including missing data in the related art.

보다 정확한 시뮬레이션을 위해서는 실제 데이터에 결측 데이터가 반영되어 있는 것과 같이 가상 데이터의 생성시에 가상 데이터에 결측 데이터가 반영될 수 있게 하여 결측 데이터를 포함한 가상 데이터를 생성하는 것이 필요하다.For a more accurate simulation, it is necessary to generate virtual data including missing data by allowing missing data to be reflected in virtual data when generating virtual data, just as missing data is reflected in real data.

아울러, 가상 데이터의 생성 과정에 조류인플루엔자의 발생 시기와 위치를 반영하는 것이 필요하다.In addition, it is necessary to reflect the time and location of avian influenza in the process of generating virtual data.

한국 공개특허공보 공개번호 제10-2019-0117969호(발명의 명칭: 레이블 있는 데이터 및 레이블 없는 데이터를 병용하는 준지도 강화 학습 방법 및 이를 이용한 장치)Korean Patent Laid-Open Publication No. 10-2019-0117969 (Name of invention: Semi-supervised reinforcement learning method using both labeled data and unlabeled data and device using the same)

이러한 문제점을 해결하기 위하여, 본 발명은 예측 모델에 실제 데이터와 유사한 조건이 매칭되도록 가상 데이터와 결측 가상 데이터를 생성하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법 및 그 장치를 제공하는 것을 목적으로 한다.In order to solve this problem, the present invention aims to provide a GAN-based virtual data generation method and apparatus for preventing the spread of avian influenza that generates virtual data and missing virtual data so that conditions similar to real data are matched in a predictive model. It is done.

상기한 목적을 달성하기 위하여 본 발명의 일 실시 예는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치로서, 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건이 반영된 조류인플루엔자 확산 시뮬레이션 예측 모델의 학습을 위한 가상 데이터를 생성하되, 상기 가상 데이터의 생성시 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 통해 결측 가상 데이터의 결측 패턴을 반영하여 최종 가상 데이터를 생성하고, 상기 날짜 조건 및 공간 조건을 기반으로 상기 최종 가상 데이터가 실제 데이터와 차이가 있는지 판별하는 가상 데이터 생성 네트워크; 및 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 통해 상기 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하되, 생성된 상기 결측 가상 데이터의 결측 패턴이 상기 가상 데이터에 반영되도록 하고, 상기 날짜 조건 및 공간 조건을 기반으로, 상기 생성된 결측 가상 데이터의 결측 패턴이 실제 결측 데이터의 결측 패턴과 차이가 있는지 판별하는 결측 가상 데이터 생성 네트워크;를 포함하는 것을 특징으로 한다.In order to achieve the above object, an embodiment of the present invention is a GAN-based virtual data generation device for preventing the spread of avian influenza, and a simulation prediction model for avian influenza spread in which date conditions and spatial conditions are reflected in a learned latent vector. Generate virtual data for learning of, but when generating the virtual data, the final virtual data is generated by reflecting the missing pattern of the missing virtual data through a first generative adversarial network (GAN), and the date condition And a virtual data generation network that determines whether the final virtual data is different from actual data based on a spatial condition. And a second generative adversarial network (GAN) to generate missing virtual data by comparing whether the virtual data is missing or not with the missing real data, wherein a missing pattern of the generated virtual data is applied to the virtual data. And a missing virtual data generation network to be reflected and to determine whether a missing pattern of the generated missing virtual data is different from a missing pattern of actual missing data based on the date condition and the spatial condition.

또한, 상기 실시 예에 따른 가상 데이터 생성 네트워크는, 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건을 반영하여 딥컨볼루션 레이어(Deconvolution Layer)와 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(Fully Connected Layer)의 결합에 기반한 가상 데이터를 생성하여 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하는 가상 데이터 생성자; 및 결측 실제 데이터의 결측 패턴에 기반하여 생성된 결측 가상 데이터의 결측 패턴을 상기 가상 데이터에 반영하여 생성되는 최종 가상 데이터를 입력받아 상기 날짜 조건과 공간 조간을 기반으로 상기 최종 가상 데이터가 실제 데이터와 차이가 있는지 판별하여 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하는 가상 데이터 판별자;를 포함하는 것을 특징으로 한다.In addition, in the virtual data generation network according to the above embodiment, the deep convolution layer and all nodes of the previous layer are all nodes of the next layer by reflecting the date condition and the spatial condition to the learned latent vector. A virtual data generator constructing a first generative adversarial network (GAN) by generating virtual data based on a combination of a fully connected layer; And the final virtual data generated by reflecting the missing pattern of the missing virtual data generated based on the missing pattern of the missing real data to the virtual data, and the final virtual data is matched with the actual data based on the date condition and the spatial interpolation. And a virtual data discriminator constituting a first generative adversarial network (GAN) by determining whether there is a difference.

또한, 상기 실시 예에 따른 가상 데이터 생성자는 생성되는 가상 데이터와 실제 데이터 사이에서 상기 가상 데이터가 탐지되는 것을 방지하도록 학습하는 가상 데이터 생성자 손실 함수를 포함하고, 상기 가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00001
)는 하기식으로 구성될 수 있다. In addition, the virtual data generator according to the embodiment includes a virtual data generator loss function that learns to prevent the virtual data from being detected between the generated virtual data and real data, and the virtual data generator loss function (
Figure 112020102576344-pat00001
) May be composed of the following formula.

Figure 112020102576344-pat00002
Figure 112020102576344-pat00002

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf)-C(xr)) 함수를 활성 함수로 사용하여 가상 데이터(xf)가 실제 데이터(xr)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr, xf using the sigmoid (C (f x) -C (x r)) function with a probability value between 0 and 1 as the active virtual function data (f x) is actual data (x r) It is characterized by a more real probability.

또한, 상기 실시 예에 따른 가상 데이터 판별자는 생성된 상기 최종 가상 데이터와 실제 데이터 사이에서 상기 최종 가상 데이터를 탐지하도록 학습하는 가상 데이터 판별자 손실 함수를 포함하고, 상기 가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00003
)는 하기식으로 구성될 수 있다.In addition, the virtual data discriminator according to the embodiment includes a virtual data discriminator loss function for learning to detect the final virtual data between the generated final virtual data and real data, and the virtual data discriminator loss function (
Figure 112020102576344-pat00003
) May be composed of the following formula.

Figure 112020102576344-pat00004
Figure 112020102576344-pat00004

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr)-C(xf)) 함수를 활성 함수로 사용하여 가상 데이터(xf) 보다 주어진 실제 데이터(xr)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr, xf)는 실제 데이터(xr)가 가상 데이터(xf)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr and xf are given real data (x r ) rather than virtual data (x f ) by using the sigmoid(C(x r )-C(x f )) function with a probability value between 0 and 1 as an active function. ) Is a more real probability, λ is a hyperparameter of GP (Gradient Penalty), and D(x r , x f ) is a probability that the real data (x r ) is more real than the virtual data (x f ). It is done.

또한, 상기 실시 예에 따른 결측 가상 데이터 생성 네트워크는 상기 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하고, 상기 생성된 결측 가상 데이터의 결측 패턴이 상기 가상 데이터에 반영되도록 하여 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하는 결측 가상 데이터 생성자; 및 날짜 조건 및 공간 조건을 기반으로, 상기 생성된 결측 가상 데이터의 결측 패턴이 실제 결측 데이터의 결측 패턴과 차이가 있는지 판별하여 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)를 구성하는 결측 가상 데이터 판별자;를 포함하는 것을 특징으로 한다.In addition, the missing virtual data generation network according to the embodiment generates missing virtual data by comparing whether the virtual data is missing with actual missing data, and allows the missing pattern of the generated missing virtual data to be reflected in the virtual data. A missing virtual data generator constituting a second generative adversarial network (GAN); And based on the date condition and the spatial condition, the missing virtual data that constitutes a second generative adversarial network (GAN) by determining whether the missing pattern of the generated missing virtual data is different from the missing pattern of the actual missing data. And a data discriminator.

또한, 상기 실시 예에 따른 결측 가상 데이터 생성자는 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴이 탐지되는 것을 방지하도록 학습하는 결측 가상 데이터 생성자 손실 함수를 포함하고, 상기 결측 가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00005
)는 하기식으로 구성될 수 있다.In addition, the missing virtual data generator according to the embodiment is a missing virtual data generator loss function that learns to prevent the detection of the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data. Including, the missing virtual data generator loss function (
Figure 112020102576344-pat00005
) May be composed of the following formula.

Figure 112020102576344-pat00006
Figure 112020102576344-pat00006

여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 결측 가상 데이터(xf miss)가 결측 실제 데이터(xr miss)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr miss and xf miss are missing virtual data (x f miss ) using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as the active function. It is characterized by a probability that it is more real than the missing real data (x r miss ).

또한, 상기 실시 예에 따른 결측 가상 데이터 판별자는 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴을 탐지하도록 학습하는 결측 가상 데이터 판별자 손실 함수를 포함하고, 결측 가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00007
)는 하기식으로 구성될 수 있다.In addition, the missing virtual data discriminator according to the embodiment includes a missing virtual data discriminator loss function that learns to detect the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data. And the missing virtual data discriminator loss function (
Figure 112020102576344-pat00007
) May be composed of the following formula.

Figure 112020102576344-pat00008
Figure 112020102576344-pat00008

여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr miss)-C(xf miss)) 함수를 활성 함수로 사용하여 가상 데이터(xf miss) 보다 주어진 실제 데이터(xr miss)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr miss, xf miss)는 결측 실제 데이터(xr miss)가 결측 가상 데이터(xf miss)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr miss and xf miss are given by using the sigmoid(C(x r miss )-C(x f miss )) function with a probability value between 0 and 1 as the active function, and then the virtual data (x f miss ). The real data (x r miss ) is the probability that the real data is more real, λ is the hyperparameter of the GP (Gradient Penalty), and D(x r miss , x f miss ) is the missing real data (x r miss ) is the missing virtual data ( It is characterized in that the probability is more real than x f miss ).

또한, 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법은 가상 데이터 생성자와 가상 데이터 판별자가 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하여, 상기 가상 데이터 생성자가 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건을 반영하여 조류인플루엔자 확산 시뮬레이션 예측 모델의 학습을 위한 가상 데이터를 생성하되, 딥컨볼루션 레이어(Deconvolution Layer)와 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(Fully Connected Layer)의 결합에 기반한 가상 데이터를 생성하고, 상기 가상 데이터 판별자가 상기 가상 데이터의 생성시 결측 가상 데이터 생성자가 생성한 결측 가상 데이터의 결측 패턴을 반영하여 생성되는 최종 가상 데이터를 입력받아 상기 날짜 조건 및 공간 조건을 기반으로 상기 최종 가상 데이터와 실제 데이터 사이에 차이가 있는지 판별하는 단계; 및 b) 상기 결측 가상 데이터 생성자와 결측 가상 데이터 판별자가 제2 생성적 적대 신경망?*(GAN, Generative Adversarial Network)을 구성하여 상기 결측 가상 데이터 생성자가 상기 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하고, 생성된 상기 결측 가상 데이터의 결측 패턴이 상기 가상 데이터에 반영되도록 하고, 상기 날짜 조건 및 장소 조건을 기반으로 결측 가상 데이터 판별자가 상기 생성된 결측 가상 데이터의 결측 패턴과 실제 결측 데이터의 결측 패턴 사이에 차이가 있는지 판별하는 단계;를 포함한다.In addition, in the GAN-based virtual data generation method for preventing the spread of avian influenza according to an embodiment of the present invention, a virtual data generator and a virtual data discriminator form a first generative adversarial network (GAN), The data generator creates virtual data for learning the avian influenza spread simulation prediction model by reflecting the date and spatial conditions to the learned latent vector, but the deep convolution layer and all nodes of the previous layer Creates virtual data based on the combination of layers connected to all nodes of the next layer (Fully Connected Layer), and the virtual data discriminator reflects the missing pattern of the missing virtual data generated by the missing virtual data creator when the virtual data is created. Receiving the resulting final virtual data and determining whether there is a difference between the final virtual data and the actual data based on the date condition and the spatial condition; And b) the missing virtual data generator and the missing virtual data discriminator form a second generative adversarial network (GAN), and the missing virtual data generator compares the missing virtual data with the missing real data. To generate missing virtual data, to reflect the missing pattern of the generated missing virtual data in the virtual data, and based on the date condition and the location condition, the missing virtual data discriminator determines the missing pattern of the generated missing virtual data and And determining whether there is a difference between the missing patterns of the actual missing data.

또한, 상기 실시 예에 따른 a) 단계의 가상 데이터 생성자는 가상 데이터 생성자 손실 함수를 이용하여 생성되는 가상 데이터와 실제 데이터 사이에서 상기 가상 데이터가 탐지되는 것을 방지하도록 학습하고, 상기 가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00009
)는 하기식으로 구성될 수 있다.In addition, the virtual data generator of step a) according to the embodiment learns to prevent detection of the virtual data between the virtual data and real data generated by using the virtual data generator loss function, and the virtual data generator loss function (
Figure 112020102576344-pat00009
) May be composed of the following formula.

Figure 112020102576344-pat00010
Figure 112020102576344-pat00010

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf)-C(xr)) 함수를 활성 함수로 사용하여 가상 데이터(xf)가 실제 데이터(xr)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr, xf using the sigmoid (C (f x) -C (x r)) function with a probability value between 0 and 1 as the active virtual function data (f x) is actual data (x r) It is characterized by a more real probability.

또한, 상기 실시 예에 따른 a) 단계의 가상 데이터 판별자는 가상 데이터 판별자 손실 함수를 이용하여 생성된 최종 가상 데이터와 실제 데이터 사이에서 상기 최종 가상 데이터가 탐지되도록 학습하고, 상기 가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00011
)는 하기식으로 구성될 수 있다. In addition, the virtual data discriminator of step a) according to the embodiment learns to detect the final virtual data between the final virtual data and real data generated using the virtual data discriminator loss function, and the virtual data discriminator loss function(
Figure 112020102576344-pat00011
) May be composed of the following formula.

Figure 112020102576344-pat00012
Figure 112020102576344-pat00012

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr)-C(xf)) 함수를 활성 함수로 사용하여 가상 데이터(xf) 보다 주어진 실제 데이터(xr)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr, xf)는 실제 데이터(xr)가 가상 데이터(xf)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr and xf are given real data (x r ) rather than virtual data (x f ) by using the sigmoid(C(x r )-C(x f )) function with a probability value between 0 and 1 as an active function. ) Is a more real probability, λ is a hyperparameter of GP (Gradient Penalty), and D(x r , x f ) is a probability that the real data (x r ) is more real than the virtual data (x f ). It is done.

또한, 상기 실시 예에 따른 b) 단계의 결측 가상 데이터 생성자는 결측 가상 데이터 생성자 손실 함수를 이용하여 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴이 탐지되는 것을 방지하도록 학습하고, 상기 결측 가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00013
)는 하기식으로 구성될 수 있다.In addition, the missing virtual data generator of step b) according to the above embodiment uses the missing virtual data generator loss function to determine the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data. Learn to prevent being detected, and the missing virtual data generator loss function (
Figure 112020102576344-pat00013
) May be composed of the following formula.

Figure 112020102576344-pat00014
Figure 112020102576344-pat00014

여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 결측 가상 데이터(xf miss)가 결측 실제 데이터(xr miss)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr miss and xf miss are missing virtual data (x f miss ) using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as the active function. It is characterized by a probability that it is more real than the missing real data (x r miss ).

또한, 상기 실시 예에 따른 b) 단계의 결측 가상 데이터 판별자는 결측 가상 데이터 판별자 손실 함수를 이용하여 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴을 탐지하도록 학습하고, 결측 가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00015
)는 하기식으로 구성될 수 있다.In addition, the missing virtual data discriminator in step b) according to the embodiment is a missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data by using a missing virtual data discriminator loss function. To detect the missing virtual data discriminator loss function (
Figure 112020102576344-pat00015
) May be composed of the following formula.

Figure 112020102576344-pat00016
Figure 112020102576344-pat00016

여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 가상 데이터(xf miss) 보다 주어진 실제 데이터(xr miss)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr miss, xf miss)는 결측 실제 데이터(xr miss)가 결측 가상 데이터(xf miss)보다 더 실제일 확률인 것을 특징으로 한다.Here, E xr miss and xf miss are given by using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as the active function, and then the virtual data (x f miss ). The real data (x r miss ) is the probability that the real data is more real, λ is the hyperparameter of the GP (Gradient Penalty), and D(x r miss , x f miss ) is the missing real data (x r miss ) is the missing virtual data ( It is characterized in that the probability is more real than x f miss ).

본 발명은 예측 모델에 실제 데이터와 유사한 조건이 매칭되도록 가상 데이터를 생성하여 제공함으로써, 예측 모델의 학습 정확도를 향상시킬 수 있는 장점이 있다.The present invention has an advantage of improving the learning accuracy of the prediction model by generating and providing virtual data so that conditions similar to real data are matched to the prediction model.

또한, 본 발명은 생성된 가상 데이터에 결측 가상 데이터를 추가 생성하여 제공함으로써, 예측 모델의 학습도를 더욱 향상시킬 수 있는 장점이 있다.In addition, the present invention has an advantage of further improving the learning degree of a predictive model by additionally generating and providing missing virtual data to the generated virtual data.

또한, 본 발명은 발생 시기와 위치 등의 조건을 반영한 가상 데이터의 생성이 가능한 장점이 있다.In addition, the present invention has the advantage of being able to generate virtual data reflecting conditions such as occurrence time and location.

또한, 본 발명은 패턴 분석을 통해 결측 데이터를 예측 모델의 학습에 반영할 수 있는 장점이 있다.In addition, the present invention has an advantage of being able to reflect missing data in learning of a predictive model through pattern analysis.

또한, 본 발명은 생성된 가상 데이터 중에서 어떤 데이터가 결측 데이터인지 판별하는 것을 통해 결측 가상 데이터 생성자는 어떤 가상 데이터가 결측인지 추천할 수 있는 장점이 있다.In addition, the present invention has the advantage of being able to recommend which virtual data is missing by determining which data is missing data among the generated virtual data.

또한, 본 발명은 가상 데이터와 결측 가상 데이터를 결합하여 결측이 포함된 최종 가상 데이터를 생성하여 제공함으로써, 실제와 유사한 가상 데이터를 생성할 수 있는 장점이 있다.In addition, the present invention has an advantage of generating and providing the final virtual data including the missing by combining the virtual data and the missing virtual data, thereby generating virtual data similar to the real one.

도1은 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치를 나타낸 블록도.
도2는 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법을 나타낸 흐름도.
도3은 도2의 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법의 가상 데이터 학습 과정을 나타낸 흐름도.
도4는 도2의 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법의 결측 가상 데이터 학습 과정을 나타낸 흐름도.
1 is a block diagram showing an apparatus for generating virtual data based on GAN for preventing the spread of avian influenza according to an embodiment of the present invention.
Figure 2 is a flow chart showing a GAN-based virtual data generation method for preventing the spread of avian influenza according to an embodiment of the present invention.
3 is a flow chart showing a virtual data learning process of a GAN-based virtual data generation method for preventing the spread of avian influenza according to the embodiment of FIG. 2.
FIG. 4 is a flowchart illustrating a process of learning missing virtual data in a GAN-based virtual data generation method for preventing the spread of avian influenza according to the embodiment of FIG. 2.

이하에서는 본 발명의 바람직한 실시 예 및 첨부하는 도면을 참조하여 본 발명을 상세히 설명하되, 도면의 동일한 참조부호는 동일한 구성요소를 지칭함을 전제하여 설명하기로 한다.Hereinafter, the present invention will be described in detail with reference to a preferred embodiment of the present invention and the accompanying drawings, but it will be described on the premise that the same reference numerals refer to the same elements.

본 발명의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 발명의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다. Prior to describing specific details for the implementation of the present invention, it should be noted that configurations that are not directly related to the technical gist of the present invention have been omitted within the scope not disturbing the technical gist of the present invention.

또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.In addition, terms or words used in the present specification and claims are meanings and concepts consistent with the technical idea of the invention based on the principle that the inventor can define the concept of an appropriate term to describe his invention in the best way. Should be interpreted as.

본 명세서에서 어떤 부분이 어떤 구성요소를 "포함"한다는 표현은 다른 구성요소를 배제하는 것이 아니라 다른 구성요소를 더 포함할 수 있다는 것을 의미한다.In the present specification, the expression that a certain part "includes" a certain component does not exclude other components, but means that other components may be further included.

또한, "‥부", "‥기", "‥모듈" 등의 용어는 적어도 하나의 기능이나 동작을 처리하는 단위를 의미하며, 이는 하드웨어나 소프트웨어, 또는 그 둘의 결합으로 구분될 수 있다.In addition, terms such as "... unit", "... group", and "... module" mean units that process at least one function or operation, which can be classified into hardware, software, or a combination of the two.

또한, "적어도 하나의" 라는 용어는 단수 및 복수를 포함하는 용어로 정의되고, 적어도 하나의 라는 용어가 존재하지 않더라도 각 구성요소가 단수 또는 복수로 존재할 수 있고, 단수 또는 복수를 의미할 수 있음은 자명하다 할 것이다. In addition, the term “at least one” is defined as a term including the singular and plural, and even if the term “at least one” does not exist, each component may exist in the singular or plural, and may mean the singular or plural. Will say self-explanatory.

또한, 각 구성요소가 단수 또는 복수로 구비되는 것은, 실시 예에 따라 변경가능하다 할 것이다.In addition, it will be said that each component is provided in a singular or plural number and may be changed according to embodiments.

이하, 첨부된 도면을 참조하여 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법 및 그 장치의 바람직한 실시 예를 상세하게 설명한다.Hereinafter, a method for generating virtual data based on GAN for preventing the spread of avian influenza according to an embodiment of the present invention and a preferred embodiment of the apparatus will be described in detail with reference to the accompanying drawings.

도1은 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치를 나타낸 블록도이다.1 is a block diagram showing an apparatus for generating virtual data based on GAN for preventing the spread of avian influenza according to an embodiment of the present invention.

도1을 참조하면, 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치는 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건이 반영된 조류인플루엔자 확산 시뮬레이션 예측 모델의 학습을 위한 가상 데이터를 생성하되, 가상 데이터의 생성시 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 통해 결측 가상 데이터의 결측 패턴을 반영하여 최종 가상 데이터를 생성하고, 날짜 조건 및 공간 조건을 기반으로 최종 가상 데이터가 실제 데이터와 차이가 있는지 판별하는 가상 데이터 생성 네트워크를 포함하여 구성될 수 있다.Referring to FIG. 1, a GAN-based virtual data generation device for preventing the spread of avian influenza according to an embodiment of the present invention shows a prediction model for avian influenza spread simulation in which date conditions and spatial conditions are reflected in a learned latent vector. Generate virtual data for learning, but when generating virtual data, final virtual data is generated by reflecting the missing pattern of missing virtual data through a first generative adversarial network (GAN), and date conditions and spatial conditions It may be configured to include a virtual data generation network that determines whether the final virtual data is different from the actual data based on the data.

또한, 본 발명의 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치는 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 통해 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하되, 생성된 결측 가상 데이터의 결측 패턴이 가상 데이터에 반영되도록 하고, 날짜 조건 및 공간 조건을 기반으로 생성된 결측 가상 데이터의 결측 패턴이 실제 결측 데이터의 결측 패턴과 차이가 있는지 판별하는 결측 가상 데이터 생성 네트워크를 포함하여 구성될 수 있다.In addition, the GAN-based virtual data generation device for preventing the spread of avian influenza according to an embodiment of the present invention is missing by comparing the missing data with the missing actual data through a second generative adversarial network (GAN). Create virtual data, but ensure that the missing pattern of the created missing virtual data is reflected in the virtual data, and determine whether the missing pattern of the missing virtual data created based on date conditions and spatial conditions is different from the missing pattern of the actual missing data. It may be configured to include a missing virtual data generation network.

여기서, 가상 데이터 생성 네트워크는 가상 데이터 생성자(100)와 가상 데이터 판별자(200)를 포함하는 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)으로 구성될 수 있고, 결측 가상 데이터 생성 네트워크는 결측 가상 데이터 생성자(300)와, 결측 가상 데이터 판별자(400)를 포함하는 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)으로 구성될 수 있다.Here, the virtual data generation network may be composed of a first generative adversarial network (GAN) including a virtual data generator 100 and a virtual data discriminator 200, and the missing virtual data generation network is missing. It may be composed of a second generative adversarial network (GAN) including a virtual data generator 300 and a missing virtual data discriminator 400.

가상 데이터 생성자(100)는 학습된 잠재변수(latent vector)에 임의의 조건, 예를 들어 날짜 조건 및 공간 조건을 고려하여 임의의 데이터 세트로 구성된 가상 데이터를 생성하는 네트워크로 구성된다.The virtual data generator 100 is configured as a network that generates virtual data composed of an arbitrary data set in consideration of an arbitrary condition, for example, a date condition and a spatial condition in a learned latent vector.

잠재변수(latent vector)란 노이즈 벡터라고 하는 가상의 벡터를 의미한다. 학습 전에 잠재변수는 아무런 의미를 가지지 않는다. The latent vector means a virtual vector called a noise vector. Before learning, latent variables have no meaning.

그러나, 생성 네트워크를 학습하는 과정에서 학습된 잠재 변수의 값은 실제 데이터상의 값과 매핑 된다. 실제로 학습된 잠재 변수를 사용하면, 이전에 보지 않은 데이터상의 매핑까지도 가능하게 된다. However, the value of the latent variable learned in the process of learning the generation network is mapped to the value on the actual data. Using the actually learned latent variables enables even mapping on data that you haven't seen before.

가상 데이터 생성자(100)는 임의의 조건(날씨, 공간)과 학습된 잠재변수를 이용하여 임의의 조건을 기반으로 한 실제 데이터상의 값으로 매핑이 가능해진다.The virtual data generator 100 can map a value on real data based on an arbitrary condition by using an arbitrary condition (weather, space) and a learned latent variable.

임의의 조건은 예를 들어, 날씨 정보, 철새 정보, 방역 정보, 소독 정보, 가금류 농장 정보, 가금류 농장과 관련된 차량 정보 등을 포함할 수도 있다.The arbitrary conditions may include, for example, weather information, migratory bird information, quarantine information, disinfection information, poultry farm information, vehicle information related to poultry farm, and the like.

또한, 가상 데이터 생성자(100)에서 생성되는 가상 데이터는 아무런 의미가 없는 데이터를 이용하여 가상 데이터를 생성할 수 있고, 이때 생성되는 가상 데이터는 결측 데이터가 없다.In addition, the virtual data generated by the virtual data generator 100 may generate virtual data using data that has no meaning, and the virtual data generated at this time has no missing data.

즉, 가상 데이터 생성자(100)에서 생성되는 가상 데이터에는 실제 데이터에 포함된 결측 데이터가 포함되지 않는다.That is, the virtual data generated by the virtual data generator 100 does not include missing data included in the actual data.

또한, 가상 데이터 생성자(100)는 가상 데이터를 생성하되, 학습의 안전성을 위해 딥컨볼루션 레이어(Deconvolution Layer)와 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(FCL: Fully Connected Layer)의 결합에 기반하여 가상 데이터를 생성할 수 있다.In addition, the virtual data generator 100 generates virtual data, but for the safety of learning, a deep convolution layer and a layer in which all nodes of the previous layer are connected to all nodes of the next layer (FCL: Fully Connected Layer). Virtual data can be created based on the combination of.

또한, 가상 데이터 생성자(100)는 앞의 레이어에서의 사소한 변화에 의해 뒤의 레이어에서 큰 변화가 이루어져 결과의 분포가 전체적으로 시프트(Shift)될 가능이 높아질 수 있는 문제를 개선하기 위해, 딥컨볼루션 레이어에서 자기 정규화(Self Normalization)와, 입력값이 음수라도 기울기가 '0'이 되지 않는 리키 렐루(Leaky Relu) 활성 함수를 사용할 수 있다.In addition, in order to improve a problem in which the possibility that the distribution of the result can be shifted as a whole is increased due to a large change in the later layer due to a minor change in the previous layer, the deep convolution In the layer, self normalization and a Leaky Relu activation function that does not have a slope of '0' even if the input value is negative can be used.

또한, 가상 데이터 생성자(100)는 FCL에서 자기 정규화(Self Normalization)와, 비정상적인 기울기(Gradient)를 방지하고 파라미터(Parameter)의 크기 확대를 방지하는 'Spectral Normalization'과, 캡핑으로 인한 포화를 방지하며 오버피팅(Overfitting)을 감소시킬 수 있도록 미시(Mish) 활성 함수를 사용할 수 있다.In addition, the virtual data generator 100 prevents self normalization and abnormal gradients in the FCL and'Spectral Normalization' which prevents the scaling of parameters, and saturation due to capping. Mish activation functions can be used to reduce overfitting.

또한, 가상 데이터 생성자(100)는 생성적 적대 신경망(Generative Adversarial Network; GAN)을 사용하여 경쟁 구조에 있는 네트워크인 가상 데이터 판별자(200)가 생성된 가상 데이터와 실제 데이터 사이에서 생성된 가상 데이터를 탐지하는 것을 방지하도록 학습하는 가상 데이터 생성자 손실 함수를 포함하여 구성될 수 있다.In addition, the virtual data generator 100 uses a generative adversarial network (GAN) to generate virtual data between the virtual data generated by the virtual data discriminator 200, which is a network in a competing structure, and the actual data. It can be configured to include a virtual data generator loss function that learns to prevent detection.

가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00017
)는 하기식으로 구성될 수 있다.Virtual data generator loss function (
Figure 112020102576344-pat00017
) May be composed of the following formula.

Figure 112020102576344-pat00018
Figure 112020102576344-pat00018

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf)-C(xr)) 함수를 활성 함수로 사용하여 가상 데이터(xf)가 실제 데이터(xr)보다 더 실제일 확률이다.Here, E xr, xf using the sigmoid (C (f x) -C (x r)) function with a probability value between 0 and 1 as the active virtual function data (f x) is actual data (x r) It is the probability that it is more real than that.

즉, 가상 데이터 생성자 손실 함수는 생성된 가상 데이터가 실제 데이터보다 더 실제 같은가를 기준으로 정의되고, 실제 데이터와 생성된 가상 데이터 사이에서 가상 데이터를 가상 데이터 판별자(200)에서 탐지하지 못하도록 한다.That is, the virtual data creator loss function is defined based on whether the generated virtual data is more real than the real data, and prevents the virtual data discriminator 200 from detecting the virtual data between the real data and the generated virtual data.

가상 데이터 판별자(200)는 결측 가상 데이터 생성자(300)에서 결측 실제 데이터와 비교하여 생성된 결측 가상 데이터의 결측 패턴을 가상 데이터에 반영하여 생성한 최종 가상 데이터와, 날짜 조건 및 공간 조건이 입력되었을 때, 최종 가상 데이터가 실제 데이터와 차이가 있는지 판별한다.The virtual data discriminator 200 inputs the final virtual data generated by reflecting the missing pattern of the missing virtual data generated by comparing the missing virtual data with the missing real data in the virtual data generator 300, and a date condition and a spatial condition. When it is done, it is determined whether the final virtual data is different from the actual data.

즉, 가상 데이터 판별자(200)는 실제 데이터와 생성된 최종 가상 데이터를 판별하는 네트워크로 구성되고, 공간 조건과 날짜 조건이 주어졌을 경우 생성된 최종 가상 데이터와 실제 데이터 사이에 차이가 있는지 판별하는 네트워크이다.That is, the virtual data discriminator 200 is composed of a network that determines the actual data and the final virtual data generated, and determines whether there is a difference between the final virtual data and the actual data when a space condition and a date condition are given. It is a network.

또한, 가상 데이터 판별자(200)는 학습의 안전성을 위해 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(FCL: Fully Connected Layer)를 사용한다.In addition, the virtual data discriminator 200 uses a fully connected layer (FCL) in which all nodes of the previous layer are connected to all nodes of the next layer for safety of learning.

또한, 가상 데이터 판별자(200)는 FCL에서 자기 정규화(Self Normalization)와, 비정상적인 기울기(Gradient)를 방지하고 파라미터(Parameter)의 크기 확대를 방지하는 'Spectral Normalization'와, 입력값이 음수라도 기울기가 '0'이 되지 않는 리키 렐루(Leaky Relu) 활성 함수를 사용할 수 있다.In addition, the virtual data discriminator 200 includes'Spectral Normalization', which prevents self normalization, abnormal gradients, and increases the size of a parameter in FCL, and slopes even if the input value is negative. You can use a Leaky Relu activation function that does not become '0'.

또한, 가상 데이터 판별자(200)는 생성된 최종 가상 데이터와 실제 데이터 사이에서 최종 가상 데이터를 탐지하도록 학습하는 가상 데이터 판별자 손실 함수를 포함하여 구성될 수 있다.In addition, the virtual data discriminator 200 may include a virtual data discriminator loss function that learns to detect the final virtual data between the generated final virtual data and the actual data.

가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00019
)는 하기식으로 구성될 수 있다.Virtual data discriminator loss function (
Figure 112020102576344-pat00019
) May be composed of the following formula.

Figure 112020102576344-pat00020
Figure 112020102576344-pat00020

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr)-C(xf)) 함수를 활성 함수로 사용하여 가상 데이터(xf) 보다 주어진 실제 데이터(xr)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr, xf)는 실제 데이터(xr)가 가상 데이터(xf)보다 더 실제일 확률이다.Here, E xr and xf are given real data (x r ) rather than virtual data (x f ) by using the sigmoid(C(x r )-C(x f )) function with a probability value between 0 and 1 as an active function. ) Is a more real probability, λ is a hyperparameter of GP (Gradient Penalty), and D(x r , x f ) is a probability that real data (x r ) is more real than virtual data (x f ).

즉, 가상 데이터 판별자 손실 함수는 실제 데이터와 생성된 최종 가상 데이터 사이에서 최종 가상 데이터를 탐지할 수 있도록 한다.That is, the virtual data discriminator loss function makes it possible to detect the final virtual data between the actual data and the generated final virtual data.

결측 가상 데이터 생성자(300)는 가상 데이터 생성자(100)의 가상 데이터에서 결측 실제 데이터의 결측 패턴에 기반하여 결측 가상 데이터를 생성하는 네트워크로서, 결측을 갖고 있는 결측 실제 데이터의 결측 분포를 보고 결측 가상 데이터 판별자(300)를 속이기 위한 결측 가상 데이터를 생성하고, 생성된 결측 가상 데이터의 결측 분포에 기반한 결측 패턴을 분석한다.The missing virtual data generator 300 is a network that generates missing virtual data based on the missing pattern of the missing real data from the virtual data of the virtual data generator 100. The missing virtual data to deceive the data discriminator 300 is generated, and a missing pattern based on the missing distribution of the generated missing virtual data is analyzed.

여기서, 본 발명에 따른 결측 가상 데이터는 실제 결측 데이터와 유사한 결측 데이터를 생성하는 것이 바람직하다.Here, it is preferable that the missing virtual data according to the present invention generate missing data similar to the actual missing data.

이를 위해, 결측치가 없는 가상 데이터에 새로운 결측 데이터를 생성하고, 결측 실제 데이터의 실제 결측 패턴과 유사하지만 실제 결측 패턴과는 다르게 생성된다.To this end, new missing data is generated in virtual data without missing values, and is similar to the actual missing pattern of the missing real data, but different from the actual missing pattern.

또한, 결측 가상 데이터 생성자(300)는 결측 패턴이 반영된 결측 가상 데이터를 가상 데이터에 반영하여 최종 가상 데이터가 생성되도록 한다.In addition, the missing virtual data generator 300 reflects the missing virtual data reflecting the missing pattern to the virtual data so that the final virtual data is generated.

또한, 결측 가상 데이터 생성자(300)는 학습의 안전성을 위해 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(FCL: Fully Connected Layer)를 사용한다.In addition, the missing virtual data generator 300 uses a fully connected layer (FCL) in which all nodes of the previous layer are connected to all nodes of the next layer for safety of learning.

또한, 결측 가상 데이터 생성자(300)는 FCL에서 자기 정규화(Self Normalization)와, 비정상적인 기울기(Gradient)를 방지하고 파라미터(Parameter)의 크기 확대를 방지하는 'Spectral Normalization'와, 입력값이 음수라도 기울기가 '0'이 되지 않는 리키 렐루(Leaky Relu) 활성 함수를 사용할 수 있다.In addition, the missing virtual data generator 300 includes'Spectral Normalization', which prevents self normalization, abnormal gradients, and increases the size of parameters in FCL, and slopes even if the input value is negative. You can use a Leaky Relu activation function that does not become '0'.

또한, 결측 가상 데이터 생성자(300)는 생성적 적대 신경망(Generative Adversarial Network; GAN)을 사용하여 경쟁 구조에 있는 네트워크인 결측 가상 데이터 판별자(400)가 생성된 결측 가상 데이터의 결측 패턴과 결측 실제 데이터의 결측 패턴 사이에서 결측 가상 데이터의 결측 패턴이 탐지되는 것을 방지하도록 학습하는 결측 가상 데이터 생성자 손실 함수를 포함한다.In addition, the missing virtual data generator 300 uses a generative adversarial network (GAN) to generate the missing virtual data discriminator 400, which is a network in a competing structure. And a missing virtual data generator loss function that learns to prevent a missing pattern of missing virtual data from being detected between the missing patterns of the data.

상기 결측 가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00021
)는 하기식으로 구성될 수 있다.The missing virtual data generator loss function (
Figure 112020102576344-pat00021
) May be composed of the following formula.

Figure 112020102576344-pat00022
Figure 112020102576344-pat00022

여기서, 상기 Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 결측 가상 데이터(xf miss)가 결측 실제 데이터(xr miss)보다 더 실제일 확률이다.Here, the E xr miss and xf miss are missing virtual data (x f miss ) using the sigmoid(C(x f miss )-C(x r miss )) function having a probability value between 0 and 1 as an active function. Is the probability that is more real than the missing real data (x r miss ).

즉, 결측 가상 데이터 생성자 손실 함수는 결측 가상 데이터가 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 결측 가상 데이터의 결측 패턴을 결측 가상 데이터 판별자(400)에서 탐지하지 못하도록 한다.That is, the missing virtual data generator loss function prevents the missing virtual data discriminator 400 from detecting the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data. .

결측 가상 데이터 판별자(400)는 날짜 조건 및 공간 조건이 입력되고, 생성된 결측 가상 데이터의 결측 패턴이 실제 결측 데이터의 결측 패턴과 차이가 있는지 판별하는 네트워크로 구성될 수 있다.The missing virtual data discriminator 400 may be configured as a network to determine whether a date condition and a spatial condition are input, and a missing pattern of the generated missing virtual data is different from a missing pattern of the actual missing data.

또한, 결측 가상 데이터 판별자(400)는 학습의 안전성을 위해 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(FCL: Fully Connected Layer)를 사용한다.In addition, the missing virtual data discriminator 400 uses a fully connected layer (FCL) in which all nodes of the previous layer are connected to all nodes of the next layer for safety of learning.

또한, 결측 가상 데이터 판별자(400)는 FCL에서 자기 정규화(Self Normalization)와, 비정상적인 기울기(Gradient)를 방지하고 파라미터(Parameter)의 크기 확대를 방지하는 'Spectral Normalization'와, 입력값이 음수라도 기울기가 '0'이 되지 않는 리키 렐루(Leaky Relu) 활성 함수를 사용할 수 있다.In addition, the missing virtual data discriminator 400 includes'Spectral Normalization', which prevents self normalization, abnormal gradient, and enlargement of the parameter size in FCL, and even if the input value is negative. You can use the Leaky Relu activation function where the slope does not become '0'.

또한, 결측 가상 데이터 판별자(400)는 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴을 탐지하도록 학습하는 결측 가상 데이터 판별자 손실 함수를 포함하여 구성될 수 있다. In addition, the missing virtual data discriminator 400 includes a missing virtual data discriminator loss function for learning to detect the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data. Can be configured.

결측 가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00023
)는 하기식으로 구성될 수 있다.Missing virtual data discriminator loss function (
Figure 112020102576344-pat00023
) May be composed of the following formula.

Figure 112020102576344-pat00024
Figure 112020102576344-pat00024

여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr miss)-C(xf miss)) 함수를 활성 함수로 사용하여 가상 데이터(xf miss) 보다 주어진 실제 데이터(xr miss)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr miss, xf miss)는 결측 실제 데이터(xr miss)가 결측 가상 데이터(xf miss)보다 더 실제일 확률이다.Here, E xr miss and xf miss are given by using the sigmoid(C(x r miss )-C(x f miss )) function with a probability value between 0 and 1 as the active function, and then the virtual data (x f miss ). The real data (x r miss ) is the probability that the real data is more real, λ is the hyperparameter of the GP (Gradient Penalty), and D(x r miss , x f miss ) is the missing real data (x r miss ) is the missing virtual data ( It is the probability that it is more real than x f miss ).

즉, 결측 가상 데이터 판별자 손실 함수는 결측 실제 데이터의 실제 결측 패턴과, 생성된 결측 가상 데이터의 가상 결측 패턴 사이에서 가상 결측 패턴을 탐지할 수 있도록 한다.That is, the missing virtual data discriminator loss function makes it possible to detect a virtual missing pattern between the actual missing pattern of the missing real data and the virtual missing pattern of the generated missing virtual data.

또한, 결측 가상 데이터 판별자 손실 함수는 GP(Gradient Penalty)를 적용해서, 가중치(weight)가 증가(exploding)하거나 또는 사라지는(Vanishing) 것을 방지한다.In addition, the missing virtual data discriminator loss function applies a gradient penalty (GP) to prevent the weight from exploding or vanishing.

다음은 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법을 설명한다.Next, a GAN-based virtual data generation method for preventing the spread of avian influenza according to an embodiment of the present invention will be described.

도2는 본 발명의 일 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법을 나타낸 흐름도이고, 도3은 도2의 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법의 가상 데이터 학습 과정을 나타낸 흐름도이며, 도4는 도2의 실시 예에 따른 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법의 결측 가상 데이터 학습 과정을 나타낸 흐름도이다.2 is a flowchart showing a GAN-based virtual data generation method for preventing the spread of avian influenza according to an embodiment of the present invention, and FIG. 3 is a GAN-based virtual data generation method for preventing the spread of avian influenza according to the embodiment of FIG. Is a flow chart showing the virtual data learning process of, and FIG. 4 is a flow chart showing the missing virtual data learning process of the GAN-based virtual data generation method for preventing the spread of avian influenza according to the embodiment of FIG.

도1 내지 도4를 참조하면, 가상 데이터 생성자(100)와 가상 데이터 판별자(200)가 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하여 가상 데이터 생성자(100)는 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건을 고려하여 딥컨볼루션 레이어(Deconvolution Layer)와 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(Fully Connected Layer)의 결합에 기반한 가상 데이터를 생성하고, 가상 데이터의 생성시 결측 가상 데이터 생성자(300)가 생성한 결측 가상 데이터의 결측 패턴을 반영하여 생성되는 최종 가상 데이터와, 상기 날짜 조건 및 공간 조건이 입력되면, 가상 데이터 판별자(200)가 최종 가상 데이터와 실제 데이터 사이에 차이가 있는지 판별하는 단계(S100)를 포함하여 구성된다.1 to 4, the virtual data generator 100 and the virtual data discriminator 200 form a first generative adversarial network (GAN) so that the virtual data generator 100 Create virtual data based on the combination of a deep convolution layer and a fully connected layer in which all nodes of the previous layer are connected to all nodes of the next layer by considering date and spatial conditions in a variable (latent vector). And, when the virtual data is generated, the final virtual data generated by reflecting the missing pattern of the missing virtual data generated by the missing virtual data generator 300, and the date condition and the spatial condition are input, the virtual data discriminator 200 And determining whether there is a difference between the final virtual data and the actual data (S100).

또한, 결측 가상 데이터 생성자(300)와 결측 가상 데이터 판별자(400)가 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하여 결측 가상 데이터 생성자(300)가 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하고, 생성된 상기 결측 가상 데이터의 결측 패턴이 상기 가상 데이터에 반영되도록 하며, 소정의 조건이 입력되면, 결측 가상 데이터 판별자(400)가 생성된 결측 가상 데이터의 결측 패턴과 실제 결측 데이터의 결측 패턴 사이에 차이가 있는지 판별하는 단계(S200)를 포함하여 구성된다.In addition, the missing virtual data generator 300 and the missing virtual data discriminator 400 form a second generative adversarial network (GAN) so that the missing virtual data generator 300 determines whether the virtual data is missing. The missing virtual data is created by comparing with real data, the missing pattern of the created missing virtual data is reflected in the virtual data, and when a predetermined condition is input, the missing virtual data discriminator 400 is created. And determining whether there is a difference between the missing pattern of the data and the missing pattern of the actual missing data (S200).

S100 단계에서 가상 데이터 생성자(100)는 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건을 고려하여 아무 의미가 없는 데이터 세트로 구성된 가상 데이터를 생성(S110)한다.In step S100, the virtual data generator 100 generates virtual data composed of a data set that has no meaning in consideration of date conditions and spatial conditions in the learned latent vector (S110).

또한, S110 단계에서 가상 데이터 생성자(100)에서 생성하는 가상 데이터는 실제 데이터에 포함된 결측치와 같은 결측 데이터가 포함되지 않는다.In addition, the virtual data generated by the virtual data generator 100 in step S110 does not include missing data such as missing values included in the actual data.

또한, S110 단계에서 가상 데이터 생성자(100)는 딥컨볼루션 레이어(Deconvolution Layer)와 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(FCL: Fully Connected Layer)의 결합에 기반하여 가상 데이터를 생성한다.In addition, in step S110, the virtual data generator 100 generates virtual data based on a combination of a deep convolution layer and a layer in which all nodes of the previous layer are connected to all nodes of the next layer (FCL). Generate.

S110 단계에서 생성된 가상 데이터는 결측 가상 데이터 생성자(200)에서 결측 실제 데이터의 실제 결측 패턴에 기반하여 가상 결측 패턴이 반영된 결측 가상 데이터와 결합하여 최종 가상 데이터를 생성하고, 가상 데이터 판별자(200)에서 최종 가상 데이터와, 날짜 조건 및 공간 조건이 입력되었을 때, 최종 가상 데이터가 실제 데이터와 차이가 있는지 판별(S120)한다.The virtual data generated in step S110 is combined with the missing virtual data reflecting the virtual missing pattern based on the actual missing pattern of the missing real data in the missing virtual data generator 200 to generate final virtual data, and the virtual data discriminator 200 ), when the final virtual data, date conditions, and spatial conditions are input, it is determined whether the final virtual data is different from the actual data (S120).

S120 단계의 판별 결과를 기반으로 가상 데이터 생성자(100)는 제1 생성적 적대 신경망(Generative Adversarial Network; GAN)에서 경쟁 구조에 있는 네트워크인 가상 데이터 판별자(200)가, 생성된 가상 데이터와 실제 데이터 사이에서 생성된 가상 데이터를 탐지하는 것을 방지하도록 가상 데이터 생성자 손실 함수를 이용하여 학습(S130)한다.Based on the determination result of step S120, the virtual data generator 100 determines that the virtual data discriminator 200, which is a network in a competing structure in the first generative adversarial network (GAN), is In order to prevent detection of virtual data generated between data, learning is performed using a virtual data generator loss function (S130).

S130 단계에서, 가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00025
)는 하기식으로 구성될 수 있다.In step S130, the virtual data generator loss function (
Figure 112020102576344-pat00025
) May be composed of the following formula.

Figure 112020102576344-pat00026
Figure 112020102576344-pat00026

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf)-C(xr)) 함수를 활성 함수로 사용하여 가상 데이터(xf)가 실제 데이터(xr)보다 더 실제일 확률이다.Here, E xr, xf using the sigmoid (C (f x) -C (x r)) function with a probability value between 0 and 1 as the active virtual function data (f x) is actual data (x r) It is the probability that it is more real than that.

또한, S120 단계의 판별 결과를 기반으로 가상 데이터 판별자(200)는 생성된 최종 가상 데이터와 실제 데이터 사이에서 최종 가상 데이터를 탐지하도록 가상 데이터 판별자 손실 함수를 이용하여 학습(S140)한다.In addition, based on the determination result in step S120, the virtual data discriminator 200 learns (S140) using a virtual data discriminator loss function to detect the final virtual data between the generated final virtual data and the real data.

S140 단계에서, 가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00027
)는 하기식으로 구성될 수 있다.In step S140, the virtual data discriminator loss function (
Figure 112020102576344-pat00027
) May be composed of the following formula.

Figure 112020102576344-pat00028
Figure 112020102576344-pat00028

여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr)-C(xf)) 함수를 활성 함수로 사용하여 가상 데이터(xf) 보다 주어진 실제 데이터(xr)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr, xf)는 실제 데이터(xr)가 가상 데이터(xf)보다 더 실제일 확률이다. Here, E xr and xf are given real data (x r ) rather than virtual data (x f ) by using the sigmoid(C(x r )-C(x f )) function with a probability value between 0 and 1 as an active function. ) Is a more real probability, λ is a hyperparameter of GP (Gradient Penalty), and D(x r , x f ) is a probability that real data (x r ) is more real than virtual data (x f ).

한편, 결측 가상 데이터 생성자(300)는 S110 단계에서 가상 데이터 생성자(100)가 생성한 가상 데이터에서 결측 실제 데이터의 결측 패턴에 기반하여 결측 가상 데이터를 생성(S210)한다.Meanwhile, the missing virtual data generator 300 generates missing virtual data based on the missing pattern of the missing real data from the virtual data generated by the virtual data generator 100 in step S110 (S210).

즉, S210 단계에서 결측 가상 데이터 생성자(300)는 실제 결측치 또는 실제 결측 패턴을 갖고 있는 결측 실제 데이터의 결측 분포를 보고, 결측 가상 데이터 판별자(300)를 속이기 위한 결측 가상 데이터를 생성한다.That is, in step S210, the missing virtual data generator 300 sees the missing distribution of the missing actual data having the actual missing value or the actual missing pattern, and generates missing virtual data to deceive the missing virtual data discriminator 300.

또한, 결측 가상 데이터 생성자(300)는 결측 실제 데이터의 실제 결측 분포 및 생성된 결측 가상 데이터의 가상 결측 분포 중 어느 하나에 기반하여 결측 패턴을 분석할 수 있다.In addition, the missing virtual data generator 300 may analyze a missing pattern based on any one of an actual missing distribution of the missing real data and a virtual missing distribution of the generated missing virtual data.

또한, S210 단계에서 결측 가상 데이터 생성자(300)가 생성한 가상 결측 패턴이 반영된 결측 가상 데이터는 S110 단계에서 생성된 가상 데이터와 결합하여 최종 가상 데이터가 생성되도록 한다.In addition, the missing virtual data reflecting the virtual missing pattern generated by the missing virtual data generator 300 in step S210 is combined with the virtual data generated in step S110 to generate the final virtual data.

계속해서, 결측 가상 데이터 판별자(400)는 S210 단계에서 생성된 결측 가상 데이터와, 날짜 조건 및 공간 조건이 입력되면, 생성된 결측 가상 데이터의 가상 결측 패턴이 실제 결측 데이터의 실제 결측 패턴과 차이가 있는지 판별(S220)한다.Subsequently, when the missing virtual data generated in step S210 and the date condition and the spatial condition are input, the virtual missing pattern of the generated missing virtual data is different from the actual missing pattern of the actual missing data. It is determined whether there is (S220).

S220 단계의 판별 결과를 기반으로 결측 가상 데이터 생성자(300)는 제2 생성적 적대 신경망(Generative Adversarial Network; GAN)에서 경쟁 구조에 있는 네트워크인 결측 가상 데이터 판별자(400)가, 생성된 결측 가상 데이터의 가상 결측 패턴과 결측 실제 데이터의 결측 패턴 사이에서 결측 가상 데이터의 결측 패턴이 탐지되는 것을 방지하도록 결측 가상 데이터 생성자 손실 함수를 이용하여 학습(S230)한다.Based on the determination result in step S220, the missing virtual data generator 300 is a network in a competing structure in a second generative adversarial network (GAN). In order to prevent a missing pattern of missing virtual data from being detected between the virtual missing pattern of the data and the missing pattern of the actual missing data, learning is performed using the missing virtual data generator loss function (S230).

S230 단계에서, 결측 가상 데이터 생성자 손실 함수(

Figure 112020102576344-pat00029
)는 하기식으로 구성될 수 있다.In step S230, the missing virtual data generator loss function (
Figure 112020102576344-pat00029
) May be composed of the following formula.

Figure 112020102576344-pat00030
Figure 112020102576344-pat00030

여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 결측 가상 데이터(xf miss)가 결측 실제 데이터(xr miss)보다 더 실제일 확률이다.Here, E xr miss and xf miss are missing virtual data (x f miss ) using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as the active function. It is the probability that it is more real than the missing real data (x r miss ).

계속해서, S220 단계의 판별 결과를 기반으로 결측 가상 데이터 판별자(400)는 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 결측 가상 데이터의 결측 패턴을 탐지하도록 결측 가상 데이터 판별자 손실 함수를 이용하여 학습(S240)한다.Subsequently, based on the determination result of step S220, the missing virtual data discriminator 400 determines the missing virtual data to detect the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data. Learning (S240) using the ruler loss function.

S240 단계에서, 결측 가상 데이터 판별자 손실 함수(

Figure 112020102576344-pat00031
)는 하기식으로 구성될 수 있다.In step S240, the missing virtual data discriminator loss function (
Figure 112020102576344-pat00031
) May be composed of the following formula.

Figure 112020102576344-pat00032
Figure 112020102576344-pat00032

여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 가상 데이터(xf miss) 보다 주어진 실제 데이터(xr miss)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr miss, xf miss)는 결측 실제 데이터(xr miss)가 결측 가상 데이터(xf miss)보다 더 실제일 확률이다.Here, E xr miss and xf miss are given by using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as the active function, and then the virtual data (x f miss ). The real data (x r miss ) is the probability that the real data is more real, λ is the hyperparameter of the GP (Gradient Penalty), and D(x r miss , x f miss ) is the missing real data (x r miss ) is the missing virtual data ( It is the probability that it is more real than x f miss ).

따라서, 예측 모델에 실제 데이터와 유사한 조건이 매칭되도록 가상 데이터를 생성하여 제공함으로써, 예측 모델의 학습 정확도를 향상시킬 수 있게 된다.Accordingly, by generating and providing virtual data so that conditions similar to real data are matched to the prediction model, it is possible to improve the learning accuracy of the prediction model.

또한, 생성된 가상 데이터에 결측 가상 데이터를 추가 생성하고, 발생 시기와 위치 등의 조건을 반영함으로써, 예측 모델의 학습도를 더욱 향상시킬 수 있게 된다.In addition, by adding missing virtual data to the generated virtual data and reflecting conditions such as occurrence time and location, it is possible to further improve the learning degree of the predictive model.

또한, 패턴 분석을 통해 결측 데이터를 예측 모델의 학습에 반영하고, 생성된 가상 데이터 중에서 어떤 데이터가 결측 데이터인지 판별하는 것을 통해 결측 가상 데이터 생성자는 어떤 가상 데이터가 결측인지 추천할 수 있어 실제와 유사한 가상 데이터를 생성할 수 있다.In addition, through pattern analysis, the missing data is reflected in the training of the predictive model, and by determining which data is missing data among the generated virtual data, the missing virtual data creator can recommend which virtual data is missing. You can create virtual data.

또한, 가상 데이터와 결측 가상 데이터를 결합하여 결측이 포함된 최종 가상 데이터를 생성하여 제공함으로써, 실제와 유사한 가상 데이터를 생성할 수 있다.In addition, by combining the virtual data and the missing virtual data to generate and provide final virtual data including the missing, virtual data similar to the real can be generated.

상기와 같이, 본 발명의 바람직한 실시 예를 참조하여 설명하였지만 해당 기술 분야의 숙련된 당업자라면 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.As described above, although it has been described with reference to a preferred embodiment of the present invention, those skilled in the art will variously modify and change the present invention within the scope not departing from the spirit and scope of the present invention described in the following claims. You will understand that you can do it.

또한, 본 발명의 특허청구범위에 기재된 도면번호는 설명의 명료성과 편의를 위해 기재한 것일 뿐 이에 한정되는 것은 아니며, 실시예를 설명하는 과정에서 도면에 도시된 선들의 두께나 구성요소의 크기 등은 설명의 명료성과 편의상 과장되게 도시되어 있을 수 있다.In addition, reference numerals in the claims of the present invention are provided for clarity and convenience of description, and are not limited thereto. In the process of describing the embodiments, the thickness of the lines shown in the drawings, the size of components, etc. May be exaggerated for clarity and convenience of description.

또한, 상술된 용어들은 본 발명에서의 기능을 고려하여 정의된 용어들로서 이는 사용자, 운용자의 의도 또는 관례에 따라 달라질 수 있으므로, 이러한 용어들에 대한 해석은 본 명세서 전반에 걸친 내용을 토대로 내려져야 할 것이다.In addition, the above-described terms are terms defined in consideration of functions in the present invention and may vary according to the intention or custom of users or operators, so interpretation of these terms should be made based on the contents throughout the present specification. .

또한, 명시적으로 도시되거나 설명되지 아니하였다 하여도 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자가 본 발명의 기재사항으로부터 본 발명에 의한 기술적 사상을 포함하는 다양한 형태의 변형을 할 수 있음은 자명하며, 이는 여전히 본 발명의 권리범위에 속한다. In addition, even if not explicitly shown or described, a person having ordinary knowledge in the technical field to which the present invention pertains can make various modifications including the technical idea according to the present invention from the description of the present invention. It is obvious, and this still belongs to the scope of the present invention.

또한, 첨부하는 도면을 참조하여 설명된 상기의 실시예들은 본 발명을 설명하기 위한 목적으로 기술된 것이며 본 발명의 권리범위는 이러한 실시예에 국한되지 아니한다.In addition, the above embodiments described with reference to the accompanying drawings are described for the purpose of describing the present invention, and the scope of the present invention is not limited to these embodiments.

100 : 가상 데이터 생성자
200 : 가상 데이터 판별자
300 : 결측 가상 데이터 생성자
400 : 결측 가상 데이터 판별자
100: virtual data creator
200: virtual data discriminator
300: missing virtual data generator
400: missing virtual data discriminator

Claims (12)

학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건이 반영된 조류인플루엔자 확산 시뮬레이션 예측 모델의 학습을 위한 가상 데이터를 생성하되, 상기 가상 데이터의 생성시 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 통해 결측 가상 데이터의 결측 패턴을 반영하여 최종 가상 데이터를 생성하고, 상기 날짜 조건 및 공간 조건을 기반으로 상기 최종 가상 데이터가 실제 데이터와 차이가 있는지 판별하는 가상 데이터 생성 네트워크; 및
제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 통해 상기 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하되, 생성된 상기 결측 가상 데이터의 결측 패턴이 상기 가상 데이터에 반영되도록 하고, 상기 날짜 조건 및 공간 조건을 기반으로, 상기 생성된 결측 가상 데이터의 결측 패턴이 실제 결측 데이터의 결측 패턴과 차이가 있는지 판별하는 결측 가상 데이터 생성 네트워크;를 포함하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치.
Generate virtual data for learning the avian influenza spread simulation prediction model in which date conditions and spatial conditions are reflected in the learned latent vector, but when generating the virtual data, a first generative adversarial network (GAN) ) To generate final virtual data by reflecting the missing pattern of the missing virtual data, and to determine whether the final virtual data is different from the actual data based on the date condition and the spatial condition; And
Through a second generative adversarial network (GAN), missing virtual data is generated by comparing the missing data with the actual missing data, and the missing pattern of the generated virtual data is reflected in the virtual data. To prevent the spread of avian influenza including; a missing virtual data generation network to determine whether the missing pattern of the generated missing virtual data is different from the missing pattern of the actual missing data, based on the date condition and the spatial condition. GAN-based virtual data generation device.
제 1 항에 있어서,
상기 가상 데이터 생성 네트워크는, 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건을 반영하여 딥컨볼루션 레이어(Deconvolution Layer)와 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(Fully Connected Layer)의 결합에 기반한 가상 데이터를 생성하여 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하는 가상 데이터 생성자(100); 및
결측 실제 데이터의 결측 패턴에 기반하여 생성된 결측 가상 데이터의 결측 패턴을 상기 가상 데이터에 반영하여 생성되는 최종 가상 데이터를 입력받아 상기 날짜 조건과 공간 조간을 기반으로 상기 최종 가상 데이터가 실제 데이터와 차이가 있는지 판별하여 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하는 가상 데이터 판별자(200);를 포함하는 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치.
The method of claim 1,
The virtual data generation network reflects the date condition and the spatial condition in the learned latent vector, so that the deconvolution layer and all the nodes of the previous layer are connected to all the nodes of the next layer. A virtual data generator 100 that generates virtual data based on the combination of layers) to form a first generative adversarial network (GAN); And
The final virtual data generated by reflecting the missing pattern of the missing virtual data generated based on the missing pattern of the missing real data is input to the virtual data, and the final virtual data is different from the actual data based on the date condition and the spatial interweave. A virtual data discriminator 200 configured to determine whether there is a first generative adversarial network (GAN); GAN-based virtual data generating apparatus for preventing the spread of avian influenza, characterized in that it comprises a.
제 2 항에 있어서,
상기 가상 데이터 생성자(100)는 생성되는 가상 데이터와 실제 데이터 사이에서 상기 가상 데이터가 탐지되는 것을 방지하도록 학습하는 가상 데이터 생성자 손실 함수를 포함하고,
상기 가상 데이터 생성자 손실 함수(
Figure 112020102576344-pat00033
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치.
Figure 112020102576344-pat00034

- 여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf)-C(xr)) 함수를 활성 함수로 사용하여 가상 데이터(xf)가 실제 데이터(xr)보다 더 실제일 확률임 -
The method of claim 2,
The virtual data generator 100 includes a virtual data generator loss function that learns to prevent the virtual data from being detected between the generated virtual data and real data,
The virtual data generator loss function (
Figure 112020102576344-pat00033
) Is a GAN-based virtual data generation device for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00034

-Here , E xr and xf are the sigmoid(C(x f )-C(x r )) functions with probability values between 0 and 1 as the active function, so that the virtual data (x f ) is the actual data (x r It is more likely to be real than)-
제 2 항에 있어서,
상기 가상 데이터 판별자(200)는 생성된 상기 최종 가상 데이터와 실제 데이터 사이에서 상기 최종 가상 데이터를 탐지하도록 학습하는 가상 데이터 판별자 손실 함수를 포함하고,
상기 가상 데이터 판별자 손실 함수(
Figure 112020102576344-pat00035
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치.
Figure 112020102576344-pat00036

- 여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr)-C(xf)) 함수를 활성 함수로 사용하여 가상 데이터(xf) 보다 주어진 실제 데이터(xr)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr, xf)는 실제 데이터(xr)가 가상 데이터(xf)보다 더 실제일 확률임 -
The method of claim 2,
The virtual data discriminator 200 includes a virtual data discriminator loss function that learns to detect the final virtual data between the generated final virtual data and real data,
The virtual data discriminator loss function (
Figure 112020102576344-pat00035
) Is a GAN-based virtual data generation device for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00036

-Here , E xr and xf are the actual data (x f ) given than the virtual data (x f) by using the sigmoid(C(x r )-C(x f )) function with a probability value between 0 and 1 as the active function. r ) is the probability that it is more real, λ is the hyperparameter of GP (Gradient Penalty), and D(x r , x f ) is the probability that the real data (x r ) is more real than the virtual data (x f)-
제 1 항에 있어서,
상기 결측 가상 데이터 생성 네트워크는 상기 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하고, 상기 생성된 결측 가상 데이터의 결측 패턴이 상기 가상 데이터에 반영되도록 하여 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하는 결측 가상 데이터 생성자(300); 및
날짜 조건 및 공간 조건을 기반으로, 상기 생성된 결측 가상 데이터의 결측 패턴이 실제 결측 데이터의 결측 패턴과 차이가 있는지 판별하여 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하는 결측 가상 데이터 판별자(400);를 포함하는 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치.
The method of claim 1,
The missing virtual data generation network generates missing virtual data by comparing whether or not the virtual data is missing with actual missing data, and causes the missing pattern of the generated missing virtual data to be reflected in the virtual data, thereby creating a second generative hostile neural network. (GAN, Generative Adversarial Network) constituting the missing virtual data generator (300); And
Missing virtual data constituting a second generative adversarial network (GAN) by determining whether the missing pattern of the generated missing virtual data is different from the missing pattern of the actual missing data based on date conditions and spatial conditions Discriminator 400; GAN-based virtual data generation device for preventing the spread of avian influenza, characterized in that it comprises.
제 5 항에 있어서,
상기 결측 가상 데이터 생성자(300)는 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴이 탐지되는 것을 방지하도록 학습하는 결측 가상 데이터 생성자 손실 함수를 포함하고,
상기 결측 가상 데이터 생성자 손실 함수(
Figure 112020102576344-pat00037
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치.
Figure 112020102576344-pat00038

- 여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 결측 가상 데이터(xf miss)가 결측 실제 데이터(xr miss)보다 더 실제일 확률임 -
The method of claim 5,
The missing virtual data generator 300 includes a missing virtual data generator loss function that learns to prevent a missing pattern of the missing virtual data from being detected between a missing pattern of the missing real data and a missing pattern of the generated missing virtual data. ,
The missing virtual data generator loss function (
Figure 112020102576344-pat00037
) Is a GAN-based virtual data generation device for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00038

-Here, E xr miss and xf miss are missing virtual data (x f miss ) using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as an active function. Is the probability that is more real than the missing real data (x r miss)-
제 5 항에 있어서,
상기 결측 가상 데이터 판별자(400)는 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴을 탐지하도록 학습하는 결측 가상 데이터 판별자 손실 함수를 포함하고,
결측 가상 데이터 판별자 손실 함수(
Figure 112020102576344-pat00039
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 장치.
Figure 112020102576344-pat00040

- 여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr miss)-C(xf miss)) 함수를 활성 함수로 사용하여 가상 데이터(xf miss) 보다 주어진 실제 데이터(xr miss)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr miss, xf miss)는 결측 실제 데이터(xr miss)가 결측 가상 데이터(xf miss)보다 더 실제일 확률임 -
The method of claim 5,
The missing virtual data discriminator 400 includes a missing virtual data discriminator loss function that learns to detect a missing pattern of the missing virtual data between a missing pattern of the missing real data and a missing pattern of the generated missing virtual data,
Missing virtual data discriminator loss function (
Figure 112020102576344-pat00039
) Is a GAN-based virtual data generation device for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00040

-Here, E xr miss and xf miss are more than virtual data (x f miss ) by using the sigmoid(C(x r miss )-C(x f miss )) function with a probability value between 0 and 1 as an active function. Given real data (x r miss ) is the probability that it is more real, λ is the hyperparameter of GP (Gradient Penalty), and D(x r miss , x f miss ) is the missing real data (x r miss ) is the missing virtual data. Probability is more real than (x f miss)-
a) 가상 데이터 생성자(100)와 가상 데이터 판별자(200)가 제1 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하여, 상기 가상 데이터 생성자(100)가 학습된 잠재변수(latent vector)에 날짜 조건 및 공간 조건을 반영하여 조류인플루엔자 확산 시뮬레이션 예측 모델의 학습을 위한 가상 데이터를 생성하되, 딥컨볼루션 레이어(Deconvolution Layer)와 이전 레이어의 모든 노드가 다음 레이어의 모든 노드에 연결된 레이어(Fully Connected Layer)의 결합에 기반한 가상 데이터를 생성하고, 상기 가상 데이터 판별자(200)가 상기 가상 데이터의 생성시 결측 가상 데이터 생성자(300)가 생성한 결측 가상 데이터의 결측 패턴을 반영하여 생성되는 최종 가상 데이터를 입력받아 상기 날짜 조건 및 공간 조건을 기반으로 상기 최종 가상 데이터와 실제 데이터 사이에 차이가 있는지 판별하는 단계; 및
b) 상기 결측 가상 데이터 생성자(300)와 결측 가상 데이터 판별자(400)가 제2 생성적 적대 신경망(GAN, Generative Adversarial Network)을 구성하여 상기 결측 가상 데이터 생성자(300)가 상기 가상 데이터에서 결측 여부를 결측 실제 데이터와 비교하여 결측 가상 데이터를 생성하고, 생성된 상기 결측 가상 데이터의 결측 패턴이 상기 가상 데이터에 반영되도록 하고, 상기 날짜 조건 및 장소 조건을 기반으로 결측 가상 데이터 판별자(400)가 상기 생성된 결측 가상 데이터의 결측 패턴과 실제 결측 데이터의 결측 패턴 사이에 차이가 있는지 판별하는 단계;를 포함하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법.
a) The virtual data generator 100 and the virtual data discriminator 200 form a first generative adversarial network (GAN), and the virtual data generator 100 is a learned latent vector. The date conditions and spatial conditions are reflected in the data to generate virtual data for training of the avian influenza spread simulation prediction model, but the deep convolution layer and all nodes of the previous layer are connected to all nodes of the next layer (Fully Connected Layer) generates virtual data based on the combination, and the virtual data discriminator 200 generates the final generated by reflecting the missing pattern of the missing virtual data generated by the missing virtual data generator 300 when the virtual data is generated. Receiving virtual data and determining whether there is a difference between the final virtual data and actual data based on the date condition and the space condition; And
b) The missing virtual data generator 300 and the missing virtual data discriminator 400 form a second generative adversarial network (GAN) so that the missing virtual data generator 300 is missing from the virtual data. The missing virtual data is generated by comparing whether or not the missing real data is missing, the missing pattern of the generated missing virtual data is reflected in the virtual data, and the missing virtual data discriminator 400 based on the date condition and the location condition Determining whether there is a difference between the missing pattern of the generated missing virtual data and the missing pattern of the actual missing data; GAN-based virtual data generation method for preventing the spread of avian influenza comprising.
제 8 항에 있어서,
상기 a) 단계의 가상 데이터 생성자(100)는 가상 데이터 생성자 손실 함수를 이용하여 생성되는 가상 데이터와 실제 데이터 사이에서 상기 가상 데이터가 탐지되는 것을 방지하도록 학습하고,
상기 가상 데이터 생성자 손실 함수(
Figure 112020102576344-pat00041
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법.
Figure 112020102576344-pat00042

- 여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf)-C(xr)) 함수를 활성 함수로 사용하여 가상 데이터(xf)가 실제 데이터(xr)보다 더 실제일 확률임 -
The method of claim 8,
The virtual data generator 100 of step a) learns to prevent the virtual data from being detected between the virtual data and real data generated using the virtual data generator loss function,
The virtual data generator loss function (
Figure 112020102576344-pat00041
) Is a GAN-based virtual data generation method for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00042

-Here , E xr and xf are the sigmoid(C(x f )-C(x r )) functions with probability values between 0 and 1 as the active function, so that the virtual data (x f ) is the actual data (x r It is more likely to be real than)-
제 8 항에 있어서,
상기 a) 단계의 가상 데이터 판별자(200)는 가상 데이터 판별자 손실 함수를 이용하여 생성된 최종 가상 데이터와 실제 데이터 사이에서 상기 최종 가상 데이터가 탐지되도록 학습하고,
상기 가상 데이터 판별자 손실 함수(
Figure 112020102576344-pat00043
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법.
Figure 112020102576344-pat00044

- 여기서, Exr,xf는 0~1 사이의 확률 값을 갖는 sigmoid(C(xr)-C(xf)) 함수를 활성 함수로 사용하여 가상 데이터(xf) 보다 주어진 실제 데이터(xr)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr, xf)는 실제 데이터(xr)가 가상 데이터(xf)보다 더 실제일 확률임 -
The method of claim 8,
The virtual data discriminator 200 of step a) learns to detect the final virtual data between the final virtual data and real data generated using the virtual data discriminator loss function,
The virtual data discriminator loss function (
Figure 112020102576344-pat00043
) Is a GAN-based virtual data generation method for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00044

-Here , E xr and xf are the actual data (x f ) given than the virtual data (x f) by using the sigmoid(C(x r )-C(x f )) function with a probability value between 0 and 1 as the active function. r ) is the probability that it is more real, λ is the hyperparameter of GP (Gradient Penalty), and D(x r , x f ) is the probability that the real data (x r ) is more real than the virtual data (x f)-
제 8 항에 있어서,
상기 b) 단계의 결측 가상 데이터 생성자(300)는 결측 가상 데이터 생성자 손실 함수를 이용하여 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴이 탐지되는 것을 방지하도록 학습하고,
상기 결측 가상 데이터 생성자 손실 함수(
Figure 112020102576344-pat00045
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법.
Figure 112020102576344-pat00046

- 여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 결측 가상 데이터(xf miss)가 결측 실제 데이터(xr miss)보다 더 실제일 확률임 -
The method of claim 8,
The missing virtual data generator 300 of step b) detects the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data by using the missing virtual data generator loss function. Learn to prevent,
The missing virtual data generator loss function (
Figure 112020102576344-pat00045
) Is a GAN-based virtual data generation method for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00046

-Here, E xr miss and xf miss are missing virtual data (x f miss ) using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as an active function. Is the probability that is more real than the missing real data (x r miss)-
제 8 항에 있어서,
상기 b) 단계의 결측 가상 데이터 판별자(400)는 결측 가상 데이터 판별자 손실 함수를 이용하여 결측 실제 데이터의 결측 패턴과 생성된 결측 가상 데이터의 결측 패턴 사이에서 상기 결측 가상 데이터의 결측 패턴을 탐지하도록 학습하고,
결측 가상 데이터 판별자 손실 함수(
Figure 112020102576344-pat00047
)는 하기식으로 구성된 것을 특징으로 하는 조류인플루엔자 확산 방지를 위한 GAN 기반 가상 데이터 생성 방법.
Figure 112020102576344-pat00048

- 여기서, Exr miss,xf miss는 0~1 사이의 확률 값을 갖는 sigmoid(C(xf miss)-C(xr miss)) 함수를 활성 함수로 사용하여 가상 데이터(xf miss) 보다 주어진 실제 데이터(xr miss)가 더 실제일 확률이고, λ는 GP(Gradient Penalty)의 하이퍼 파라미터이며, D(xr miss, xf miss)는 결측 실제 데이터(xr miss)가 결측 가상 데이터(xf miss)보다 더 실제일 확률임 -
The method of claim 8,
The missing virtual data discriminator 400 of step b) detects the missing pattern of the missing virtual data between the missing pattern of the missing real data and the missing pattern of the generated missing virtual data using the missing virtual data discriminator loss function. Learn to do,
Missing virtual data discriminator loss function (
Figure 112020102576344-pat00047
) Is a GAN-based virtual data generation method for preventing the spread of avian influenza, characterized in that consisting of the following formula.
Figure 112020102576344-pat00048

-Here, E xr miss and xf miss are more than virtual data (x f miss ) by using the sigmoid(C(x f miss )-C(x r miss )) function with a probability value between 0 and 1 as an active function. Given real data (x r miss ) is the probability that it is more real, λ is the hyperparameter of GP (Gradient Penalty), and D(x r miss , x f miss ) is the missing real data (x r miss ) is the missing virtual data. Probability is more real than (x f miss)-
KR1020200125028A 2020-09-25 2020-09-25 Method and apparatus for generating gan-based virtual data to prevent the spread of avian influenza KR102230538B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020200125028A KR102230538B1 (en) 2020-09-25 2020-09-25 Method and apparatus for generating gan-based virtual data to prevent the spread of avian influenza

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020200125028A KR102230538B1 (en) 2020-09-25 2020-09-25 Method and apparatus for generating gan-based virtual data to prevent the spread of avian influenza

Publications (1)

Publication Number Publication Date
KR102230538B1 true KR102230538B1 (en) 2021-03-22

Family

ID=75222832

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020200125028A KR102230538B1 (en) 2020-09-25 2020-09-25 Method and apparatus for generating gan-based virtual data to prevent the spread of avian influenza

Country Status (1)

Country Link
KR (1) KR102230538B1 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180000625A (en) * 2016-06-23 2018-01-03 주식회사 케이티 Apparatus for predicting diffusion of epidemic animal disease and method thereof
WO2019166332A1 (en) * 2018-02-27 2019-09-06 Koninklijke Philips N.V. Ultrasound system with a neural network for producing images from undersampled ultrasound data
KR20190117969A (en) 2018-04-09 2019-10-17 주식회사 뷰노 Method for semi supervised reinforcement learning using data with label and data without label together and apparatus using the same

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180000625A (en) * 2016-06-23 2018-01-03 주식회사 케이티 Apparatus for predicting diffusion of epidemic animal disease and method thereof
WO2019166332A1 (en) * 2018-02-27 2019-09-06 Koninklijke Philips N.V. Ultrasound system with a neural network for producing images from undersampled ultrasound data
KR20190117969A (en) 2018-04-09 2019-10-17 주식회사 뷰노 Method for semi supervised reinforcement learning using data with label and data without label together and apparatus using the same

Similar Documents

Publication Publication Date Title
Li et al. A comparative study on the prediction of the BP artificial neural network model and the ARIMA model in the incidence of AIDS
Aumann A methodology for developing simulation models of complex systems
Kounelis et al. Building trust in the human? internet of things relationship
CN110839031B (en) Malicious user behavior intelligent detection system based on reinforcement learning
AU2020102874A4 (en) A recommendation model for aero dynamic design of structures using deep recurrent neural network
CN110197282A (en) A kind of threat estimating and method for situation assessment based on Genetic-fuzzy logic tree
KR20190078899A (en) Visual Question Answering Apparatus Using Hierarchical Visual Feature and Method Thereof
CN110493043A (en) A kind of distribution Situation Awareness call method and device
Wallstrom Quantification of margins and uncertainties: A probabilistic framework
KR102230538B1 (en) Method and apparatus for generating gan-based virtual data to prevent the spread of avian influenza
Wakaki Assumption-based argumentation equipped with preferences
Herzig et al. Bayesian Reasoning Over Models.
Barnett et al. Using causal models to manage the cyber threat to C2 agility: Working with the benefit of hindsight
Darrah et al. A decision support tool to guide the use of nest exclosures for Piping Plover conservation
Eide et al. Predator-prey-subsidy population dynamics on stepping-stone domains with dispersal delays
Chen et al. Identifying multi-level emergent behaviors in agent-directed simulations using complex event type specifications
Costa et al. Multi-entity bayesian networks without multi-tears
Sadoun et al. Formal rule representation and verification from natural language requirements using an ontology
Ceolin et al. Calculating the Trust of Event Descriptions using Provenance.
Ullberg et al. Propagating temporal constraints on sets of intervals
Basu et al. Symbolic Reinforcement Learning Framework with Incremental Learning of Rule-based Policy.
Laskey et al. Uncertainty representation and reasoning in complex systems
CN117216722B (en) Sensor time sequence data-based multi-source heterogeneous data fusion system
Braga et al. Lightweight analysis of access control models with description logic
Matheus et al. A demonstration of formal policy reasoning using an extended version of basevisor

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant