KR100866909B1 - 토양환경 생태등급 예측방법 - Google Patents

토양환경 생태등급 예측방법 Download PDF

Info

Publication number
KR100866909B1
KR100866909B1 KR1020080032911A KR20080032911A KR100866909B1 KR 100866909 B1 KR100866909 B1 KR 100866909B1 KR 1020080032911 A KR1020080032911 A KR 1020080032911A KR 20080032911 A KR20080032911 A KR 20080032911A KR 100866909 B1 KR100866909 B1 KR 100866909B1
Authority
KR
South Korea
Prior art keywords
soil
grade
ecological
model
ecology
Prior art date
Application number
KR1020080032911A
Other languages
English (en)
Inventor
박준홍
기동원
이재진
박태권
김흥래
Original Assignee
연세대학교 산학협력단
(주)평화엔지니어링
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 연세대학교 산학협력단, (주)평화엔지니어링 filed Critical 연세대학교 산학협력단
Application granted granted Critical
Publication of KR100866909B1 publication Critical patent/KR100866909B1/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/02Agriculture; Fishing; Forestry; Mining

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Tourism & Hospitality (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Pure & Applied Mathematics (AREA)
  • Strategic Management (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Computational Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Mining & Mineral Resources (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Animal Husbandry (AREA)
  • General Engineering & Computer Science (AREA)
  • Marine Sciences & Fisheries (AREA)
  • Software Systems (AREA)
  • Agronomy & Crop Science (AREA)
  • Databases & Information Systems (AREA)
  • Algebra (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Development Economics (AREA)
  • Educational Administration (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

본 발명은 인공지능형 통계기법 중의 하나인 의사결정나무 방법을 이용하여 토양 생태질을 정량적으로 산정하고 지형공간정보와 연계하여 지도화하는, 토양환경 생태등급 수치지도 작성방법에 관한 것이다.
상기한 목적을 달성하기 위한 본 발명에 따른 토양환경 생태등급 예측 방법은, 대상지역을 선정하여 토양 생태의 질을 토양미생물 종 다양성으로 수치화/등급화하는 제1 단계와; 상기 자연생태정보 및 토양특성 정보를 독립변수로 하고 상기 SMD를 종속변수로 하여 AI 모델을 통한 데이터 마이닝을 수행하는 단계와, 적합한 변수 및 정확도를 가진 최적모델을 이용하여 미지의 지역에 해당하는 변수들을 이용하여 SMD를 예측하는 단계를 포함한다.
토양환경, 생태등급, 토양질, 인공지능, 토양생태 수치지도, 환경정보

Description

토양환경 생태등급 예측방법{Method for Estimating Soil Ecological Quality from Existing Soil Environmental Data}
본 발명은 토양미생물 종 다양성 정도를 토양생태질의 정량적 지표로 고려하여 테스트 지역에 대해 실험적으로 측정하고, 기존의 생태환경 관련 데이터베이스(DB)를 이용해서 토양생태수치지도 작성을 위한 트레이닝 세트(training set) 자료를 획득하여, 국가정보시스템에서 제공하는 자연생태 자료, 토양특성 자료와 테스트 지역에서 획득된 측정자료들을 가지고 인공지능(Artificial Intelligence: AI)에 기반을 둔 모델에 학습을 시킨 후에 이를 이용해서 미지의 토양생태등급을 산정하는 토양환경 생태등급 예측 방법에 관한 것이다.
나아가, 본 발명은 이와 같은 토양환경 생태등급 예측방법에 의해 계산된 결과값을 지형공간정보와 연계하여 지도화하는, 토양환경 생태등급 수치지도 작성방법에 관한 것이다.
토양질(Soil Quality)에 대한 관심은 농업적인 측면에서 오래전부터 계속되 어 왔으나, 국내에서 동식물생태(정흥락 등, 2006; 노태호 등, 2007), 하천생태(조용현 등, 2001 ; 배연제 등, 2003) 및 습지생태(강수진, 2004)의 경우 생태가치에 대한 총체적 평가 기법 연구와 등급화 연구 등이 수행된 바 있지만, 토양생태의 경우 환경영향평가에서조차 고려되고 있지 않으며, 생태의 질에 대한 기초자료의 구축도 미흡한 상황이다.
토양생명체의 대부분을 차지하고 있는 토양미생물은 분해자이자 생명체에 필요한 탄소 및 질소 순환의 원동력으로서 중요한 역할을 하며, 오염된 환경생태를 복원하는 등의 순기능을 보유하고 있다. 이러한 과학적 이유로 UN(United Nations) 산하의 FAO(Food and Agriculture Organization, 2003a, 2003b), OECD(Organization for Economic Cooperation and Development, 2004)에 따르면 토양생태다양성의 지속가능성에 대한 개념을 강조하고 있다. 양질의 토양생태는 중요한 생태자원이므로 대형건설사업의 구상 및 계획 단계에서 토양환경생태에 미치는 영향에 대한 체계적인 평가가 요구된다. 이를 위해서 토양생태질에 대한 정량적 지표화(등급화)가 필요하며, 이 정보를 지형공간정보와 연계한 수치지도가 필요하다. 이러한 중요성과 필요성에도 불구하고, 토양생태질의 정보를 정량화하여 등급화하려는 시도가 매우 제한적인 것이 국내외 현황이다(Rombke 등, 2005).
현재 각 나라별로 토양질을 가장 잘 반영할 수 있는 토양질 지표(indicator)들을 정하여 최소자료군(Minimum Data Set, MDS)을 구축하고, 이 자료를 통합하여 점수화/등급화를 하는 시도를 통해 토양질 평가를 하고 있다.
이에 대한 대표적인 모델로서는 뉴질랜드의 SINDY(Soil Indicators)라는 웹 기반(web-based) 프로그램(http://sindi.landcare.cri.nz/ 참조)이 있다. 이 프로그램은 각 개인이 원하는 토양특성지표자료를 입력하여 토양질을 비옥도, 산도, 유기물원, 물리성 지표에 대하여 평가할 수 있는 시스템이다. 그러나, 이러한 시스템은 특정 토양에 대한 지표 정보에 근거하여 각 항목의 토양질을 평가할 수 있으며, 전국적 영역에 대한 토양질 정보를 제공할 수 없다는 데에 한계가 있다.
또한, 토양생태의 질을 평가하기 위하여, 기존 문헌에서는 토양 내 생명체들의 다양성과 개체군 수를 지표로 제안하고 있다.
토양 생태계의 대부분은 토양 미생물이며, 이 토양 미생물들은 분해자이자 생명체에 필요한 탄소 및 질소 순환의 원동력으로서 중요한 역할을 하고, 오염된 환경생태를 복원하는 순기능을 보유하고 있기 때문에 양질의 토양생태는 자원으로 판단될 수 있을 것이다.
하지만, 자연생태에 관하여 환경부의 각종 자연환경정보를 수치지도로 작성한 생태자연도는 주로 동식물 생태 중심으로 평가되어 있고, 환경영향평가시 고려되고 있지만, 토양생태의 경우 이에 대한 기초자료도 부족할 뿐만 아니라 토양생태의 질을 산정하는 평가방법, 정량화/등급화 방법도 미흡하다. 다시 말해서, 생태 가치에 대한 기초자료 즉, 토양생태질에 대해 정량화/등급화한 수치지도 정보체계가 미흡하다는 것에 문제점이 있다.
한편, 토양생태의 질에 대해서 분자생물학적 방법을 이용하여 토양 내 생명체들의 다양성 즉, 토양미생물 종 다양성 정도를 정량적으로 측정할 수 있지만, 환경부의 생태자연도나 농업토양정보시스템에서 제공되는 토양특성 자료들처럼 전국 적 영역에 대한 지형정보가 접목된 수치지도를 작성하기 위해서 토양생태질을 측정하기에는 높은 비용에 대한 문제점이 있다.
본 발명은 상기한 문제점들을 해결하기 위하여 안출된 것으로, 대상지역을 선정하여 토양 생태의 질을 토양미생물 종 다양성으로 수치화/등급화하는 방법에 그 목적이 있다.
또한 본 발명은, 기존의 자연생태 및 토양 특성 지표를 이용하여 토양생태와의 관계를 도출하여, 전국적 영역으로 토양 생태의 질을 수치화/등급화한 후에, 이를 이용하여 토양생태수치지도 작성할 수 있는 효과적인 방법을 제안하는 데에 그 목적이 있다.
본 발명의 다른 목적 및 장점들은 하기에 설명될 것이며, 본 발명의 실시예에 의해 알게 될 것이다. 또한, 본 발명의 목적 및 장점들은 청구범위에 나타낸 수단 및 조합에 의해 실현될 수 있다.
상기한 목적을 달성하기 위한 본 발명에 따른 토양환경 생태등급 예측 방법은, 선정된 대상지역에서 채취된 토양시료에 대해 토양 생태의 질을 토양미생물 종 다양성으로 수치화/등급화하는 제1 단계와; 기존의 자연생태 및 토양 특성 지표를 이용하여 토양생태와의 관계를 도출하는 제2 단계를 포함하는 것을 특징으로 한다.
상기 제1 단계는, 토양미생물 종 다양성을 측정하기 위한 대상지역에 대한 시료채취지점을 선정하는 단계와, 선정된 시료채취 대상지점에서 샘플링 채취된 토양 시료에 대해 분자생물학적 실험인 T-RFLP 방법을 이용하여 토양 미생물 종 다양성 정도(SMD)를 측정하는 단계와, 상기 SMD와 자연생태정보 및 토양특성 정보를 수치화하여 토양생태 DB를 작성하는 단계를 더 포함한다.
상기 제2 단계는, 상기 자연생태정보 및 토양특성 정보를 독립변수로 하고 상기 SMD를 종속변수로 하여 AI 모델을 통한 데이터 마이닝을 수행하는 단계와, 적합한 변수 및 정확도를 가진 최적모델을 이용하여 미지의 지역에 해당하는 변수들을 이용하여 SMD를 예측하는 단계를 더 포함한다.
또한, 토양생태질에 대해 전국적으로 분자생물학적 실험을 하는 것은 불가능하므로, 본 발명에서는 전국규모로 획득이 가능한 토양 및 자연생태 관련 기존 자료들로부터 토양미생물 종 다양성을 도출하는 방법을 제안하고 있다.
나아가, 본 발명은 토양생태질의 정량적 지표로서 토양미생물 종 다양성을 실험적으로 측정하고, 기존의 자연생태와 토양특성 간의 상관관계를 도출하여 전국적 영역의 토양생태 수치지도를 만들기 위한 알고리즘 개발을 특징으로 한다.
실시예에서, 상기 대상지역에 대한 샘플링은 기존의 전국적 영역의 GIS 기반 자료를 바탕으로 수행하며, 상기 AI 모델은 Decision Tree 모델, Support Vector Machine 모델, 및 Atificial Neural Network 모델 중 어느 하나가 이용될 수 있으며, 본 발명의 바람직한 실시예로서는 의사결정나무(Decision Tree)모델이 적용되었다.
본 발명을 통하여 개발되는 토양환경생태등급 예측 모델을 통하여 전국적 토양환경생태 예측 및 토양생태수치지도를 작성할 수 있고, 이 토양생태수치지도는 지속가능하고 친환경적 국토개발사업의 설계 및 평가, 환경영향평가, 사전 환경성평가 등에 자료로 활용될 수 있고, 생태가치평가에 대한 논의가 좀 더 객관적인 토대 위에서 진행될 수 있는 장점이 있다.
또한, 토양환경생태등급 예측 모델은 환경의 복합적 정보를 융합하는 환경정보기술에 파급효과가 있다. 환경정보기술은 복잡한 환경 및 생물생태인자들의 종합적이며 신속한 분석을 요구하는 과학, 농업 및 임업 관련분야에서 유용이 사용될 수 있다는 장점이 있다.
더욱이, 토양생태수치지도의 토양생태등급화를 통한 계량적인 접근을 통해 보다 체계적이고 공정한 평가가 가능하게 될 것이며, 정성적일 수 있는 토양 생태질에 대한 가치평가 문제를 생태가치 정보기술을 통해서 체계적이며 포괄적인 접근이 가능할 것이다.
이하 첨부된 도면을 참조로 본 발명의 바람직한 실시예를 상세히 설명하기로 한다. 이에 앞서, 본 명세서 및 청구범위에 사용된 용어나 단어는 통상적이거나 사전적인 의미로 한정해서 해석되어서는 아니되며, 발명자는 그 자신의 발명을 가장 최선의 방법으로 설명하기 위해 용어의 개념을 적절하게 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야만 한다.
따라서, 본 명세서에 기재된 실시예와 도면에 도시된 구성은 본 발명의 가장 바람직한 일실시예에 불과할 뿐이고 본 발명의 기술적 사상을 모두 대변하는 것은 아니므로, 본 출원시점에 있어서 이들을 대체할 수 있는 다양한 균등물과 변형예들이 있을 수 있음을 이해하여야 한다.
본 발명은 상기한 목적 달성을 위해, 첫째로 토양생태질의 정량적 지표화 및 현장측정방법을 제안하고, 두 번째로 토양환경자료기반을 이용하여 토양생태 등급 수치지도 작성방법을 제안한다.
도 1은 본 발명의 일실시예에 따른 토양환경 생태등급 예측 방법을 설명하는 순서도이다.
본 발명에 의한 토양환경 생태등급 예측방법은,
토양미생물 종 다양성을 측정하기 위한 대상지역의 시료채취 위치(sampling point)를 선정하여, 대상지역에 대한 시료 샘플링을 실시하는 단계와,
채취된 시료에 대하여 분자생물학적 실험인 T-RFLP 방법을 이용하여 토양 미생물 종 다양성 정도(SMD)를 측정하는 측정단계와,
상기 SMD와, 농촌진흥청이 운영하는 농업토양정보시스템에서 제공되는 토양 특성 정보를 수치화하여 토양생태 DB를 구축하는 DB구축단계와,
상기 토양생태 DB에 구축된 정보들을 기반으로, 입력변수와 목표변수의 상관 관계를 인공지능(Artificial Intelligence: AI) 분석모델에 학습시키는 분석모델 준비단계와,
미측지역의 토양정보를 입력변수로 하여, 상기 학습된 인공지능 분석모델을 이용하여 토양생태 등급을 산정하는 등급산출단계로 이루어지는 토양환경 생태등급 예측 방법을 특징으로 한다.
도 1을 참조하면, 먼저 토양미생물생태를 평가하기 위하여 토양미생물 종 다양성을 측정하기 위한 대상지역에 대한 시료채취지점 또는 샘플링 포인트(Sampling Point)를 선정하는 작업이 필요하다.
기존의 전국적 영역의 지형정보인 생태자연도 등급자료, 농업토양정보시스템의 자료검색을 통하여 가능한 토양 지표 변수의 속성이 다양하고 고르게 선택될 수 있는 지점들을 시료채취지점으로 선정한다. 대상 표본 지점은 실험의 한계를 고려하여 50∼100개 지점의 데이터가 적당하다.
1. 토양 시료의 채취
토양 시료의 채취지점 선정에 있어서, 가장 고려되어야 할 사항은 토양시료채취의 대표성을 확보할 수 있는 지점 선정이 중요하다.
이를 위하여, 토양 시료의 채취지점 선정은 생태자연도 속성자료인 생태등급도 등급, 식생우수성 등급, 생물다양성 등급과, 농업토양정보시스템의 토양 속성자료를 고려하여 층화 무작위 추출법(Stratified random sampling)을 이용하여 시료채취하는 것이 바람직하다.
예를 들어, 후술하게 될 본 발명의 실험예에서는 도심지나 농업지대(논,밭)이 아닌 산간(산림)지역을 대상으로 시료를 채취하였다. 우리나라 산간지역은 생태 자연도 안의 속성자료인 생태등급도, 식생우수성, 생물다양성의 등급조합이 15개 존재하는데 1차 시료 채취한 50개의 토양시료의 경우 대상지역 안에 12개가 존재한다. 그 등급 조합의 분포율은 전국규모의 등급조합 분포의 99.9%를 차지하고 있으 므로, 토양시료채취의 대표성이 인정될 수 있을 것이다.
2. 토양 생태질 지표선정 및 등급화 방법
먼저, 토양 생태질을 정량적으로 지표화하기 위한 과정에 대하여 설명한다.
토양의 물리적, 화학적 특징을 이용하여 적성등급을 구분하는 연구가 국내외에서 이루어지기는 하였지만(Doran, 1999; 송관철, 2003), 토양생태의 질에 대한 정량적이고 등급화된 정보는 존재하고 있지 않다.
본 발명에서는 문헌조사를 통해 토양생태질의 정량화를 위한 지표를 선정하고, 토양 생태질을 현장에서 실제 측정한 결과값에 근거하여 등급화하는 방법에 대한 구체적인 방법을 제시한다.
토양생태의 질을 평가하기 위한 방법으로 기존의 문헌에서는 토양 내 생명체들의 다양성과 개체군 수를 지표로 제안한 바 있다(Rombke 등, 2005; Stenberg, 1999; Nielson 등, 2002). 토양생태계 내의 생명체들 중 곰팡이와 박테리아를 포함하는 토양미생물은 약 75%를 차지하고 있기 때문에, 토양생태질의 지표로서 충분한 의미를 가지며, 나아가 분자생물학적 방법을 통해 토양 미생물의 종 다양성에 대한 정량적 분석이 가능하므로, 본 발명에서 토양 미생물의 종 다양성을 토양 생태질 평가지표 중의 하나로서 선정한다.
그러나, 토양 미생물의 종(種) 다양성 지수(index)의 결정 조건이 생물과 환경에 따라 모두 다르기 때문에 도출하고자 하는 상황을 고려하여 적절한 지수를 사용해야 한다. 본 발명에 있어서는 토양 미생물의 종(種) 다양성을 지수(index)로 산출하는 방법으로서, 시료 내 종의 수와 분포 균등 정도를 동시에 반영하기 위해 다음과 같은 수학식1을 적용하였다.
[수학식 1]
Figure 112008072283138-pat00027
여기서,
n은 종의 수,
i는 종의 개체수,
pi는 모든 생명체에 대해, i번째 종에 속하는 비율
상기 수학식1에 제시된 Shannon Index 외에도, Species Richness (S), 샘플 내에서 무작위로 각 종을 추출하였을 때 종의 분포를 나타내는 척도인 Simpson Index (D), 개체분포의 균등 정도를 나타내는 Evenness 등의 방식들이 알려져 있으나, Species Richness는 개체의 분포에 대한 정보가 없이 시료 내 개체 수에 대한 정보만을 제공하고, Evenness는 시료 내 개체의 수에 대한 정보 없이 개체 분포의 균등 정도에 대한 정보만을 제공하는 한계가 있기 때문이다.
그리고, 지금까지 토양 미생물 군집 내에서 종 다양성에 대한 정량적 분석방법은 토양 미생물 DNA시료에서 16S rRNA(박테리아)나 18S rRNA(곰팡이) 유전자 정보 분석을 통해 이루어져 왔다. 이러한 분자생물학적 접근방법은 환경 DNA시료에서 16S rRNA(박테리아)나 18S rRNA(곰팡이) 유전자 정보를 PCR(polymerase chain reaction)로 증폭하고 이렇게 증폭된 혼합된 유전자 정보를 cloning 방법을 통해서 분리한 후 각기 분리된 clone내 염기서열분석을 통해서 미생물 종을 결정하는 방법 이다. 이 방법은 구체적으로 어떠한 종이 얼마나 존재하는 지에 대한 다양성과 수에 대한 정보를 동시에 제공하므로 매우 유용하지만, 많은 비용이 소요되는 단점이 있다. 특히, 많은 환경시료를 분석해야 하는 경우에 이러한 분자생물학적 접근방법은 큰 부담이 될 수밖에 없다.
다양성에 대한 비교지표만을 획득하는 것이 목적일 경우에는 T-RFLP(terminal restriction fragment length polymorphism) 방법이 경제적이다(Winding 등, 2005). T-RFLP은 환경 DNA시료에서 16S rRNA(박테리아)나 18S rRNA(곰팡이) 유전자 정보를 PCR(polymerase chain reaction)로 증폭하여 확보한 후 restriction enzyme digestion을 통해서 해당 미생물군집의 fingerprint를 획득하는 방법이다(Marsh 등, 2000; http://rdp8.cme.msu.edu/html/t-rflp_jul02.html; 그림 3.2). 도 2은 토양 미생물의 종 다양성 측정방법 중의 하나인 T-RFLP방법 설명도이다.
T-RFLP는 환경시료로부터 PCR을 통해 증폭된 미생물 DNA 염기서열의 차이를 빠르게 비교할 수 있으며 많은 양의 시료를 한번에 분석할 수 있는 장점이 있다(Dunbar 등, 2001). 하지만 종에 대한 정확한 정보를 알 수 없고, 종 다양성 분석 시 해상도(resolution)가 다소 떨어지는 단점이 있다.
본 발명에서는 대상으로 하는 토양의 생태질 등급화를 위해 필요한 정확/정밀도를 획득하면서도 충분한 수의 자료를 얻기 위하여, T-RFLP 방법을 통해 다수의 토양시료 내 종 다양성 정도를 결정한 후에, 제한된 수의 cloning과 염기서열분석을 통하여 T-RFLP에 의한 결과들의 정확도를 보완하는 절충방안이 적용되었다.
즉, 본 발명에서는, 제한된 수의 토양시료에서 T-RFLP으로 결정된 종 다양성 정도와 cloning-염기서열 방식으로 결정된 종 다양성 정도 간의 상관관계를 도출해서 T-RFLP을 측정된 결과를 보정하는 방법을 제안한다. 이 방법에 의해 환경시료로부터 PCR을 통해 증폭된 미생물 DNA 염기서열의 차이를 빠르게 비교할 수 있으며 많은 양의 시료를 한번에 분석할 수 있는 장점을 취할 수 있을 뿐만 아니라, 종 다양성에 대한 정보의 정확성을 제고하고 종 다양성 분석의 정밀도늘 충분히 높일 수 있다.
상기의 과정에 의해서 도출된 Shannon Index값을 토대로 하여, 토양 생태질 즉, 종 다양성을 등급화함에 있어서, ⅰ) 미생물 종 다양성 지수를 절대값으로 나누는 방법, ⅱ) 미생물 종 다양성 분포가 정규분포이어서 평균으로부터 일정구간을 정하여 나누는 방법, ⅲ) 전체 시료 수에 대한 미생물 종 다양성 분포를 백분율(percentile)로 표시하는 방법의 세 가지 방법이 있을 수 있다.
본 발명에서는 상기 세 방법 중에서 어떤 방법이 가장 바람직한 토양 생태질 등급화 방법인지를 확인하기 위하여, 아래와 같은 구체적인 실험 실시예를 통하여 가장 바람직한 토양 생태질 등급화 방법을 도출하였다.
< 실험 예 >
A. 시료채취
- 경기도 및 강원도 일부 지역에서 도심지역이 아닌 산간지역을 중심으로 하여, 총 250여개의 시료를 채취하였다.
- 1차 시료채취는 늦가을인 11월에, 2차 시료채취는 봄인 5월에 각각 채취하 였으며, 시료채취지역을 도 3에 도시하였다.
- 시료채취 방법 및 보관에 관한 방법은 국제표준화기구방법(International Organization for Standardization [ISO], 1994)을 적용하여, 시료 채취 시에는 지표에서 15cm 정도의 토양을 걷어내고, 15∼20cm이하의 표토층을 모삽, 원형 추출기를 이용하여 지점 당 한 개의 시료를 채취하였다.
B. 채취 시료의 보관
- 채취한 토양 시료는 현장에서 50ml Falcon tube(미생물분석)과 plastic bag(토양분석)에 각각 나누어 담았으며, 실험실 안에서 냉장 보관 (4℃) 하였다.
- 또한, 토양시료 보존 기간은 국제표준화기구방법(ISO)에서 제시한 기간에 준하여 2개월 안에 미생물분석과 토양분석을 위한 실험을 모두 실행하였다.
C. 토양 미생물 다양성 측정
본 발명의 실험예에서는 앞서 설명한 바와 같이, 토양미생물 종 다양성 정보를 토양생태질의 정량적 지표로 고려하였으며, 토양미생물 종 다양성을 측정하기 위해서 다음과 같은 분자생물학적 방법을 사용하였다.
- 채취한 토양 시료에 있는 DNA를 UltraCleanTM Soil Isolation kit(MO BIO Laboratories, Inc., USA) 를 이용하여 제공된 protocol에 따라 시행하여 추출하였고, 그 후 DNA를 -20℃에서 보관하였다.
- 추출한 genomic DNA로부터 16S rDNA 유전자 증폭을 위하여 bacterial universal primers 27f-FAM [flourescence labeled] (AGAGT TTGAT CATGG CTCAG)와 1492r (TACGG TTACC TTGTTA CGACTT)이 사용되었다. PCR (Polymerase Chain Reaction) 증폭을 위해, 10μM의 27f-FAM과 1492r primer용액 0.5㎕, DNA polymerase로는 5U/㎕ Taq polymerase(Fermentas, Germany)를 0.25㎕, template DNA 20ng에 증류수를 포함하여 최종부피 25μl로 맞추어 실험하였다. PCR을 통한 증폭은 MJ Mini Thermal Cycler (BIO-RAD, USA)를 이용하였고, 조건은 처음 94℃에서 3분, 다음은 30 cycle 동안 94℃에서 1분, 55℃에서 30초, 그리고 72℃에서 2분 동안 수행하였고, 마지막 단계에서는 5분 동안 반응시켰다. 증폭한 16S rDNA 유전자를 QIAquick PCR Purification Kit(Qiagen Inc.)를 이용하여 정제한 후, 정제한 DNA를 TangoTM buffer, 증류수, 10U의 제한효소 HhaI (Fermentas, Germany)를 포함하여 최종부피 20㎕로 맞추어 37℃에서 18시간 가량 반응시켰다.
- 제한효소로 처리된 DNA를 ethanol precipitation(desalting) 과정을 거친 후 T-RFLP 분석을 위해 서울대학교 농업과학공동기기센터 (NICEM)에서 단편분석을 하였다(96-capillary 3730xl DNA Analyzer, ABI). 결과로 얻은 electropherogram은 GeneMapper® Software v4.0(ABI)를 사용하였으며, 이것은 다양한 peak height로 나열된 미생물 군집에 해당하는 profile이다. Electropherogram의 peak height 단위가 50 이상인 peak들만 고려하여, 미생물 종 다양성 지수인 Shannon index (H) 값을 수학식1을 통하여 계산하였다.
- 도 4은 본 발명의 실험에서 토양시료로부터 T-RFLP 분석결과 Profile을 도시한 것이다.
D. 미생물 종 다양성 분포 비교
- 토양의 채취시기별로 토양 미생물 종 다양성의 분포를 비교하였다. 11월경 에 채취된 1차 시료(시료 수 50개)와, 5월경에 채취된 2차 시료(시료 수 146개)에 대한 분석결과, 봄에 시료 채취한 토양미생물 종 다양성이 전체적으로 높게 나옴을 알 수 있다. 도 5는 시료채취 시기별 미생물 종 다양성 분포의 비교 결과를 도시한 그래프이다. y축은 전체 시료에 대한 각 구간의 시료 수의 빈도를 나타낸다.
- 채취한 토양이 속한 생태지역(산림지역)과 타 생태지역(갯벌지역)의 토양 미생물 종 다양성 분포를 비교하였다. 도 6는 생태 지역별 미생물 종 다양성 분포의 비교 결과를 도시한 그래프이다. 비교실험을 위해 갯벌지역의 토양시료 54개를 채취하여 동일한 실험과정을 거쳤다.
상기에서 실험한 결과에서 알 수 있듯이, 특정 지역 토양에서의 미생물 종 다양성은 시기에 따라 아주 다르게 측정되기 때문에, 미생물 종 다양성 지수를 절대값으로 나누어 토양 생태질을 등급화하는 것이 불가능함을 확인할 수 있을 뿐만 아니라, 미생물 종 다양성 분포가 정규분포를 전혀 따르지 않기 때문에 평균으로부터 일정구간을 정하여 등급화하는 방법도 적용할 수 없음을 확인할 수 있었다.
결론적으로, 전체 시료 수에 대한, 특정 지역의 미생물 종 다양성 분포를 백분율 (percentile)로 표시하는 방법에 의해서 해당 지역의 토양 생태질을 등급화하는 것이 가장 타당한 방법이라 할 것이다.
3. 미측 지역의 토양생태 등급정보 산출
국토의 효율적 활용을 위해, 전 국토의 모든 각 지역에 대해 토양미생물 종 다양성을 분자생물학적 방법을 이용하여 토양 생태질을 모니터링하고 일정 기간마다 토양생태 질 자료를 갱신할 수 있다면 가장 훌륭한 접근방식이 될 것이나, 토양 미생물 모니터링의 중요성이 국가 정책에 반영되어 있지 않은 현실정에서는 토양미생물 종 다양성을 전 국토를 대상으로 모니터링하는 것은 비용과 구축기간 등의 측면에서 현실적으로 어려운 상황이다.
이의 극복을 위한 대안으로서 대상지역에서 측정된 토양미생물 종 다양성 자료와 토양환경속성자료 간의 통계적 상관관계 또는 패턴을 인식할 수 있도록 통계 알고리즘을 학습하고, 이렇게 학습된 알고리즘을 이용해서 미측된 토양미생물 종 다양성을 예측하는 방식으로 대상지역의 토양미생물 종 다양성 속성자료를 획득할 수 있다. 더불어 이렇게 획득된 토양생태 질의 등급정보를 지형정보와 연계해서 지도화하는 것이 가능하다.
국내에 존재하는 토양환경속성 정보 DB에는 농업토양정보시스템이 있으며, 토양특성자료들은 정성적인 자료와 정량적인 자료가 동시에 포함되어 있고, 그 속성자료의 범위도 매우 다중적이다. 이러한 다중 변수들과 목표변수 값인 토양생태질 등급 간의 상관관계를 다변수 선형 회귀분석(multivariate linear regression analysis) 과 같은 통상적인 통계방법으로 도출하는 것도 고려해 볼 수도 있겠으나, 목적 함수치와 다변수 간의 관계가 비선형 관계일 경우에는 신뢰할 수 없는 결과를 도출하게 될 것이다.
본 발명의 목표는 도로개발계획이 있는 산림지역에서 측정된 토양생태질 자료(즉 토양미생물의 종 다양성 자료)와 기존에 구축된 토양환경속성 자료들 간의 상관관계 혹은 패턴을 도출할 수 있는 인공지능 알고리즘을 학습시키고, 이를 통해서 미측된 토양생태질 등급자료를 획득하고 수치지도화할 수 있는 방법을 제안하는 것이다.
도 7은 본 발명에 의한 토양 생태등급 수치지도 작성방법을 개념적으로 설명한 그림으로서, 본 발명에 의한 토양 생태등급 수치지도 작성방법을 요약하여 설명하면, 먼저 입력변수인 농업토양정보시스템의 토양특성자료와 대상지역에서 채취하여 미생물 종 다양성을 측정한 토양생태질 간의 등급화된 정보를 이용하여 학습(training)을 시켜 토양생태 등급 예측 모델을 구축한다. 그 후 미측된 지역의 토양특성자료를 토양생태 등급 예측 모델에 입력하면 토양생태 등급을 출력값으로 획득할 수 있다. 획득된 토양생태 등급을 지형정보 프로그램인 Arc GIS를 이용하여 지도화하면 토양생태 등급 수치지도를 작성하게 된다.
이를 위해, 본 발명에서는 다변수선형회귀분석기법의 한계를 극복할 수 있는, 비선형 분류 (nonlinear classification) 통계방법 혹은 인공지능기법 (artificial intelligence)을 이용하였다. 구체적으로 본 발명에서 사용한 인공지능 알고리즘은 의사결정나무 (decision tree) 방법과 로지스틱 회귀분석 (logistic regression analysis) 기법이다.
본 연구에서 토양생태 등급 수치지도를 작성하기 위해 목표로 하는 변수는 토양생태 등급 정보이다. 이를 위해 3장에서 토양생태질의 정량적 지표로서 미생물 다양성 지수를 선정하고, 대상지역에 대한 토양 시료를 T-RFLP 방법을 통해 미생물 다양성 (Shannon Index) 지수를 획득하였다.
정량화된 토양생태질 (미생물 다양성 지수)로부터 등급화를 하여야 하는데, 본 발명에서는 백분위수 (percentile) 방법으로 등급화하는 방법이 적용되었다.
본 발명에 있어서, 토양 생태질을 몇 등급으로 분류하는 것이 적당한지가 불분명하여, 3등급, 4등급, 5등급의 3 종류로 등급화하였다. 이 때 각 등급화 백분위수는 모델적용에 유리한 정규분포로 하였다.
채취한 토양시료의 좌표에 해당하는 토양특성 변수정보를 농업토양정보시스템 (ASIS)으로부터 획득하였다. 농업토양정보시스템 웹사이트에서 제공하는 토양특성 정보들은 물리적, 화학적 특성과 토지이용, 토양분류 등이 있으나, 물리적 특성정보(표토의 자갈함량, 유효토심, 표토의 토성, 배수등급, 표토의 침식정도, 경사의 속성자료)와, 토양분류(분포지형 속성자료) 정보만을 이용하였다.
상기 농업토양정보시스템으로부터 획득한 7개의 토양특성변수들은 의사결정나무 및 로지스틱 회귀분석 모델적용을 위한 입력변수가 되는데, 아래 표는 이들 7개의 변수들에 대해 등급화를 실시한 내용을 정리하였다.
[표 1]
<농업토양정보시스템 토양특성 입력변수 (전체토양 시료수=196)>
Figure 112008501851394-pat00002
본 발명의 상기 실험예에서 채취된 등급별 토양시료수를 보면, 본 실험의 입력변수로 사용된 토양특성 변수의 등급마다 고르게 토양시료가 분포하여, 시료선정이 잘 된 것으로 인정될 수 있다.
이러한 과정에 의해 입력변수가 정의되고, 목표변수 즉, 미측된 지역에 대한 토양 생태등급정보가 설정이 완료된다. 다음 단계로서, 토양생태 등급 예측을 위해 적용될 알고리즘을 구축하는 단계이다.
토양생태등급 예측에 적용되는 모델은 인공지능 기법 중 의사결정나무(decision tree)와 통계적 기법 중 로지스틱 회귀분석 (losistic regression)이다. 본 발명에서 적용하는 변수들을 살펴보면 모두 연속형 변수(continuous value)가 아닌 등급화된 변수(discrete value)이다. 이러한 등급화된 변수를 적용하기에 적합한 모델이 바로 의사결정나무와 로지스틱 회귀분석이라고 할 수 있다. 특히 의사결정나무의 경우 토양생태등급을 분류하는데 있어서 중요한 토양특성변수를 알아낼 수 있는 장점이 있기 때문에 본 발명의 실시예에 있어서 의미있는 결과를 획득할 수 있다.
본 발명의 실시예에서는 등급분류 모델을 구축하는데 있어서 각각의 등급을 분류하는 일반적인 방법(conventional method)과 OPP(Ordinal Pairwise Partitioning) 방법을 이용한 쌍대비교 방법을 모두 적용하였다. 일반적인 방법은 각 등급을 개별적으로 분류하는 방법을 말하며, OPP방법은 각 등급의 서수적인 관계를 이용하여 자료를 분류하고 모형을 세워 순차적으로 각 모형을 적용하여 등급을 결정하는 방법으로서, 전향적(forward)방법과, 후향적(backward)방법이 있다.
OPP 방법을 적용하기 위해서는 등급의 수에 따라 분류모델의 수가 달라진다. 3등급인 경우 표 2과 같이 모델을 2개를 구축하였으며, 4등급은 3개의 모델을, 5등급은 4개의 모델을 구축하였다. 아래 표 2에 나타낸 바와 같이, 목표로 하는 등급을 (1), 나머지를 (0)로 2분류하여 등급을 분류하였고, 앞서 설명한 바와 같이 전향적(forward), 후향적(backward) 방법 각각 모델을 만들었다.
[표 2]
Figure 112008501851394-pat00003
의사결정나무와 로지스틱 회귀분석을 적용하기 위해서 사용한 분석 tool로서 인공지능 프로그램으로 상용화 되어있고 또한 가장 널리 쓰이고 있는 SAS Enterprise Miner v9.1 을 이용하였다. 의사결정나무 방법에서는 Gini reduction, Entropy reduction, 그리고 Chi-square test 분류방법 중 분류성능이 좋은 방법을 사용하였으며, 로지스틱 회귀분석에서는 Forward, Backward, Stepwise 변수선택방법과 Cross-validation Misclassification, AIC, SBC 등의 모형선택 기준 중 분류 성능이 좋은 방법을 사용하였다. 특히 본 발명의 실시예에서 토양생태수치지도를 작성하기 위해 사용한 의사결정나무 분류기준에는 OPP_B_DT의 model 1에서는 Entropy reduction 분류방법을 사용하였으며 OPP_F_DT model 1, OPP_F_DT model 2, OPP_B_DT model 2 에서는 Gini reduction 분류방법을 적용하였다.
목표변수인 토양생태 항목과 입력변수 자료들을 이용하여 인공지능 기법인 의사결정나무와 통계적 기법인 로지스틱 회귀분석을 통해 알고리즘을 구축하기 위해서는 자료구분(data partition)을 먼저 하여야 한다. 본 발명의 실시예에서는 training과 test 2가지 data로 구분을 하였으며 training 대 test data의 비율을 각각 70% : 30%으로 구분하였다. (training에 사용되는 데이터는 목표변수인 토양생태 등급을 예측하는 알고리즘 구축을 위하여 이용되고, test data는 training에 사용되었던 자료들을 이용하여 학습된 토양생태 등급 예측 모델이 어느 정도 예측이 잘 되는지를 평가하기 위한 자료로서 이용되는 것이다. 의사결정나무나 로지스틱 회귀분석의 구축된 모델에 농업토양정보시스템의 토양특성 자료를 입력하면 목표로 하는 등급을 획득하여야 한다. 이러한 과정을 SAS Enterprise Miner에서는 점수화 (scoring) 이라고 한다.)
의사결정나무와 로지스틱 회귀분석을 이용한 등급분류 성능 결과는 아래 표 3과 같다. 본 발명의 실시예에서는 OPP 방법을 이용하였으며, 일반적으로 세 등급을 분류하는 전통적인 방법과 분류 성능을 비교하였다. 또한 forward와 backward 방법 모두 적용하여 보았다. 표 3에 제시된 결과는 앞에서 제시한 무작위 (random) 방법으로 training 과 test를 구분하여 10번에 걸친 분류성능을 hit rate 값들의 평균이다. 일반적으로 세 등급을 분류하는 모델(C_DT, C_LR)이 OPP방법을 이용한 모델(OPP_F_FT, OPP_F_LR, OPP_B_DT, OPP_B_LR)보다 분류성능이 좋지 않음을 알 수 있다.
[표 3]
<Hit rate의 평균으로 각 모델의 분류성능 (%) 비교>
Figure 112008501851394-pat00004
*C_DT : conventional decision tree
*C_LR : conventional logistic regression
*OPP_F_DT : ordinary pairwise partitioning decision tree (forward)
*OPP_F_LR : ordinary pairwise partitioning logistic regression (backward)
*OPP_B_DT : ordinary pairwise partitioning decision tree (forward)
*OPP_B_LR : ordinary pairwise partitioning logistic regression (backward)
본 발명의 실시예에 의한 학습모델에서 목표로 하는 변수인 토양생태 등급이 3개로 구성되어 있기 때문에 확률적으로 최소 33%의 분류성능을 가져야 한다. 하지만 OPP방법을 적용한 모델들은 대부분 적어도 50%이상의 분류성능을 보였으며, 로지스틱 회귀분석의 경우 약 60%정도의 분류성능을 보였다. 이것은 확률적인 최소한의 정분류율인 33%의 약 1.5∼1.8배로서 기존의 선행연구 중 인공지능 기법을 적용하여 신용등급 평가를 하는 경우와 비교하여 보았을 때, 분류성능이 비슷한 수준이라 볼 수 있다.
상기 표 3에서 분류성능이 의사결정나무 모델보다 로지스틱 회귀분석방법이 분류정확도가 약간 높았지만, 점수화(scoring) 과정에서 로지스틱 회귀분석은 확률값이 목표로 하는 등급과 나머지 등급간 분류가 0.5대 0.5로 분류가 되는 경향이 많아서 미지의 입력값에 대해 분류가 잘 되지 않는 경향을 보였다.
따라서, 추후 토양생태 등급 수치지도화 과정에서는 OPP 방법을 이용한 의사결정나무 모델(OFF_F_DT, OPP_B_DT)로만 진행을 하였다.
본 발명의 실시예에서 적용된 의사결정나무 모델은, 이 모델을 통해 얻고자 하는 목표변수인 토양생태 등급을 결정하는데 영향을 미치는 입력변수가 무엇인지 변수들 간의 상호작용 (interaction)을 알 수 있는 장점이 있다.
이하에서는 의사결정나무 방법 중 forward와 backward 모델에서 학습된 알고리즘 중 하나씩 선별하여 분류나무 분석을 통해 토양생태 등급에 영향을 미치는 토 양특성 변수들이 무엇인지 분석하여 설명한다.
도 8은 OPP_B_DT 방법 중 1등급과 나머지 등급인 2, 3등급을 분류하는 model 1의 분류나무 구조이다. 학습된 자료를 통해 토양생태 등급이 분류되는데 기여하는 토양변수는 배수등급, 유효토심, 표토의 자갈함량이었다. 본 알고리즘에 따르면 배수등급이 1등급 (약간양호/약간분량/매우불량)이고 유효토심이 1, 2등급 (매우얕음, 얕음)일 경우 토양생태 등급이 1등급일 확률이 높았고, 배수등급이 2, 3등급 (양호, 매우양호)이고, 표토의 자갈함량이 1, 2등급 (바위가 있음, 잔돌이 있음/돌이 있음/둥근바위가 있음)일 경우 토양생태 등급이 1등급일 확률이 높았다.
도 9은 OPP_F_DT 방법 중 1등급과 나머지 등급인 2, 3등급을 분류하는 model 1의 분류나무 구조이다. 학습된 자료를 통해 토양생태 등급이 분류되는데 기여하는 토양변수는 유효토심, 표토의 토성, 배수등급이었다. 본 알고리즘에 따르면 유효토심이 3, 4등급 (보통, 깊음)이고 표토의 토성이 1등급 (양토/미사질 양토)일 경우와 유효토심이 3, 4등급 (보통, 깊음)이고, 표토의 토성이 2등급 (양질세사토/양질사토/세사양토/사양토)이며, 배수등급이 1, 2등급 (약간양호/약간불량/매우불량, 양호)일 경우 토양생태 등급이 1등급일 확률이 높았다.
이와 같은 방법에 따라 OPP_B_DT 방법 model 2와 OPP_F_DT 방법 model 2의 분류나무 구조를 통해 토양생태 등급에 영향을 미치는 토양특성 변수들이 무엇인지 분석하였으며, 그 분석 결과 토양생태등급 분류에 고려되어지는 주요 입력변수를 표 4에 나타내었다.
[표 4]
<OPP_F_DT 알고리즘에서 1등급으로 분류되는 토양특성 변수>
Figure 112008501851394-pat00005
<OPP_F_DT 알고리즘에서 2등급으로 분류되는 토양특성 변수>
Figure 112008501851394-pat00006
<OPP_F_DT 알고리즘에서 3등급으로 분류되는 토양특성 변수>
Figure 112008501851394-pat00007
<OPP_B_DT 알고리즘에서 1등급으로 분류되는 토양특성 변수>
Figure 112008501851394-pat00008
<OPP_B_DT 알고리즘에서 2등급으로 분류되는 토양특성 변수>
Figure 112008501851394-pat00009
<OPP_B_DT 알고리즘에서 3등급으로 분류되는 토양특성 변수>
Figure 112008501851394-pat00010
본 발명의 실시예에 적용한 의사결정나무 알고리즘을 통해, 토양생태 등급 결정에 분류기준으로서 토양특성 변수 중 배수등급, 유효토심, 분포지형, 표토의 침식정도, 표토의 토성, 표토의 자갈함량이 고려가 되었다. 배수등급이 좋지 않을수록, 유효토심이 깊을수록, 분포지형이 평탄한 지역일수록, 표토의 침식이 없을수록, 표토의 토성이 양토 위주일수록, 표토의 자갈함량이 많을수록 토양생태 등급이 낮아지는, 즉 토양 생태질이 좋아지는 조건이 되었다.
그 중에서 OPP_F_DT와 OPP_B_DT 두 모델을 통해 토양생태 등급 분류를 결정하는 7개의 토양특성 변수 중 배수등급과 유효토심이 가장 많이 고려가 되었다. 특히 두 변수는 1등급을 분류하는데 고려가 되어지는 변수였다.
유효토심의 경우 모든 경우가 일치하진 않았지만 유효토심의 등급이 높을수록 (유효토심이 깊을수록) 토양생태 등급이 낮게 나오는 경우가 많았다. 농업토양 정보시스템의 유효토심 기준은 작물뿌리가 땅속으로 충분히 뻗을 수 있는 깊이이며, 토양단면 중 B층위(집적층)까지를 말한다. 유효토심이 깊은 만큼 많은 토양미생물이 식물의 영양에 필요한 탄소 및 질소의 순환의 역할을 할 수 있고, 토양생태차원에서 양질의 토양이 될 것이다.
본 발명의 실시예에서 이용한 의사결정나무방법인 OPP_F_DT와 OPP_B_DT 모델의 신뢰도, 즉 구축한 토양생태 등급 예측 모델에 본 발명의 실시예에 사용한 196개의 토양특성 자료를 입력하였을 때 제대로 예측이 되는 조건과 그렇지 않은 조건이 어떠한지 분석을 하였다.
도 10와 도 11은 의사결정나무 방법인 OPP_F_DT와 OPP_B_DT 모델 각각 실제 등급과 예측 등급 간의 비교분석 그래프를 도시한 것이다.
각 등급이 제대로 예측이 되는 경우를 제외한 것을 이상치라고 판단할 수 있으며, 제대로 예측이 되는 경우와 그렇지 않은 경우에 대해 토양특성 자료 데이터 베이스를 통해 분석을 하였다. 실제 1등급이 1등급으로 제대로 예측을 하는 경우와 2, 3등급으로 예측을 잘못하는 경우, 실제 2등급이 2등급으로 제대로 예측하는 경우와 1, 3등급으로 예측을 잘못하는 경우, 실제 3등급이 1, 2등급으로 예측을 잘못하는 경우로 분류를 하여 분석을 실시하였다. OPP_F_DT 모델은 OPP_B_DT 모델에 비해 실제등급보다 높은 등급으로 예측되는 경우가 많았고, 반면에 OPP_B_DT 모델은 실제 등급에 비해 등급이 낮게 나오는 경우가 많았다.
OPP_F_DT 와 OPP_B_DT 모델의 토양생태 등급 분류의 성능이 완벽하지 않기 때문에 모든 경우에 있어서 표 4에서 제시한 토양생태 등급을 분류하는데 결정이 되는 토양특성 변수를 따르지는 않지만, 표 4의 토양특성 변수 기준을 대부분 따르는 것으로 나타났다.
4. 토양생태 등급 수치지도 작성
상기 단계에 의해 획득된 결과값을 이용하여 수치지도에 나타내는 방법에 대하여 설명한다.
산출된 토양생태 등급을 지도화하기 위해서 먼저 대상지역에 대한 입력변수 자료를 준비해야 한다. 본 발명의 실시예로서 대상지역은 경기도 가평, 양평 및 강원도 일부 지역으로서 1:25,000 축척의 9개 도엽 (377024, 377033, 377034, 377062, 377064, 377071, 377072, 377073, 377074)을 선택하였다. 농업과학기술원 (농업토양정보시스템)을 통해 얻은 해당지역에 대한 토양특성 변수 자료를 살펴보 면 각 polygon에 하나의 토양통 (soil series) 정보로 되어 있으며, 하나의 토양통에는 7개의 토양특성 변수 정보가 동일하게 구성되어 있었다. 대상지역의 토양통 정보는 모두 124개 이었으며, 이로부터 표토의 자갈함량, 유효토심, 표토의 토성, 배수등급, 표토의 침식정도, 경사, 형태적분류(목), 분포지형, 퇴적양식의 토양특성 자료에 대한 입력변수 data set을 구축하였다.
입력변수 자료를 구축된 토양생태 등급 예측 모델에 입력하여 목표변수인 토양생태 등급 결과를 얻는 것은 앞에서 언급하였던 점수화(scoring) 과정을 통해 수행하였다. 예측된 등급을 이용하여 지도화(mapping)를 수행한 것은 가장 널리 쓰이고 있는 GIS 프로그램인 ESRI사에서 제작한 ArcGIS v9.1이었다. 토양생태 등급을 지도화하기 위하여 예측된 토양생태 등급 결과를 얻은 후에 토양도 안에 등급 정보를 추가해야 한다. 대상지역의 토양특성자료가 있는 GIS 속성 파일에 ArcGIS 프로그램의 Join 기능을 이용하여 토양생태 등급 항목을 추가하여 지도화하였다.
의사결정나무 방법의 forward와 backward 방법을 이용하여 구축된 알고리즘에 대상지역을 토양특성변수를 입력하여 얻은 토양생태 등급 예측값으로 도 12a와 같은 토양생태 등급 수치지도를 획득하였다.
본 발명에 따른 토양생태수치지도의 예측등급이 정확하다고 단정할 수 없기 때문에 이를 보정할 수 있는 방법이 있어야 한다. 이를 위해 매 지역마다 다시 토양시료를 채취하여 토양미생물 종 다양성을 측정하는 방법도 있겠지만, 이는 추가적인 비용과 노력이 수반되어야하는 단점이 있다. 본 발명에서는 개발된 알고리즘에 이용하였던 196개의 자료를 이용하여 실제 등급과 예측 등급간의 오차를 나타내 는 모델을 구축하였으며, 그에 따른 등급오차 수치지도 (Class Error Map, CEM)를 고안하였다.
수치지도를 보정하기 위한 '등급오차 지도 (Class Error Map, CEM)'를 만들기 위해서 앞에서와 동일한 과정을 진행할 필요가 있다. 먼저 등급차이를 계산하기 위해 구축된 예측 모델에 본 발명의 실시예에 사용되었던 토양생태 실제등급을 알고 있는 196개의 토양특성 변수를 입력하여 예측 등급을 획득한다. 그러면 실제등급과 예측등급간의 등급 차이를 절대값으로 계산할 수 있다.
등급차이의 값은 0, 1, 그리고 2가 될 것이다. 3가지의 값을 새로운 목표변수로 고려하여, 196개의 입력변수와 OPP 방법으로 '등급차이 예측 모델'을 구축한다. 이 때 model 1에서 목표로 하는 등급을 등급차이 0으로 하고, 나머지를 등급차이 1과 2로 하였으며 model 2에서는 2와 3을 구분하는 모델을 구축하였다. 이와 같이 구축된 '등급차이 예측 모델' 에 대상지역의 토양특성변수를 입력하여 등급차이 예측 값을 획득하였고, 토양생태 등급 수치지도화 방법과 같은 방법으로 '등급차이 지도' 를 작성할 수 있었다. 도 12b는 이러한 등급오차 지도를 나타낸 것이다.
이와 같이 작성된 등급차이 지도를 반영하여 수정된 토양생태 등급 예측지도를 작성한 것을 11c 및 도 12d에 나타내었다. 도 12c는 예측등급이 2등급에서 보정에 의해 1등급으로 보정된 경우의 지도이며, 도 12d는 예측등급이 2등급에서 3등급으로 고려된 경우의 지도를 각각 나타낸 것이다.
지금까지 본 발명의 실시예를 통하여, 산림지역을 대상으로 현장시료로부터 측정된 토양미생물 다양성 자료(토양생태질 등급)와 기존에 구축되어 있는 농업토 양정보시스템의 토양환경정보 간의 상관관계를 의사결정나무 방법을 통해 학습된 토양생태질 등급 예측 인공지능 알고리즘을 구축하였으며, 이를 ArcGIS에 접목해서 미측된 토양생태질 등급 수치지도를 제작하는 방법을 구체적으로 설명하였다. 또한 실제등급과 예측등급 간의 등급오차를 나타내는 수치지도와 이를 반영하여 보정한 4가지의 토양생태 등급 수치지도를 작성하여, 환경영향평가는 물론 국토의 종합적 개발계획 수립을 위한 자료로 활용할 수 있음을 설명하였다.
이상에서는 본 발명의 실시예에 국한하여 설명하였지만, 본 발명은 상기한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 고안이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형실시들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.
상술한 바와 같이, 본 발명을 통하여 개발되는 토양환경생태등급 예측 모델을 통하여 전국적 토양환경생태 예측 및 토양생태수치지도를 작성할 수 있고, 이 토양생태수치지도는 지속가능하고 친환경적 국토개발사업의 설계 및 평가, 환경영향평가, 사전 환경성 평가 등에 자료로 활용될 수 있고, 생태가치평가에 대한 논의가 좀 더 객관적인 토대 위에서 진행될 수 있는 장점이 있다.
또한, 토양환경생태등급 예측 모델은 환경의 복합적 정보를 융합하는 환경정보기술에 파급효과가 있다. 환경정보기술은 복잡한 환경 및 생물생태인자들의 종합적이며 신속한 분석을 요구하는 과학, 농업 및 임업 관련분야에서 유용이 사용될 수 있다는 장점이 있다.
더욱이, 토양생태수치지도의 토양생태등급화를 통한 계량적인 접근을 통해 보다 체계적이고 공정한 평가가 가능하게 될 것이며, 정성적일 수 있는 토양 생태질에 대한 가치평가 문제를 생태가치 정보기술을 통해서 체계적이며 포괄적인 접근이 가능할 것이다.
도 1은 본 발명의 실시예에 따른 토양환경 생태등급 예측방법을 설명하는 순서도.
도 2은 토양 미생물의 종 다양성 측정방법 중의 하나인 T-RFLP방법 설명도.
도 3는 본 발명의 실험과정에서 시료채취 지역을 도시한 지도.
도 4은 본 발명의 실험에서 토양시료로부터 T-RFLP 분석결과 Profile.
도 5는 시료채취 시기별 미생물 종 다양성 분포의 비교 결과를 도시한 그래프.
도 6는 생태 지역별 미생물 종 다양성 분포의 비교 결과를 도시한 그래프.
도 7은 본 발명에 의한 토양환경 생태등급 수치지도 작성방법을 개념도.
도 8은 OPP_B_DT 방법 중 1등급과 나머지 등급인 2, 3등급을 분류하는 model 1의 분류나무 구조의 개념도
도 9은 OPP_F_DT 방법 중 1등급과 나머지 등급인 2, 3등급을 분류하는 model 1의 분류나무 구조의 개념도
도 10는 OPP_F_DT모델을 통해 예측한 등급과 실제 등급 간의 비교분석 그래프
도 11은 OPP_B_DT모델을 통해 예측한 등급과 실제 등급 간의 비교분석 그래프
도 12a 내지 도 12d는 본 발명에 의한 토양환경 생태등급을 나타낸 수치지도

Claims (5)

  1. 삭제
  2. 삭제
  3. 삭제
  4. 토양미생물 종 다양성을 측정하기 위한 대상지역의 시료채취 위치(sampling point)를 선정하는 단계와;
    선정된 시료채취 대상지점에서 샘플링 채취된 토양 시료에 대하여 분자생물학적 실험인 T-RFLP 방법을 이용하여 토양 미생물 종 다양성 정도(SMD)를 측정하되, 상기 토양미생물 종 다양성 정도(SMD)는
    Figure 112008072283138-pat00028
    (상기 n은 종의 수, i는 종의 개체수, pi는 모든 생명체에 대한 i번째 종의 비율을 나타낸 것임)에 의해 계산되어지는 지수로서, 전체 시료 수에 대한 백분율로 환산하여 등급화한 것을 특징으로 하는 토양 미생물 종 다양성 정도(SMD) 측정단계와;
    상기 SMD와, 농촌진흥청이 운영하는 농업토양정보시스템에서 제공되는 토양 특성 정보를 수치화하여 토양생태 DB를 구축하되, 상기 토양특성 정보는 표토의 자갈함량, 유효토심, 표토의 토성, 배수등급, 표토의 침식정도, 경사의 속성자료와, 분포지형 속성자료들을 각각 등급화하여 토양생태 DB를 구축하는 DB구축단계와;
    상기 토양생태 DB에 구축된 정보들을 기반으로 하여, 입력변수와 목표변수의 상관관계를, 인공지능(Artificial Intelligence: AI) 분석모델 중에서 특히 의사결정나무모델에 학습시키는 분석모델 준비단계와;
    미측지역의 토양정보를 입력변수로 하여, 상기 학습된 인공지능 분석모델을 이용하여 토양환경 생태등급을 산정하는 등급산출단계로 이루어지는 토양환경 생태등급 예측방법에 있어서,
    상기 등급산출단계에는 각 등급의 서수적인 관계를 이용하여 자료를 분류하고 모형을 세워 순차적으로 각 모형을 적용하여 등급을 결정하는 OPP(Ordinal Pairwise Partitioning) 방법에 의해 산출되는 것을 특징으로 하는 토양환경 생태등급 예측방법.
  5. 삭제
KR1020080032911A 2007-06-05 2008-04-07 토양환경 생태등급 예측방법 KR100866909B1 (ko)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR20070054746 2007-06-05
KR1020070054746 2007-06-05

Publications (1)

Publication Number Publication Date
KR100866909B1 true KR100866909B1 (ko) 2008-11-04

Family

ID=40283615

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080032911A KR100866909B1 (ko) 2007-06-05 2008-04-07 토양환경 생태등급 예측방법

Country Status (1)

Country Link
KR (1) KR100866909B1 (ko)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101432437B1 (ko) 2013-03-28 2014-08-21 부산대학교 산학협력단 수계수질상태의 진단 및 예측이 가능한 수질정보제공시스템 및 방법
CN110990786A (zh) * 2019-11-27 2020-04-10 中山大学 一种重金属污染的土壤环境的综合评价方法
JP2020068033A (ja) * 2018-10-22 2020-04-30 国立交通大学 農地の土壌状態を予測するモノのインターネットシステム及びモデリング方法
KR102324230B1 (ko) * 2020-09-29 2021-11-10 서울대학교산학협력단 분광기반 토양성분 예측 방법 및 시스템, 이를 구현하는 프로그램매체
KR20210151445A (ko) * 2020-06-05 2021-12-14 한국과학기술연구원 토양내 화학 사고 진단 방법
CN115796613A (zh) * 2022-11-04 2023-03-14 崇义县源德矿业有限公司 一种矿产资源开采规划区划定方法及装置
CN116384717A (zh) * 2023-06-06 2023-07-04 武汉南北极测绘地理信息有限公司 一种土地利用规划勘察项目测绘数据采集分析***
CN116433068A (zh) * 2023-02-22 2023-07-14 农业农村部环境保护科研监测所 一种评价土壤多功能性的因果机器学习方法
CN116894514A (zh) * 2023-07-13 2023-10-17 中国农业科学院农业环境与可持续发展研究所 一种基于土壤质量指标的作物产量预测方法及***
CN117010587A (zh) * 2023-06-03 2023-11-07 中国农业科学院农业环境与可持续发展研究所 有机物料对土壤质量改善效应的集成学习优化评价方法
CN117171660A (zh) * 2023-11-02 2023-12-05 北京建工环境修复股份有限公司 基于支持向量机的微生物修复状态监测方法、***及介质
CN117423214A (zh) * 2023-10-24 2024-01-19 重庆市生态环境科学研究院 一种基于环境dna数据的环境生态风险评估方法
CN117171676B (zh) * 2023-11-02 2024-02-02 北京建工环境修复股份有限公司 基于决策树的土壤微生物识别分析方法、***及存储介质

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040083979A (ko) * 2003-03-26 2004-10-06 농업기반공사 지아이에스를 이용한 담수호관리 시스템 및 방법
KR20070056201A (ko) * 2005-11-29 2007-06-04 대한민국(산림청 국립수목원장) Gis를 이용한 식물자원 수량화 방법

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040083979A (ko) * 2003-03-26 2004-10-06 농업기반공사 지아이에스를 이용한 담수호관리 시스템 및 방법
KR20070056201A (ko) * 2005-11-29 2007-06-04 대한민국(산림청 국립수목원장) Gis를 이용한 식물자원 수량화 방법

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101432437B1 (ko) 2013-03-28 2014-08-21 부산대학교 산학협력단 수계수질상태의 진단 및 예측이 가능한 수질정보제공시스템 및 방법
JP2020068033A (ja) * 2018-10-22 2020-04-30 国立交通大学 農地の土壌状態を予測するモノのインターネットシステム及びモデリング方法
CN110990786A (zh) * 2019-11-27 2020-04-10 中山大学 一种重金属污染的土壤环境的综合评价方法
KR20210151445A (ko) * 2020-06-05 2021-12-14 한국과학기술연구원 토양내 화학 사고 진단 방법
KR102376566B1 (ko) * 2020-06-05 2022-03-22 한국과학기술연구원 토양내 화학 사고 진단 방법
KR102324230B1 (ko) * 2020-09-29 2021-11-10 서울대학교산학협력단 분광기반 토양성분 예측 방법 및 시스템, 이를 구현하는 프로그램매체
CN115796613A (zh) * 2022-11-04 2023-03-14 崇义县源德矿业有限公司 一种矿产资源开采规划区划定方法及装置
CN115796613B (zh) * 2022-11-04 2023-12-08 崇义县源德矿业有限公司 一种矿产资源开采规划区划定方法及装置
CN116433068A (zh) * 2023-02-22 2023-07-14 农业农村部环境保护科研监测所 一种评价土壤多功能性的因果机器学习方法
CN116433068B (zh) * 2023-02-22 2024-04-05 农业农村部环境保护科研监测所 一种评价土壤多功能性的因果机器学习方法
CN117010587A (zh) * 2023-06-03 2023-11-07 中国农业科学院农业环境与可持续发展研究所 有机物料对土壤质量改善效应的集成学习优化评价方法
CN116384717B (zh) * 2023-06-06 2023-08-22 武汉南北极测绘地理信息有限公司 一种土地利用规划勘察项目测绘数据采集分析***
CN116384717A (zh) * 2023-06-06 2023-07-04 武汉南北极测绘地理信息有限公司 一种土地利用规划勘察项目测绘数据采集分析***
CN116894514A (zh) * 2023-07-13 2023-10-17 中国农业科学院农业环境与可持续发展研究所 一种基于土壤质量指标的作物产量预测方法及***
CN117423214A (zh) * 2023-10-24 2024-01-19 重庆市生态环境科学研究院 一种基于环境dna数据的环境生态风险评估方法
CN117171660A (zh) * 2023-11-02 2023-12-05 北京建工环境修复股份有限公司 基于支持向量机的微生物修复状态监测方法、***及介质
CN117171676B (zh) * 2023-11-02 2024-02-02 北京建工环境修复股份有限公司 基于决策树的土壤微生物识别分析方法、***及存储介质
CN117171660B (zh) * 2023-11-02 2024-03-12 北京建工环境修复股份有限公司 基于支持向量机的微生物修复状态监测方法及***

Similar Documents

Publication Publication Date Title
KR100866909B1 (ko) 토양환경 생태등급 예측방법
Augusto et al. Tree functional traits, forest biomass, and tree species diversity interact with site properties to drive forest soil carbon
Gerwin et al. Assessment and quantification of marginal lands for biomass production in Europe using soil-quality indicators
Zhang et al. Environment and geographic distance differ in relative importance for determining fungal community of rhizosphere and bulk soil
Tripathi et al. Tropical soil bacterial communities in Malaysia: pH dominates in the equatorial tropics too
Zhang et al. Local community assembly mechanisms shape soil bacterial β diversity patterns along a latitudinal gradient
Wang et al. Mechanisms of soil bacterial and fungal community assembly differ among and within islands
van Geel et al. Decrease in diversity and changes in community composition of arbuscular mycorrhizal fungi in roots of apple trees with increasing orchard management intensity across a regional scale
Jesmok et al. Next‐generation sequencing of the bacterial 16S rRNA gene for forensic soil comparison: a feasibility study
House et al. Disturbance reduces the differentiation of mycorrhizal fungal communities in grasslands along a precipitation gradient
Klaubauf et al. Molecular diversity of fungal communities in agricultural soils from Lower Austria
Van Geel et al. High soil phosphorus levels overrule the potential benefits of organic farming on arbuscular mycorrhizal diversity in northern vineyards
McCann et al. Microbial communities in a high arctic polar desert landscape
Lankau et al. Ectomycorrhizal fungal richness declines towards the host species’ range edge
Herben et al. Vertical root distribution of individual species in a mountain grassland community: does it respond to neighbours?
Chalmandrier et al. Environmental and biotic drivers of soil microbial β‐diversity across spatial and phylogenetic scales
Carboni et al. Changes in trait divergence and convergence along a productivity gradient in wet meadows
Hewitt et al. The potential for mycobiont sharing between shrubs and seedlings to facilitate tree establishment after wildfire at Alaska arctic treeline
Resch et al. Evaluating long‐term success in grassland restoration: an ecosystem multifunctionality approach
Kaspari et al. Scaling community structure: how bacteria, fungi, and ant taxocenes differentiate along a tropical forest floor
Albornoz et al. Evidence for niche differentiation in the environmental responses of co-occurring Mucoromycotinian fine root endophytes and Glomeromycotinian arbuscular mycorrhizal fungi
Jafarian et al. Which spatial distribution model best predicts the occurrence of dominant species in semi-arid rangeland of northern Iran?
Lankau et al. Simultaneous adaptation and maladaptation of tree populations to local rhizosphere microbial communities at different taxonomic scales
Chiaverini et al. Effects of non-representative sampling design on multi-scale habitat models: flammulated owls in the Rocky Mountains.
Matsuoka et al. Taxonomic, functional, and phylogenetic diversity of fungi along primary successional and elevational gradients near Mount Robson, British Columbia

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20121030

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20131030

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20141030

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20151022

Year of fee payment: 8

FPAY Annual fee payment

Payment date: 20161107

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20171030

Year of fee payment: 10

LAPS Lapse due to unpaid annual fee