CN108053071A - 区域空气污染物浓度预测方法、终端及可读存储介质 - Google Patents

区域空气污染物浓度预测方法、终端及可读存储介质 Download PDF

Info

Publication number
CN108053071A
CN108053071A CN201711393032.2A CN201711393032A CN108053071A CN 108053071 A CN108053071 A CN 108053071A CN 201711393032 A CN201711393032 A CN 201711393032A CN 108053071 A CN108053071 A CN 108053071A
Authority
CN
China
Prior art keywords
concentration data
pollutant concentration
prediction
data
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711393032.2A
Other languages
English (en)
Inventor
戈燕红
舒少君
雷涛
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Universtar Science and Technology Shenzhen Co Ltd
Original Assignee
Universtar Science and Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Universtar Science and Technology Shenzhen Co Ltd filed Critical Universtar Science and Technology Shenzhen Co Ltd
Priority to CN201711393032.2A priority Critical patent/CN108053071A/zh
Publication of CN108053071A publication Critical patent/CN108053071A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/06Investigating concentration of particle suspensions
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/0004Gaseous mixtures, e.g. polluted air
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Economics (AREA)
  • Software Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Immunology (AREA)
  • Pathology (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Biochemistry (AREA)
  • Data Mining & Analysis (AREA)
  • Game Theory and Decision Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Medicinal Chemistry (AREA)
  • Dispersion Chemistry (AREA)
  • Food Science & Technology (AREA)
  • Development Economics (AREA)
  • Combustion & Propulsion (AREA)
  • Medical Informatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明实施例提供一种区域空气污染物浓度预测方法、终端及计算机可读存储介质。所述方法包括:将计算得到的日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用多层前馈神经网络实现;确定当前时间当天预测的未来预设天数的预测气象数据;对预测气象数据进行预处理;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。本发明实施例提高了区域空气污染物浓度预测精度,具有较强的泛化能力。

Description

区域空气污染物浓度预测方法、终端及可读存储介质
技术领域
本发明涉及数据处理技术领域,尤其涉及一种区域空气污染物浓度预测方法、终端及计算机可读存储介质。
背景技术
近年来,我国大部分地区频繁出现大面积的空气污染事件,空气污染问题已经严重影响到人民的正常生活生产。常见的大气污染物,如PM2.5、PM10、O3等对人类健康危害极为严重。采用可靠、易行的空气预测预报方法来预测空气污染的发生和变化趋势,使政府部门及时了解未来空气质量状况,面对重空气污染事件提前采取应对措施,保证人民的生活健康,以最低经济成本实现最大的社会效益显得尤为重要。
目前,空气污染预报的主要方法包括统计预报和数值预报两种。数值预报方法通过对大气污染的物理和化学过程进行建模,实现了在不同尺度、不同背景下对未来空气污染状况的模拟。由于数值预报方法需要对空气污染的物理化学转化机理进行详尽的了解和建模,且建模和应用过程复杂,不仅需要高性能的计算机集群,也需要高分辨率的气象数据和污染源清单数据作为支撑,这些都导致在一些检测水平较低的中小城市或区域较难实现。
基于统计预报的方法是依据统计学的原理,利用特定的统计学算法从空气污染物浓度、气象因子以及其他相关的历史数据找出相互的转化规律,因而该方法不需要对污染物的物理化学过程进行建模。然而现有的统计预报方法研究和应用主要以多元线性回归为主,多元线性回归非线性拟合能力较差,其预测效果精度不高。
发明内容
本发明实施例提供一种区域空气污染物浓度预测方法、终端及计算机可读存储介质,可对区域空气污染物浓度进行预测,提高了区域空气污染物浓度预测精度,具有较强的泛化能力。
第一方面,本发明实施例提供了一种区域空气污染物浓度预测方法,该方法包括:
根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集;
确定待预测的区域当前时间对应季节的日历史气象数据集;
对日历史气象数据集进行预处理;
将日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用多层前馈神经网络实现;
确定当前时间当天预测的未来预设天数的预测气象数据;
对预测气象数据进行预处理;
根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。
第二方面,本发明实施例提供了一种终端,该终端包括用于执行上述第一方面所述的方法的单元。
第三方面,本发明实施例提供了另一种终端,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储应用程序代码,所述处理器被配置用于调用所述程序代码,执行上述第一方面所述的方法。
第四方面,本发明实施例提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面所述的方法。
本发明实施例通过将计算得到的日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用多层前馈神经网络实现;确定当前时间当天预测的未来预设天数的预测气象数据;对预测气象数据进行预处理;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。本发明实施例使用训练好的随机森林模型对区域的污染物浓度进行预测,提高了区域空气污染物浓度预测精度,具有较强的泛化能力。
附图说明
为了更清楚地说明本发明实施例技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种区域空气污染物浓度预测方法的流程示意图;
图2是本发明实施例提供的一种区域空气污染物浓度预测方法的子流程示意图;
图3是本发明实施例提供的一种区域空气污染物浓度预测方法的另一子流程示意图;
图4是本发明实施例提供的一种区域空气污染物浓度预测方法的另一子流程示意图;
图5是本发明另一实施例提供的一种区域空气污染物浓度预测方法的另一子流程示意图;
图6是本发明施例提供的一种终端的示意性框图;
图7是本发明实施例提供的平均计算单元的示意性框图;
图8是本发明实施例提供的第一预处理单元的示意性框图;
图9是本发明实施例提供的预测单元的示意性框图;
图10是本发明另一实施例提供的预测单元的示意性框图;
图11是本发明另一实施例提供的一种终端的示意性框图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。
具体实现中,本发明实施例中描述的终端包括但不限于诸如具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的移动电话、膝上型计算机或平板计算机之类的便携式设备。还应当理解的是,在某些实施例中,所述设备并非便携式通信设备,而是具有触摸敏感表面(例如,触摸屏显示器和/或触摸板)的台式计算机。
污染物浓度指单位体积内所含污染物的量。由于空间差异性,不同区域的污染物浓度会有所不同,同一区域的污染物浓度会根据季节气候的不同而变化,因此对污染物浓度进行监测和预测时,是面向区域的、季节的。按照区域进行污染物浓度监测和预测时,可以减低不同区域在排放时间分布和空间分布的差异性,避免单个监测点异常的影响。按照季节进行污染物浓度监测和预测时,可以降低不同季节的污染物排放差异性的影响。其中,可按照如下规则对季节进行划分:冬季为12月到次年2月、春季为3月到5月、夏季为6月到8月、秋季为9到11月。具体根据不同地区可对季节进行不同的划分。
图1为本发明实施例提供的一种区域空气污染物浓度预测方法的流程示意图。该方法包括S101-S107。
S101,根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集。
其中,在待预测的区域内会部署多个微型监测点,该多个微型监测点有多个污染物监测器,如PM2.5、PM10、O3等监测器。该多个微型监测点每隔预设时间如5分钟会监测污染物浓度数据,因此在每天中会有多个时间点都会有污染物浓度数据。需要注意的是,文中提到的污染物浓度数据指的是同一种污染物浓度数据。
根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集。具体地,获取待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集,其中,通常包括多年监测得到的污染物浓度数据;对每天内多个时间点获取的数据进行处理得到多个时间点对应的污染物浓度数据,将多个时间点对应的污染物浓度数据进行平均得到日平均历史污染物浓度数据,重复计算以获得待预测的区域当前时间对应季节所有日期的日平均历史污染物浓度数据集。当前时间对应季节所有日期指的是对应季节中当前时间以及当前时间对应的日期。对区域污染物浓度数据进行处理得到日平均历史污染物浓度数据,可以降低一天中个别时间点的异常值的影响。
在一实施例中,如图2所示,对一个时间点获取的数据进行处理得到该时间点对应的污染物浓度数据,包括S201-S204。
S201,对一个时间点对应的所有监测点的监测污染物浓度数据的异常值进行处理。具体地,判断对应监测点的监测污染物浓度数据是否有缺失值、极端值;若有缺失值,根据对应监测点的邻域监测点的平均值替代缺失值;若有极端值,采用对应污染物浓度数据的边界值替换;若邻域内无监测点,那么剔除对应监测点当前时间点对应的数据。其中,极端值可以理解为超过对应范围的值,如假设PM2.5的浓度范围为[0,500],单位为微克每立方米,那么极端值就是超过500的值、以及小于0的值,对应的PM2.5的边界值分别为0和500。若监测到PM2.5的值小于0,那么用PM2.5的边界值0替换;若监测到PM2.5的值大于500,那么用PM2.5的边界值500替换。其中邻域理解为距离对应监测点的距离小于K的所有点集合。K可以取3km,也可以取其他合适的值。
S202,对待预测的区域进行网格化得到多个网格单元。
其中,网格单元大小根据待预测区域面积大小进行设置,如可以设置为1km*1km。可以进行规则设置,也可以进行不规则的设置,如待预测区域内对应有大一片区域是森林,那么可以将森林的区域设置为一个网格单元。
S203,利用插值算法计算多个网格单元对应网格区域的污染物浓度数据。
可以理解为,每个网格单元中不一定都设置有监测点,因此对没有设置监测点的网格单元利用插值算法计算对应网格区域的污染物浓度数据,如此每个网格单元对应网格区域都有污染物浓度数据。其中,插值算法为克里金插值算法,也可以为其他合适的插值算法。
S204,计算多个网格单元对应网格区域的污染物浓度数据的平均值,得到所述待预测的区域当前时间点对应的污染物浓度数据。
计算多个网格单元对应网格区域的污染物浓度数据的平均值,将该平均值作为待预测的区域当前时间点对应的污染物浓度数据。
图2所示的实施例通过对一个时间点获取所有监测点的监测污染物浓度数据进行异常值处理,并对待预测的区域进行网格单元划分,并用插值算法计算每个网格单元对应区域的污染物浓度数据,对得到的每个网格单元对应区域的污染物浓度数据进行平均,以得到对应时间点的污染物浓度数据,如此提高了对应时间点的污染物浓度数据的准确度。
S102,确定待预测的区域当前时间对应季节的日历史气象数据集。
日历史气象数据集包括但不限于以下气象因子:(1)气温:每日2时、8时、14时、20时的气温和每日2时、8时、14时、20时的变温,日平均气温,日最低气温,日最高气温,7时地表、700hpa、850hpa、925hpa的气温与各层的温差;(2)气压:每日2时、8时、14时、20时的气压和每日2时、8时、14时、20时的变压,日平均气压,日平均气压差;(3)湿度:每日2时、8时、14时、20时的相对湿度,日平均相对湿度;(4)风:主导风向、日平均风速、24小时风速变量;(5)其它:日平均降雨量、日平均云量、日平均光照强度。其中,每日8时的变温指的是前一天8时的温度减去当日8时的温度,日平均气温指的是每日2时、8时、14时、20时的气温的平均值,每日8时的变压指的是前一天8时的气压减去当日8时的气压,日平均气压差指的是一天里面最高气压减去最低气压的值。
S103,对日历史气象数据集进行预处理。
在一实施例中,如图3所示,对日历史气象数据集进行预处理,包括S301-S302。
S301,采用相关系数法对日历史气象数据集对应的特征属性进行过滤。
其中,日历史气象数据集对应的特征属性,可以理解为具体的气象因子,如2时气温、日平均气温、日最高气温等。通过计算日历史气象数据集中各特征属性与需要预测的污染物浓度的相关系数,根据相关系数来将对应的特征属性进行过滤。如皮尔逊相关系数,以相关系数0.2作为阀值,将小于该阀值则特征属性过滤掉,如此实现特征属性的初步过滤。可以理解地,日历史气象数据集中的某些特征属性对需要预测的污染物浓度没有影响、或者影响不大,那么可以将没有影响、或者影响不大对应的特征属性过滤,保留对污染物浓度有较大影响的特征属性。
S302,根据归一化处理公式对过滤后的日历史气象数据集进行归一化处理。
对于过滤后的日历史气象数据集,为了避免不同量纲造成的尺度不一,需要将不同量纲得到的气象数据转化为相同量纲的气象数据。因此可对过滤后的日历史气象数据集进行归一化处理,归一化处理方法可以采用min-max标准化方法。其中,对应的标准化处理公式为:Y*=0.1+0.8*(Yi-Ymin)/(Ymax-Ymin),其中,Yi表示第i个特征属性的值,Ymax表示该特征属性对应的最大值,Ymin表示该特征属性对应的最小值,Y*表示该特征属性归一化后的值。
S104,将日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用多层前馈神经网络实现。
其中,随机森林算法是一种集成学习算法,该算法通过构造多棵决策树进行集成学习来提高了预测的准确性和泛化性,有效避免单一算法的过拟合问题,提高对空气污染物检测数据的噪声和异常值的容忍性。利用该算法对特征属性的随机选取,避免特征选择的不合理性问题,最终实现区域大气污染物浓度的预测。单棵树的预测模型选取多层前馈神经网络实现。其中,多层前馈神经网络指的是BP神经网络,以下统一使用BP神经网络。
具体地,设置随机森林算法参数,如随机森林的数规模P、每棵决策树有放回的取样本数据的次数N、每个样本数据中提取特征属性的个数k等;对于每棵决策树:采用Bootstrap抽样法从归一化后的样本数据集中有放回的随机选择N个样本数据生成训练子集;从样本数据的特征属性集合中随机选择k个特征,按照选择的k个特征从训练子集中提取特征子空间训练集;初始化BP神经网络,输入特征子空间训练集进行单棵决策树的训练。重复以上每棵决策树的操作完成所有决策树的训练。
其中,每个样本数据中提取特征属性的个数k是在区间[4,m]中随机生成的,m为样本数据的特征属性集的维度。其中,P可以为100等。随机森林模型中单棵决策树采用BP神经网络算法实现,该BP神经网络算法的输入层个数采用生成的参数k,输出层为1,隐含层个数根据确定,其中,a在[1,10]中取值。初始化BP神经网络时,需要设置BP神经网络的终止条件、每次迭代允许的误差、最大监督次数等。其中,可以设置最大迭代次数为BP神经网络的终止条件,最大迭代次数可以为2000等。
以上步骤S101-S104是随机森林模型训练的过程。通过计算日平均历史污染物浓度数据集以及对日历史气象数据的预处理,提高了样本数据的可靠性和准确度。再根据更准确和可靠的样本数据,利用随机森林模型进行训练,提高了模型的泛化能力。
完成了随机森林模型的训练,就可以使用训练出的随机森林模型来进行空气污染物浓度预测。
S105,确定当前时间当天预测的未来预设天数的预测气象数据。
其中,预测气象数据可以采用气象预测模式如WRF(The Weather Research andForecasting Model)等的预测结果得到。WRF模式初始和边界条件可以采用美国国家大气研究中心(NCAR)和美国环境预测中心(NCEP)的全球预报***(GFS)的全球气象资料,地形和下垫面资料可以采用USGS 30s全球地形和MODIS下垫面分类资料。预测气象数据也可以采用其他的气象预测模式得到。预设天数可以为1天,也可以为7天等。
S106,对预测气象数据进行预处理。
具体地,采用相关系数法对预测气象数据对应的特征属性进行过滤;根据归一化处理公式对过滤后的预测气象数据进行归一化处理。
需要注意的是,对预测气象数据进行预处理和对日历史气象数据集进行预处理是一致的,以为了能得到相同数据属性的预测气象数据。具体对预测气象数据进行预处理的方式请参看对对日历史气象数据集进行预处理的方式,在此不再赘述。
S107,根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,如图4所示,根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据,即步骤S107包括S401-S404。
S401,获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据。
具体地,根据当天对应的气象数据,和前一天计算出的实际污染物浓度数据,即前一天的平均历史污染物浓度数据,用训练好的随机森林模型来预测当天的污染物浓度,得到后一天及后一天以后的未来若干天的预测污染物浓度数据。其中,需要注意的是,这里提到的当天对应的气象数据是经过预处理后的数据。如此,计算出最近L天的预测污染物浓度数据,其中,每天的预测污染物浓度数据对应有多个。其中,L的取值可以为7,也可以为其他合适的数据。
S402,根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,利用误差计算公式计算每棵决策树的预测误差,其中,误差计算公式为:
其中,MSN表示每棵树的预测误差,n表示每次预测的时间长度,单位是日,如当天预测未来三天的空气污染物浓度,那么n的值为3。yti为第t天利用随机森林模型预测得到的未来第i天的污染物浓度,yt'为第t天中根据实际监测的污染物浓度数据计算出的日平均历史污染物浓度数据。在最近L天中,每天可以预测的时间长度n不变,因此最近L天中每天的预测污染物浓度数据跟n有关。误差公式中考虑了当天预测未来n天中每天的预测误差,即预测误差中不仅考虑了当天预测未来第一天的误差,也考虑了当天预测未来第二天到第n天的误差。如此提高了计算预测误差的准确度,如此可以使后续与该预测误差相关的计算结果更加的准确。
S403,根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果。
根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据计算出的当天的平均历史污染物浓度数据,利用训练好的随机森林模型进行预测,每棵决策树对应有一个预测结果,那么多棵决策树会得到多个预测结果。
S404,选择预测误差小的对应决策树的预测结果作为待预测区域的未来预设天数的污染物浓度数据。
在另一实施例中,如图5所示,根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据,即步骤S107包括S501-S504。图5与图4实施例的区别在于:增加了步骤S503,以及S505的区别。
S503,将每棵决策树的预测误差进行归一化,以得到每棵决策树的权重。具体地,权重的计算公式按照如下公式:
其中,MSN表示每棵树的预测误差,P表示决策树的个数,vi表示过渡因子,ri表示每棵决策树的权重。
S505,根据每棵决策树的权重、每棵决策树对应的预测结果计算得到待预测区域的未来预设天数的污染物浓度数据。具体地,将每棵决策树的权重乘以每棵决策树未来预设天数中对应的预测结果得到待预测区域的未来预设天数中每天的污染物浓度数据。
在其他实施例中,当计算出每棵决策树未来预设天数中对应的预测结果后,也可以直接将每棵决策树对应的预测结果加权平均得到未来预设天数中每天对应的预测结果。
步骤S105-S107是进行预测的流程,可以对当前时间未来预设天数的空气污染物浓度数据进行预测。对预测的气象数据进行预处理,以提高气象数据的可信度以及与空气污染物浓度之间的关联度,再进行预测时,根据更准确的预测误差,使得预测的结果更加准确,进一步提高了随机森林模型的泛化能力。
需要注意的是,训练好的随机森林模型还需要再定期进行训练,以使新的数据可以反馈到该模型中,提高模型预测的准确度,提高模型的泛化能力。
图6是本发明实施例提供的一种终端的示意性框图。如图6所示,该终端60包括计算单元601、第一确定单元602、第一预处理单元603、训练单元604、第二确定单元605、第二预处理单元606、预测单元607。
计算单元601,用于根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集。
其中,在待预测的区域内会部署多个微型监测点,该多个微型监测点有多个污染物监测器,如PM2.5、PM10、O3等监测器。该多个微型监测点每隔预设时间如5分钟会监测污染物浓度数据,因此在每天中会有多个时间点都会有污染物浓度数据。需要注意的是,文中提到的污染物浓度数据指的是同一种污染物浓度数据。
在一实施例中,计算单元601包括第一获取单元、平均计算单元。其中,第一获取单元,用于获取待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集,其中,通常包括多年监测得到的污染物浓度数据;平均计算单元,用于对每天内多个时间点获取的数据进行处理得到多个时间点对应的污染物浓度数据,将多个时间点对应的污染物浓度数据进行平均得到日平均历史污染物浓度数据,重复计算以获得待预测的区域当前时间对应季节所有日期的日平均历史污染物浓度数据集。当前时间对应季节所有日期指的是对应季节中当前时间以及当前时间对应的日期。对区域污染物浓度数据进行处理得到日平均历史污染物浓度数据,可以降低一天中个别时间点的异常值的影响。
在一实施例中,如图7所示,平均计算单元70包括异常值处理单元701、网格化单元702、插值单元703、时间点计算单元704。
异常值处理单元701,用于对一个时间点对应的所有监测点的监测污染物浓度数据的异常值进行处理。
具体地,判断对应监测点的监测污染物浓度数据是否有缺失值、是否有极端值;若有缺失值,根据对应监测点的邻域监测点的平均值替代缺失值;若有极端值,采用对应污染物浓度数据的边界值替换;若邻域内无监测点,那么剔除对应监测点当前时间点对应的数据。其中,极端值可以理解为超过对应范围的值,如假设PM2.5的浓度范围为[0,500],单位为微克每立方米,那么极端值就是超过500的值、以及小于0的值,对应的PM2.5的边界值分别为0和500。若监测到PM2.5的值小于0,那么用PM2.5的边界值0替换;若监测到PM2.5的值大于500,那么用PM2.5的边界值500替换。其中邻域理解为距离对应监测点的距离小于K的所有点集合。K可以取3km,也可以取其他合适的值。
网格化单元702,用于对待预测的区域进行网格化得到多个网格单元。
其中,网格单元大小根据待预测区域面积大小进行设置,如可以设置为1km*1km。可以进行规则设置,也可以进行不规则的设置,如待预测区域内对应有大一片区域是森林,那么可以将森林的区域设置为一个网格单元。
插值单元703,用于利用插值算法计算多个网格单元对应网格区域的污染物浓度数据。可以理解为,每个网格单元中不一定都设置有监测点,因此对没有设置监测点的网格单元利用插值算法计算对应网格区域的污染物浓度数据,如此每个网格单元对应网格区域都有污染物浓度数据。其中,插值算法为克里金插值算法,也可以为其他合适的插值算法。
时间点计算单元704,用于计算多个网格单元对应网格区域的污染物浓度数据的平均值,得到所述待预测的区域当前时间点对应的污染物浓度数据。计算多个网格单元对应网格区域的污染物浓度数据的平均值,将该平均值作为待预测的区域当前时间点对应的污染物浓度数据。
平均计算单元70通过对一个时间点获取所有监测点的监测污染物浓度数据进行异常值处理,并对待预测的区域进行网格单元划分,并用插值算法计算每个网格单元对应区域的污染物浓度数据,对得到的每个网格单元对应区域的污染物浓度数据进行平均,以得到对应时间点的污染物浓度数据,如此提高了对应时间点的污染物浓度数据的准确度。
第一确定单元602,用于确定待预测的区域当前时间对应季节的日历史气象数据集。
日历史气象数据集包括但不限于以下气象因子:(1)气温:每日2时、8时、14时、20时的气温和每日2时、8时、14时、20时的变温,日平均气温,日最低气温,日最高气温,7时地表、700hpa、850hpa、925hpa的气温与各层的温差;(2)气压:每日2时、8时、14时、20时的气压和每日2时、8时、14时、20时的变压,日平均气压,日平均气压差;(3)湿度:每日2时、8时、14时、20时的相对湿度,日平均相对湿度;(4)风:主导风向、日平均风速、24小时风速变量;(5)其它:日平均降雨量、日平均云量、日平均光照强度。其中,每日8时的变温指的是前一天8时的温度减去当日8时的温度,日平均气温指的是每日2时、8时、14时、20时的气温的平均值,每日8时的变压指的是前一天8时的气压减去当日8时的气压,日平均气压差指的是一天里面最高气压减去最低气压的值。
第一预处理单元603,用于对日历史气象数据集进行预处理。
在一实施例中,如图8所示,第一预处理单元603包括过滤单元801、归一化单元802。
过滤单元801,用于采用相关系数法对日历史气象数据集对应的特征属性进行过滤。其中,日历史气象数据集对应的特征属性,可以理解为具体的气象因子,如2时气温、日平均气温、日最高气温等。通过计算日历史气象数据集中各特征属性与需要预测的污染物浓度的相关系数,根据相关系数来将对应的特征属性进行过滤。如皮尔逊相关系数,以相关系数0.2作为阀值,将小于该阀值则特征属性过滤掉,如此实现特征属性的初步过滤。可以理解地,日历史气象数据集中的某些特征属性对需要预测的污染物浓度没有影响、或者影响不大,那么可以将没有影响、或者影响不大对应的特征属性过滤,保留对污染物浓度有较大影响的特征属性。
归一化单元802,用于根据归一化处理公式对过滤后的日历史气象数据集进行归一化处理。对于过滤后的日历史气象数据集,为了避免不同量纲造成的尺度不一,需要将不同量纲得到的气象数据转化为相同量纲的气象数据。因此可对过滤后的日历史气象数据集进行归一化处理,归一化处理方法可以采用min-max标准化方法。其中,对应的标准化处理公式为:Y*=0.1+0.8*(Yi-Ymin)/(Ymax-Ymin),其中,Yi表示第i个特征属性的值,Ymax表示该特征属性对应的最大值,Ymin表示该特征属性对应的最小值,Y*表示该特征属性归一化后的值。
训练单元604,用于将日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用BP神经网络实现。
具体地,设置随机森林算法参数,如随机森林的数规模P、每棵决策树有放回的取样本数据的次数N、每个样本数据中提取特征属性的个数k等;对于每棵决策树:采用Bootstrap抽样法从归一化后的样本数据集中有放回的随机选择N个样本数据生成训练子集;从样本数据的特征属性集合中随机选择k个特征,按照选择的k个特征从训练子集中提取特征子空间训练集;初始化BP神经网络,输入特征子空间训练集进行单棵决策树的训练。重复以上每棵决策树的操作完成所有决策树的训练。
其中,每个样本数据中提取特征属性的个数k是在区间[4,m]中随机生成的,m为样本数据的特征属性集的维度。其中,P可以为100等。随机森林模型中单棵决策树采用BP神经网络算法实现,该BP神经网络算法的输入层个数采用生成的参数k,输出层为1,隐含层个数根据确定,其中,a在[1,10]中取值。初始化BP神经网络时,需要设置BP神经网络的终止条件、每次迭代允许的误差、最大监督次数等。其中,可以设置最大迭代次数为BP神经网络的终止条件,最大迭代次数可以为2000等。
以上计算单元601、第一确定单元602、第一预处理单元603、训练单元604通过计算日平均历史污染物浓度数据集以及对日历史气象数据的预处理,提高了样本数据的可靠性和准确度。再根据更准确和可靠的样本数据,利用随机森林模型进行训练,提高了模型的泛化能力。
完成了随机森林模型的训练,就可以使用训练出的随机森林模型来进行空气污染物浓度预测。
第二确定单元605,用于确定当前时间当天预测的未来预设天数的预测气象数据。其中,预测气象数据可以采用气象预测模式如WRF(The Weather Research andForecasting Model)等的预测结果得到。预设天数可以为1天,也可以为7天等。
第二预处理单元606,用于对预测气象数据进行预处理。具体地,第二预处理单元606,用于采用相关系数法对预测气象数据对应的特征属性进行过滤;根据归一化处理公式对过滤后的预测气象数据进行归一化处理。需要注意的是,对预测气象数据进行预处理和对日历史气象数据集进行预处理是一致的,以为了能得到相同数据属性的预测气象数据。具体对预测气象数据进行预处理的方式请参看对对日历史气象数据集进行预处理的方式,在此不再赘述。
预测单元607,用于根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,如图9所示,预测单元607包括第二获取单元901、第一误差计算单元902、第一预测结果单元903、第一结果确定单元904。
第二获取单元901,用于获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据。具体地,根据当天对应的气象数据,和前一天计算出的实际污染物浓度数据,即前一天的平均历史污染物浓度数据,用训练好的随机森林模型来预测当天的污染物浓度,得到后一天及后一天以后的未来若干天的预测污染物浓度数据。其中,需要注意的是,这里提到的当天对应的气象数据是经过预处理后的数据。如此,计算出最近L天的预测污染物浓度数据,其中,每天的预测污染物浓度数据对应有多个。其中,L的取值可以为7,也可以为其他合适的数据。
第一误差计算单元902,用于根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,利用误差计算公式计算每棵决策树的预测误差,其中,误差计算公式为:
其中,MSN表示每棵树的预测误差,n表示每次预测的时间长度,单位是日,如当天预测未来三天的空气污染物浓度,那么n的值为3。yti为第t天利用随机森林模型预测得到的未来第i天的污染物浓度,yt'为第t天中根据实际监测的污染物浓度数据计算出的日平均历史污染物浓度数据。在最近L天中,每天可以预测的时间长度n不变,因此最近L天中每天的预测污染物浓度数据跟n有关。误差公式中考虑了当天预测未来n天中每天的预测误差,即预测误差中不仅考虑了当天预测未来第一天的误差,也考虑了当天预测未来第二天到第n天的误差。如此提高了计算预测误差的准确度,如此可以使后续与该预测误差相关的计算结果更加的准确。
第一预测结果单元903,用于根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果。根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据计算出的当天的平均历史污染物浓度数据,利用训练好的随机森林模型进行预测,每棵决策树对应有一个预测结果,那么多棵决策树会得到多个预测结果。
第一结果确定单元904,用于选择预测误差小的对应决策树的预测结果作为待预测区域的未来预设天数的污染物浓度数据。
在另一实施例中,如图10所示,预测单元607包括第三获取单元101、第二误差计算单元102、权重计算单元103、第二预测结果单元104、第二结果确定单元105。其中,图10所示的实施例与图9所示的实施例的区别在于:增加了权重计算单元103,以及第二结果确定单元105的不同。第三获取单元101、第二误差计算单元102、第二预测结果单元104请参看图9所示的实施例相应的描述。
权重计算单元103,用于将每棵决策树的预测误差进行归一化,以得到每棵决策树的权重。具体地,权重的计算公式按照如下公式:
其中,MSN表示每棵树的预测误差,P表示决策树的个数,vi表示过渡因子,ri表示每棵决策树的权重。
第二结果确定单元105,用于根据每棵决策树的权重、每棵决策树对应的预测结果计算得到待预测区域的未来预设天数的污染物浓度数据。具体地,将每棵决策树的权重乘以每棵决策树未来预设天数中对应的预测结果得到待预测区域的未来预设天数中每天的污染物浓度数据。
在其他实施例中,当计算出每棵决策树未来预设天数中对应的预测结果后,也可以直接将每棵决策树对应的预测结果加权平均得到未来预设天数中每天对应的预测结果。
第二确定单元605、第二预处理单元606、预测单元607可以实现对当前时间未来预设天数的空气污染物浓度数据进行预测。通过对预测的气象数据进行预处理,以提高气象数据的可信度以及与空气污染物浓度之间的关联度,再进行预测时,根据更准确的预测误差,使得预测的结果更加准确,进一步提高了随机森林模型的泛化能力。
需要注意的是,训练好的随机森林模型还需要再定期进行训练,以使新的数据可以反馈到该模型中,提高模型预测的准确度,提高模型的泛化能力。
图11为本发明另一实施例提供的一种终端的示意性框图。该终端110包括包括一个或多个输入设备111、一个或多个输出设备112、一个或多个存储器113以及一个或多个处理器114,上述输入设备111、输出设备112、存储器113以及处理器114通过总线115连接。存储器113用于存储计算机程序,所述计算机程序包括程序指令,处理器114被配置用于调用存储器113存储的程序指令。其中,处理器114用于执行:
根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集;确定待预测的区域当前时间对应季节的日历史气象数据集;对日历史气象数据集进行预处理;将日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用多层前馈神经网络实现;确定当前时间当天预测的未来预设天数的预测气象数据;对预测气象数据进行预处理;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,处理器114在执行根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集时,具体执行:
获取待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集;对每天内多个时间点获取的数据进行处理得到多个时间点对应的污染物浓度数据,将多个时间点对应的污染物浓度数据进行平均得到日平均历史污染物浓度数据,重复计算以获得待预测的区域当前时间对应季节所有日期的日平均历史污染物浓度数据集。
在一实施例中,处理器114在执行对一个时间点获取的数据进行处理得到该时间点对应的污染物浓度数据时,具体执行:
对一个时间点对应的所有监测点的监测污染物浓度数据的异常值进行处理;对所述待预测的区域进行网格化得到多个网格单元;利用插值算法计算多个网格单元对应网格区域的污染物浓度数据;计算多个网格单元对应网格区域的污染物浓度数据的平均值,得到所述待预测的区域当前时间点对应的污染物浓度数据。
在一实施例中,处理器114在执行对日历史气象数据集进行预处理时,具体执行:
采用相关系数法对日历史气象数据集对应的特征属性进行过滤;根据归一化处理公式对过滤后的日历史气象数据集进行归一化处理,其中,归一化处理公式为:Y*=0.1+0.8*(Yi-Ymin)/(Ymax-Ymin),其中,Yi表示第i个特征属性的值,Ymax表示所述特征属性对应的最大值,Ymin表示所述特征属性对应的最小值,Y*表示所述特征属性归一化后的值。
在一实施例中,处理器114在执行根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据时,具体执行:
获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据;根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,利用误差计算公式计算每棵决策树的预测误差,其中,误差计算公式为:
其中,n表示每次预测的时间长度,yti为第t天利用随机森林模型预测得到的未来第i天的污染物浓度,yt'为第t天中根据实际监测的污染物浓度数据计算出的日平均历史污染物浓度数据;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果;选择预测误差小的对应决策树的预测结果作为待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,处理器114在执行根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据时,具体执行:
获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据;根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,计算每棵决策树的预测误差;将每棵决策树的预测误差进行归一化,以得到每棵决策树的权重;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果;根据每棵决策树的权重、每棵决策树对应的预测结果计算得到待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,处理器114还用于执行:确定当前时间当天预测的未来预设天数的预测气象数据,是通过气象预测模式来确定的。
应当理解,在本发明实施例中,所称处理器114可以是中央处理单元(CentralProcessing Unit,CPU),该处理器还可以是其他通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable GateArray,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
输入设备111可包括键盘、鼠标、声音输入装置、触摸式输入装置等。输出设备112可包括显示器、显示屏、触摸屏等。
该存储器113可以包括只读存储器和随机存取存储器,并向处理器114提供指令和数据。存储器113的一部分还可以包括非易失性随机存取存储器。例如,存储器113还可以存储设备类型的信息。
具体实现中,本发明实施例中所描述的输入设备111、输出设备112、处理器114可执行本发明实施例提供的光学指纹识别方法的所有实施例所描述的实现方式,也可执行本发明实施例所描述的终端的实现方式,在此不再赘述。
在本发明的另一实施例中提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时实现以下步骤:
根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集;确定待预测的区域当前时间对应季节的日历史气象数据集;对日历史气象数据集进行预处理;将日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用多层前馈神经网络实现;确定当前时间当天预测的未来预设天数的预测气象数据;对预测气象数据进行预处理;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,所述处理器在执行根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集时,具体实现:
获取待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集;对每天内多个时间点获取的数据进行处理得到多个时间点对应的污染物浓度数据,将多个时间点对应的污染物浓度数据进行平均得到日平均历史污染物浓度数据,重复计算以获得待预测的区域当前时间对应季节所有日期的日平均历史污染物浓度数据集。
在一实施例中,所述处理器在执行对一个时间点获取的数据进行处理得到该时间点对应的污染物浓度数据时,具体实现:
对一个时间点对应的所有监测点的监测污染物浓度数据的异常值进行处理;对所述待预测的区域进行网格化得到多个网格单元;利用插值算法计算多个网格单元对应网格区域的污染物浓度数据;计算多个网格单元对应网格区域的污染物浓度数据的平均值,得到所述待预测的区域当前时间点对应的污染物浓度数据。
在一实施例中,所述处理器在执行对日历史气象数据集进行预处理时,具体实现:
采用相关系数法对日历史气象数据集对应的特征属性进行过滤;根据归一化处理公式对过滤后的日历史气象数据集进行归一化处理,其中,归一化处理公式为:Y*=0.1+0.8*(Yi-Ymin)/(Ymax-Ymin),其中,Yi表示第i个特征属性的值,Ymax表示所述特征属性对应的最大值,Ymin表示所述特征属性对应的最小值,Y*表示所述特征属性归一化后的值。
在一实施例中,所述处理器在执行根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据时,具体实现:
获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据;根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,利用误差计算公式计算每棵决策树的预测误差,其中,误差计算公式为:
其中,n表示每次预测的时间长度,yti为第t天利用随机森林模型预测得到的未来第i天的污染物浓度,yt'为第t天中根据实际监测的污染物浓度数据计算出的日平均历史污染物浓度数据;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果;选择预测误差小的对应决策树的预测结果作为待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,所述处理器在执行根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据时,具体执行:
获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据;根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,计算每棵决策树的预测误差;将每棵决策树的预测误差进行归一化,以得到每棵决策树的权重;根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果;根据每棵决策树的权重、每棵决策树对应的预测结果计算得到待预测区域的未来预设天数的污染物浓度数据。
在一实施例中,所述处理器还执行:确定当前时间当天预测的未来预设天数的预测气象数据,是通过气象预测模式来确定的。
所述计算机可读存储介质可以是前述任一实施例所述的终端的内部存储单元,例如终端的硬盘或内存。所述计算机可读存储介质也可以是所述终端的外部存储设备,例如所述终端上配备的插接式硬盘,智能存储卡(SmartMedia Card,SMC),安全数字(SecureDigital,SD)卡等。进一步地,所述计算机可读存储介质还可以既包括所述终端的内部存储单元也包括外部存储设备。在本申请所提供的几个实施例中,应该理解到,所揭露的终端和方法,可以通过其它的方式实现。例如,以上所描述的终端实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,上述描述的终端和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

Claims (10)

1.一种区域空气污染物浓度预测方法,其特征在于,所述方法包括:
根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集;
确定待预测的区域当前时间对应季节的日历史气象数据集;
对日历史气象数据集进行预处理;
将日平均历史污染物浓度数据集和预处理后的日历史气象数据集作为样本数据集,利用随机森林模型进行训练,其中,随机森林模型包括有多棵决策树,每棵决策树使用多层前馈神经网络实现;
确定当前时间当天预测的未来预设天数的预测气象数据;
对预测气象数据进行预处理;
根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据。
2.根据权利要求1所述的方法,其特征在于,所述根据待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集计算得到日平均历史污染物浓度数据集,包括:
获取待预测的区域当前时间对应季节所有监测点的监测污染物浓度数据集;
对每天内多个时间点获取的数据进行处理得到多个时间点对应的污染物浓度数据,将多个时间点对应的污染物浓度数据进行平均得到日平均历史污染物浓度数据,重复计算以获得待预测的区域当前时间对应季节所有日期的日平均历史污染物浓度数据集。
3.根据权利要求2所述的方法,其特征在于,对一个时间点获取的数据进行处理得到该时间点对应的污染物浓度数据,包括:
对一个时间点对应的所有监测点的监测污染物浓度数据的异常值进行处理;
对所述待预测的区域进行网格化得到多个网格单元;
利用插值算法计算多个网格单元对应网格区域的污染物浓度数据;
计算多个网格单元对应网格区域的污染物浓度数据的平均值,得到所述待预测的区域当前时间点对应的污染物浓度数据。
4.根据权利要求1所述的方法,其特征在于,所述对日历史气象数据集进行预处理,包括:
采用相关系数法对日历史气象数据集对应的特征属性进行过滤;
根据归一化处理公式对过滤后的日历史气象数据集进行归一化处理,其中,归一化处理公式为:Y*=0.1+0.8*(Yi-Ymin)/(Ymax-Ymin),其中,Yi表示第i个特征属性的值,Ymax表示所述特征属性对应的最大值,Ymin表示所述特征属性对应的最小值,Y*表示所述特征属性归一化后的值。
5.根据权利要求1所述的方法,其特征在于,所述根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据,包括:
获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据;
根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,利用误差计算公式计算每棵决策树的预测误差,其中,误差计算公式为:
<mrow> <mi>M</mi> <mi>S</mi> <mi>N</mi> <mo>=</mo> <msqrt> <mrow> <mfrac> <mn>1</mn> <mrow> <mi>L</mi> <mo>*</mo> <mi>n</mi> </mrow> </mfrac> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>t</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>L</mi> </munderover> <munderover> <mo>&amp;Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>y</mi> <mrow> <mi>t</mi> <mi>i</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>y</mi> <mi>t</mi> <mo>&amp;prime;</mo> </msubsup> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow>
其中,n表示每次预测的时间长度,yti为第t天利用随机森林模型预测得到的未来第i天的污染物浓度,yt'为第t天中根据实际监测的污染物浓度数据计算出的日平均历史污染物浓度数据;
根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果;
选择预测误差小的对应决策树的预测结果作为待预测区域的未来预设天数的污染物浓度数据。
6.根据权利要求1所述的方法,其特征在于,所述根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型预测待预测区域的未来预设天数的污染物浓度数据,包括:
获取利用训练好的随机森林模型计算的最近L天的预测污染物浓度数据;
根据最近L天的预测污染物浓度数据与实际监测的污染物浓度数据,计算每棵决策树的预测误差;
将每棵决策树的预测误差进行归一化,以得到每棵决策树的权重;
根据预处理后的预测气象数据、当前时间当天监测的污染物浓度数据,利用训练好的随机森林模型进行预测,得到多棵决策树的预测结果;
根据每棵决策树的权重、每棵决策树对应的预测结果计算得到待预测区域的未来预设天数的污染物浓度数据。
7.根据权利要求1所述的方法,其特征在于,所述确定当前时间当天预测的未来预设天数的预测气象数据,是通过气象预测模式来确定的。
8.一种终端,其特征在于,所述终端包括用于执行如权利要求1-7任一权利要求所述的方法的单元。
9.一种终端,其特征在于,包括处理器、输入设备、输出设备和存储器,所述处理器、输入设备、输出设备和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指令,所述处理器被配置用于调用所述程序指令,执行如权利要求1-7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-7任一项所述的方法。
CN201711393032.2A 2017-12-21 2017-12-21 区域空气污染物浓度预测方法、终端及可读存储介质 Pending CN108053071A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711393032.2A CN108053071A (zh) 2017-12-21 2017-12-21 区域空气污染物浓度预测方法、终端及可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711393032.2A CN108053071A (zh) 2017-12-21 2017-12-21 区域空气污染物浓度预测方法、终端及可读存储介质

Publications (1)

Publication Number Publication Date
CN108053071A true CN108053071A (zh) 2018-05-18

Family

ID=62131227

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711393032.2A Pending CN108053071A (zh) 2017-12-21 2017-12-21 区域空气污染物浓度预测方法、终端及可读存储介质

Country Status (1)

Country Link
CN (1) CN108053071A (zh)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629980A (zh) * 2018-06-27 2018-10-09 石家庄铁道大学 一种通过控制交通流量改善空气质量的方法
CN108808671A (zh) * 2018-07-03 2018-11-13 南京信息工程大学 一种风电场短期风速集合预报方法
CN109034641A (zh) * 2018-08-10 2018-12-18 中国石油大学(北京) 管道缺陷预测方法及装置
CN109213839A (zh) * 2018-09-12 2019-01-15 北京英视睿达科技有限公司 基于网格化特征深度学习的热点网格污染物数据获取方法
CN109298136A (zh) * 2018-10-11 2019-02-01 北京大学 空气质量评价方法、装置、设备和存储介质
CN109543874A (zh) * 2018-10-12 2019-03-29 南京航空航天大学 一种结合气象条件影响的机场空气质量预测方法
CN109541730A (zh) * 2018-11-23 2019-03-29 长三角环境气象预报预警中心(上海市环境气象中心) 一种大气污染物浓度预测的方法及设备
CN109612895A (zh) * 2019-02-16 2019-04-12 新疆林科院森林生态研究所 一种城市森林环境中的空气质量监测方法
CN109934379A (zh) * 2019-01-21 2019-06-25 平安科技(深圳)有限公司 空气污染物浓度的预测方法、装置及电子设备
CN109946209A (zh) * 2019-03-13 2019-06-28 北京英视睿达科技有限公司 一种大气污染报警的方法及装置
CN109977185A (zh) * 2019-03-19 2019-07-05 深圳博沃智慧科技有限公司 基于网格的大气污染监管方法和***
CN110531029A (zh) * 2019-08-16 2019-12-03 北京慧辰资道资讯股份有限公司 一种基于环保物联网大数据预测空气质量趋势的装置
CN110610258A (zh) * 2019-08-20 2019-12-24 中国地质大学(武汉) 融合多源时空数据的城市空气质量精细化估测方法及装置
CN111144625A (zh) * 2019-12-10 2020-05-12 北京蛙鸣信息科技发展有限公司 基于邻近空间数据主成分要素的空气质量预测方法和***
CN111310970A (zh) * 2020-01-16 2020-06-19 集美大学 一种环境参数实时预测方法、终端设备及存储介质
CN111340288A (zh) * 2020-02-25 2020-06-26 武汉墨锦创意科技有限公司 一种顾及时空关联性的城市空气质量时序预测方法
CN111352926A (zh) * 2018-12-20 2020-06-30 北京沃东天骏信息技术有限公司 数据处理的方法、装置、设备及可读存储介质
CN111443163A (zh) * 2020-03-10 2020-07-24 中国科学院深圳先进技术研究院 一种臭氧缺失数据的插补方法、装置及插补设备
CN111507533A (zh) * 2020-04-22 2020-08-07 中科三清科技有限公司 空气污染物浓度预测方法、装置、电子设备及存储介质
CN111754042A (zh) * 2020-06-28 2020-10-09 成都佳华物链云科技有限公司 基于高斯回归的大气污染物浓度的预测方法及装置
CN111768038A (zh) * 2020-06-30 2020-10-13 平安国际智慧城市科技股份有限公司 污染物监控方法、装置、终端设备及存储介质
CN111832222A (zh) * 2020-06-28 2020-10-27 成都佳华物链云科技有限公司 一种污染物浓度的预测模型训练方法、预测方法及装置
CN112001520A (zh) * 2020-06-05 2020-11-27 上海眼控科技股份有限公司 天气预报方法、装置、计算机设备及存储介质
CN112800350A (zh) * 2021-02-04 2021-05-14 中科三清科技有限公司 实景日历控件生成方法、装置、电子设备、存储介质及实景日历
CN112950352A (zh) * 2021-02-08 2021-06-11 北京淇瑀信息科技有限公司 用户筛选策略生成方法、装置及电子设备
CN113283630A (zh) * 2021-04-09 2021-08-20 中科三清科技有限公司 空气质量预测方法、装置、设备和计算机可读存储介质
CN113888381A (zh) * 2021-09-24 2022-01-04 中科三清科技有限公司 污染物浓度预报方法及装置
CN114266200A (zh) * 2022-02-24 2022-04-01 山东大学 二氧化氮浓度预测方法及***
CN114689478A (zh) * 2022-04-08 2022-07-01 江苏锦测环保科技有限公司 一种空气质量检测装置及方法
CN115096374A (zh) * 2022-08-22 2022-09-23 中工重科智能装备有限责任公司 一种铸造中智能除尘预测补偿的方法及***
CN115237896A (zh) * 2022-07-12 2022-10-25 四川大学 一种基于深度学习预报空气质量的数据前处理方法及***
CN115270013A (zh) * 2022-09-22 2022-11-01 中科三清科技有限公司 评估活动期间减排措施的方法、装置及电子设备
CN115423148A (zh) * 2022-07-29 2022-12-02 江苏大学 一种基于克里金法和决策树的农机作业性能预测方法与装置
CN115526434A (zh) * 2022-11-07 2022-12-27 广东中思拓大数据研究院有限公司 对象信息预测方法、装置、计算机设备和存储介质
CN115878695A (zh) * 2023-02-20 2023-03-31 中国民用航空局空中交通管理局航空气象中心 一种基于气象数据库的数据可视化调整方法及***
CN117571976A (zh) * 2024-01-15 2024-02-20 深圳市恒义建筑技术有限公司 室内装修材料有害物质释放速率的测算方法及相关设备

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110212461A1 (en) * 2010-02-26 2011-09-01 Hans Marcus Ludwig Bitter Prediction of cardiotoxicity
CN104850734A (zh) * 2015-04-21 2015-08-19 武大吉奥信息技术有限公司 一种基于时空分布特征的空气质量指数预测方法
CN106019409A (zh) * 2016-05-11 2016-10-12 北京市环境保护监测中心 一种臭氧浓度的分区预测方法及***
CN106525678A (zh) * 2016-12-03 2017-03-22 安徽新华学院 一种基于地理位置的pm2.5浓度值的预测方法及装置
CN106599520A (zh) * 2016-12-31 2017-04-26 中国科学技术大学 一种基于lstm‑rnn模型的空气污染物浓度预报方法
CN106651100A (zh) * 2016-10-12 2017-05-10 华南理工大学 基于车联网优选车载监测点的空气质量评估***及方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20110212461A1 (en) * 2010-02-26 2011-09-01 Hans Marcus Ludwig Bitter Prediction of cardiotoxicity
CN104850734A (zh) * 2015-04-21 2015-08-19 武大吉奥信息技术有限公司 一种基于时空分布特征的空气质量指数预测方法
CN106019409A (zh) * 2016-05-11 2016-10-12 北京市环境保护监测中心 一种臭氧浓度的分区预测方法及***
CN106651100A (zh) * 2016-10-12 2017-05-10 华南理工大学 基于车联网优选车载监测点的空气质量评估***及方法
CN106525678A (zh) * 2016-12-03 2017-03-22 安徽新华学院 一种基于地理位置的pm2.5浓度值的预测方法及装置
CN106599520A (zh) * 2016-12-31 2017-04-26 中国科学技术大学 一种基于lstm‑rnn模型的空气污染物浓度预报方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
侯俊雄 等: "基于随机森林的PM2. 5实时预报***", 《测绘科学》 *
周丽峰: "基于非平衡数据分类的贷款违约预测研究", 《中国优秀硕士学位论文全文数据库(经济与管理科学辑)》 *
尹华: "面向高维和不平衡数据分类的集成学习研究", 《中国博士学位论文全文数据库(信息科技辑)》 *
林愿仪: "基于PSO-BP神经网络预测广州市日均PM10浓度", 《2015年(第四届)全国大学生统计建模大赛论文》 *

Cited By (54)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108629980A (zh) * 2018-06-27 2018-10-09 石家庄铁道大学 一种通过控制交通流量改善空气质量的方法
CN108629980B (zh) * 2018-06-27 2020-04-07 石家庄铁道大学 一种通过控制交通流量改善空气质量的方法
CN108808671A (zh) * 2018-07-03 2018-11-13 南京信息工程大学 一种风电场短期风速集合预报方法
CN109034641A (zh) * 2018-08-10 2018-12-18 中国石油大学(北京) 管道缺陷预测方法及装置
CN109213839A (zh) * 2018-09-12 2019-01-15 北京英视睿达科技有限公司 基于网格化特征深度学习的热点网格污染物数据获取方法
CN109298136B (zh) * 2018-10-11 2019-10-15 北京大学 空气质量评价方法、装置、设备和存储介质
CN109298136A (zh) * 2018-10-11 2019-02-01 北京大学 空气质量评价方法、装置、设备和存储介质
CN109543874A (zh) * 2018-10-12 2019-03-29 南京航空航天大学 一种结合气象条件影响的机场空气质量预测方法
CN109543874B (zh) * 2018-10-12 2021-06-22 南京航空航天大学 一种结合气象条件影响的机场空气质量预测方法
CN109541730A (zh) * 2018-11-23 2019-03-29 长三角环境气象预报预警中心(上海市环境气象中心) 一种大气污染物浓度预测的方法及设备
CN111352926A (zh) * 2018-12-20 2020-06-30 北京沃东天骏信息技术有限公司 数据处理的方法、装置、设备及可读存储介质
CN111352926B (zh) * 2018-12-20 2024-03-08 北京沃东天骏信息技术有限公司 数据处理的方法、装置、设备及可读存储介质
CN109934379A (zh) * 2019-01-21 2019-06-25 平安科技(深圳)有限公司 空气污染物浓度的预测方法、装置及电子设备
CN109612895A (zh) * 2019-02-16 2019-04-12 新疆林科院森林生态研究所 一种城市森林环境中的空气质量监测方法
CN109612895B (zh) * 2019-02-16 2021-02-23 新疆林科院森林生态研究所 一种城市森林环境中的空气质量监测方法
CN109946209A (zh) * 2019-03-13 2019-06-28 北京英视睿达科技有限公司 一种大气污染报警的方法及装置
CN109977185A (zh) * 2019-03-19 2019-07-05 深圳博沃智慧科技有限公司 基于网格的大气污染监管方法和***
CN110531029A (zh) * 2019-08-16 2019-12-03 北京慧辰资道资讯股份有限公司 一种基于环保物联网大数据预测空气质量趋势的装置
CN110531029B (zh) * 2019-08-16 2022-02-25 北京慧辰资道资讯股份有限公司 一种基于环保物联网大数据预测空气质量趋势的装置
CN110610258A (zh) * 2019-08-20 2019-12-24 中国地质大学(武汉) 融合多源时空数据的城市空气质量精细化估测方法及装置
CN110610258B (zh) * 2019-08-20 2022-05-10 中国地质大学(武汉) 融合多源时空数据的城市空气质量精细化估测方法及装置
CN111144625A (zh) * 2019-12-10 2020-05-12 北京蛙鸣信息科技发展有限公司 基于邻近空间数据主成分要素的空气质量预测方法和***
CN111310970A (zh) * 2020-01-16 2020-06-19 集美大学 一种环境参数实时预测方法、终端设备及存储介质
CN111340288B (zh) * 2020-02-25 2024-04-05 武汉墨锦创意科技有限公司 一种顾及时空关联性的城市空气质量时序预测方法
CN111340288A (zh) * 2020-02-25 2020-06-26 武汉墨锦创意科技有限公司 一种顾及时空关联性的城市空气质量时序预测方法
CN111443163A (zh) * 2020-03-10 2020-07-24 中国科学院深圳先进技术研究院 一种臭氧缺失数据的插补方法、装置及插补设备
WO2021179742A1 (zh) * 2020-03-10 2021-09-16 中国科学院深圳先进技术研究院 一种臭氧缺失数据的插补方法、装置及插补设备
CN111507533B (zh) * 2020-04-22 2021-03-19 中科三清科技有限公司 空气污染物浓度预测方法、装置、电子设备及存储介质
CN111507533A (zh) * 2020-04-22 2020-08-07 中科三清科技有限公司 空气污染物浓度预测方法、装置、电子设备及存储介质
CN112001520A (zh) * 2020-06-05 2020-11-27 上海眼控科技股份有限公司 天气预报方法、装置、计算机设备及存储介质
CN111832222A (zh) * 2020-06-28 2020-10-27 成都佳华物链云科技有限公司 一种污染物浓度的预测模型训练方法、预测方法及装置
CN111832222B (zh) * 2020-06-28 2023-07-25 成都佳华物链云科技有限公司 一种污染物浓度的预测模型训练方法、预测方法及装置
CN111754042A (zh) * 2020-06-28 2020-10-09 成都佳华物链云科技有限公司 基于高斯回归的大气污染物浓度的预测方法及装置
CN111768038A (zh) * 2020-06-30 2020-10-13 平安国际智慧城市科技股份有限公司 污染物监控方法、装置、终端设备及存储介质
CN111768038B (zh) * 2020-06-30 2023-02-03 平安国际智慧城市科技股份有限公司 污染物监控方法、装置、终端设备及存储介质
CN112800350A (zh) * 2021-02-04 2021-05-14 中科三清科技有限公司 实景日历控件生成方法、装置、电子设备、存储介质及实景日历
CN112950352A (zh) * 2021-02-08 2021-06-11 北京淇瑀信息科技有限公司 用户筛选策略生成方法、装置及电子设备
CN113283630A (zh) * 2021-04-09 2021-08-20 中科三清科技有限公司 空气质量预测方法、装置、设备和计算机可读存储介质
CN113888381A (zh) * 2021-09-24 2022-01-04 中科三清科技有限公司 污染物浓度预报方法及装置
CN113888381B (zh) * 2021-09-24 2023-08-29 中科三清科技有限公司 污染物浓度预报方法及装置
CN114266200B (zh) * 2022-02-24 2022-07-05 山东大学 二氧化氮浓度预测方法及***
CN114266200A (zh) * 2022-02-24 2022-04-01 山东大学 二氧化氮浓度预测方法及***
CN114689478A (zh) * 2022-04-08 2022-07-01 江苏锦测环保科技有限公司 一种空气质量检测装置及方法
CN115237896A (zh) * 2022-07-12 2022-10-25 四川大学 一种基于深度学习预报空气质量的数据前处理方法及***
CN115237896B (zh) * 2022-07-12 2023-07-11 四川大学 一种基于深度学习预报空气质量的数据前处理方法及***
CN115423148A (zh) * 2022-07-29 2022-12-02 江苏大学 一种基于克里金法和决策树的农机作业性能预测方法与装置
CN115423148B (zh) * 2022-07-29 2023-10-31 江苏大学 一种基于克里金法和决策树的农机作业性能预测方法与装置
CN115096374B (zh) * 2022-08-22 2022-11-11 中工重科智能装备有限责任公司 一种铸造中智能除尘预测补偿的方法及***
CN115096374A (zh) * 2022-08-22 2022-09-23 中工重科智能装备有限责任公司 一种铸造中智能除尘预测补偿的方法及***
CN115270013A (zh) * 2022-09-22 2022-11-01 中科三清科技有限公司 评估活动期间减排措施的方法、装置及电子设备
CN115270013B (zh) * 2022-09-22 2022-12-20 中科三清科技有限公司 评估活动期间减排措施的方法、装置及电子设备
CN115526434A (zh) * 2022-11-07 2022-12-27 广东中思拓大数据研究院有限公司 对象信息预测方法、装置、计算机设备和存储介质
CN115878695A (zh) * 2023-02-20 2023-03-31 中国民用航空局空中交通管理局航空气象中心 一种基于气象数据库的数据可视化调整方法及***
CN117571976A (zh) * 2024-01-15 2024-02-20 深圳市恒义建筑技术有限公司 室内装修材料有害物质释放速率的测算方法及相关设备

Similar Documents

Publication Publication Date Title
CN108053071A (zh) 区域空气污染物浓度预测方法、终端及可读存储介质
Yafouz et al. Hybrid deep learning model for ozone concentration prediction: comprehensive evaluation and comparison with various machine and deep learning algorithms
CN112765808B (zh) 一种生态干旱的监测与评估方法
Hosseini et al. A data fusion-based methodology for optimal redesign of groundwater monitoring networks
Mateu et al. Spatio-temporal design: Advances in efficient data acquisition
CN108846503B (zh) 一种基于神经网络的呼吸***疾病患病人次动态预测方法
Chen Logistic models of fractal dimension growth of urban morphology
CN101853290A (zh) 基于地理信息***的气象服务效益评估方法
Fan et al. Development of PCA-based cluster quantile regression (PCA-CQR) framework for streamflow prediction: Application to the Xiangxi river watershed, China
CN107423857B (zh) 一种区域长期来水多目标联合概率预测方法
Mahajan et al. An empirical study of PM2. 5 forecasting using neural network
Chen et al. An adaptive Kalman filtering approach to sensing and predicting air quality index values
Beuchat et al. A robust framework for probabilistic precipitations downscaling from an ensemble of climate predictions applied to Switzerland
Tanaka et al. Refining coarse-grained spatial data using auxiliary spatial data sets with various granularities
Sahraei et al. Application of machine learning models to predict maximum event water fractions in streamflow
Song et al. Evaluating the performance of climate models in reproducing the hydrological characteristics of rainfall events
Richards et al. Regression modelling of spatiotemporal extreme US wildfires via partially-interpretable neural networks
Bonakdari et al. Stochastic modeling: A thorough guide to evaluate, pre-process, model and compare time series with MATLAB software
Başakın et al. Developing a novel approach for missing data imputation of solar radiation: A hybrid differential evolution algorithm based eXtreme gradient boosting model
Richards et al. A unifying partially-interpretable framework for neural network-based extreme quantile regression
Han et al. Developing a multi-objective simulation-optimization model for ecological water conveyance in arid inland river basins
Raja et al. Drought prediction and validation for desert region using machine learning methods
Gelfand et al. Combining monitoring data and computer model output in assessing environmental exposure
CN106844948B (zh) 滑坡预测方法和装置
Vitolo Exploring data mining for hydrological modelling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180518