CN113077089B - 一种多因素对空气质量影响的评价方法和装置 - Google Patents
一种多因素对空气质量影响的评价方法和装置 Download PDFInfo
- Publication number
- CN113077089B CN113077089B CN202110379858.3A CN202110379858A CN113077089B CN 113077089 B CN113077089 B CN 113077089B CN 202110379858 A CN202110379858 A CN 202110379858A CN 113077089 B CN113077089 B CN 113077089B
- Authority
- CN
- China
- Prior art keywords
- air quality
- road
- data
- road network
- wind direction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 238000012544 monitoring process Methods 0.000 claims abstract description 66
- 239000000203 mixture Substances 0.000 claims abstract description 43
- 238000011156 evaluation Methods 0.000 claims abstract description 23
- 238000007781 pre-processing Methods 0.000 claims abstract description 14
- 239000000809 air pollutant Substances 0.000 claims description 12
- 231100001243 air pollutant Toxicity 0.000 claims description 12
- 238000012360 testing method Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 7
- 238000013138 pruning Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 230000001502 supplementing effect Effects 0.000 claims description 3
- 238000000605 extraction Methods 0.000 description 5
- 238000004445 quantitative analysis Methods 0.000 description 5
- 238000011160 research Methods 0.000 description 4
- 238000012512 characterization method Methods 0.000 description 3
- JCXJVPUVTGWSNB-UHFFFAOYSA-N nitrogen dioxide Inorganic materials O=[N]=O JCXJVPUVTGWSNB-UHFFFAOYSA-N 0.000 description 3
- 238000012549 training Methods 0.000 description 3
- 238000012935 Averaging Methods 0.000 description 2
- 238000003915 air pollution Methods 0.000 description 2
- 239000000356 contaminant Substances 0.000 description 2
- 238000010219 correlation analysis Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- MGWGWNFMUOTEHG-UHFFFAOYSA-N 4-(3,5-dimethylphenyl)-1,3-thiazol-2-amine Chemical compound CC1=CC(C)=CC(C=2N=C(N)SC=2)=C1 MGWGWNFMUOTEHG-UHFFFAOYSA-N 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Human Resources & Organizations (AREA)
- Economics (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Databases & Information Systems (AREA)
- Operations Research (AREA)
- Entrepreneurship & Innovation (AREA)
- Remote Sensing (AREA)
- Game Theory and Decision Science (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Educational Administration (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明提供一种多因素对空气质量影响的评价方法和装置,所述方法包括:获取路网地理信息数据、路网交通流量数据、风向数据和空气质量数据;根据路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系;根据位置关系,对数据进行预处理,构建数据集;利用关联规则算法,设定最小支持度和最小置信度,迭代计算支持度和置信度,获得强关联规则;选择合适的强关联规则,输出对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果。本发明对影响空气质量的多因素进行定量分析,获得不同路网道路组成、不同交通流量在不同风向环境下对空气质量影响的评价结果,为改善空气质量提供理论基础。
Description
技术领域
本发明涉及计算机大数据处理的技术领域,更具体地,涉及一种多因素对空气质量影响的评价方法和装置。
背景技术
目前,机动车污染成为我国空气污染的重要来源。而空气污染是一种复杂的动态现象,会受到许多因素的影响:不同的气象条件会影响空气污染物的分布,机动车排放、工矿企业等也会直接影响空气质量。因此,要改善空气质量就需要对影响空气质量的多方面影响因素进行研究评价。空气质量在不同空间尺度的研究主要表现在:小尺度的道路交通范围、中尺度的城市区域范围和大尺度的全球范围。道路交通范围的空气质量主要受到机动车尾气排放、气象等因素的影响;城市区域范围的空气质量状况受到城市发展、城市气象和城市人口数量等因素的影响;全球范围的空气质量则是聚焦在全球气候的变化的影响。交通信息与气象因子对空气质量影响的研究发现,目前采用的方法大都是相关性的分析,虽然可以直观的从相关性系数知道哪方面因素与空气质量的关联度最高,但由于没有定量分析,不能反映深层次的关系,更无法得知数据之间存在何种关联关系;并且对于复杂的道路交通***,研究因素单一会造成巨大误差,而路网结构组成不同也会对空气在质量存在较大的影响;因此需要从多角度研究影响空气质量的因素。
2019年12月20日公开的中国专利CN110598953A提供了一种时空相关的空气质量预测方法,该发明将城市划分成大小相同的网格,每个网格受相邻区域网格影响,按照网格内是否有空气监测站分为预测区域和估计区域;获取影响空气质量数据相关时序数据,对时序数据采用循环神经网络和空间深度学习进行特征提取,进行时序模型训练。获取影响空气质量数据相关非时序数据,对非时序数据采用卷积神经网络进行特征提取,进行空间模型训练;该方法对影响空气质量数据相关的时序数据和非时序数据进行特征提取,利用提取结果对模型训练,进而对空气质量进行预测估计。该方法对空气质量进行预测估计时前,数据需要经过特征提取过程,属于相关性的分析,虽然可以直观的从相关性系数知道哪方面因素与空气质量的关联度最高,但由于没有定量分析,不能反映深层次的关系,对空气质量的预测估计不准确。
发明内容
本发明为克服上述现有技术对空气质量影响因素研究单一,缺乏定量分析,无法反映多因素与空气质量的深层次关系,具有对空气质量评价、预测不准确的缺陷,提供一种多因素对空气质量影响的评价方法和装置,综合考虑了路网地理信息、路网交通流量和风向对空气质量的影响,并对其进行定量分析,获得不同路网道路组成、不同交通流量在不同风向环境下对空气质量影响的评价结果,对空气质量的评价、预测更加准确。
为解决上述技术问题,本发明的技术方案如下:
本发明提供一种多因素对空气质量影响的评价方法,所述方法包括以下步骤:
S1:获取试验区域内路网地理信息数据、路网交通流量数据、风向数据和空气质量监测站监测的空气质量数据;
S2:根据所述路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系;
S3:根据所述位置关系,对路网交通流量数据、路网道路组成、风向数据和的空气质量数据进行预处理,将预处理后的数据作为数据集的元素,构建数据集;
S4:设定最小支持度和最小置信度,利用关联规则算法迭代计算数据集中元素的支持度和置信度,保留所有置信度大于最小置信度的元素,获得强关联规则;所述强关联规则包括规则前项和规则后项;
S5:确定强关联规则,所述强关联规则的规则前项为不同路网道路组成、不同交通流量和不同风向,规则后项为空气质量,输出该项强关联规则对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果。
优选地,所述试验区域是以空气质量监测站为中心,预设公里数为半径的区域;所述路网地理信息数据、路网交通流量数据、风向数据和空气质量数据是以日为统计间隔,以小时为统计间隔内的具体间隔尺度获得的监测数据。
优选地,所述路网地理信息数据包括路网道路组成的经纬度、空气质量监测站的经纬度、道路名称、路段ID和道路长度;所述路网交通流量数据包括道路名称、流量、车型和行驶方向;所述空气质量数据包括空气质量监测站点编号、空气质量指数、空气质量等级和空气污染物浓度。
优选地,获取路网道路组成和空气质量监测站的位置关系的具体方法为:
将路网道路组成和空气质量监测站的经纬度进行投影转化,获得路网道路组成在投影坐标系中的折点坐标P1(x1,y1),…,Pn(xn,yn)和空气质量监测站在投影坐标系中的位置坐标Ps(xs,ys);
计算相邻的两个折点间距离,记为d1,…,dn-1;依次累加两个折点间距离,每当距离和大于距离阈值dm时,划定一个间隔点,获得路段link1,2,...,以及每个路段的起始点坐标Pa(xa,ya)和末尾点坐标Pb(xb,yb);
计算每个路段的中点坐标Pc(xc,yc),设定基准线,计算每个路段与空气质量监测站位置的夹角α1,2,...和距离L1,2,...;计算每个路段自身的夹角β1,2,...;计算实时风向与空气质量监测站的夹角γ1,2,...。
上述路网道路组成和空气质量监测站的位置关系是下一步对数据预处理的基础。
优选地,所述路段的中点坐标Pc的计算方法为:
其中,xc,yc分别为路段的中点在投影坐标系中的横坐标和纵坐标;xa,ya分别为路段的起始点在投影坐标系中的横坐标和纵坐标;xb,yb分别为路段的起末尾点在投影坐标系中的横坐标和纵坐标。
优选地,路段与空气质量监测站位置的距离的计算方法为:
其中,xc,yc分别为路段的中点在投影坐标系中的横坐标和纵坐标;xs,ys分别空气质量监测站在投影坐标系中的横坐标和纵坐标。
优选地,所述对路网交通流量数据、路网道路组成、风向数据和的空气质量数据预处理包括:
对部分路段缺失小时流量数据进行补充:对路段小时断面流量求均值,获得道路小时流量值;再对同一类型道路的道路小时流量求均值,得到不同道路类型的交通流小时数据;
对路网道路组成、风向数据和空气质量数据进行离散化:
设置基准线为参考,以风向的8个方位为标准进行分类,分类标准为:NE[0° 45°]、EN[45° 90°]、ES[90° 135°]、SE[135° 180°]、SW[180° 225°]、WS[225° 270°]、WN[270°315°]、NW[315° 360°],其中区间为风向与基准线的夹角范围,风向与基准线的夹角落在相应区间内,就将该风向归为的相应风向方位;
设置基准线为参考,以路段link1,2,...与空气质量监测站位置的夹角α1,2,...和路段link1,2,...自身的夹角β1,2,...为标准进行分类,区间与风向分类的区间保持一致;
路段link1,2,...与空气质量监测站位置的距离L1,2,...远近属性进行分类;
路段的小时流量数据和空气污染物浓度按照等深分箱的聚类方法进行分类,分类标准按照聚类方法预设的区间个数,把持每个区间内的数据数量一致。
优选地,获得强关联规则的具体方法为:
S4.1:扫描经数据离散化的数据集,对每个元素进行计数,获得候选集C1;
S4.2:计算候选集C1中元素的支持度,根据预设的最小支持度,对候选集C1进行剪枝,保留支持度大于最小支持度的元素,得到频繁1项集L1;
S4.3:对频繁1项集L1进行连接,得到候选集C2;再次扫描经数据离散化的数据集,对候选集C2中的元素进行计数,计算候选集C2中元素的支持度,剪枝保留支持度大于最小支持度的元素,得到频繁2项集L2;
S4.4:重复连接、扫描、计数、计算支持度和剪枝操作,直到找不到频繁n项集;
S4.5:计算所有频繁项集中元素的置信度,将置信度大于最小置信度的元素作为强关联规则。
优选地,所述S5中,评价结果具体为:置信度越高,该项强关联规则中的前项因素与空气污染物的关联性越强。置信度属于定量表征规则的效果,能够反映出多种因素与空气质量的深层次关系。
本发明还提供一种多因素对空气质量影响的评价装置,所述装置包括:
数据获取模块,用于获取试验区域内路网地理信息数据、路网交通流量数据、风向数据和空气质量监测站监测的空气质量数据;
运算模块,根据所述路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系;
预处理模块,对路网交通流量数据、路网道路组成、风向数据和的空气质量数据进行预处理,将预处理后的数据作为数据集的元素,构建数据集;
关联规则模块,设定最小支持度和最小置信度,利用关联规则算法迭代计算数据集中元素的支持度和置信度,保留所有置信度大于最小置信度的元素,获得强关联规则;
评价生成模块,确定强关联规则,所述强关联规则的规则前项为不同路网道路组成、不同交通流量和不同风向,规则后项为空气质量,输出该项强关联规则对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果。
与现有技术相比,本发明技术方案的有益效果是:
本发明收集试验区域内路网地理信息数据、路网交通流量数据、风向数据和空气质量监测站监测的空气质量数据,数据基础丰富,从多角度研究影响空气质量的因素;基于路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系,作为对数据预处理的基础;根据位置关系,将预处理后的数据作为数据集的元素,构建数据集;设定最小支持度和最小置信度;迭代计算元素的支持度和置信度,保留所有置信度大于最小置信度的元素,获得强关联规则;选择规则前项为不同路网道路组成、不同交通流量和不同风向,规则后项为空气质量的强关联规则,输出该项强关联规则对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果;将置信度作为评价结果输出,实现了对空气质量影响因素的定量分析,反映出多种因素与空气质量的深层次关系。本发明有效挖掘出路网地理信息数据、路网交通流量数据、风向数据和空气质量数据之间的关联关系,对影响空气质量的多因素进行定量分析,可以获得不同路网道路组成、不同交通流量在不同风向环境下对空气质量影响的评价结果,为改善空气质量提供理论基础。
附图说明
图1为实施例1所述的一种多因素对空气质量影响的评价方法的流程图;
图2为实施例1所述的强关联规则输出的对空气质量影响的评价结果显示图;
图3为实施例2所述的一种多因素对空气质量影响的评价装置的示意图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
本发明提供一种多因素对空气质量影响的评价方法,如图1所示,所述方法包括以下步骤:
S1:获取试验区域内路网地理信息数据、路网交通流量数据、风向数据和空气质量监测站监测的空气质量数据;
所述试验区域是以空气质量监测站为中心,预设公里数为半径的区域,本实施例中,预设公里数为1公里;所述路网交通流量数据包括道路名称、流量、车型和行驶方向;所述空气质量数据包括空气质量监测站点编号、空气质量指数、空气质量等级和空气污染物浓度;
所述路网地理信息数据包括路网道路组成的经纬度、空气质量监测站的经纬度、道路名称、路段ID和道路长度;所述路网交通流量数据包括道路名称、流量、车型和行驶方向;所述空气质量数据包括空气质量监测站点编号、空气质量指数、空气质量等级和空气污染物浓度;本实施例中,所述空气污染物浓度具体为二氧化氮浓度和PM2.5浓度。
S2:根据所述路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系;
将路网道路组成和空气质量监测站的经纬度进行投影转化,利用python编程读取路网地理信息arcgis的shp文件,获得路网道路组成在投影坐标系中的折点坐标P1(x1,y1),…,Pn(xn,yn)和空气质量监测站在投影坐标系中的位置坐标Ps(xs,ys),并记录每个折点所属的道路名称和路段ID;
计算相邻的两个折点间距离,记为d1,…,dn-1;依次累加两个折点间距离,每当距离和大于距离阈值dm时,划定一个间隔点,获得路段link1,2,...,以及每个路段的起始点坐标Pa(xa,ya)和末尾点坐标Pb(xb,yb);本实施例中距离阈值dm=500m。
以正北0°为基准线,将路段中点与空气质量监测站的夹角和距离作为该路段与空气质量监测站的夹角和距离,计算夹角α的方法具体为:路段中点的坐标为Pc(xc,yc),空气质量监测站的坐标为Ps(xs,ys),则路段中点到空气质量检测站的向量坐标为Pcs(xc-xs,yc-ys),则
当xc-xs>0时,α=90°;当xc-xs<0时,α=270°;
路段与空气质量监测站位置的距离的计算方法为:
其中,xc,yc分别为路段的中点在投影坐标系中的横坐标和纵坐标;xs,ys分别空气质量监测站在投影坐标系中的横坐标和纵坐标。
每个路段自身的夹角:
其中,xa,ya分别为路段的起始点在投影坐标系中的横坐标和纵坐标;xb,yb分别为路段的末尾点在投影坐标系中的横坐标和纵坐标。
以正北0°为基准线,求风向与监测站的夹角γ1...n。
S3:根据所述位置关系,对路网交通流量数据、路网道路组成、风向数据和的空气质量数据进行预处理,将预处理后的数据作为数据集的元素,构建数据集;所述预处理包括:
对部分路段缺失小时流量数据进行补充:对路段小时断面流量求均值,获得道路小时流量值;再对同一类型道路的道路小时流量求均值,得到不同道路类型的交通流小时数据;
对路网道路组成、风向数据和空气质量数据进行离散化:
设置基准线为参考,以风向的8个方位为标准进行分类,分类标准为:NE[0° 45°]、EN[45° 90°]、ES[90° 135°]、SE[135° 180°]、SW[180° 225°]、WS[225° 270°]、WN[270°315°]、NW[315° 360°],其中区间为风向与基准线的夹角范围,风向与基准线的夹角落在相应区间内,就将该风向归为的相应风向方位;
设置基准线为参考,以路段link1,2,...与空气质量监测站位置的夹角α1,2,...和路段link1,2,...自身的夹角β1,2,...为标准进行分类,区间与风向分类的区间保持一致;
路段link1,2,...与空气质量监测站位置的距离L1,2,...远近属性进行分类;
路段的小时流量数据和空气污染物浓度按照等深分箱的聚类方法进行分类,分类标准按照聚类方法预设的区间个数,把持每个区间内的数据数量一致。
S4:设定最小支持度和最小置信度,利用关联规则算法迭代计算数据集中元素的支持度和置信度,保留所有置信度大于最小置信度的元素,获得强关联规则;所述强关联规则包括规则前项和规则后项;
基于python编程条件下采用apriori算法,设置最小支持度和最小置信度,数据集中的元素作为apriori算法的输入,进行以下步骤获得强关联规则:
S4.1:扫描经数据离散化的数据集,对每个元素进行计数,获得候选集C1;
S4.2:计算候选集C1中元素的支持度,根据预设的最小支持度,对候选集C1进行剪枝,保留支持度大于最小支持度的元素,得到频繁1项集L1;
S4.3:对频繁1项集L1进行连接,得到候选集C2;再次扫描经数据离散化的数据集,对候选集C2中的元素进行计数,计算候选集C2中元素的支持度,剪枝保留支持度大于最小支持度的元素,得到频繁2项集L2;
S4.4:重复连接、扫描、计数、计算支持度和剪枝操作,直到找不到频繁n项集;
S4.5:计算所有频繁项集中元素的置信度,将置信度大于最小置信度的元素作为强关联规则。
S5:确定强关联规则,所述强关联规则的规则前项为不同路网道路组成、不同交通流量和不同风向,规则后项为空气质量,输出该项强关联规则对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果。评价结果具体为:置信度越高,该项强关联规则中的前项因素与空气污染物的关联性越强。置信度属于定量表征规则的效果,能够反映出多种因素与空气质量的深层次关系。
如图2所示,箭头标识符的左侧为强关联规则前项,是离散后的风向数据、路网交通流量数据和路网地理信息数据;箭头标识符的右侧为强关联规则后项,是离散后的空气污染物浓度数据;conf为置信度,属于定量表征规则的效果,数字表示百分比,数值越大,关联性越强。从图中可知,当路段处于空气质量监测站以北方位时,有76.9%的可能性,NO2浓度达到第六级别。此时当路段link1和link2距离空气质量监测站较近,距离标识分别为K1和K2、路段link2的交通流量为第三级别hb3,风向为北偏西风NW时,说明路段link2处于靠近空气质量监测站的位置,在交通流量的增加与风向的推动下,对空气污染物起到扩散作用。
实施例2
本实施例提供一种多因素对空气质量影响的评价装置,如图3所示,所述装置包括:
数据获取模块,用于获取试验区域内路网地理信息数据、路网交通流量数据、风向数据和空气质量监测站监测的空气质量数据;
运算模块,根据所述路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系;
预处理模块,对路网交通流量数据、路网道路组成、风向数据和的空气质量数据进行预处理,将预处理后的数据作为数据集的元素,构建数据集;
关联规则模块,设定最小支持度和最小置信度,利用关联规则算法迭代计算数据集中元素的支持度和置信度,保留所有置信度大于最小置信度的元素,获得强关联规则;
评价生成模块,确定强关联规则,所述强关联规则的规则前项为不同路网道路组成、不同交通流量和不同风向,规则后项为空气质量,输出该项强关联规则对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (8)
1.一种多因素对空气质量影响的评价方法,其特征在于,所述方法包括以下步骤:
S1:获取试验区域内路网地理信息数据、路网交通流量数据、风向数据和空气质量监测站监测的空气质量数据;
S2:根据所述路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系;
所述路网地理信息数据包括路网道路组成的经纬度、空气质量监测站的经纬度、道路名称、路段ID和道路长度;所述路网交通流量数据包括道路名称、流量、车型和行驶方向;所述空气质量数据包括空气质量监测站点编号、空气质量指数、空气质量等级和空气污染物浓度;
获得路网道路组成和空气质量监测站的位置关系的具体方法为:
将路网道路组成和空气质量监测站的经纬度进行投影转化,获得路网道路组成在投影坐标系中的折点坐标P1(x1,y1),…,Pn(xn,yn)和空气质量监测站在投影坐标系中的位置坐标Ps(xs,ys);
计算相邻的两个折点间距离,记为d1,…,dn-1;依次累加两个折点间距离,每当距离和大于距离阈值dm时,划定一个间隔点,获得路段link1,2,...,以及每个路段的起始点坐标Pa(xa,ya)和末尾点坐标Pb(xb,yb);
计算每个路段的中点坐标Pc(xc,yc),设定基准线,计算每个路段与空气质量监测站位置的夹角α1,2,...和距离D1,2,...;计算每个路段自身的夹角β1,2,...;计算实时风向与空气质量监测站的夹角γ1,2,...;
S3:根据所述位置关系,对路网交通流量数据、路网道路组成、风向数据和空气质量数据进行预处理,将预处理后的数据作为数据集的元素,构建数据集;
S4:设定最小支持度和最小置信度,利用关联规则算法迭代计算数据集中元素的支持度和置信度,保留所有置信度大于最小置信度的元素,获得强关联规则;所述强关联规则包括规则前项和规则后项;
S5:确定强关联规则,所述强关联规则的规则前项为不同路网道路组成、不同交通流量和不同风向,规则后项为空气质量,输出该项强关联规则对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果。
2.根据权利要求1所述的多因素对空气质量影响的评价方法,其特征在于,所述试验区域是以空气质量监测站为中心、以预设公里数为半径的区域;所述路网地理信息数据、路网交通流量数据、风向数据和空气质量数据是以日为统计间隔,以小时为统计间隔内的具体间隔尺度获得的监测数据。
5.根据权利要求4所述的多因素对空气质量影响的评价方法,其特征在于,所述对路网交通流量数据、路网道路组成、风向数据和空气质量数据预处理包括:对缺失小时流量数据的部分路段进行补充和对路网道路组成、风向数据和空气质量数据离散化。
6.根据权利要求5所述的多因素对空气质量影响的评价方法,其特征在于,获得强关联规则的具体方法为:
S4.1:扫描经数据离散化的数据集,对每个元素进行计数,获得候选集C1;
S4.2:计算候选集C1中元素的支持度,根据预设的最小支持度,对候选集C1进行剪枝,保留支持度大于最小支持度的元素,得到频繁1项集L1;
S4.3:对频繁1项集L1进行连接,得到候选集C2;再次扫描经数据离散化的数据集,对候选集C2中的元素进行计数,计算候选集C2中元素的支持度,剪枝保留支持度大于最小支持度的元素,得到频繁2项集L2;
S4.4:重复连接、扫描、计数、计算支持度和剪枝操作,直到找不到频繁n项集;
S4.5:计算所有频繁项集中元素的置信度,将置信度大于最小置信度的元素作为强关联规则。
7.根据权利要求6所述的多因素对空气质量影响的评价方法,其特征在于,所述S5中,评价结果具体为:置信度越高,该项强关联规则中的前项因素与空气污染物的关联性越强。
8.一种多因素对空气质量影响的评价装置,其特征在于,所述装置包括:
数据获取模块,用于获取试验区域内路网地理信息数据、路网交通流量数据、风向数据和空气质量监测站监测的空气质量数据;
运算模块,根据所述路网地理信息数据,获取路网道路组成、风向数据和空气质量监测站的位置关系;
所述路网地理信息数据包括路网道路组成的经纬度、空气质量监测站的经纬度、道路名称、路段ID和道路长度;所述路网交通流量数据包括道路名称、流量、车型和行驶方向;所述空气质量数据包括空气质量监测站点编号、空气质量指数、空气质量等级和空气污染物浓度;
获得路网道路组成和空气质量监测站的位置关系的具体方法为:
将路网道路组成和空气质量监测站的经纬度进行投影转化,获得路网道路组成在投影坐标系中的折点坐标P1(x1,y1),…,Pn(xn,yn)和空气质量监测站在投影坐标系中的位置坐标Ps(xs,ys);
计算相邻的两个折点间距离,记为d1,…,dn-1;依次累加两个折点间距离,每当距离和大于距离阈值dm时,划定一个间隔点,获得路段link1,2,...,以及每个路段的起始点坐标Pa(xa,ya)和末尾点坐标Pb(xb,yb);
计算每个路段的中点坐标Pc(xc,yc),设定基准线,计算每个路段与空气质量监测站位置的夹角α1,2,…和距离D1,2,...;计算每个路段自身的夹角β1,2,...;计算实时风向与空气质量监测站的夹角γ1,2,...;
预处理模块,对路网交通流量数据、路网道路组成、风向数据和空气质量数据进行预处理,将预处理后的数据作为数据集的元素,构建数据集;
关联规则模块,设定最小支持度和最小置信度,利用关联规则算法迭代计算数据集中元素的支持度和置信度,保留所有置信度大于最小置信度的元素,获得强关联规则;
评价生成模块,确定强关联规则,所述强关联规则的规则前项为不同路网道路组成、不同交通流量和不同风向,规则后项为空气质量,输出该项强关联规则对应的置信度作为不同路网道路组成、不同交通流量在不同风向环境下,对空气质量影响的评价结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110379858.3A CN113077089B (zh) | 2021-04-08 | 2021-04-08 | 一种多因素对空气质量影响的评价方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110379858.3A CN113077089B (zh) | 2021-04-08 | 2021-04-08 | 一种多因素对空气质量影响的评价方法和装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113077089A CN113077089A (zh) | 2021-07-06 |
CN113077089B true CN113077089B (zh) | 2023-05-30 |
Family
ID=76615719
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110379858.3A Active CN113077089B (zh) | 2021-04-08 | 2021-04-08 | 一种多因素对空气质量影响的评价方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113077089B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113777224B (zh) * | 2021-08-12 | 2024-04-30 | 北京金水永利科技有限公司 | 一种网格化空气质量评估数据的生成方法及*** |
CN116732926A (zh) * | 2023-08-14 | 2023-09-12 | 中科三清科技有限公司 | 改善空气质量的方法、装置与可读存储介质 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336093A (zh) * | 2013-06-26 | 2013-10-02 | 中山大学 | 一种区域空间质量分析方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108629980B (zh) * | 2018-06-27 | 2020-04-07 | 石家庄铁道大学 | 一种通过控制交通流量改善空气质量的方法 |
CN110334133B (zh) * | 2019-07-11 | 2020-11-20 | 北京京东智能城市大数据研究院 | 规则挖掘方法和装置、电子设备和计算机可读存储介质 |
CN110598953A (zh) * | 2019-09-23 | 2019-12-20 | 哈尔滨工程大学 | 一种时空相关的空气质量预测方法 |
CN112465243B (zh) * | 2020-12-02 | 2024-01-09 | 南通大学 | 一种空气质量预报方法及*** |
-
2021
- 2021-04-08 CN CN202110379858.3A patent/CN113077089B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103336093A (zh) * | 2013-06-26 | 2013-10-02 | 中山大学 | 一种区域空间质量分析方法 |
Also Published As
Publication number | Publication date |
---|---|
CN113077089A (zh) | 2021-07-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109543906B (zh) | 一种大气能见度预测的方法及设备 | |
CN113128791B (zh) | 基于moves模型的机动车排放清单测算方法及装置 | |
CN109063071B (zh) | 一种基于拓扑关联的水污染溯源方法及设备 | |
CN113077089B (zh) | 一种多因素对空气质量影响的评价方法和装置 | |
CN110598953A (zh) | 一种时空相关的空气质量预测方法 | |
CN107563566B (zh) | 一种基于支持向量机的公交站间运行时间区间预测方法 | |
CN106997666B (zh) | 一种利用手机信令数据位置切换获取交通流速度的方法 | |
US20070129892A1 (en) | System and method for identifying road features | |
US20240003686A1 (en) | Hyper-local mapping of environmental conditions | |
CN116626233A (zh) | 基于多源数据融合的大气污染溯源方法、终端及存储介质 | |
CN113836808A (zh) | 一种基于重污染特征约束的pm2.5深度学习预测方法 | |
CN111783034B (zh) | 一种车云协同计算的排放路谱分析方法 | |
CN104834944A (zh) | 一种基于协同训练的城市区域空气质量估计方法 | |
CN117871790B (zh) | 基于多种数据融合的路边监测站数据分析和交通溯源方法 | |
Weissert et al. | Hierarchical network design for nitrogen dioxide measurement in urban environments | |
CN114822709A (zh) | 大气污染多粒度精准成因分析方法及装置 | |
CN114898823A (zh) | 一种高时空分辨率遥感近地面no2浓度预估方法和*** | |
Efe et al. | Analysis of air pollutants in Kagithane valley and Istanbul Metropolitan Area | |
CN111680888B (zh) | 基于rfid数据确定路网容量的方法 | |
CN113742929A (zh) | 一种针对格点气象实况的数据质量评价方法 | |
Li et al. | An automatic extraction method of coach operation information from historical trajectory data | |
CN112598896B (zh) | 一种基于gps数据的工业园区物流关键路段识别方法 | |
CN114999162A (zh) | 一种道路交通流量获取方法和装置 | |
CN114878748A (zh) | 一种co2排放量的监测方法及监测*** | |
CN111785012B (zh) | 一种车云协同计算的能耗路谱分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |