CN117829614B - 一种基于多源数据融合的工业企业排污风险分级计算方法 - Google Patents

一种基于多源数据融合的工业企业排污风险分级计算方法 Download PDF

Info

Publication number
CN117829614B
CN117829614B CN202410253212.4A CN202410253212A CN117829614B CN 117829614 B CN117829614 B CN 117829614B CN 202410253212 A CN202410253212 A CN 202410253212A CN 117829614 B CN117829614 B CN 117829614B
Authority
CN
China
Prior art keywords
pollution
data
historical
score
vocs
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202410253212.4A
Other languages
English (en)
Other versions
CN117829614A (zh
Inventor
韩科
王迪
薛云博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sichuan Guolan Zhongtian Environmental Technology Group Co ltd
Original Assignee
Sichuan Guolan Zhongtian Environmental Technology Group Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sichuan Guolan Zhongtian Environmental Technology Group Co ltd filed Critical Sichuan Guolan Zhongtian Environmental Technology Group Co ltd
Priority to CN202410253212.4A priority Critical patent/CN117829614B/zh
Publication of CN117829614A publication Critical patent/CN117829614A/zh
Application granted granted Critical
Publication of CN117829614B publication Critical patent/CN117829614B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/25Fusion techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0637Strategic management or analysis, e.g. setting a goal or target of an organisation; Planning actions based on goals; Analysis or evaluation of effectiveness of goals
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Strategic Management (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Marketing (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Quality & Reliability (AREA)
  • Software Systems (AREA)
  • Operations Research (AREA)
  • Game Theory and Decision Science (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Development Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Water Supply & Treatment (AREA)
  • Mathematical Physics (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及环境监测技术领域,公开了一种基于多源数据融合的工业企业排污风险分级计算方法,包括获取历史多源异构数据,并根据历史多源异构数据提取对应的特征指标;获取历史VOCs走航数据,并根据历史VOCs走航数据确定VOCs走航污染评分;获取历史电力监控数据,并根据历史电力监控数据确定电力监控污染评分;获取历史移动站热力数据,并根据历史移动站热力数据确定移动站污染评分;获取历史电子围栏数据,并根据历史电子围栏数据确定电子围栏污染评分;计算排污风险得分,根据排污风险得分确定工业企业排污风险分级结果。本发明可以提高多源异构数据利用率并且提高工业企业排污风险监测的准确性和计算效率。

Description

一种基于多源数据融合的工业企业排污风险分级计算方法
技术领域
本发明涉及环境监测技术领域,具体涉及一种基于多源数据融合的工业企业排污风险分级计算方法。
背景技术
现阶段,虽有较多的环保监测手段,但联合分析能力较弱,存在监测盲点、人力物力耗资大、管控滞后性等情况,无法精准、快速、有效的支撑管控措施的落地。
发明内容
针对现有技术中的上述不足,本发明提供了一种基于多源数据融合的工业企业排污风险分级计算方法。
为了达到上述发明目的,本发明采用的技术方案为:
一种基于多源数据融合的工业企业排污风险分级计算方法,包括以下步骤:
获取历史多源异构数据,并根据历史多源异构数据提取对应的特征指标;包括:
获取历史VOCs走航数据,并根据历史VOCs走航数据确定VOCs走航污染评分;
获取历史电力监控数据,并根据历史电力监控数据确定电力监控污染评分;
获取历史移动站热力数据,并根据历史移动站热力数据确定移动站污染评分;
获取历史电子围栏数据,并根据历史电子围栏数据确定电子围栏污染评分;
根据确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分计算排污风险得分,根据排污风险得分确定工业企业排污风险分级结果。
作为可选地,历史VOCs走航数据包括:
走航数据发布时间、GPS轨迹和VOCs监测值。
作为可选地,根据历史VOCs走航数据确定VOCs走航污染评分,包括以下步骤:
根据设定的VOCs阈值,从历史VOCs走航数据中筛选大于VOCs阈值的历史VOCs走航数据;
根据筛选的历史VOCs走航数据计算污染数值点位与工业企业固定污染源的距离;
根据设定的污染扩散距离阈值,从计算的污染数值点位与工业企业固定污染源的距离中筛选小于污染扩散距离阈值的污染数值点位;
根据筛选的污染数值点对应的历史VOCs走航数据,采用加权方式计算污染浓度指数;
根据污染浓度指数,采用归一化和对数变换计算VOCs走航污染评分。
作为可选地,历史电力监控数据包括:
电力报警数据企业名称、报警时间和报警次数。
作为可选地,根据历史电力监控数据确定电力监控污染评分,包括以下步骤:
根据历史电力监控数据,按照设定的时间窗口划分时间区间,统计每个时间区间内的报警率;根据各个时间区间内的报警率,计算日间报警率和夜间报警率;根据日间报警率和夜间报警率的大小关系确定工业企业的生产类型,并根据工业企业的生产类型确定历史最大报警时段;
获取当前电力监控数据,按照设定的时间窗口划分时间区间,统计每个时间区间内的报警率;根据各个时间区间内的报警率,计算日间报警率和夜间报警率;根据日间报警率和夜间报警率的大小关系确定工业企业的生产类型,并根据工业企业的生产类型确定当前最大报警时段;
根据历史最大报警时段和当前最大报警时段,采用线性加权法计算电力监控污染评分。
作为可选地,历史移动站热力数据包括:
移动站污染物监测数据、GPS轨迹和监测污染物类型。
作为可选地,根据历史移动站热力数据确定移动站污染评分,包括以下步骤:
根据设定的监测阈值,从历史移动站热力数据中筛选大于监测阈值的历史移动站热力数据;
将筛选的历史移动站热力数据与目标区域网格化的网格区域进行匹配,得到网格化热力数据;
将网格化热力数据中的同一种污染物数据组合为数据帧,再将多种污染物数据帧拼接合并,采用机器学习方法对拼接后的污染物数据进行特征挖掘,得到网格化特征数据;
将工业企业信息与目标区域网格化的网格区域进行匹配,得到网格化企业数据;并将网格化企业数据与网格化特征数据进行合并,得到企业特征数据;
采用因子分析模型根据企业特征数据计算特征累计方差,得到移动站污染评分。
作为可选地,历史电子围栏数据包括:
PID设备信息、TVOC监测值和监测时间。
作为可选地,根据历史电子围栏数据确定电子围栏污染评分,包括以下步骤:
将设定的电子围栏监测范围进行网格化,得到网格化范围数据;
计算电子围栏监测范围内每一个网格区域与工业企业固定污染源的距离;
根据设定的污染扩散距离阈值,从计算的网格区域与工业企业固定污染源的距离中筛选小于污染扩散距离阈值的污染数值点位;
根据筛选的污染数值点对应的历史VOCs走航数据,采用加权方式计算污染浓度指数;
根据污染浓度指数,采用归一化和对数变换计算电子围栏污染评分。
作为可选地,根据确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分计算排污风险得分,根据排污风险得分确定工业企业排污风险分级结果,包括以下步骤:
将确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分进行求和平均,得到综合污染得分;
将综合污染得分进行归一化,得到排污风险得分;
将排污风险得分范围进行分级,根据得到的排污风险得分确定工业企业排污风险分级结果。
本发明具有以下有益效果:
本发明通过融合多源数据,结合VOCs走航、电力监控、电子围栏、移动站等监测数据,利用机器学习数据处理特征工程,快速计算企业风险得分,可以提高多源异构数据利用率并且提高工业企业排污风险监测的准确性和计算效率。
附图说明
图1为一种基于多源数据融合的工业企业排污风险分级计算方法的流程示意图。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1所示,本发明实施例提供了一种基于多源数据融合的工业企业排污风险分级计算方法,包括以下步骤S1和S2:
获取历史多源异构数据,并根据历史多源异构数据提取对应的特征指标;包括:
S1、获取历史VOCs走航数据,并根据历史VOCs走航数据确定VOCs走航污染评分;
获取历史电力监控数据,并根据历史电力监控数据确定电力监控污染评分;
获取历史移动站热力数据,并根据历史移动站热力数据确定移动站污染评分;
获取历史电子围栏数据,并根据历史电子围栏数据确定电子围栏污染评分;
S2、根据确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分计算排污风险得分,根据排污风险得分确定工业企业排污风险分级结果。
本实施例结合多源异构大数据(一厂一策清单数据包含“行业、绩效等级、重污染停限产措施”、移动微站监测数据、PID电子围栏监测数据、电力监控数据、VOCs走航监测数据),利用机器学习技术统计分析历史数据分布,挖掘不同特征与企业污染贡献的定性定量关系,利用定量关系进行数据融合,最终提供风险企业清单以及企业综合风险指数,从而解决了多源异构数据利用率低下、企业排污精准画像缺乏、污染排查缺乏针对性,人工耗时费力成效低等环境监管问题。
在本发明的一个可选实施例中,本实施例获取的历史VOCs走航数据包括:
走航数据发布时间、GPS轨迹和VOCs监测值。
本实施例在获取历史VOCs走航数据后,进行VOCs走航数据处理,具体为将GPS数据的经度、纬度以及VOCs监测值转换为浮点数,发布时间转换为时间类型。其中VOCs是指常温下饱和蒸汽压大于70 Pa、常压下沸点在260℃以下的有机化合物,或在20℃条件下,蒸汽压大于或者等于10 Pa且具有挥发性的全部有机化合物。
此外,本实施例还获取固定污染源清单,具体通过获取一厂一策清单的企业名称、经度、纬度,企业名称转换为字符串,经度、纬度转换为浮点数,记作S。
本实施例根据历史VOCs走航数据确定VOCs走航污染评分,包括以下步骤A1至A5:
A1、根据设定的VOCs阈值,从历史VOCs走航数据中筛选大于VOCs阈值的历史VOCs走航数据,记作T;
A2、根据筛选的历史VOCs走航数据计算污染数值点位与工业企业固定污染源的距离,记作D;计算式为:
其中,表示历史VOCs走航数据的经度,/>表示历史VOCs走航数据的纬度,表示固定污染源的经度,/>表示固定污染源的纬度;
A3、根据设定的污染扩散距离阈值,从计算的污染数值点位与工业企业固定污染源的距离中筛选小于污染扩散距离阈值的污染数值点位,记作D data
本实施例中污染扩散是指污染源排放到大气当中的污染物,在大气湍流、分子运动等气象因素影响,叠加人为等影响因素,在大气中进行区域迁移的过程。
A4、根据筛选的污染数值点对应的历史VOCs走航数据,采用加权方式计算污染浓度指数,记作X;计算式为:
其中,表示VOCs监测值;
A5、根据污染浓度指数,采用归一化和对数变换计算VOCs走航污染评分。
本实施例利用归一化将污染浓度指数X映射至[0,1]之间,再利用对数函数进行变换,记作VOC data;计算式为:
其中,表示污染浓度指数最大值,/>表示污染浓度指数最小值。
在本发明的一个可选实施例中,本实施例获取的历史电力监控数据包括:
电力报警数据企业名称、报警时间和报警次数。
本实施例在获取历史电力监控数据后,进行电力监控数据处理,具体为:
将企业报警次数转换为整数,企业报警时间转换为浮点数,企业名称转换为字符串。
本实施例根据历史电力监控数据确定电力监控污染评分,包括以下步骤B1至B3:
B1、根据历史电力监控数据,按照设定的时间窗口划分时间区间,统计每个时间区间内的报警率;根据各个时间区间内的报警率,计算日间报警率和夜间报警率;根据日间报警率和夜间报警率的大小关系确定工业企业的生产类型,并根据工业企业的生产类型确定历史最大报警时段;
B2、获取当前电力监控数据,按照设定的时间窗口划分时间区间,统计每个时间区间内的报警率;根据各个时间区间内的报警率,计算日间报警率和夜间报警率;根据日间报警率和夜间报警率的大小关系确定工业企业的生产类型,并根据工业企业的生产类型确定当前最大报警时段;
B3、根据历史最大报警时段和当前最大报警时段,采用线性加权法计算电力监控污染评分。
示例性地,本实施例根据历史电力监控数据构建历史数据画像,具体为获取历史时间区间内的电力报警数据,按照每3小时一个时间窗口进行划分,将24小时等分为8个时间区间,统计每个时间区间内的报警率,分别记作{[9,10,11]: T1}、{[12,13,14]: T2}、{[15,16,17]: T3}、{[18,19,20]: T4}、{[21,22,23]: T5}、{[0,1,2]: T6}、{[3,4,5]:T7}、{[6,7,8]: T8},日间报警时段为T1、T2、T3、T4,概率记作D,夜间报警时段为T5、T6、T7、T8,概率记作N。
每个时间区间内的报警率的计算式为:
其中,表示第n个时间区间的报警率,s表示时间区间开始时间,e表示时间区间结束时间,/>表示时间区间内第i个时间的报警数量,/>表示第j小时的报警数量;
日间报警率D的计算式为:
其中,表示第k个日间报警时段的报警率;
夜间报警率N的计算式为:
其中,表示第v个日间报警时段的报警率。
基于历史日间及夜间报警率,判断日间报警率是否大于夜间报警率,如果日间报警率大,则企业性质为违规生产,反之,夜间报警率大,则企业性质为错峰生产,利用这一规则将全部企业进行定性,再根据企业生产性质找出最大报警时段,记作Hhistory
例如1:A企业生产行为是错峰生产,则最大报警率为Max(夜间时段)。
例如2:B企业生产行为是违规生产,则最大报警率为Max(日间时段)。
本实施例根据当前电力监控数据构建当前数据画像,实施步骤与上述步骤类似,记作Hnow
本实施例采用线性加权法可以充分融合企业历史数据及当前数据,获得更具科学性统计指标,采用历史数据乘以权重加当前数据乘以权重,得到电力监控污染评分,记作HBdata;计算式为:
其中,表示历史电力监控数据的权重,/>表示当前电力监控数据的权重。
在本发明的一个可选实施例中,本实施例获取的历史移动站热力数据包括:
移动站污染物监测数据、GPS轨迹和监测污染物类型。
本实施例在获取历史移动站热力数据后,进行移动站热力数据处理,具体为:
将氮氧化物(NOX)、臭氧(O3)、总挥发性有机物(TVOC)转换为浮点数,GPS经度、纬度转换为浮点数,污染物类型转换为字符串。其中TVOC是指世界卫生组织(WHO,1989)定义为熔点低于室温,沸点范围在50~260℃之间的挥发性有机化合物的总称。主要成分是烃类、卤代烃、氧烃和氮烃,它包括:苯系物、有机氯化物、氟利昂系列、有机酮、胺、醇、醚、酯、酸和石油烃化合物等。
本实施例根据历史移动站热力数据确定移动站污染评分,包括以下步骤C1至C5:
C1、根据设定的监测阈值,从历史移动站热力数据中筛选大于监测阈值的历史移动站热力数据;
C2、将筛选的历史移动站热力数据与目标区域网格化的网格区域进行匹配,得到网格化热力数据;
C3、将网格化热力数据中的同一种污染物数据组合为数据帧,再将多种污染物数据帧拼接合并,采用机器学习方法对拼接后的污染物数据进行特征挖掘,得到网格化特征数据;
C4、将工业企业信息与目标区域网格化的网格区域进行匹配,得到网格化企业数据;并将网格化企业数据与网格化特征数据进行合并,得到企业特征数据;
C5、采用因子分析模型根据企业特征数据计算特征累计方差,得到移动站污染评分。
示例性地,本实施例可以按照以下步骤执行:
数据筛选:设定NOX、O3、TVOC的监测阈值,从历史移动站热力数据中筛选大于监测阈值的历史移动站热力数据;
数据网格化:将目标区域按照200m * 200m网格进行划分,利用GPS点位的经度、纬度与网格左上右下点的经度、纬度进行计算,将污染物数据匹配至网格中,得到网格化热力数据;
特征工程:每一个网格中会存在多个GPS轨迹数据、多个污染物数据,首先针对网格中的同一种污染物数据进行组合为数据帧,再将多种污染物数据帧拼接合并,针对多数据进行特征挖掘,挖掘网格中一组监测数据的(最大值、最小值、平均值、方差、标准差)等特征,用于充分刻画网格信息,记作网格化特征数据,记作Mfeature
污染源匹配:获取企业基本信息,将企业数据匹配网格,获得网格化企业数据,并与Mfeature进行合并,得出企业级特征数据,记作Efeature
移动站污染评分:利用因子分析模型,计算Efeature数据的特征累计方差,用于刻画企业污染得分,最终得到移动站评分,记作Mdata
在本发明的一个可选实施例中,本实施例获取的历史电子围栏数据包括:
PID设备信息、TVOC监测值和监测时间。其中PID设备是指光离子化检测器,使用了紫外灯(UV)光源将有机物分子电离成可被检测器检测到的正负离子,形成电流信号,故有机分子的浓度可被仪器所监测。
本实施例获取历史电子围栏数据后,进行电子围栏数据处理,具体为:
将PID设备的经度、维度以及监测值转换为浮点数,监测时间转换为时间类型。
本实施例根据历史电子围栏数据确定电子围栏污染评分,包括以下步骤D1至D5:
D1、将设定的电子围栏监测范围进行网格化,得到网格化范围数据;
D2、计算电子围栏监测范围内每一个网格区域与工业企业固定污染源的距离;
D3、根据设定的污染扩散距离阈值,从计算的网格区域与工业企业固定污染源的距离中筛选小于污染扩散距离阈值的污染数值点位;
D4、根据筛选的污染数值点对应的历史VOCs走航数据,采用加权方式计算污染浓度指数;
D5、根据污染浓度指数,采用归一化和对数变换计算电子围栏污染评分。
示例性地,本实施例可以按照以下步骤执行:
固定站涵盖范围:定义电子围栏监测范围,将监测范围划分为200m*200m网格,得到网格化范围数据;
电子围栏污染评分:计算监测范围内每一个网格的污染浓度,计算方法采用步骤A2至A5计算污染浓度指数,得出网格化电子围栏监测数据,记作Rdata
在本发明的一个可选实施例中,本实施例根据确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分计算排污风险得分,根据排污风险得分确定工业企业排污风险分级结果,包括以下步骤S21至S23:
S21、将确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分进行求和平均,得到综合污染得分;
S22、将综合污染得分进行归一化,得到排污风险得分;
S23、将排污风险得分范围进行分级,根据得到的排污风险得分确定工业企业排污风险分级结果。
示例性地,多源数据在计算排污风险得分时,首先进行求和平均,获得综合污染得分,计算式为:
其中,M表示污染源个数,具体包括4种污染源“VOCs走航、电力监控、移动站热力、电子围栏”,表示第c种污染源对应的评分;
再将综合污染得分进行归一化百分制处理,得出排污风险得分,计算式为:
其中,表示综合污染得分最大值,/>表示综合污染得分最小值。
最后将排污风险得分范围进行分级,按照4个等级进行划分,0 ~ 24.9%为低风险、25% ~ 49.9%为轻度风险、50% ~ 74.9%为中度风险、75% ~ 100%为高度风险。根据得到的排污风险得分即可确定工业企业排污风险分级结果。
在本发明的一个可选实施例中,本实施例还包括根据排污风险得分确认重点区域。
本实施例可以按照以下步骤执行:
获取目标区域shp文件,将目标区域划分为200m*200m网格。
网格匹配:将SCORE经纬度与网格经纬度计算匹配,得到网格化企业数据,记作SCOREgrid
基于层次聚类算法,利用网格之间的经纬度距离换算相似度,将数据归一化映射至[0,1],再用1减去距离系数得到相似度,距离越近,网格相似度越高,反之,距离越远,网格相似度越低,相似度近似作为一个区域,最终获得目标行政区域中的N个重点区域。
本发明基于企业风险清单划定重点管控区域,从而在战略、战术层面制定精细化企业监管方案,为城市打好工业企业环境治理战役提供坚实的数据底座以及稳定的技术支持。此外,本发明提供的排放高值重点区域,可以帮助政府快速定位污染区域,并结合风险清单进行小范围的高效排查,可快速发现污染源头、有效治理污染事件。
综上所述,本发明具有以下优点:
融合多源数据,结合VOCs走航、电力监控、电子围栏、移动站等监测数据,利用机器学习数据处理特征工程,快速计算企业风险得分以及重点区域。
该技术计算速度快,在计算以月为时间周期的数据在普通服务器上运行时间在1~ 5min之间,以季度为时间周期的在5 ~ 10min之间,以年为时间周期的在10 ~ 20min之间。
设置监测指标更科学,不同监测传感器监测的数值区间不一致,该技术在计算企业风险得分时将数据归一化,统计分析的是趋势,可以规避掉传感器数据之间的误差。
人工阈值选取优势,该技术的人工阈值均是由专业人员参与评定,阈值更科学,得到的溯源结果更准确。
监测数据处理优势,该技术对于监测数据处理均是采用反距离系数来刻画污染浓度,可以更科学的反演污染监测值在随距离远近在空气中飘散的损失。
本发明是参照根据本发明实施例的方法、设备(***)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本领域的普通技术人员将会意识到,这里所述的实施例是为了帮助读者理解本发明的原理,应被理解为本发明的保护范围并不局限于这样的特别陈述和实施例。本领域的普通技术人员可以根据本发明公开的这些技术启示做出各种不脱离本发明实质的其它各种具体变形和组合,这些变形和组合仍然在本发明的保护范围内。

Claims (5)

1.一种基于多源数据融合的工业企业排污风险分级计算方法,其特征在于,包括以下步骤:
获取历史多源异构数据,并根据历史多源异构数据提取对应的特征指标;包括:
获取历史VOCs走航数据,并根据历史VOCs走航数据确定VOCs走航污染评分;其中历史VOCs走航数据包括走航数据发布时间、GPS轨迹和VOCs监测值;
获取历史电力监控数据,并根据历史电力监控数据确定电力监控污染评分;其中历史电力监控数据包括电力报警数据企业名称、报警时间和报警次数;
获取历史移动站热力数据,并根据历史移动站热力数据确定移动站污染评分;其中历史移动站热力数据包括移动站污染物监测数据、GPS轨迹和监测污染物类型;
获取历史电子围栏数据,并根据历史电子围栏数据确定电子围栏污染评分;其中历史电子围栏数据包括PID设备信息、TVOC监测值和监测时间;
根据确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分计算排污风险得分,根据排污风险得分确定工业企业排污风险分级结果,包括以下步骤:
将确定的VOCs走航污染评分、电力监控污染评分、移动站污染评分和电子围栏污染评分进行求和平均,得到综合污染得分;
将综合污染得分进行归一化,得到排污风险得分;
将排污风险得分范围进行分级,根据得到的排污风险得分确定工业企业排污风险分级结果。
2.根据权利要求1所述的一种基于多源数据融合的工业企业排污风险分级计算方法,其特征在于,根据历史VOCs走航数据确定VOCs走航污染评分,包括以下步骤:
根据设定的VOCs阈值,从历史VOCs走航数据中筛选大于VOCs阈值的历史VOCs走航数据;
根据筛选的历史VOCs走航数据计算污染数值点位与工业企业固定污染源的距离;
根据设定的污染扩散距离阈值,从计算的污染数值点位与工业企业固定污染源的距离中筛选小于污染扩散距离阈值的污染数值点位;
根据筛选的污染数值点对应的历史VOCs走航数据,采用加权方式计算污染浓度指数;
根据污染浓度指数,采用归一化和对数变换计算VOCs走航污染评分。
3.根据权利要求1所述的一种基于多源数据融合的工业企业排污风险分级计算方法,其特征在于,根据历史电力监控数据确定电力监控污染评分,包括以下步骤:
根据历史电力监控数据,按照设定的时间窗口划分时间区间,统计每个时间区间内的报警率;根据各个时间区间内的报警率,计算日间报警率和夜间报警率;根据日间报警率和夜间报警率的大小关系确定工业企业的生产类型,并根据工业企业的生产类型确定历史最大报警时段;
获取当前电力监控数据,按照设定的时间窗口划分时间区间,统计每个时间区间内的报警率;根据各个时间区间内的报警率,计算日间报警率和夜间报警率;根据日间报警率和夜间报警率的大小关系确定工业企业的生产类型,并根据工业企业的生产类型确定当前最大报警时段;
根据历史最大报警时段和当前最大报警时段,采用线性加权法计算电力监控污染评分。
4.根据权利要求1所述的一种基于多源数据融合的工业企业排污风险分级计算方法,其特征在于,根据历史移动站热力数据确定移动站污染评分,包括以下步骤:
根据设定的监测阈值,从历史移动站热力数据中筛选大于监测阈值的历史移动站热力数据;
将筛选的历史移动站热力数据与目标区域网格化的网格区域进行匹配,得到网格化热力数据;
将网格化热力数据中的同一种污染物数据组合为数据帧,再将多种污染物数据帧拼接合并,采用机器学习方法对拼接后的污染物数据进行特征挖掘,得到网格化特征数据;
将工业企业信息与目标区域网格化的网格区域进行匹配,得到网格化企业数据;并将网格化企业数据与网格化特征数据进行合并,得到企业特征数据;
采用因子分析模型根据企业特征数据计算特征累计方差,得到移动站污染评分。
5.根据权利要求1所述的一种基于多源数据融合的工业企业排污风险分级计算方法,其特征在于,根据历史电子围栏数据确定电子围栏污染评分,包括以下步骤:
将设定的电子围栏监测范围进行网格化,得到网格化范围数据;
计算电子围栏监测范围内每一个网格区域与工业企业固定污染源的距离;
根据设定的污染扩散距离阈值,从计算的网格区域与工业企业固定污染源的距离中筛选小于污染扩散距离阈值的污染数值点位;
根据筛选的污染数值点对应的历史VOCs走航数据,采用加权方式计算污染浓度指数;
根据污染浓度指数,采用归一化和对数变换计算电子围栏污染评分。
CN202410253212.4A 2024-03-06 2024-03-06 一种基于多源数据融合的工业企业排污风险分级计算方法 Active CN117829614B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202410253212.4A CN117829614B (zh) 2024-03-06 2024-03-06 一种基于多源数据融合的工业企业排污风险分级计算方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202410253212.4A CN117829614B (zh) 2024-03-06 2024-03-06 一种基于多源数据融合的工业企业排污风险分级计算方法

Publications (2)

Publication Number Publication Date
CN117829614A CN117829614A (zh) 2024-04-05
CN117829614B true CN117829614B (zh) 2024-05-07

Family

ID=90517656

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202410253212.4A Active CN117829614B (zh) 2024-03-06 2024-03-06 一种基于多源数据融合的工业企业排污风险分级计算方法

Country Status (1)

Country Link
CN (1) CN117829614B (zh)

Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657995A (zh) * 2018-12-24 2019-04-19 恒瑞通(福建)信息技术有限公司 一种生态环境网格监管热点指数的方法及存储介质
CN112801556A (zh) * 2021-04-06 2021-05-14 深圳市维度数据科技股份有限公司 一种工业企业排污行为的区域影响程度评估方法及***
CN112880751A (zh) * 2020-04-03 2021-06-01 中科三清科技有限公司 基于走航监测的空气污染状况获取方法
CN114118580A (zh) * 2021-11-29 2022-03-01 国网山东省电力公司东营供电公司 一种电力-环保数据融合分析的黄河流域污染源监测预警方法
CN114359002A (zh) * 2022-03-21 2022-04-15 四川国蓝中天环境科技集团有限公司 基于移动监测趋势挖掘的大气污染小尺度溯源方法及***
CN114493959A (zh) * 2022-01-17 2022-05-13 山东浪潮工业互联网产业股份有限公司 基于工业互联网的企业污染排放监控方法、设备及介质
CN115204688A (zh) * 2022-07-18 2022-10-18 哈尔滨工业大学 排水***健康性综合评价方法
CN115688045A (zh) * 2022-09-20 2023-02-03 西安市智慧环保综合指挥中心 一种污染源数据融合分析方法
CN115860477A (zh) * 2022-12-09 2023-03-28 国网上海市电力公司 一种基于电力数据的污染物实时排放监测方法和***
CN115983725A (zh) * 2023-03-20 2023-04-18 四川国蓝中天环境科技集团有限公司 一种基于移动站监测数据的污染物空间分布趋势挖掘方法
CN116308415A (zh) * 2023-02-15 2023-06-23 江苏蓝创智能科技股份有限公司 一种污水排放数据真伪风险评估方法
CN116385689A (zh) * 2023-06-02 2023-07-04 北京建工环境修复股份有限公司 一种场地污染数据的可视化信息管理方法、***及介质
WO2023124490A1 (zh) * 2021-12-31 2023-07-06 中国环境科学研究院 基于电网及税收数据融合的水污染环保校验方法和装置
CN116402187A (zh) * 2023-02-21 2023-07-07 湖南思极科技有限公司 一种基于电力大数据的企业排污预测方法
CN117112867A (zh) * 2023-10-24 2023-11-24 四川国蓝中天环境科技集团有限公司 一种基于gps轨迹数据的重型车辆排放计算和可视化方法

Patent Citations (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109657995A (zh) * 2018-12-24 2019-04-19 恒瑞通(福建)信息技术有限公司 一种生态环境网格监管热点指数的方法及存储介质
CN112880751A (zh) * 2020-04-03 2021-06-01 中科三清科技有限公司 基于走航监测的空气污染状况获取方法
CN112801556A (zh) * 2021-04-06 2021-05-14 深圳市维度数据科技股份有限公司 一种工业企业排污行为的区域影响程度评估方法及***
CN114118580A (zh) * 2021-11-29 2022-03-01 国网山东省电力公司东营供电公司 一种电力-环保数据融合分析的黄河流域污染源监测预警方法
WO2023124490A1 (zh) * 2021-12-31 2023-07-06 中国环境科学研究院 基于电网及税收数据融合的水污染环保校验方法和装置
CN114493959A (zh) * 2022-01-17 2022-05-13 山东浪潮工业互联网产业股份有限公司 基于工业互联网的企业污染排放监控方法、设备及介质
CN114359002A (zh) * 2022-03-21 2022-04-15 四川国蓝中天环境科技集团有限公司 基于移动监测趋势挖掘的大气污染小尺度溯源方法及***
CN115204688A (zh) * 2022-07-18 2022-10-18 哈尔滨工业大学 排水***健康性综合评价方法
CN115688045A (zh) * 2022-09-20 2023-02-03 西安市智慧环保综合指挥中心 一种污染源数据融合分析方法
CN115860477A (zh) * 2022-12-09 2023-03-28 国网上海市电力公司 一种基于电力数据的污染物实时排放监测方法和***
CN116308415A (zh) * 2023-02-15 2023-06-23 江苏蓝创智能科技股份有限公司 一种污水排放数据真伪风险评估方法
CN116402187A (zh) * 2023-02-21 2023-07-07 湖南思极科技有限公司 一种基于电力大数据的企业排污预测方法
CN115983725A (zh) * 2023-03-20 2023-04-18 四川国蓝中天环境科技集团有限公司 一种基于移动站监测数据的污染物空间分布趋势挖掘方法
CN116385689A (zh) * 2023-06-02 2023-07-04 北京建工环境修复股份有限公司 一种场地污染数据的可视化信息管理方法、***及介质
CN117112867A (zh) * 2023-10-24 2023-11-24 四川国蓝中天环境科技集团有限公司 一种基于gps轨迹数据的重型车辆排放计算和可视化方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
化工园企业环境风险分级评估与管理方法研究;陈旭雯等;环境保护科学;20150630;第41卷(第3期);144-148 *
水环境重点行业风险评估方法的研究及应用;刘鹏;;环境保护与循环经济;20180415;38(04);29-33 *

Also Published As

Publication number Publication date
CN117829614A (zh) 2024-04-05

Similar Documents

Publication Publication Date Title
CN112418609B (zh) 一种基于面-网格-点的大气二次污染精准溯源方法
Bhatti et al. Time series analysis and forecasting of air pollution particulate matter (PM 2.5): an SARIMA and factor analysis approach
CN110531030B (zh) 一种基于物联网大数据大气污染物分析的方法及装置
CN111311111B (zh) 化工园区废水废气智能管控***及控制方法
CN114371260A (zh) 一种工业企业无组织VOCs网格化监测、扩散预警及溯源方法
CN107292417B (zh) 基于重污染序列案例库的区域重污染判别预报方法及装置
CN112991132B (zh) Pm2.5和臭氧协同管控区域识别方法及装置
CN109116444B (zh) 基于PCA-kNN的空气质量模式PM2.5预报方法
Stojić et al. Forecasting of VOC emissions from traffic and industry using classification and regression multivariate methods
CN116340723B (zh) 基于大数据的乡村水污染快速溯源方法及***
CN110261272B (zh) 基于地理探测和pca对pm2.5浓度分布的关键影响因子筛选方法
CN112540148A (zh) 一种炼化企业大气污染物监测预警与溯源***构建方法
KR102100739B1 (ko) 미세먼지 발생 예측방법
CN117708617B (zh) 基于多源大数据及污染特征时空匹配的大气污染溯源方法
CN114218976B (zh) 臭氧前体物高值区精细化排放源追溯定位方法和***
CN117871790B (zh) 基于多种数据融合的路边监测站数据分析和交通溯源方法
CN117092297A (zh) 一种工业园区大气污染物的溯源方法、***、设备及介质
Barbulescu et al. Modeling the carbon monoxide dissipation in Timisoara, Romania
CN116626233A (zh) 基于多源数据融合的大气污染溯源方法、终端及存储介质
Soh et al. Spatial-Temporal pattern analysis and prediction of air quality in Taiwan
Hur et al. Systematic bias of WRF-CMAQ PM10 simulations for Seoul, Korea
Hamid et al. Short term prediction of PM10 concentrations using seasonal time series analysis
CN114822709A (zh) 大气污染多粒度精准成因分析方法及装置
CN117829614B (zh) 一种基于多源数据融合的工业企业排污风险分级计算方法
CN109613179B (zh) 累积高值区的确定方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant