WO2020010701A1 - 污染物异常监测方法、***、计算机设备和存储介质 - Google Patents

污染物异常监测方法、***、计算机设备和存储介质 Download PDF

Info

Publication number
WO2020010701A1
WO2020010701A1 PCT/CN2018/106682 CN2018106682W WO2020010701A1 WO 2020010701 A1 WO2020010701 A1 WO 2020010701A1 CN 2018106682 W CN2018106682 W CN 2018106682W WO 2020010701 A1 WO2020010701 A1 WO 2020010701A1
Authority
WO
WIPO (PCT)
Prior art keywords
data
real
pollutant
index
forest model
Prior art date
Application number
PCT/CN2018/106682
Other languages
English (en)
French (fr)
Inventor
金戈
徐亮
肖京
Original Assignee
平安科技(深圳)有限公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 平安科技(深圳)有限公司 filed Critical 平安科技(深圳)有限公司
Publication of WO2020010701A1 publication Critical patent/WO2020010701A1/zh

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0639Performance analysis of employees; Performance analysis of enterprise or organisation operations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/004Artificial life, i.e. computing arrangements simulating life
    • G06N3/006Artificial life, i.e. computing arrangements simulating life based on simulated virtual individual or collective life forms, e.g. social simulations or particle swarm optimisation [PSO]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Definitions

  • the present application relates to the technical field of environmental pollution data processing, and in particular, to a method, a system, a computer device, and a storage medium for monitoring anomalies of pollutants.
  • a pollution source is a source of pollutants that causes environmental pollution. It usually refers to a place, equipment, device, or human body that emits harmful substances to the environment or has a harmful effect on the environment. Any substance or energy that enters the environmental system at an inappropriate concentration, quantity, speed, form, and path and causes pollution or damage to the environment is collectively referred to as a pollutant.
  • a pollutant In some links in industrial production, such as production equipment or production sites used in raw material production, processing, combustion, heating and cooling, and finishing of finished products, they can become sources of industrial pollution.
  • there are generally two methods for monitoring the emissions of pollution sources The first is supervisory monitoring, which periodically checks whether the content of harmful substances in the exhaust gas emitted by pollution sources meets national regulations.
  • the second is research-based monitoring, which monitors the types, emissions, and discharge laws of pollutants emitted by pollution sources, which helps to identify the main sources of air pollution, discuss the development trend of air pollution, formulate pollution control measures, and improve ambient air quality.
  • the threshold of the single pollution source is set, and compared with the detection data of the single pollution source, it is found that the pollutant discharge enterprises exceed the standard.
  • the types of pollution sources are complicated, the setting and checking of single thresholds are cumbersome, and the setting of thresholds cannot prevent the occurrence of excessive standards.
  • a method for monitoring anomalies of pollutants includes the following steps:
  • An index threshold is set for each index item of each of the pollutants, and each of the data sets is filtered according to the index threshold, and data that does not exceed the index threshold is set as a feature item, and the feature is set. Items are stored in non-exceeded data sets;
  • a pollutant abnormality monitoring system includes the following units:
  • the acquiring data unit is configured to acquire historical environmental monitoring data of a pollution source monitoring point of each enterprise from a preset environmental monitoring data system, and set the historical environmental monitoring data to one data of one pollutant per enterprise Set for storage;
  • the screening unit is configured to set an index threshold for each index item of each of the pollutants, filter each of the data sets according to the index threshold value, and filter out data that does not exceed the index threshold value as a feature item , Storing the feature items in a non-exceeding data set;
  • a training unit configured to train an isolated forest model by using the feature terms in the non-exceeded data set, and establish the corresponding isolated forest model for each non-exceeded data set;
  • the abnormal point summary unit is configured to obtain real-time monitoring data of a pollutant in an enterprise in units of hours from the environmental monitoring data system, and input the real-time monitoring data into the isolated forest corresponding to the pollutant In the model, it is determined whether the path length from the root node to the leaf node of the isolated forest model is an abnormal point through the real-time monitoring data, and the abnormal points are summarized.
  • a computer device includes a memory and a processor.
  • the memory stores computer-readable instructions.
  • the processor causes the processor to perform the following steps:
  • An index threshold is set for each index item of each of the pollutants, and each of the data sets is filtered according to the index threshold, and data that does not exceed the index threshold is set as a feature item, and the feature is set. Items are stored in non-exceeded data sets;
  • a storage medium storing computer-readable instructions.
  • the one or more processors execute the following steps:
  • An index threshold is set for each index item of each of the pollutants, and each of the data sets is filtered according to the index threshold, and data that does not exceed the index threshold is set as a feature item, and the feature is set. Items are stored in non-exceeded data sets;
  • the above-mentioned pollutant abnormality monitoring method, device, computer equipment and storage medium include obtaining historical environmental monitoring data of each enterprise's pollution source monitoring point from a preset environmental monitoring data system, and converting historical environmental monitoring data to Each pollutant is set as a data set for storage; each indicator of each pollutant is set with an index threshold, each data set is filtered according to the index threshold, and the data that does not exceed the index threshold is set as a feature.
  • Store the feature items in the non-exceeding data set use the feature items in the non-exceeding data set to train an isolated forest model, and establish a corresponding isolated forest model for each non-exceeding data set; obtain an enterprise-in-one
  • the real-time monitoring data of the pollutants are measured in hours.
  • the real-time monitoring data is input into the isolated forest model corresponding to the pollutants, and the path length of the root node to the leaf node of the isolated forest model is determined by the real-time monitoring data to determine whether it is an abnormal point.
  • the abnormal points are summarized.
  • This application screens historical data and selects non-exceeding pollutant data as feature items, and uses an isolated forest model to monitor abnormal points of the company's sewage.
  • the monitoring of the abnormal point data is simple and fast, and it can predict the pollution source exceeding the standard in advance. And output, to prevent the occurrence of excessive standards.
  • FIG. 1 is a flowchart of a pollutant abnormality monitoring method in an embodiment of the present application
  • FIG. 2 is a flowchart of step S3 in FIG. 1;
  • step S3 is a structural diagram of a tree constructed in step S3;
  • FIG. 4 is a flowchart of step S4 in FIG. 1;
  • FIG. 5 is a structural diagram of a pollutant abnormality monitoring system in an embodiment of the present application.
  • FIG. 6 is a schematic block diagram of the abnormal point summary unit in FIG. 5.
  • FIG. 1 is a flowchart of a method for monitoring abnormal pollutants in an embodiment of the present application. As shown in FIG. 1, the monitoring method includes the following steps:
  • Step S1 Obtaining data: Obtain historical environmental monitoring data of each enterprise's pollution source monitoring point from a preset environmental monitoring data system, and set historical environmental monitoring data with one pollutant of each enterprise as a data set. storage.
  • the abnormality monitoring of pollutants in this step is mainly for the pollutants discharged by enterprises. Therefore, the enterprises in this embodiment are the key pollutant discharge units included in the pollution source monitoring center of the Ministry of Ecology and Environment.
  • the preset environmental monitoring data system is provided by the government environmental protection department.
  • the environmental monitoring data system collected historical environmental monitoring data and real-time monitoring data from all pollution source monitoring points of each key sewage unit.
  • the pollution source monitoring points of the enterprise are generally set at the drainage outlet and the exhaust outlet. Therefore, the pollutants of the enterprise include the drainage pollutants based on the drainage outlet monitoring and the exhaust pollutants based on the exhaust outlet monitoring.
  • the data set is classified and stored according to the drainage pollutant data set and the exhaust pollutant data set.
  • Step S2 screening data: setting index thresholds for each index item of each pollutant, filtering each data set according to the index thresholds, filtering out data that does not exceed the index threshold value, setting them as feature items, and storing the feature items in the Out-of-standard data set.
  • a corresponding index threshold is set for each index item of the pollutant.
  • the index items of drainage pollutants include at least one of suspended solids index, chemical oxygen demand index, pH value or ammonia nitrogen index, and corresponding index thresholds are set for the index items of drainage pollutants.
  • the exhaust pollutant index items include at least one of nitrogen oxide index, sulfur dioxide index, soot index, or carbon monoxide index, and corresponding exhaust thresholds are set for the exhaust pollutant index items.
  • the index items of pollutants and the corresponding index thresholds are shown in Table 1 below:
  • each data set is filtered according to a preset index threshold, and the data that does not exceed the threshold is screened out and stored as a feature item in a non-exceeding data set.
  • the feature items are classified with one pollutant per enterprise and stored in the corresponding non-exceeded data set. That is, the feature items selected by the drainage pollutant data set of each enterprise are stored as the drainage non-standard data set, and the feature items selected by the exhaust pollutant data set of each enterprise are stored as the exhaust non-standard data set.
  • it can be used as a sample of a certain pollutant in the enterprise.
  • Step S3 training the model: using the feature terms in the non-exceeding data set to train an isolated forest model, and establishing a corresponding isolated forest model for each non-exceeding data set.
  • the isolated forest model is a fast anomaly detection method with linear time complexity and high accuracy, and is an algorithm that meets the requirements of big data processing.
  • the isolated forest model is suitable for continuous data anomaly detection.
  • the anomaly is defined as “outliers that are easy to be isolated”, which can be understood as the points that are sparsely distributed and far from the densely populated group. In terms of statistics, that is, in the data space, a sparsely distributed area indicates that the probability of data occurring in this area is very low, so the data falling in these areas can be considered abnormal.
  • the isolated forest model is based on the above principles and builds a binary tree from the samples: the input training data set A, e is the current tree height, and l is the height limit of the tree.
  • First place A in the root node randomly select a dimension q in A, and randomly choose a value p between the maximum and minimum values on q, and flow the sample in A that is larger than p to q to the right.
  • samples smaller than p flow to the left child node. Then repeat the above steps until: each child node has only one sample or multiple identical samples, that is, each sample is isolated, or the height of the tree reaches l.
  • the abnormal point is more easily isolated, so the path length of the leaf node where it is isolated is also shorter, that is, the number of edges experienced by the root node to the leaf node where the abnormal point is located is shorter.
  • the normal point is not easy to be isolated, so its path length is also longer.
  • Step S4 Summarization of abnormal points: Obtain real-time monitoring data of a pollutant in an enterprise in units of hours from the environmental monitoring data system, enter the real-time monitoring data into an isolated forest model corresponding to the pollutants, and achieve The path length from the root node to the leaf node of the isolated forest model determines whether it is an abnormal point, and summarizes the abnormal points.
  • This step is based on the feature that the outliers in the isolated forest model are easier to isolate, and the number of edges experienced by the outlier from the root node to the leaf node where the outlier is located is short.
  • a more accurate isolated forest model is trained by obtaining historical environmental monitoring data from a preset environmental monitoring data system, and the isolated forest model is used to monitor real-time monitoring data, and abnormal points are monitored and summarized.
  • the process monitoring data is simple and fast, and can accurately monitor the excessive situation of various pollution sources in the enterprise and summarize them to prevent the occurrence of excessive standards.
  • step S3 when the isolated forest model is trained using the feature terms in the non-exceeded data set, as shown in FIG. 2, the following method is adopted:
  • a point structure feature is obtained: a feature item in every non-standard data set for every N hours is set as a point structure feature. Since there may be more data in the non-exceeded data set, in order to reduce the use of data, take the feature items in units of the non-exceeded data set for training, that is, you can select the hourly feature items or the feature items every 2 hours to set as Point construction features. These point construction features are put into the root node of the tree of the isolated forest model.
  • a difference threshold is set: a difference between each point structure feature and a previous point structure feature is set to a difference threshold of X.
  • the difference threshold can be randomly generated as the cutting point of the current node.
  • step S303 the left and right child nodes of the tree are constructed: the difference between the structural features of two adjacent points is less than X and is divided into the left child node of the tree, and the difference between X and X is divided into the right child node of the tree.
  • Step S304 recursively construct the tree: recursively, steps S302 and S303, continuously construct left child nodes and right child nodes until the following conditions are met: the training non-exceeded data set has only one record or multiple identical records, or the height of the tree reaches a pre-set Set the height range.
  • the height range of the tree is: in a non-exceeded data set containing n records, the minimum height of the constructed tree is log (n), and the maximum height of the constructed tree is n-1.
  • FIG. 3 for example, four points a, b, c, and d are constructed into an isolated forest model.
  • the four points a, b, c, and d are constructed first.
  • the root node of the tree into the isolated forest model.
  • the difference between the three point structure features a, b, and c and the previous point structure feature is less than X, and is divided into the left child node of the tree.
  • the difference between the point d structure feature and the previous point structure feature is greater than X, and To the right child node of the tree.
  • the above steps are recursively, and the left child node and the right child node are continuously constructed.
  • each leaf node has only one record. It can be seen that the structural feature at point d was isolated at the earliest, so the structural feature at point d is most likely an anomaly.
  • the data in the non-standard data set is first filtered to ensure that the trained isolated forest model is as accurate as possible to reduce the data collection amount.
  • the difference threshold is used to effectively reflect the changes between the structural features of two adjacent points every N hours. The isolated forest model finally obtained can be more reliable as an abnormal point monitoring.
  • step S4 the real-time monitoring data is input into the isolated forest model corresponding to the pollutants, and the path length of the root node to the leaf node of the isolated forest model is determined by the real-time monitoring data to determine whether it is an abnormal point, such as As shown in Figure 4, the following steps are taken:
  • Step S401 generating a path length: real-time data in the real-time monitoring data is input into the corresponding isolated forest model one by one, and the real-time data is divided into M times according to the isolated forest model and is no longer divided, the real-time data is at the root node of the isolated forest model The path length to the leaf node is M.
  • the path length of the structural feature at point a is 2
  • the path length of the structural feature at point b and c is 3
  • the path length of the structural feature at point d is 1.
  • step S402 the normalization process is performed on the path length M of the real-time data to obtain M '.
  • step S403 the abnormal point summary is preset: the abnormal point threshold value Y is preset, and when M 'is greater than Y, the real-time data is set as the abnormal point, and summarized to generate an abnormal point summary table.
  • the range of the abnormal point threshold Y should be greater than 0.5 and close to 1.
  • a normalization method is introduced to normalize the path length of a certain real-time data, and change the path length into a scalar without rigidity, so as to facilitate the summary and sum of the abnormal points. Comparison of abnormal points of each subsequent pollutant.
  • a pollutant abnormality monitoring system is proposed, as shown in FIG. 5, and includes the following units:
  • the acquisition data unit is configured to acquire historical environmental monitoring data of each enterprise's pollution source monitoring point from a preset environmental monitoring data system, and set the historical environmental monitoring data as one pollutant for each enterprise as a data set. storage;
  • the screening unit is set to set an index threshold for each index item of each pollutant, and to filter each data set according to the index threshold, to filter out data that does not exceed the index threshold as a feature item, and to store the feature item in a non-exceeding standard Data set
  • the training unit is set to train the isolated forest model by using the feature items in the non-exceeded data set, and establish a corresponding isolated forest model for each non-exceeded data set;
  • the outlier summary unit is set to obtain real-time monitoring data of a pollutant in an enterprise from the environmental monitoring data system in units of hours, and input the real-time monitoring data into an isolated forest model corresponding to the pollutants.
  • the path length from the root node to the leaf node of the isolated forest model determines whether it is an abnormal point, and summarizes the abnormal points.
  • the pollutants in the data acquisition unit include drainage pollutants based on drainage port monitoring and exhaust pollutants based on exhaust port monitoring.
  • each enterprise stores drainage Pollutant dataset and exhaust pollutant dataset.
  • the index items of drainage pollutants include at least one index item of suspended solids index, chemical oxygen demand index, pH value or ammonia nitrogen index, and corresponding index thresholds are set for the index items of drainage pollutants.
  • the exhaust pollutant index items include at least one of nitrogen oxide index, sulfur dioxide index, soot index or carbon monoxide index, and the exhaust pollutant index items are provided with corresponding index thresholds.
  • the screening unit is further configured to classify and store feature items with one pollutant per enterprise in a corresponding non-exceeding data set.
  • the training unit includes: left and right child node modules of the construction tree, which are set to take the feature items of every N hours in the non-exceeded data set and set as a point construction feature, each point construction feature and the previous point construction feature Set the difference threshold to X, then the difference between the structural features of two adjacent points is less than X is divided into the left child node of the tree, and the difference greater than or equal to X is divided into the right child node of the tree;
  • Recursive module set to recursively construct left and right child nodes until the following conditions are met: the training non-standard data set has only one record or multiple identical records, or the height of the tree reaches a preset height range, and the height range of the tree For: In a non-exceeded data set containing n records, the minimum height of the constructed tree is log (n), and the maximum height of the constructed tree is n-1.
  • the abnormal point summary unit includes:
  • Generate a path length module and set it to input the real-time data in the real-time monitoring data one by one into the corresponding isolated forest model.
  • the real-time data is divided into M times according to the isolated forest model and no longer divided, the real-time data is at the root node of the isolated forest model.
  • the path length to the leaf node is M;
  • the normalization processing module is configured to perform normalization processing on the path length M of the real-time data to obtain M ′;
  • the abnormal point summary table module is set to a preset abnormal point threshold value Y.
  • M ′ is greater than Y
  • the real-time data is set as an abnormal point, and summarized to generate an abnormal point summary table.
  • a computer device which includes a memory and a processor.
  • the memory stores computer-readable instructions.
  • the processor causes the processor to execute the pollutant abnormality in the foregoing embodiments. Steps in a monitoring method.
  • a storage medium storing computer-readable instructions.
  • the one or more processors are caused to execute the pollutant abnormality in each of the foregoing embodiments. Steps in a monitoring method.
  • the storage medium may be a non-volatile storage medium.
  • the program may be stored in a computer-readable storage medium.
  • the storage medium may include: Read-only memory (ROM, Read Only Memory), random access memory (RAM, Random Access Memory), magnetic disks or optical disks, etc.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Human Resources & Organizations (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Strategic Management (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Marketing (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Health & Medical Sciences (AREA)
  • General Business, Economics & Management (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Game Theory and Decision Science (AREA)
  • Operations Research (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Quality & Reliability (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Primary Health Care (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

一种污染物异常监测方法、***、计算机设备和存储介质,涉及环境污染数据处理技术领域,其中监测方法包括:获取历史环境监测数据并设置为数据集进行存储,对污染物的指标项设置指标阈值,根据指标阈值对数据集进行筛选,筛选出未超过指标阈值的数据设置为特征项存储在未超标数据集中;采用特征项训练出孤立森林模型;获取实时监测数据,将实时监测数据输入孤立森林模型中,通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总;能监测异常点数据,简单快捷,并且能***出污染源超标情况并进行输出,预防超标的产生。

Description

污染物异常监测方法、***、计算机设备和存储介质
本申请要求于2018年07月11日提交中国专利局、申请号为201810757268.8、发明名称为“污染物异常监测方法、***、计算机设备和存储介质”的中国专利申请的优先权,其全部内容通过引用结合在本申请中。
技术领域
本申请涉及环境污染数据处理技术领域,尤其涉及一种污染物异常监测方法、***、计算机设备和存储介质。
背景技术
污染源是指造成环境污染的污染物发生源,通常指向环境排放有害物质或对环境产生有害影响的场所、设备、装置或人体。任何以不适当的浓度、数量、速度、形态和途径进入环境***并对环境产生污染或破坏的物质或能量,统称为污染物。在工业生产中的一些环节,如原料生产、加工过程、燃烧过程、加热和冷却过程、成品整理过程等使用的生产设备或生产场所都可能成为工业污染源。现有技术中,对于污染源排放的监测一般有两种方法,一是监督性监测,即定期检查污染源排放废气中的有害物质含量是否符合国家规定。二是研究性监测,是对污染源排放污染物的种类、排放量、排放规律进行监测,有利于查清空气污染的主要来源,探讨空气污染发展的趋势,制订污染控制措施,改善环境空气质量。
但是,无论是那种检测方式,目前均是通过单项污染源的达标阈值设定,对比单项污染源检测数据,发现排污超标企业。而存在的问题是污染源种类复杂,单项阈值的设定和查比繁琐,并且阈值的设定无法预防超标的产生。
发明内容
有鉴于此,有必要针对通过单项污染源的达标阈值设定查比繁琐,无法预防超标的产生的问题,提供一种污染物异常监测方法、***、计算机设备和存 储介质。
一种污染物异常监测方法,包括如下步骤:
从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的所述孤立森林模型;
从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
一种污染物异常监测***,包括如下单元:
获取数据单元,设置为从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
筛选单元,设置为对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
训练单元,设置为采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的所述孤立森林模型;
异常点汇总单元,设置为从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读 指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的所述孤立森林模型;
从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:
从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的所述孤立森林模型;
从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
上述污染物异常监测方法、装置、计算机设备和存储介质,包括从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;对每项污染物的每个指标项设置指标阈值,根据指标阈值对每项数据集进行筛选,筛选出未超过指标阈值的数据设置为特征项,将特征项存储在未超标数据集中;采用未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的孤立森林模型;从环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将实时监测数据输入与污染物对应的孤立森林模型中,通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。本申请通过对历史数据进行筛选,筛选出未超标的污染物数据作为特征项,通过孤立森林模型对企业排污情况做异常点监测的方式,监测异常点数据简单快捷,能***出污染源超标情况并进行输出,预防超标的产生。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本申请的限制。
图1为本申请一个实施例中的污染物异常监测方法的流程图;
图2为图1中步骤S3的流程图;
图3为步骤S3构造的一种树的结构图;
图4为图1中步骤S4的流程图;
图5为本申请一个实施例中的污染物异常监测***的结构图;
图6为图5中的异常点汇总单元的模块示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实 施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。
图1为本申请一个实施例中的污染物异常监测方法的流程图,如图1所示,监测方法,包括如下步骤:
步骤S1,获取数据:从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储。
本步骤对污染物异常监测主要是针对企业排放的污染物进行监测,因此本实施例中的企业是纳入生态环境部污染源监控中心的重点排污单位,预设的环境监测数据***是政府环保部门的生态环境部污染源监控中心的自动监控工作调度平台,或者第三方的环境监测数据***。环境监测数据***采集了每个重点排污单位的所有污染源监测点的历史环境监测数据和实时监测数据。
企业的污染源监测点一般设置在排水口处和排气口处,因此企业的污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物,在对历史环境监测数据进行存储时,数据集按照排水污染物数据集和排气污染物数据集分类存储。
步骤S2,筛选数据:对每项污染物的每个指标项设置指标阈值,根据指标阈值对每项数据集进行筛选,筛选出未超过指标阈值的数据设置为特征项,将特征项存储在未超标数据集中。
在对数据集中的数据进行筛选前,针对污染物的每个指标项均设置对应的指标阈值。其中,排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项,对排水污染物的指标项均设有对应的指标阈值。排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一 氧化碳指标中的至少一种指标项,对排气污染物指标项均设有对应的指标阈值。本步骤中,污染物的指标项及对应指标阈值如下表1所示:
Figure PCTCN2018106682-appb-000001
表1
对污染物设置阈值时,对于排气污染物,可参照《大气污染物综合排放标准》(GB 16297-1996),对于排水污染物,可参照《污水综合排放标准》(GB8978-1996),以便于更符合国家规定的污染物排放标准,筛查出更精确的未超标数据。
本步骤根据预设的指标阈值,对每项数据集进行筛选,筛选出未超过阈值的数据,作为特征项合并存储在未超标数据集中。将特征项存储在未超标数据集中时,以每个企业的一项污染物对特征项进行分类存储在对应的未超标数据集中。即每个企业的排水污染物数据集筛选出的特征项存储为排水未超标数据集,每个企业的排气污染物数据集筛选出的特征项存储为排气未超标数据集。以便于后续训练孤立森林模型时,作为企业某一项污染物的样本使用。
步骤S3,训练模型:采用未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的孤立森林模型。
孤立森林模型,即Isolation Forest模型,是一个快速异常检测方法,具有线性时间复杂度和高精准度,是符合大数据处理要求的算法。孤立森林模型适用于连续数据(Continuous numerical data)的异常检测,将异常定义为“容 易被孤立的离群点”,可以理解为分布稀疏且离密度高的群体较远的点。用统计学来解释的话,即在数据空间里面,分布稀疏的区域表示数据发生在此区域的概率很低,因而可以认为落在这些区域里的数据是异常的。
因此孤立森林模型基于上述原理,通过样本建立二分树:输入训练数据集A,e为当前的树高,l为树的高度限制。首先将A放在根节点中,随机选择A中的一个维度q,并在q上的最大值和最小值之间随机选择一个值p,将A中在q上比p大的样本流向右子节点中,比p小的样本流向左子节点。然后重复上述步骤直到:每个子节点中都只有一个样本或者多个相同的样本,即每个样本都被孤立了,或树的高度达到l。当采用上述方法建立树的时候,异常点更容易被孤立,因此其被孤立时所在的叶子节点的路径长度也较短,即从根节点到异常点所在叶子节点所经历过的边数较短,而正常点不容易被孤立,因此其路径长度也较长。
步骤S4,异常点汇总:从环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将实时监测数据输入与污染物对应的孤立森林模型中,通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
本步骤基于孤立森林模型的异常点更容易被孤立,异常点被孤立时从根节点到异常点所在叶子节点所经历过的边数较短的特性,通过将实时监测数据输入孤立森林模型中,得到边上较短,即路径长度较短的一些数据设置为异常点,并将这些异常点进行汇总,实现污染源异常点的监测。
本实施例,通过对预设的环境监测数据***中获取历史环境监测数据,训练出较为精确的孤立森林模型,并采用此孤立森林模型对实时监测数据进行监测,监测出异常点并汇总,整个过程监测数据简单快捷,能较为准确的监测出企业各种污染源的超标情况并进行汇总,预防超标的产生。
在一个实施例中,步骤S3中,采用未超标数据集中的特征项训练孤立森林模型时,如图2所示,采用如下方法:
步骤S301,取点构造特征:取未超标数据集中每N小时的特征项设置为一个点构造特征。由于未超标数据集中的数据可能较多,因此为了减少采用数据, 取未超标数据集中以小时为单位的特征项进行训练,即可以选择每小时的特征项或每2小时的特征项等设置为点构造特征。将这些点构造特征放入孤立森林模型的树的根节点。
步骤S302,设差分阈值:每个点构造特征和前一个点构造特征之间的差分设差分阈值为X。差分阈值可以随机产生作为当前节点的切割点。
步骤S303,构造树的左右子节点:两个相邻点构造特征之间的差分小于X的被分到树的左子节点,差分大于等于X的被分到树的右子节点。
步骤S304,递归构造树:递归步骤S302和S303,不断构造左子节点和右子节点,直到满足以下条件:训练的未超标数据集只有一条记录或多条一样的记录,或者树的高度达到预设高度范围,树的高度范围为:在包含n条记录的未超标数据集中,构造的树的高度最小值为log(n),构造的树的高度最大值为n-1。
具体的,如图3所示,比如a、b、c、d四个点构造特征,放入孤立森林模型,遍历一颗树时,先将a、b、c、d四个点构造特征放入孤立森林模型的树的根节点。a、b、c三个点构造特征和前一个点构造特征之间的差分小于X,被分到树的左子节点,d点构造特征和前一个点构造特征之间的差分大于X,被分到树的右子节点。递归上述步骤,不断构造左子节点和右子节点,如图3所示,经过三次递归后,得到每个叶子节点均只有一条记录。可以看到,d点构造特征最早就被孤立,因此d点构造特征最有可能是异常点。
本实施例在对未超标数据集中的特征项训练孤立森林模型时,首先对未超标数据集中的数据进行筛选,以确保训练出的孤立森林模型尽可能精确的前提下,减少数据采集量。在设置切割点时,采用差分阈值的形式,能有效反映出每N小时相邻的两个点构造特征之间的变化,最终得到的孤立森林模型作为异常点监控时,能更为可靠。
在一个实施例中,步骤S4中,将实时监测数据输入与污染物对应的孤立森林模型中,通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点时,如图4所示,采用如下步骤:
步骤S401,生成路径长度:将实时监测数据中的实时数据逐个输入对应的 孤立森林模型中,实时数据按照孤立森林模型被划分为M次后不再划分时,实时数据在孤立森林模型的根节点到叶子节点的路径长度为M。
具体的,如图3所示,如果a、b、c、d是实时监测数据中的四个实时数据,则a点构造特征的路径长度为2,b和c点构造特征的路径长度为3,d点构造特征的路径长度为1。
步骤S402,归一化处理:对实时数据的路径长度M做归一化处理,得到M’。
归一化处理时,采用如下方式:
首先统计所有树上待判断点x的平均路径,记为E(h(x)),E()表示平均,h(x)表示x的路径长度。假设实时监测数据中有n个点,n个点如果用一个孤立森林模型中树来搜索,n个点的平均路径长度c(n)=2H(n-1)-(2(n-1)/n)。H(k)=ln(k)+ξ,ξ=0.5772156649为欧拉常数,归一化后的s(x,n)为:
Figure PCTCN2018106682-appb-000002
其中,M=h(x),M’=s(x,n);
s(x,n)取值范围为[0,1]。
步骤S403,异常点汇总:预设异常点阈值Y,当M’大于Y时,将实时数据设置为异常点,进行汇总,生成异常点汇总表。
由于归一化后的M’取值范围为[0,1],异常点判断时,M’越接近1表示此实时数据是异常点的可能性高,M’越接近0表示此实时数据是正常点的可能性高,如果实时监测数据中的实时数据都接近于0.5,说明整个实时监测数据中都没有明显的异常点。因此,异常点阈值Y取值范围应大于0.5,靠近1的数值。
本实施例,在判断异常点时,引入归一化处理的方式,对某一实时数据的路径长度进行归一化,将路径长度变成一个无刚量的标量,以便于异常点的汇总和后续各个污染物的异常点比较。
在一个实施例中,提出了一种污染物异常监测***,如图5所示,包括如下单元:
获取数据单元,设置为从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将历史环境监测数据以每个企业的一项污染物 设置为一项数据集进行存储;
筛选单元,设置为对每项污染物的每个指标项设置指标阈值,根据指标阈值对每项数据集进行筛选,筛选出未超过指标阈值的数据设置为特征项,将特征项存储在未超标数据集中;
训练单元,设置为采用未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的孤立森林模型;
异常点汇总单元,设置为从环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将实时监测数据输入与污染物对应的孤立森林模型中,通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
在一个实施例中,获取数据单元中的污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物,在对历史环境监测数据进行存储时,每个企业均存储排水污染物数据集和排气污染物数据集。
在一个实施例中,排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项,对排水污染物的指标项均设有对应的指标阈值;排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一氧化碳指标中的至少一种指标项,对排气污染物指标项均设有对应的指标阈值。
在一个实施例中,筛选单元,还设置为以每个企业的一项污染物对特征项进行分类存储在对应的未超标数据集中。
在一个实施例中,训练单元,包括:构造树的左右子节点模块,设置为取未超标数据集中每N小时的特征项设置为一个点构造特征,每个点构造特征和前一个点构造特征之间的差分设差分阈值为X,则两个相邻点构造特征之间的差分小于X的被分到树的左子节点,差分大于等于X的被分到树的右子节点;
递归模块,设置为递归构造左子节点和右子节点,直到满足以下条件:训练的未超标数据集只有一条记录或多条一样的记录,或者树的高度达到预设高度范围,树的高度范围为:在包含n条记录的未超标数据集中,构造的树的高度最小值为log(n),构造的树的高度最大值为n-1。
在一个实施例中,如图6所示,异常点汇总单元包括:
生成路径长度模块,设置为将实时监测数据中的实时数据逐个输入对应的孤立森林模型中,实时数据按照孤立森林模型被划分为M次后不再划分时,实时数据在孤立森林模型的根节点到叶子节点的路径长度为M;
归一化处理模块,设置为对实时数据的路径长度M做归一化处理,得到M’;
生成异常点汇总表模块,设置为预设异常点阈值Y,当M’大于Y时,将实时数据设置为异常点,进行汇总,生成异常点汇总表。
在一个实施例中,提出了一种计算机设备,包括存储器和处理器,存储器中存储有计算机可读指令,计算机可读指令被处理器执行时,使得处理器执行上述各实施例里污染物异常监测方法中的步骤。
在一个实施例中,提出了一种存储有计算机可读指令的存储介质,计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行上述各实施例里污染物异常监测方法中的步骤。其中,存储介质可以为非易失性存储介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请一些示例性实施例,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

Claims (20)

  1. 一种污染物异常监测方法,包括:
    从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
    对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
    采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的所述孤立森林模型;
    从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
  2. 根据权利要求1所述的污染物异常监测方法,其中,所述污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物,在对所述历史环境监测数据进行存储时,每个企业均存储排水污染物数据集和排气污染物数据集。
  3. 根据权利要求2所述的污染物异常监测方法,其中,所述排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项,对所述排水污染物的指标项均设有对应的指标阈值;
    所述排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一氧化碳指标中的至少一种指标项,对所述排气污染物指标项均设有对应的指标阈值。
  4. 根据权利要求1所述的污染物异常监测方法,其中,所述将所述特征项存储在未超标数据集中,包括:以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
  5. 根据权利要求1所述的污染物异常监测方法,其中,所述采用所述未超标数据集中的特征项训练所述孤立森林模型,包括:
    取所述未超标数据集中每N小时的特征项设置为一个点构造特征,每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X,则两个相邻点构造特征之间的差分小于X的被分到树的左子节点,差分大于等于X的被分到树的右子节点;
    递归构造所述左子节点和所述右子节点,直到满足以下条件:
    训练的所述未超标数据集只有一条记录或多条一样的记录,或者树的高度达到预设高度范围,所述树的高度范围为:在包含n条记录的所述未超标数据集中,构造的树的高度最小值为log(n),构造的树的高度最大值为n-1。
  6. 根据权利要求1所述的污染物异常监测方法,其中,所述将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,包括:
    将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中,所述实时数据按照所述孤立森林模型被划分为M次后不再划分时,所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M;
    对所述实时数据的路径长度M做归一化处理,得到M’;
    预设异常点阈值Y,当M’大于Y时,将所述实时数据设置为异常点,进行汇总,生成异常点汇总表。
  7. 一种污染物异常监测***,包括:
    获取数据单元,设置为从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
    筛选单元,设置为对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
    训练单元,设置为采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的所述孤立森林模型;
    异常点汇总单元,设置为从所述环境监测数据***中获取一企业中一项污 染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
  8. 根据权利要求7所述的污染物异常监测***,其中,所述获取数据单元中的所述污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物,在对所述历史环境监测数据进行存储时,每个企业均存储排水污染物数据集和排气污染物数据集。
  9. 根据权利要求8所述的污染物异常监测***,其中,所述排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项,对所述排水污染物的指标项均设有对应的指标阈值;
    所述排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一氧化碳指标中的至少一种指标项,对所述排气污染物指标项均设有对应的指标阈值。
  10. 根据权利要求7所述的污染物异常监测***,其中,所述筛选单元,还设置为以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
  11. 根据权利要求7所述的污染物异常监测***,其中,所述训练单元,包括:
    构造树的左右子节点模块,设置为取所述未超标数据集中每N小时的特征项设置为一个点构造特征,每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X,则两个相邻点构造特征之间的差分小于X的被分到树的左子节点,差分大于等于X的被分到树的右子节点;
    递归模块,设置为递归构造所述左子节点和所述右子节点,直到满足以下条件:训练的所述未超标数据集只有一条记录或多条一样的记录,或者树的高度达到预设高度范围,所述树的高度范围为:在包含n条记录的所述未超标数据集中,构造的树的高度最小值为log(n),构造的树的高度最大值为n-1。
  12. 根据权利要求7所述的污染物异常监测***,其中,所述异常点汇总单元包括:
    生成路径长度模块,设置为将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中,所述实时数据按照所述孤立森林模型被划分为M次后不再划分时,所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M;
    归一化处理模块,设置为对所述实时数据的路径长度M做归一化处理,得到M’;
    生成异常点汇总表模块,设置为预设异常点阈值Y,当M’大于Y时,将所述实时数据设置为异常点,进行汇总,生成异常点汇总表。
  13. 一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机可读指令,所述计算机可读指令被所述处理器执行时,使得所述处理器执行以下步骤:
    从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
    对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
    采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数据集均建立对应的所述孤立森林模型;
    从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
  14. 根据权利要求13所述的计算机设备,其中,所述将所述特征项存储在未超标数据集中时,使得所述处理器执行以下步骤:
    以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
  15. 根据权利要求13所述的计算机设备,其中,所述采用所述未超标数据 集中的特征项训练所述孤立森林模型时,使得所述处理器执行以下步骤:
    取所述未超标数据集中每N小时的特征项设置为一个点构造特征,每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X,则两个相邻点构造特征之间的差分小于X的被分到树的左子节点,差分大于等于X的被分到树的右子节点;
    递归构造所述左子节点和所述右子节点,直到满足以下条件:
    训练的所述未超标数据集只有一条记录或多条一样的记录,或者树的高度达到预设高度范围,所述树的高度范围为:在包含n条记录的所述未超标数据集中,构造的树的高度最小值为log(n),构造的树的高度最大值为n-1。
  16. 根据权利要求13所述的计算机设备,其中,所述将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点时,使得所述处理器执行以下步骤:
    将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中,所述实时数据按照所述孤立森林模型被划分为M次后不再划分时,所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M;
    对所述实时数据的路径长度M做归一化处理,得到M’;
    预设异常点阈值Y,当M’大于Y时,将所述实时数据设置为异常点,进行汇总,生成异常点汇总表。
  17. 一种存储有计算机可读指令的存储介质,所述计算机可读指令被一个或多个处理器执行时,使得一个或多个处理器执行以下步骤:
    从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据,将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储;
    对每项所述污染物的每个指标项设置指标阈值,根据所述指标阈值对每项所述数据集进行筛选,筛选出未超过所述指标阈值的数据设置为特征项,将所述特征项存储在未超标数据集中;
    采用所述未超标数据集中的特征项训练出孤立森林模型,对每项未超标数 据集均建立对应的所述孤立森林模型;
    从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据,将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点,并将异常点进行汇总。
  18. 根据权利要求17所述的存储介质,其中,所述将所述特征项存储在未超标数据集中时,使得一个或多个所述处理器执行以下步骤:
    以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
  19. 根据权利要求17所述的存储介质,其中,所述采用所述未超标数据集中的特征项训练所述孤立森林模型时,使得一个或多个所述处理器执行以下步骤:
    取所述未超标数据集中每N小时的特征项设置为一个点构造特征,每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X,则两个相邻点构造特征之间的差分小于X的被分到树的左子节点,差分大于等于X的被分到树的右子节点;
    递归构造所述左子节点和所述右子节点,直到满足以下条件:
    训练的所述未超标数据集只有一条记录或多条一样的记录,或者树的高度达到预设高度范围,所述树的高度范围为:在包含n条记录的所述未超标数据集中,构造的树的高度最小值为log(n),构造的树的高度最大值为n-1。
  20. 根据权利要求17所述的存储介质,其中,所述将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中,通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点时,使得一个或多个所述处理器执行以下步骤:
    将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中,所述实时数据按照所述孤立森林模型被划分为M次后不再划分时,所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M;
    对所述实时数据的路径长度M做归一化处理,得到M’;
    预设异常点阈值Y,当M’大于Y时,将所述实时数据设置为异常点,进行汇总,生成异常点汇总表。
PCT/CN2018/106682 2018-07-11 2018-09-20 污染物异常监测方法、***、计算机设备和存储介质 WO2020010701A1 (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201810757268.8 2018-07-11
CN201810757268.8A CN108921440B (zh) 2018-07-11 2018-07-11 污染物异常监测方法、***、计算机设备和存储介质

Publications (1)

Publication Number Publication Date
WO2020010701A1 true WO2020010701A1 (zh) 2020-01-16

Family

ID=64412682

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/CN2018/106682 WO2020010701A1 (zh) 2018-07-11 2018-09-20 污染物异常监测方法、***、计算机设备和存储介质

Country Status (2)

Country Link
CN (1) CN108921440B (zh)
WO (1) WO2020010701A1 (zh)

Cited By (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428886A (zh) * 2020-04-10 2020-07-17 青岛聚好联科技有限公司 一种故障诊断的深度学习模型自适应更新的方法及装置
CN111950853A (zh) * 2020-07-14 2020-11-17 东南大学 一种基于信息物理双侧数据的电力运行状态白名单生成方法
CN112016050A (zh) * 2020-08-07 2020-12-01 汉威科技集团股份有限公司 一种基于流形学习的cems***异常数据监控方法
CN112084382A (zh) * 2020-09-04 2020-12-15 安徽思环科技有限公司 用于工业园区污染源水质三维荧光数据的预处理方法
CN112085081A (zh) * 2020-09-02 2020-12-15 董萍 一种污水成分检测方法及***
CN112232648A (zh) * 2020-10-09 2021-01-15 生态环境部环境规划院 一种钢铁与炼焦企业炼焦普查数据宏观校核方法及***
CN112505278A (zh) * 2020-11-30 2021-03-16 深圳市联正通达科技有限公司 一种抽样式污水监控分析设备
CN112597144A (zh) * 2020-12-29 2021-04-02 农业农村部环境保护科研监测所 一种产地环境监测数据的自动化清洗方法
CN112733897A (zh) * 2020-12-30 2021-04-30 胜斗士(上海)科技技术发展有限公司 确定多维样本数据的异常原因的方法和设备
CN112860671A (zh) * 2021-01-19 2021-05-28 中国石油天然气集团有限公司 一种生产要素数据异常诊断方法及装置
CN113420652A (zh) * 2021-06-22 2021-09-21 中冶赛迪重庆信息技术有限公司 一种时序信号片段异常识别方法、***、介质及终端
CN113777223A (zh) * 2021-08-12 2021-12-10 北京金水永利科技有限公司 一种大气污染物溯源方法及***
CN113792988A (zh) * 2021-08-24 2021-12-14 河北先河环保科技股份有限公司 一种企业在线监测数据异常识别方法
CN114062038A (zh) * 2020-07-31 2022-02-18 力合科技(湖南)股份有限公司 一种污染溯源管控方法
CN114236068A (zh) * 2021-11-24 2022-03-25 中冶赛迪重庆信息技术有限公司 一种基于循环水***的氯离子浓度分析方法及***
CN114527206A (zh) * 2022-01-25 2022-05-24 长安大学 一种磺胺类抗生素地下水污染的溯源方法及***
CN114611616A (zh) * 2022-03-16 2022-06-10 吕少岚 一种基于集成孤立森林的无人机智能故障检测方法及***
CN114931854A (zh) * 2022-05-31 2022-08-23 北京实力伟业环保科技有限公司 一种微生物净化废气的***及方法
CN115171362A (zh) * 2022-09-07 2022-10-11 江西珉轩智能科技有限公司 一种面向重点区域防控的预警方法及***
CN115291006A (zh) * 2022-07-21 2022-11-04 福州大学 基于用电数据的污染企业环保工况异常识别方法
CN116069892A (zh) * 2023-03-27 2023-05-05 乳山市海洋经济发展中心 一种基于海洋工程的环境数据处理方法及***
CN116484153A (zh) * 2023-06-20 2023-07-25 北京泰豪智能工程有限公司 一种基于卫星物联网的环境监测方法
CN116500240A (zh) * 2023-06-21 2023-07-28 江西索立德环保服务有限公司 一种土壤环境质量监测方法、***及可读存储介质
CN116522270A (zh) * 2023-07-04 2023-08-01 西安启迪能源技术有限公司 用于智慧海绵城市的数据处理***
CN116576553A (zh) * 2023-07-11 2023-08-11 韦德电子有限公司 一种空气调节机数据优化采集方法及***
CN116627953A (zh) * 2023-05-24 2023-08-22 首都师范大学 一种地下水位监测数据缺失的修复方法
CN116699072A (zh) * 2023-06-08 2023-09-05 东莞市华复实业有限公司 基于侦测巡航的环境预警方法
CN116718249A (zh) * 2023-08-08 2023-09-08 山东元明晴技术有限公司 一种水利工程液位检测***
CN116992390A (zh) * 2023-09-26 2023-11-03 北京联创高科信息技术有限公司 一种异常数据的配置及展示方法
CN116992244A (zh) * 2023-09-26 2023-11-03 山东益来环保科技有限公司 一种cems智能化监测***
CN117151391A (zh) * 2023-08-30 2023-12-01 深圳市水务工程检测有限公司 一种基于物联网的环境污染监测***及方法
CN117194920A (zh) * 2023-09-06 2023-12-08 万仁企业管理技术(深圳)有限公司 一种基于大数据分析的数据***处理平台及处理方法
CN117454096A (zh) * 2023-12-25 2024-01-26 西安高商智能科技有限责任公司 一种电机生产质量检测方法及***
CN117455124A (zh) * 2023-12-25 2024-01-26 杭州烛微智能科技有限责任公司 企业的环保设备监测方法、***、介质及电子设备
CN117538491A (zh) * 2024-01-09 2024-02-09 武汉怡特环保科技有限公司 一种站房空气质量智能监测方法及***
CN118313564A (zh) * 2024-06-05 2024-07-09 生态环境部环境工程评估中心 企业排放物监测数据的异常识别方法、装置、设备及介质

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109828825A (zh) * 2019-01-07 2019-05-31 平安科技(深圳)有限公司 异常数据检测方法、装置、计算机设备及存储介质
CN109902721B (zh) * 2019-01-28 2024-07-02 平安科技(深圳)有限公司 异常点检测模型验证方法、装置、计算机设备及存储介质
CN109785595A (zh) * 2019-02-26 2019-05-21 成都古河云科技有限公司 一种基于机器学习的车辆异常轨迹实时识别方法
CN110243599B (zh) * 2019-07-02 2020-05-05 西南交通大学 多维离群列车动车组轴箱轴承温度异常状态监测方法
CN110398375B (zh) * 2019-07-16 2021-10-19 广州亚美信息科技有限公司 车辆冷却***工作状态的监测方法、装置、设备和介质
CN110469522A (zh) * 2019-08-13 2019-11-19 浪潮通用软件有限公司 一种排水***的异常检测方法及装置
CN111160647B (zh) * 2019-12-30 2023-08-22 第四范式(北京)技术有限公司 一种洗钱行为预测方法及装置
CN111275547B (zh) * 2020-03-19 2023-07-18 重庆富民银行股份有限公司 基于孤立森林的风控***及方法
CN111675257B (zh) * 2020-06-16 2022-04-12 浙江富春紫光环保股份有限公司 一种污水处理厂的远程集控方法与***
CN111783904B (zh) * 2020-09-04 2020-12-04 平安国际智慧城市科技股份有限公司 基于环境数据的数据异常分析方法、装置、设备及介质
CN113420816A (zh) * 2021-06-24 2021-09-21 北京市生态环境监测中心 一种针对全光谱水质监测设备的数据异常值确定方法
CN113655111A (zh) * 2021-08-17 2021-11-16 北京雪迪龙科技股份有限公司 基于走航监测的大气挥发性有机物溯源方法
CN114417263B (zh) * 2022-01-27 2022-10-04 中国环境科学研究院 污染物波动系数确定、污染物监控方法及装置、存储介质
CN116773238B (zh) * 2023-06-16 2024-01-19 南方电网调峰调频发电有限公司检修试验分公司 一种基于工业数据的故障监测方法及***
CN116933186B (zh) * 2023-09-14 2023-11-24 江苏新路德建设有限公司 基于数据驱动的污水管网堵塞实时监测方法
CN116992391B (zh) * 2023-09-27 2023-12-15 青岛冠宝林活性炭有限公司 一种硬碳工艺环保监测数据采集处理方法
CN117436005B (zh) * 2023-12-21 2024-03-15 山东汇力环保科技有限公司 一种环境空气自动监测过程中异常数据处理方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020642A (zh) * 2012-10-08 2013-04-03 江苏省环境监测中心 水环境监测质控数据分析方法
CN104063609A (zh) * 2014-07-01 2014-09-24 北京金控自动化技术有限公司 一种利用神经网络辅助判定污染源监测数据有效性的方法
CN106682685A (zh) * 2016-12-06 2017-05-17 重庆大学 基于微波加热温度场分布特征深度学习的局部温度变化异常检测方法
CN106846806A (zh) * 2017-03-07 2017-06-13 北京工业大学 基于Isolation Forest的城市道路交通异常检测方法
CN106872657A (zh) * 2017-01-05 2017-06-20 河海大学 一种多变量水质参数时序数据异常事件检测方法
CN107292350A (zh) * 2017-08-04 2017-10-24 电子科技大学 大规模数据的异常检测方法
CN107657288A (zh) * 2017-10-26 2018-02-02 国网冀北电力有限公司 一种基于孤立森林算法的电力调度流数据异常检测方法

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7866204B2 (en) * 2007-01-31 2011-01-11 The United States Of America As Represented By The Administrator Of The United States Environmental Protection Agency Adaptive real-time contaminant detection and early warning for drinking water distribution systems
US8954365B2 (en) * 2012-06-21 2015-02-10 Microsoft Corporation Density estimation and/or manifold learning
CN104091061B (zh) * 2014-07-01 2017-04-26 北京金控数据技术股份有限公司 一种利用正态分布辅助判定污染源监测数据有效性的方法
CN106485353B (zh) * 2016-09-30 2019-11-29 中国科学院遥感与数字地球研究所 空气污染物浓度预报方法及***

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103020642A (zh) * 2012-10-08 2013-04-03 江苏省环境监测中心 水环境监测质控数据分析方法
CN104063609A (zh) * 2014-07-01 2014-09-24 北京金控自动化技术有限公司 一种利用神经网络辅助判定污染源监测数据有效性的方法
CN106682685A (zh) * 2016-12-06 2017-05-17 重庆大学 基于微波加热温度场分布特征深度学习的局部温度变化异常检测方法
CN106872657A (zh) * 2017-01-05 2017-06-20 河海大学 一种多变量水质参数时序数据异常事件检测方法
CN106846806A (zh) * 2017-03-07 2017-06-13 北京工业大学 基于Isolation Forest的城市道路交通异常检测方法
CN107292350A (zh) * 2017-08-04 2017-10-24 电子科技大学 大规模数据的异常检测方法
CN107657288A (zh) * 2017-10-26 2018-02-02 国网冀北电力有限公司 一种基于孤立森林算法的电力调度流数据异常检测方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
LIU, FEITONY ET AL., ISOLATION FOREST'' 2008 EIGHTH IEEE INTERNATIONAL CONFERENCE ON DATA MINING, 31 December 2008 (2008-12-31), XP031423720 *

Cited By (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111428886B (zh) * 2020-04-10 2023-08-04 青岛聚好联科技有限公司 一种故障诊断的深度学习模型自适应更新的方法及装置
CN111428886A (zh) * 2020-04-10 2020-07-17 青岛聚好联科技有限公司 一种故障诊断的深度学习模型自适应更新的方法及装置
CN111950853A (zh) * 2020-07-14 2020-11-17 东南大学 一种基于信息物理双侧数据的电力运行状态白名单生成方法
CN111950853B (zh) * 2020-07-14 2024-05-31 东南大学 一种基于信息物理双侧数据的电力运行状态白名单生成方法
CN114062038A (zh) * 2020-07-31 2022-02-18 力合科技(湖南)股份有限公司 一种污染溯源管控方法
CN112016050B (zh) * 2020-08-07 2023-11-21 汉威科技集团股份有限公司 一种基于流形学习的cems***异常数据监控方法
CN112016050A (zh) * 2020-08-07 2020-12-01 汉威科技集团股份有限公司 一种基于流形学习的cems***异常数据监控方法
CN112085081B (zh) * 2020-09-02 2024-02-02 西部第三方检测集团(宁夏)有限公司 一种污水成分检测方法及***
CN112085081A (zh) * 2020-09-02 2020-12-15 董萍 一种污水成分检测方法及***
CN112084382A (zh) * 2020-09-04 2020-12-15 安徽思环科技有限公司 用于工业园区污染源水质三维荧光数据的预处理方法
CN112232648A (zh) * 2020-10-09 2021-01-15 生态环境部环境规划院 一种钢铁与炼焦企业炼焦普查数据宏观校核方法及***
CN112505278A (zh) * 2020-11-30 2021-03-16 深圳市联正通达科技有限公司 一种抽样式污水监控分析设备
CN112505278B (zh) * 2020-11-30 2024-05-17 福建钱江水务有限公司 一种抽样式污水监控分析设备
CN112597144A (zh) * 2020-12-29 2021-04-02 农业农村部环境保护科研监测所 一种产地环境监测数据的自动化清洗方法
CN112733897A (zh) * 2020-12-30 2021-04-30 胜斗士(上海)科技技术发展有限公司 确定多维样本数据的异常原因的方法和设备
CN112860671A (zh) * 2021-01-19 2021-05-28 中国石油天然气集团有限公司 一种生产要素数据异常诊断方法及装置
CN113420652A (zh) * 2021-06-22 2021-09-21 中冶赛迪重庆信息技术有限公司 一种时序信号片段异常识别方法、***、介质及终端
CN113777223B (zh) * 2021-08-12 2024-04-30 北京金水永利科技有限公司 一种大气污染物溯源方法及***
CN113777223A (zh) * 2021-08-12 2021-12-10 北京金水永利科技有限公司 一种大气污染物溯源方法及***
CN113792988A (zh) * 2021-08-24 2021-12-14 河北先河环保科技股份有限公司 一种企业在线监测数据异常识别方法
CN114236068A (zh) * 2021-11-24 2022-03-25 中冶赛迪重庆信息技术有限公司 一种基于循环水***的氯离子浓度分析方法及***
CN114236068B (zh) * 2021-11-24 2024-03-01 中冶赛迪信息技术(重庆)有限公司 一种基于循环水***的氯离子浓度分析方法及***
CN114527206A (zh) * 2022-01-25 2022-05-24 长安大学 一种磺胺类抗生素地下水污染的溯源方法及***
CN114611616A (zh) * 2022-03-16 2022-06-10 吕少岚 一种基于集成孤立森林的无人机智能故障检测方法及***
CN114931854A (zh) * 2022-05-31 2022-08-23 北京实力伟业环保科技有限公司 一种微生物净化废气的***及方法
CN114931854B (zh) * 2022-05-31 2023-05-26 北京实力伟业环保科技有限公司 一种微生物净化废气的***及方法
CN115291006A (zh) * 2022-07-21 2022-11-04 福州大学 基于用电数据的污染企业环保工况异常识别方法
CN115171362A (zh) * 2022-09-07 2022-10-11 江西珉轩智能科技有限公司 一种面向重点区域防控的预警方法及***
CN116069892B (zh) * 2023-03-27 2023-08-04 乳山市海洋经济发展中心 一种基于海洋工程的环境数据处理方法及***
CN116069892A (zh) * 2023-03-27 2023-05-05 乳山市海洋经济发展中心 一种基于海洋工程的环境数据处理方法及***
CN116627953B (zh) * 2023-05-24 2023-10-27 首都师范大学 一种地下水位监测数据缺失的修复方法
CN116627953A (zh) * 2023-05-24 2023-08-22 首都师范大学 一种地下水位监测数据缺失的修复方法
CN116699072A (zh) * 2023-06-08 2023-09-05 东莞市华复实业有限公司 基于侦测巡航的环境预警方法
CN116699072B (zh) * 2023-06-08 2024-01-26 东莞市华复实业有限公司 基于侦测巡航的环境预警方法
CN116484153B (zh) * 2023-06-20 2023-09-01 北京泰豪智能工程有限公司 一种基于卫星物联网的环境监测方法
CN116484153A (zh) * 2023-06-20 2023-07-25 北京泰豪智能工程有限公司 一种基于卫星物联网的环境监测方法
CN116500240A (zh) * 2023-06-21 2023-07-28 江西索立德环保服务有限公司 一种土壤环境质量监测方法、***及可读存储介质
CN116500240B (zh) * 2023-06-21 2023-12-29 江西索立德环保服务有限公司 一种土壤环境质量监测方法、***及可读存储介质
CN116522270B (zh) * 2023-07-04 2023-09-15 西安启迪能源技术有限公司 用于智慧海绵城市的数据处理***
CN116522270A (zh) * 2023-07-04 2023-08-01 西安启迪能源技术有限公司 用于智慧海绵城市的数据处理***
CN116576553B (zh) * 2023-07-11 2023-09-22 韦德电子有限公司 一种空气调节机数据优化采集方法及***
CN116576553A (zh) * 2023-07-11 2023-08-11 韦德电子有限公司 一种空气调节机数据优化采集方法及***
CN116718249A (zh) * 2023-08-08 2023-09-08 山东元明晴技术有限公司 一种水利工程液位检测***
CN117151391A (zh) * 2023-08-30 2023-12-01 深圳市水务工程检测有限公司 一种基于物联网的环境污染监测***及方法
CN117194920A (zh) * 2023-09-06 2023-12-08 万仁企业管理技术(深圳)有限公司 一种基于大数据分析的数据***处理平台及处理方法
CN117194920B (zh) * 2023-09-06 2024-05-28 北京酷炫网络技术股份有限公司 一种基于大数据分析的数据***处理平台及处理方法
CN116992244B (zh) * 2023-09-26 2023-12-22 山东益来环保科技有限公司 一种cems智能化监测***
CN116992390A (zh) * 2023-09-26 2023-11-03 北京联创高科信息技术有限公司 一种异常数据的配置及展示方法
CN116992390B (zh) * 2023-09-26 2023-12-05 北京联创高科信息技术有限公司 一种异常数据的配置及展示方法
CN116992244A (zh) * 2023-09-26 2023-11-03 山东益来环保科技有限公司 一种cems智能化监测***
CN117455124A (zh) * 2023-12-25 2024-01-26 杭州烛微智能科技有限责任公司 企业的环保设备监测方法、***、介质及电子设备
CN117454096A (zh) * 2023-12-25 2024-01-26 西安高商智能科技有限责任公司 一种电机生产质量检测方法及***
CN117454096B (zh) * 2023-12-25 2024-03-01 西安高商智能科技有限责任公司 一种电机生产质量检测方法及***
CN117455124B (zh) * 2023-12-25 2024-03-08 杭州烛微智能科技有限责任公司 企业的环保设备监测方法、***、介质及电子设备
CN117538491A (zh) * 2024-01-09 2024-02-09 武汉怡特环保科技有限公司 一种站房空气质量智能监测方法及***
CN117538491B (zh) * 2024-01-09 2024-04-05 武汉怡特环保科技有限公司 一种站房空气质量智能监测方法及***
CN118313564A (zh) * 2024-06-05 2024-07-09 生态环境部环境工程评估中心 企业排放物监测数据的异常识别方法、装置、设备及介质

Also Published As

Publication number Publication date
CN108921440B (zh) 2022-08-05
CN108921440A (zh) 2018-11-30

Similar Documents

Publication Publication Date Title
WO2020010701A1 (zh) 污染物异常监测方法、***、计算机设备和存储介质
US11838308B2 (en) Computer-implemented method and arrangement for classifying anomalies
CN107391353A (zh) 基于日志的复杂软件***异常行为检测方法
CN112183709B (zh) 一种垃圾焚烧废气二噁英超标预测预警方法
CN110990393A (zh) 一种行业企业数据异常行为的大数据识别方法
CN116151621A (zh) 一种基于数据分析的大气污染治理风险检测***
CN113435471A (zh) 深度特征聚类的高排放移动源污染识别方法及***
CN115077627B (zh) 一种多融合环境数据监管方法及监管***
Costa et al. Modeling temporal activity to detect anomalous behavior in social media
KR102549313B1 (ko) 오염물질 배출수준 산정 시스템 및 방법
CN115098740B (zh) 一种基于多源异构数据源的数据质量检测方法及装置
CN113341087A (zh) 一种河道水质污染源智能监测分析方法、***及计算机存储介质
Cadena et al. Near-optimal and practical algorithms for graph scan statistics with connectivity constraints
CN116881747B (zh) 基于医疗废水监测的智能处理方法及***
CN109856321A (zh) 异常高值点位的确定方法
CN116504016B (zh) 一种基于人工智能的火电厂安全监测预警方法及***
US20160078071A1 (en) Large scale offline retrieval of machine operational information
CN116797649A (zh) 一种基于工业大数据的焚烧处理性能分析方法及***
CN105553990A (zh) 一种基于决策树算法的网络安全三元组异常检测方法
CN116149908A (zh) 一种数据链路熔断方法及装置和电子设备
CN116128697A (zh) 基于餐饮油烟监测数据的城市管理案件判定方法及***
CN113628423B (zh) 一种有害气体浓度监测报警***
CN114677052A (zh) 基于tarch模型的天然气负荷波动非对称性分析方法及***
CN117540346B (zh) 大气污染数据高维回归建模的秩序类别变量冗余去除方法
TWI748486B (zh) 物聯網空氣品質微型感測資料品質檢核方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 18926224

Country of ref document: EP

Kind code of ref document: A1

NENP Non-entry into the national phase

Ref country code: DE

32PN Ep: public notification in the ep bulletin as address of the adressee cannot be established

Free format text: NOTING OF LOSS OF RIGHTS PURSUANT TO RULE 112(1) EPC (EPO FORM 1205 DATED 21/04/2021)

122 Ep: pct application non-entry in european phase

Ref document number: 18926224

Country of ref document: EP

Kind code of ref document: A1