WO2020010701A1

WO2020010701A1 - 污染物异常监测方法、***、计算机设备和存储介质

Info

Publication number: WO2020010701A1
Application number: PCT/CN2018/106682
Authority: WO
Inventors: 金戈; 徐亮; 肖京
Original assignee: 平安科技（深圳）有限公司
Priority date: 2018-07-11
Filing date: 2018-09-20
Publication date: 2020-01-16
Also published as: CN108921440B; CN108921440A

Abstract

一种污染物异常监测方法、***、计算机设备和存储介质，涉及环境污染数据处理技术领域，其中监测方法包括：获取历史环境监测数据并设置为数据集进行存储，对污染物的指标项设置指标阈值，根据指标阈值对数据集进行筛选，筛选出未超过指标阈值的数据设置为特征项存储在未超标数据集中；采用特征项训练出孤立森林模型；获取实时监测数据，将实时监测数据输入孤立森林模型中，通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总；能监测异常点数据，简单快捷，并且能***出污染源超标情况并进行输出，预防超标的产生。

Description

污染物异常监测方法、***、计算机设备和存储介质

本申请要求于2018年07月11日提交中国专利局、申请号为201810757268.8、发明名称为“污染物异常监测方法、***、计算机设备和存储介质”的中国专利申请的优先权，其全部内容通过引用结合在本申请中。

技术领域

本申请涉及环境污染数据处理技术领域，尤其涉及一种污染物异常监测方法、***、计算机设备和存储介质。

背景技术

污染源是指造成环境污染的污染物发生源，通常指向环境排放有害物质或对环境产生有害影响的场所、设备、装置或人体。任何以不适当的浓度、数量、速度、形态和途径进入环境***并对环境产生污染或破坏的物质或能量，统称为污染物。在工业生产中的一些环节，如原料生产、加工过程、燃烧过程、加热和冷却过程、成品整理过程等使用的生产设备或生产场所都可能成为工业污染源。现有技术中，对于污染源排放的监测一般有两种方法，一是监督性监测，即定期检查污染源排放废气中的有害物质含量是否符合国家规定。二是研究性监测，是对污染源排放污染物的种类、排放量、排放规律进行监测，有利于查清空气污染的主要来源，探讨空气污染发展的趋势，制订污染控制措施，改善环境空气质量。

但是，无论是那种检测方式，目前均是通过单项污染源的达标阈值设定，对比单项污染源检测数据，发现排污超标企业。而存在的问题是污染源种类复杂，单项阈值的设定和查比繁琐，并且阈值的设定无法预防超标的产生。

发明内容

有鉴于此，有必要针对通过单项污染源的达标阈值设定查比繁琐，无法预防超标的产生的问题，提供一种污染物异常监测方法、***、计算机设备和存储介质。

一种污染物异常监测方法，包括如下步骤：

从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；

对每项所述污染物的每个指标项设置指标阈值，根据所述指标阈值对每项所述数据集进行筛选，筛选出未超过所述指标阈值的数据设置为特征项，将所述特征项存储在未超标数据集中；

采用所述未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的所述孤立森林模型；

从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。

一种污染物异常监测***，包括如下单元：

获取数据单元，设置为从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；

筛选单元，设置为对每项所述污染物的每个指标项设置指标阈值，根据所述指标阈值对每项所述数据集进行筛选，筛选出未超过所述指标阈值的数据设置为特征项，将所述特征项存储在未超标数据集中；

训练单元，设置为采用所述未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的所述孤立森林模型；

异常点汇总单元，设置为从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。

一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行以下步骤：

一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

上述污染物异常监测方法、装置、计算机设备和存储介质，包括从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；对每项污染物的每个指标项设置指标阈值，根据指标阈值对每项数据集进行筛选，筛选出未超过指标阈值的数据设置为特征项，将特征项存储在未超标数据集中；采用未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的孤立森林模型；从环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将实时监测数据输入与污染物对应的孤立森林模型中，通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。本申请通过对历史数据进行筛选，筛选出未超标的污染物数据作为特征项，通过孤立森林模型对企业排污情况做异常点监测的方式，监测异常点数据简单快捷，能***出污染源超标情况并进行输出，预防超标的产生。

附图说明

通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本申请的限制。

图1为本申请一个实施例中的污染物异常监测方法的流程图；

图2为图1中步骤S3的流程图；

图3为步骤S3构造的一种树的结构图；

图4为图1中步骤S4的流程图；

图5为本申请一个实施例中的污染物异常监测***的结构图；

图6为图5中的异常点汇总单元的模块示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本申请，并不用于限定本申请。

本技术领域技术人员可以理解，除非特意声明，这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是，本申请的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件，但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。

图1为本申请一个实施例中的污染物异常监测方法的流程图，如图1所示，监测方法，包括如下步骤：

步骤S1，获取数据：从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储。

本步骤对污染物异常监测主要是针对企业排放的污染物进行监测，因此本实施例中的企业是纳入生态环境部污染源监控中心的重点排污单位，预设的环境监测数据***是政府环保部门的生态环境部污染源监控中心的自动监控工作调度平台，或者第三方的环境监测数据***。环境监测数据***采集了每个重点排污单位的所有污染源监测点的历史环境监测数据和实时监测数据。

企业的污染源监测点一般设置在排水口处和排气口处，因此企业的污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物，在对历史环境监测数据进行存储时，数据集按照排水污染物数据集和排气污染物数据集分类存储。

步骤S2，筛选数据：对每项污染物的每个指标项设置指标阈值，根据指标阈值对每项数据集进行筛选，筛选出未超过指标阈值的数据设置为特征项，将特征项存储在未超标数据集中。

在对数据集中的数据进行筛选前，针对污染物的每个指标项均设置对应的指标阈值。其中，排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项，对排水污染物的指标项均设有对应的指标阈值。排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一氧化碳指标中的至少一种指标项，对排气污染物指标项均设有对应的指标阈值。本步骤中，污染物的指标项及对应指标阈值如下表1所示：

表1

对污染物设置阈值时，对于排气污染物，可参照《大气污染物综合排放标准》(GB 16297-1996)，对于排水污染物，可参照《污水综合排放标准》(GB8978-1996)，以便于更符合国家规定的污染物排放标准，筛查出更精确的未超标数据。

本步骤根据预设的指标阈值，对每项数据集进行筛选，筛选出未超过阈值的数据，作为特征项合并存储在未超标数据集中。将特征项存储在未超标数据集中时，以每个企业的一项污染物对特征项进行分类存储在对应的未超标数据集中。即每个企业的排水污染物数据集筛选出的特征项存储为排水未超标数据集，每个企业的排气污染物数据集筛选出的特征项存储为排气未超标数据集。以便于后续训练孤立森林模型时，作为企业某一项污染物的样本使用。

步骤S3，训练模型：采用未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的孤立森林模型。

孤立森林模型，即Isolation Forest模型，是一个快速异常检测方法，具有线性时间复杂度和高精准度，是符合大数据处理要求的算法。孤立森林模型适用于连续数据(Continuous numerical data)的异常检测，将异常定义为“容易被孤立的离群点”，可以理解为分布稀疏且离密度高的群体较远的点。用统计学来解释的话，即在数据空间里面，分布稀疏的区域表示数据发生在此区域的概率很低，因而可以认为落在这些区域里的数据是异常的。

因此孤立森林模型基于上述原理，通过样本建立二分树：输入训练数据集A，e为当前的树高，l为树的高度限制。首先将A放在根节点中，随机选择A中的一个维度q，并在q上的最大值和最小值之间随机选择一个值p，将A中在q上比p大的样本流向右子节点中，比p小的样本流向左子节点。然后重复上述步骤直到：每个子节点中都只有一个样本或者多个相同的样本，即每个样本都被孤立了，或树的高度达到l。当采用上述方法建立树的时候，异常点更容易被孤立，因此其被孤立时所在的叶子节点的路径长度也较短，即从根节点到异常点所在叶子节点所经历过的边数较短，而正常点不容易被孤立，因此其路径长度也较长。

步骤S4，异常点汇总：从环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将实时监测数据输入与污染物对应的孤立森林模型中，通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。

本步骤基于孤立森林模型的异常点更容易被孤立，异常点被孤立时从根节点到异常点所在叶子节点所经历过的边数较短的特性，通过将实时监测数据输入孤立森林模型中，得到边上较短，即路径长度较短的一些数据设置为异常点，并将这些异常点进行汇总，实现污染源异常点的监测。

本实施例，通过对预设的环境监测数据***中获取历史环境监测数据，训练出较为精确的孤立森林模型，并采用此孤立森林模型对实时监测数据进行监测，监测出异常点并汇总，整个过程监测数据简单快捷，能较为准确的监测出企业各种污染源的超标情况并进行汇总，预防超标的产生。

在一个实施例中，步骤S3中，采用未超标数据集中的特征项训练孤立森林模型时，如图2所示，采用如下方法：

步骤S301，取点构造特征：取未超标数据集中每N小时的特征项设置为一个点构造特征。由于未超标数据集中的数据可能较多，因此为了减少采用数据，取未超标数据集中以小时为单位的特征项进行训练，即可以选择每小时的特征项或每2小时的特征项等设置为点构造特征。将这些点构造特征放入孤立森林模型的树的根节点。

步骤S302，设差分阈值：每个点构造特征和前一个点构造特征之间的差分设差分阈值为X。差分阈值可以随机产生作为当前节点的切割点。

步骤S303，构造树的左右子节点：两个相邻点构造特征之间的差分小于X的被分到树的左子节点，差分大于等于X的被分到树的右子节点。

步骤S304，递归构造树：递归步骤S302和S303，不断构造左子节点和右子节点，直到满足以下条件：训练的未超标数据集只有一条记录或多条一样的记录，或者树的高度达到预设高度范围，树的高度范围为：在包含n条记录的未超标数据集中，构造的树的高度最小值为log(n)，构造的树的高度最大值为n-1。

具体的，如图3所示，比如a、b、c、d四个点构造特征，放入孤立森林模型，遍历一颗树时，先将a、b、c、d四个点构造特征放入孤立森林模型的树的根节点。a、b、c三个点构造特征和前一个点构造特征之间的差分小于X，被分到树的左子节点，d点构造特征和前一个点构造特征之间的差分大于X，被分到树的右子节点。递归上述步骤，不断构造左子节点和右子节点，如图3所示，经过三次递归后，得到每个叶子节点均只有一条记录。可以看到，d点构造特征最早就被孤立，因此d点构造特征最有可能是异常点。

本实施例在对未超标数据集中的特征项训练孤立森林模型时，首先对未超标数据集中的数据进行筛选，以确保训练出的孤立森林模型尽可能精确的前提下，减少数据采集量。在设置切割点时，采用差分阈值的形式，能有效反映出每N小时相邻的两个点构造特征之间的变化，最终得到的孤立森林模型作为异常点监控时，能更为可靠。

在一个实施例中，步骤S4中，将实时监测数据输入与污染物对应的孤立森林模型中，通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点时，如图4所示，采用如下步骤：

步骤S401，生成路径长度：将实时监测数据中的实时数据逐个输入对应的孤立森林模型中，实时数据按照孤立森林模型被划分为M次后不再划分时，实时数据在孤立森林模型的根节点到叶子节点的路径长度为M。

具体的，如图3所示，如果a、b、c、d是实时监测数据中的四个实时数据，则a点构造特征的路径长度为2，b和c点构造特征的路径长度为3，d点构造特征的路径长度为1。

步骤S402，归一化处理：对实时数据的路径长度M做归一化处理，得到M’。

归一化处理时，采用如下方式：

首先统计所有树上待判断点x的平均路径，记为E(h(x))，E()表示平均，h(x)表示x的路径长度。假设实时监测数据中有n个点，n个点如果用一个孤立森林模型中树来搜索，n个点的平均路径长度c(n)＝2H(n-1)-(2(n-1)/n)。H(k)＝ln(k)+ξ，ξ＝0.5772156649为欧拉常数，归一化后的s(x,n)为：

其中，M＝h(x)，M’＝s(x,n)；

s(x,n)取值范围为[0,1]。

步骤S403，异常点汇总：预设异常点阈值Y，当M’大于Y时，将实时数据设置为异常点，进行汇总，生成异常点汇总表。

由于归一化后的M’取值范围为[0,1]，异常点判断时，M’越接近1表示此实时数据是异常点的可能性高，M’越接近0表示此实时数据是正常点的可能性高，如果实时监测数据中的实时数据都接近于0.5，说明整个实时监测数据中都没有明显的异常点。因此，异常点阈值Y取值范围应大于0.5，靠近1的数值。

本实施例，在判断异常点时，引入归一化处理的方式，对某一实时数据的路径长度进行归一化，将路径长度变成一个无刚量的标量，以便于异常点的汇总和后续各个污染物的异常点比较。

在一个实施例中，提出了一种污染物异常监测***，如图5所示，包括如下单元：

获取数据单元，设置为从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；

筛选单元，设置为对每项污染物的每个指标项设置指标阈值，根据指标阈值对每项数据集进行筛选，筛选出未超过指标阈值的数据设置为特征项，将特征项存储在未超标数据集中；

训练单元，设置为采用未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的孤立森林模型；

异常点汇总单元，设置为从环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将实时监测数据输入与污染物对应的孤立森林模型中，通过实时监测数据达到孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。

在一个实施例中，获取数据单元中的污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物，在对历史环境监测数据进行存储时，每个企业均存储排水污染物数据集和排气污染物数据集。

在一个实施例中，排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项，对排水污染物的指标项均设有对应的指标阈值；排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一氧化碳指标中的至少一种指标项，对排气污染物指标项均设有对应的指标阈值。

在一个实施例中，筛选单元，还设置为以每个企业的一项污染物对特征项进行分类存储在对应的未超标数据集中。

在一个实施例中，训练单元，包括：构造树的左右子节点模块，设置为取未超标数据集中每N小时的特征项设置为一个点构造特征，每个点构造特征和前一个点构造特征之间的差分设差分阈值为X，则两个相邻点构造特征之间的差分小于X的被分到树的左子节点，差分大于等于X的被分到树的右子节点；

递归模块，设置为递归构造左子节点和右子节点，直到满足以下条件：训练的未超标数据集只有一条记录或多条一样的记录，或者树的高度达到预设高度范围，树的高度范围为：在包含n条记录的未超标数据集中，构造的树的高度最小值为log(n)，构造的树的高度最大值为n-1。

在一个实施例中，如图6所示，异常点汇总单元包括：

生成路径长度模块，设置为将实时监测数据中的实时数据逐个输入对应的孤立森林模型中，实时数据按照孤立森林模型被划分为M次后不再划分时，实时数据在孤立森林模型的根节点到叶子节点的路径长度为M；

归一化处理模块，设置为对实时数据的路径长度M做归一化处理，得到M’；

生成异常点汇总表模块，设置为预设异常点阈值Y，当M’大于Y时，将实时数据设置为异常点，进行汇总，生成异常点汇总表。

在一个实施例中，提出了一种计算机设备，包括存储器和处理器，存储器中存储有计算机可读指令，计算机可读指令被处理器执行时，使得处理器执行上述各实施例里污染物异常监测方法中的步骤。

在一个实施例中，提出了一种存储有计算机可读指令的存储介质，计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行上述各实施例里污染物异常监测方法中的步骤。其中，存储介质可以为非易失性存储介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：只读存储器(ROM，Read Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁盘或光盘等。

以上所述实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各个技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请一些示例性实施例，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请专利的保护范围应以所附权利要求为准。

Claims

一种污染物异常监测方法，包括：

从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；

对每项所述污染物的每个指标项设置指标阈值，根据所述指标阈值对每项所述数据集进行筛选，筛选出未超过所述指标阈值的数据设置为特征项，将所述特征项存储在未超标数据集中；

采用所述未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的所述孤立森林模型；

从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。
根据权利要求1所述的污染物异常监测方法，其中，所述污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物，在对所述历史环境监测数据进行存储时，每个企业均存储排水污染物数据集和排气污染物数据集。
根据权利要求2所述的污染物异常监测方法，其中，所述排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项，对所述排水污染物的指标项均设有对应的指标阈值；

所述排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一氧化碳指标中的至少一种指标项，对所述排气污染物指标项均设有对应的指标阈值。
根据权利要求1所述的污染物异常监测方法，其中，所述将所述特征项存储在未超标数据集中，包括：以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
根据权利要求1所述的污染物异常监测方法，其中，所述采用所述未超标数据集中的特征项训练所述孤立森林模型，包括：

取所述未超标数据集中每N小时的特征项设置为一个点构造特征，每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X，则两个相邻点构造特征之间的差分小于X的被分到树的左子节点，差分大于等于X的被分到树的右子节点；

递归构造所述左子节点和所述右子节点，直到满足以下条件：

训练的所述未超标数据集只有一条记录或多条一样的记录，或者树的高度达到预设高度范围，所述树的高度范围为：在包含n条记录的所述未超标数据集中，构造的树的高度最小值为log(n)，构造的树的高度最大值为n-1。
根据权利要求1所述的污染物异常监测方法，其中，所述将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，包括：

将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中，所述实时数据按照所述孤立森林模型被划分为M次后不再划分时，所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M；

对所述实时数据的路径长度M做归一化处理，得到M’；

预设异常点阈值Y，当M’大于Y时，将所述实时数据设置为异常点，进行汇总，生成异常点汇总表。
一种污染物异常监测***，包括：

获取数据单元，设置为从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；

筛选单元，设置为对每项所述污染物的每个指标项设置指标阈值，根据所述指标阈值对每项所述数据集进行筛选，筛选出未超过所述指标阈值的数据设置为特征项，将所述特征项存储在未超标数据集中；

训练单元，设置为采用所述未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的所述孤立森林模型；

异常点汇总单元，设置为从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。
根据权利要求7所述的污染物异常监测***，其中，所述获取数据单元中的所述污染物包括基于排水口监测的排水污染物、基于排气口监测的排气污染物，在对所述历史环境监测数据进行存储时，每个企业均存储排水污染物数据集和排气污染物数据集。
根据权利要求8所述的污染物异常监测***，其中，所述排水污染物的指标项包括悬浮物指标、化学需氧量指标、PH值或氨氮指标中的至少一种指标项，对所述排水污染物的指标项均设有对应的指标阈值；

所述排气污染物的指标项包括氮氧化物指标、二氧化硫指标、烟尘指标或一氧化碳指标中的至少一种指标项，对所述排气污染物指标项均设有对应的指标阈值。
根据权利要求7所述的污染物异常监测***，其中，所述筛选单元，还设置为以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
根据权利要求7所述的污染物异常监测***，其中，所述训练单元，包括：

构造树的左右子节点模块，设置为取所述未超标数据集中每N小时的特征项设置为一个点构造特征，每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X，则两个相邻点构造特征之间的差分小于X的被分到树的左子节点，差分大于等于X的被分到树的右子节点；

递归模块，设置为递归构造所述左子节点和所述右子节点，直到满足以下条件：训练的所述未超标数据集只有一条记录或多条一样的记录，或者树的高度达到预设高度范围，所述树的高度范围为：在包含n条记录的所述未超标数据集中，构造的树的高度最小值为log(n)，构造的树的高度最大值为n-1。
根据权利要求7所述的污染物异常监测***，其中，所述异常点汇总单元包括：

生成路径长度模块，设置为将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中，所述实时数据按照所述孤立森林模型被划分为M次后不再划分时，所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M；

归一化处理模块，设置为对所述实时数据的路径长度M做归一化处理，得到M’；

生成异常点汇总表模块，设置为预设异常点阈值Y，当M’大于Y时，将所述实时数据设置为异常点，进行汇总，生成异常点汇总表。
一种计算机设备，包括存储器和处理器，所述存储器中存储有计算机可读指令，所述计算机可读指令被所述处理器执行时，使得所述处理器执行以下步骤：

从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；

对每项所述污染物的每个指标项设置指标阈值，根据所述指标阈值对每项所述数据集进行筛选，筛选出未超过所述指标阈值的数据设置为特征项，将所述特征项存储在未超标数据集中；

采用所述未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的所述孤立森林模型；

从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。
根据权利要求13所述的计算机设备，其中，所述将所述特征项存储在未超标数据集中时，使得所述处理器执行以下步骤：

以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
根据权利要求13所述的计算机设备，其中，所述采用所述未超标数据集中的特征项训练所述孤立森林模型时，使得所述处理器执行以下步骤：

取所述未超标数据集中每N小时的特征项设置为一个点构造特征，每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X，则两个相邻点构造特征之间的差分小于X的被分到树的左子节点，差分大于等于X的被分到树的右子节点；

递归构造所述左子节点和所述右子节点，直到满足以下条件：

训练的所述未超标数据集只有一条记录或多条一样的记录，或者树的高度达到预设高度范围，所述树的高度范围为：在包含n条记录的所述未超标数据集中，构造的树的高度最小值为log(n)，构造的树的高度最大值为n-1。
根据权利要求13所述的计算机设备，其中，所述将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点时，使得所述处理器执行以下步骤：

将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中，所述实时数据按照所述孤立森林模型被划分为M次后不再划分时，所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M；

对所述实时数据的路径长度M做归一化处理，得到M’；

预设异常点阈值Y，当M’大于Y时，将所述实时数据设置为异常点，进行汇总，生成异常点汇总表。
一种存储有计算机可读指令的存储介质，所述计算机可读指令被一个或多个处理器执行时，使得一个或多个处理器执行以下步骤：

从预设的环境监测数据***中获取每个企业的污染源监测点的历史环境监测数据，将所述历史环境监测数据以每个企业的一项污染物设置为一项数据集进行存储；

对每项所述污染物的每个指标项设置指标阈值，根据所述指标阈值对每项所述数据集进行筛选，筛选出未超过所述指标阈值的数据设置为特征项，将所述特征项存储在未超标数据集中；

采用所述未超标数据集中的特征项训练出孤立森林模型，对每项未超标数据集均建立对应的所述孤立森林模型；

从所述环境监测数据***中获取一企业中一项污染物以小时为单位的实时监测数据，将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点，并将异常点进行汇总。
根据权利要求17所述的存储介质，其中，所述将所述特征项存储在未超标数据集中时，使得一个或多个所述处理器执行以下步骤：

以每个企业的一项污染物对所述特征项进行分类存储在对应的未超标数据集中。
根据权利要求17所述的存储介质，其中，所述采用所述未超标数据集中的特征项训练所述孤立森林模型时，使得一个或多个所述处理器执行以下步骤：

取所述未超标数据集中每N小时的特征项设置为一个点构造特征，每个所述点构造特征和前一个点构造特征之间的差分设差分阈值为X，则两个相邻点构造特征之间的差分小于X的被分到树的左子节点，差分大于等于X的被分到树的右子节点；

递归构造所述左子节点和所述右子节点，直到满足以下条件：

训练的所述未超标数据集只有一条记录或多条一样的记录，或者树的高度达到预设高度范围，所述树的高度范围为：在包含n条记录的所述未超标数据集中，构造的树的高度最小值为log(n)，构造的树的高度最大值为n-1。
根据权利要求17所述的存储介质，其中，所述将所述实时监测数据输入与所述污染物对应的所述孤立森林模型中，通过所述实时监测数据达到所述孤立森林模型的根节点到叶子节点的路径长度判断是否为异常点时，使得一个或多个所述处理器执行以下步骤：

将所述实时监测数据中的实时数据逐个输入对应的所述孤立森林模型中，所述实时数据按照所述孤立森林模型被划分为M次后不再划分时，所述实时数据在所述孤立森林模型的根节点到叶子节点的路径长度为M；

对所述实时数据的路径长度M做归一化处理，得到M’；

预设异常点阈值Y，当M’大于Y时，将所述实时数据设置为异常点，进行汇总，生成异常点汇总表。