CN106203756A - 一种基于特征数据库的工业污水污染物溯源分析方法 - Google Patents
一种基于特征数据库的工业污水污染物溯源分析方法 Download PDFInfo
- Publication number
- CN106203756A CN106203756A CN201510224532.8A CN201510224532A CN106203756A CN 106203756 A CN106203756 A CN 106203756A CN 201510224532 A CN201510224532 A CN 201510224532A CN 106203756 A CN106203756 A CN 106203756A
- Authority
- CN
- China
- Prior art keywords
- factory
- pollutant
- data base
- sample
- source
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Removal Of Specific Substances (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种基于特征数据库的工业污水污染物溯源分析方法,属于工业污水污染物监管技术领域。其特征包括:建立各类型工厂污染物参数的特征权重数据库M,采集目标区域各工厂***污水的污染物数据,构建目标区域工厂排污的特征数据样本库N,利用所述特征数据样本库N构建KD-tree的类变量,输入混合工业废水的各污染物测量值待识别向量z,采用所述kNN分类器与特征数据样本库N中的数据进行匹配识别,完成污染物溯源。本发明能够完成各种区域混合工业废水的污染物溯源,快速有效的给出目标排放工厂的排序,适用性与普遍性强,为政府相关职能部门按次序排查污染来源工厂提供了技术支持,大大提高了排查效率和成功率。
Description
技术领域
本发明属于工业污水污染物监管技术领域,涉及一种工业污水污染物溯源分析方法,特别是一种基于特征数据库的工业污水污染物溯源分析方法。
背景技术
目前我国的水污染问题相当严重,这与非法超标偷排现象屡禁不止有着直接的关系。加强各类工业排放污水的监管已经成为各级政府工作的重要内容,对非法超排的有效监管与溯源追责尚缺乏行之有效的技术手段。传统的溯源技术一般都是在污染事件发生后,对污染源上下游附近的工厂污水进行取样分析,工作量大、耗时较长、时效性差,往往很难及时找到污染源。
近年来也涌现出一些新的溯源技术,但一般都是针对某一类工业废水或者某些阴离子而进行的,或者是从监管管理方面提出的方法,比如中国环境科学院2012年公开的《一种突发水环境污染事故涉嫌风险源的溯源方法》,公开号为CN102622670A,再比如环境保护部华南环境科学研究所2014年公开的《一种有限条件下突发性水环境事件污染源的溯源方法》,公开号为CN104103005A,该方法主要给出了一个***,其匹配模型仅在有限条件下适用。
尚缺乏一种普遍适用各种工业混合废水的溯源方法,满足不同种类工业区域混合污水的溯源需求。
发明内容
本发明的目的是为了克服上述背景技术的不足,提供一种基于特征数据库的工业污水污染物溯源分析方法,能够适用于对各种工业混合废水的溯源。
本发明提供的一种基于特征数据库的工业污水污染物溯源分析方法如图1所示,具体步骤如下,:
(1)收集各类型工厂主要排放污水的污染物参数,建立各类型工厂污染物参数的特征权重数据库M;
(2)采集目标区域各工厂***污水的污染物数据,构建目标区域工厂排污的特征数据样本库N;
(3)利用所述特征数据样本库N构建KD-tree的类变量,作为kNN分类器的识别模型;
(4)通过集成式污染物采集工控机获取或者直接手动输入混合工业废水的各污染物测量值,作为待识别向量z;
(5)采用所述kNN分类器与特征数据样本库N中的数据进行匹配识别,在匹配过程中,利用所述特征权重数据库M按照工厂类型对目标工厂进行加权,根据匹配程度给出目标排放工厂排序;
(6)按顺序显示目标排放工厂名称。
所述kNN分类器的核心识别算法为:
Input:所述特征数据样本库N的训练样本集D,所述待识别向量z,样本的类别标签集L。
Output:cz∈L,即样本向量的类别。
for each样本y∈D do
计算z到y的距离d(z,y)
end
选择k个与z距离最近的训练样本构成集合N,
其中,k为预定识别的目标排放工厂的个数,I(·)为指示函数,如果条件成立值为1,如果条件不成立值为0。
kNN分类器中的细节处理原则包括:
A.d(z,y)是待识别样本与训练样本库中样本的相似度度量,表示特征空间内两个点的距离。可供选择的其他数学距离有多种,比如欧拉距离、马氏距离、曼哈顿距离、切比雪夫距离、闵氏距离等等;
B.采用加权投票法进行类别判定,采取少数服从多数的原则,近邻中哪个类别的点最多就分为哪类,权重根据特征权重数据库M按工厂类型进行选取;
C.对特征向量进行归一化,降低变量值域对距离的影响;
D.采用主成分分析的方法,降低高维度对距离衡量的影响。
本发明的有益效果是,能够完成各种区域混合工业废水的污染物溯源,快速有效的给出目标排放工厂的排序,适用性与普遍性强,为政府相关职能部门按次序排查污染来源工厂提供了技术支持,大大提高了排查效率和成功率。
附图说明
图1工业污水污染物溯源分析方法流程图。
图2目标区域工厂名称图示。
具体实施方式:
下面结合附图和实施例对本发明作进一步的详细描述,但该实施例不应理解为对本发明的限制。
在本实施方式中,目标区域选择大连市工业园区,区域内工厂包括12家,具体名称由图2所示,各工厂***污水污染物种类28种,包括苯、pH值、氨氮、色度、甲苯、总氮、总镉、总铬、总镍、总砷、总铜、总锌、二甲苯、氟化物、挥发酚等等。
按照以下操作步骤进行溯源:
(1)收集各类型工厂主要排放污水的污染物参数,建立各类型工厂污染物参数的特征权重数据库M1;
(2)采集图2所示各工厂***污水的28种污染物数据,构建目标区域工厂排污的特征数据样本库N1,并按照类型对工厂分类;
(3)利用所述特征数据样本库N1构建KD-tree的类变量,作为kNN分类器的识别模型;
(4)通过手动输入混合工业废水的各污染物量值,作为待识别向量z1;
(5)采用所述kNN分类器与特征数据样本库N1中的数据进行匹配识别,在匹配过程中,利用所述特征权重数据库M1按照工厂类型对目标工厂进行加权,根据匹配程度给出目标排放工厂排序;
(6)按顺序显示所述目标排放工厂名称。
所述kNN分类器算法中,所述距离d(z1,y)选择欧式距离,公式如下:
所述kNN分类器算法中,k值选择为3,投票权重根据特征权重数据库M1按工厂类型进行选取,对特征向量z1进行了归一化,采用了主成分分析的方法。
Claims (1)
1.一种基于特征数据库的工业污水污染物溯源分析方法,其特征在于,
(1)收集各类型工厂主要排放污水的污染物参数,建立各类型工厂污染物参数的特征权重数据库M;
(2)采集目标区域各工厂***污水的污染物数据,构建目标区域工厂排污的特征数据样本库N;
(3)利用所述特征数据样本库N构建KD-tree的类变量,作为kNN分类器的识别模型;
(4)通过集成式污染物采集工控机获取或者直接手动输入混合工业废水的各污染物测量值,作为待识别向量z;
(5)采用所述kNN分类器与特征数据样本库N中的数据进行匹配识别,在匹配过程中,利用所述特征权重数据库M按照工厂类型对目标工厂进行加权,根据匹配程度给出目标排放工厂排序;
采用加权投票法进行类别判定,采取少数服从多数的原则,近邻中哪个类别的点最多就分为哪类,权重根据特征权重数据库M按工厂类型进行选取;
对特征向量进行归一化,降低变量值域对距离的影响;
采用主成分分析的方法,降低高维度对距离衡量的影响;
所述kNN分类器的核心识别算法为:
Input:所述特征数据样本库N的训练样本集D,所述待识别向量z,样本的类别标签集L;
Output:cz∈L,即样本向量的类别;
for each样本y∈D do
计算z到y的距离d(z,y)
end
选择k个与z距离最近的训练样本构成集合N,
其中,k为预定识别的目标排放工厂的个数,I(·)为指示函数,如果条件成立值为1,如果条件不成立值为0;
d(z,y)是待识别样本与训练样本库中样本的相似度度量,表示特征空间内两个点的距离;
(6)按顺序显示目标排放工厂名称。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510224532.8A CN106203756A (zh) | 2015-05-05 | 2015-05-05 | 一种基于特征数据库的工业污水污染物溯源分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510224532.8A CN106203756A (zh) | 2015-05-05 | 2015-05-05 | 一种基于特征数据库的工业污水污染物溯源分析方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN106203756A true CN106203756A (zh) | 2016-12-07 |
Family
ID=57458976
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510224532.8A Pending CN106203756A (zh) | 2015-05-05 | 2015-05-05 | 一种基于特征数据库的工业污水污染物溯源分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN106203756A (zh) |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108596473A (zh) * | 2018-04-20 | 2018-09-28 | 上海海洋大学 | 一种流域污染管理***和新核算方法 |
CN109709293A (zh) * | 2018-11-27 | 2019-05-03 | 聚光科技(杭州)股份有限公司 | 偷排污水的识别方法 |
CN109886830A (zh) * | 2019-01-02 | 2019-06-14 | 同济大学 | 一种基于用户投诉信息的供水管网污染源追踪定位方法 |
CN110335047A (zh) * | 2018-03-30 | 2019-10-15 | 中国石油化工股份有限公司 | 一种油品溯源分析*** |
CN110531043A (zh) * | 2019-08-29 | 2019-12-03 | 中水三立数据技术股份有限公司 | 一种流域水环境污染智能管理***及其方法 |
CN110729026A (zh) * | 2019-10-28 | 2020-01-24 | 中国科学院生态环境研究中心 | 一种基于混合清单构建和空间多介质模型模拟相结合的多氯联苯时空定量溯源的方法 |
CN111882473A (zh) * | 2020-07-23 | 2020-11-03 | 南京财经大学 | 一种雨污管网零直排溯源追踪方法 |
CN112184090A (zh) * | 2020-11-30 | 2021-01-05 | 广东浩迪创新科技有限公司 | 标准用电特征库建立方法、环保监测方法、***和监测仪 |
CN112903660A (zh) * | 2021-03-11 | 2021-06-04 | 广西大学 | 一种判别流域水体污染现状和污染来源的方法 |
CN117373556A (zh) * | 2023-12-04 | 2024-01-09 | 山东清控生态环境产业发展有限公司 | 一种基于多维数据的溯源仪器及*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102622670A (zh) * | 2012-02-20 | 2012-08-01 | 中国环境科学研究院 | 一种突发水环境污染事故涉嫌风险源的溯源方法 |
US20140088883A1 (en) * | 2007-12-03 | 2014-03-27 | Charles C. Zhou | Method and System for Knowledge Pattern Search and Analysis for Selecting Microorganisms Based on Desired Metabolic Property or Biological Behavior |
-
2015
- 2015-05-05 CN CN201510224532.8A patent/CN106203756A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140088883A1 (en) * | 2007-12-03 | 2014-03-27 | Charles C. Zhou | Method and System for Knowledge Pattern Search and Analysis for Selecting Microorganisms Based on Desired Metabolic Property or Biological Behavior |
CN102622670A (zh) * | 2012-02-20 | 2012-08-01 | 中国环境科学研究院 | 一种突发水环境污染事故涉嫌风险源的溯源方法 |
Non-Patent Citations (2)
Title |
---|
崔妍妍: "数据挖掘分类***的研究与实现", 《中国优秀硕士学位论文全文数据库 信息科技辑》 * |
李彩鹦: "污水化学指纹数据库的构建及其在水污染溯源中的应用", 《中国优秀硕士学位论文全文数据库 工程科技Ⅰ辑》 * |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110335047A (zh) * | 2018-03-30 | 2019-10-15 | 中国石油化工股份有限公司 | 一种油品溯源分析*** |
CN108596473B (zh) * | 2018-04-20 | 2021-07-02 | 上海海洋大学 | 一种流域污染管理***和新核算方法 |
CN108596473A (zh) * | 2018-04-20 | 2018-09-28 | 上海海洋大学 | 一种流域污染管理***和新核算方法 |
CN109709293A (zh) * | 2018-11-27 | 2019-05-03 | 聚光科技(杭州)股份有限公司 | 偷排污水的识别方法 |
CN109886830A (zh) * | 2019-01-02 | 2019-06-14 | 同济大学 | 一种基于用户投诉信息的供水管网污染源追踪定位方法 |
CN109886830B (zh) * | 2019-01-02 | 2023-07-04 | 同济大学 | 一种基于用户投诉信息的供水管网污染源追踪定位方法 |
CN110531043A (zh) * | 2019-08-29 | 2019-12-03 | 中水三立数据技术股份有限公司 | 一种流域水环境污染智能管理***及其方法 |
CN110729026A (zh) * | 2019-10-28 | 2020-01-24 | 中国科学院生态环境研究中心 | 一种基于混合清单构建和空间多介质模型模拟相结合的多氯联苯时空定量溯源的方法 |
CN111882473A (zh) * | 2020-07-23 | 2020-11-03 | 南京财经大学 | 一种雨污管网零直排溯源追踪方法 |
CN112184090A (zh) * | 2020-11-30 | 2021-01-05 | 广东浩迪创新科技有限公司 | 标准用电特征库建立方法、环保监测方法、***和监测仪 |
CN112903660A (zh) * | 2021-03-11 | 2021-06-04 | 广西大学 | 一种判别流域水体污染现状和污染来源的方法 |
CN117373556A (zh) * | 2023-12-04 | 2024-01-09 | 山东清控生态环境产业发展有限公司 | 一种基于多维数据的溯源仪器及*** |
CN117373556B (zh) * | 2023-12-04 | 2024-02-13 | 山东清控生态环境产业发展有限公司 | 一种基于多维数据的溯源仪器及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN106203756A (zh) | 一种基于特征数据库的工业污水污染物溯源分析方法 | |
Xu et al. | Assessment and spatiotemporal variation analysis of water quality in the Zhangweinan River Basin, China | |
CN103903441B (zh) | 一种基于半监督学习的道路交通状态判别方法 | |
Liu et al. | Concentrations, distribution, sources, and ecological risk assessment of heavy metals in agricultural topsoil of the Three Gorges Dam region, China | |
CN106600509B (zh) | 一种基于基础数据分析判断企业兑水排污行为的方法 | |
CN111861274A (zh) | 一种水环境风险预测预警方法 | |
CN102999927B (zh) | 一种土壤污染物含量空间分布的精细分区方法 | |
Batbayar et al. | Chemical water quality gradients in the Mongolian sub-catchments of the Selenga River basin | |
CN110489785A (zh) | 一种大气污染物在线源解析方法及*** | |
CN103530688B (zh) | 一种磨削加工工艺检测***及方法 | |
CN101759236B (zh) | 一种工业园区点源污染物的调控方法 | |
CN104217040A (zh) | 一种基于传统在线监测仪的污染事件快速探测方法 | |
CN109613197B (zh) | 一种基于河道水网的水质监测预警反馈响应方法 | |
CN112198144A (zh) | 一种快速污水溯源的方法及*** | |
Xiao et al. | Water quality assessment and pollution source apportionment using multivariate statistical techniques: a case study of the Laixi River Basin, China | |
CN114210718A (zh) | 一种农产品污染治理修复方法 | |
Chen et al. | Source apportionment of trace element pollution in surface sediments using positive matrix factorization combined support vector machines: application to the Jinjiang River, China | |
CN118039021A (zh) | 一种污水污染物检测及报警方法及*** | |
CN103377316A (zh) | 基于统计分析和贝叶斯集成的青霉素生产过程监测方法 | |
CN110781225A (zh) | 一种环境介质污染物浓度水平的诊断方法 | |
Lin et al. | Environmental DNA metabarcoding revealed the impacts of anthropogenic activities on phytoplankton diversity in Dianchi Lake and its three inflow rivers | |
CN102789598B (zh) | 一种以机器特征属性为区间数的作业车间瓶颈识别方法 | |
Li et al. | Waste landfill plant and waste disposal plant efficiencies in China | |
CN201330211Y (zh) | 污水处理厂运行参数自寻优模拟*** | |
CN104569340A (zh) | 地下环境质量测定方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20161207 |
|
WD01 | Invention patent application deemed withdrawn after publication |