CN110163290A - 一种基于快速聚类和化学质量平衡对污染源进行解析的方法 - Google Patents

一种基于快速聚类和化学质量平衡对污染源进行解析的方法 Download PDF

Info

Publication number
CN110163290A
CN110163290A CN201910449506.3A CN201910449506A CN110163290A CN 110163290 A CN110163290 A CN 110163290A CN 201910449506 A CN201910449506 A CN 201910449506A CN 110163290 A CN110163290 A CN 110163290A
Authority
CN
China
Prior art keywords
pollution sources
mass balance
source
pollution
contribution rate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910449506.3A
Other languages
English (en)
Inventor
陈锋
张云峰
刘凤明
曹张伟
孟凡生
梅凯
刘艳梅
司秀荣
周建华
丁玎
刘晓立
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Institute of Aerospace Engineering
Original Assignee
North China Institute of Aerospace Engineering
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Institute of Aerospace Engineering filed Critical North China Institute of Aerospace Engineering
Priority to CN201910449506.3A priority Critical patent/CN110163290A/zh
Publication of CN110163290A publication Critical patent/CN110163290A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Tourism & Hospitality (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Business, Economics & Management (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Other Investigation Or Analysis Of Materials By Electrical Means (AREA)

Abstract

本发明公开了一种基于快速聚类和化学质量平衡对污染源进行解析的方法,首先把基于污染源谱的因子荷载的识别当成多参数模式的识别问题,利用快速聚类分析对污染源进行识别,首先进行数据的预处理及初始化;然后输出训练样本对;然后利用识别好的分类模型利用化学质量平衡方法实现因子荷载的污染源贡献率的计算,实现特征污染物的源解析。本发明可实现对污染源快速准确的解析。

Description

一种基于快速聚类和化学质量平衡对污染源进行解析的方法
技术领域
本发明涉及污染源解析技术领域,特别是涉及一种基于快速聚类和化学质量平衡对污染源进行解析的方法。
背景技术
源解析(source apportionment)是研究污染源对周围环境污染的影响和作用的一种方法。当前的污染源解析技术大体可以分为三种:清单分析法、扩散模型和受体模型。清单分析法是通过观测和模拟污染物的源排放量、排放特征及排放地理分布等,建立列表模型的一种源解析方法;扩散模型属于预测式模型,它是通过输入各个污染源的排放数据和相关参数信息来预测污染物的时空变化情况;受体模型则通过对受体样品的化学和显微分析,确定各污染源贡献率的一类技术,其最终目的是识别对受体有贡献的污染源,并且定量计算各污染源的分担率。在基于受体模型化学法的各类源解析方法中,多元统计法应用简单,且不需要预先知道各个污染源的指纹谱图,不需要事先对研究区域污染源进行监测,仅需要受体样品监测数据。正定矩阵因子分解模型属于污染物源解析技术中的多元统计方法,是一种基于分解矩阵中元素非负,利用数据标准偏差来进行优化的因子分析方法。该技术的核心思想是主成分分析,传统的基于最小二乘法的主成份因子分析(PCA),由于采取基于行或列对受体样品数据D进行标准化,这将导致因子分析过程的数据失真。他们同时认为基于最小二乘法的PCA 隐合地假定样本数据存在非现实的标准偏差,从而导致PCA不能得到最小方差的最优解。利用正定矩阵因子分解模型开展源解析研究,核心环节在于非负约束因子分解,以及利用因子荷载矩阵进行的污染源识别。当前针对污染源识别的研究很少,主要的污染源识别方法就是通过对源谱和因子荷载的图形观察实现定性比较,或通过计算源谱和因子荷载的偏差实现半定量比较。这些方法多没有考虑污染源谱的非线性特征,识别结果不能真实反映因子荷载与污染源谱的对应关系。
发明内容
本发明的目的是提供了一种基于快速聚类和化学质量平衡对污染源进行解析的方法。其是将因子荷载识别过程看作是一个非线性分类过程,是一个多因子综合分类问题,是一个模式识别过程。本发明利用基快速聚类分析对污染源进行识别,进而再利用化学质量平衡源解析方法技术领域。
本发明的污染源解析方法包括以下步骤:
(1)把基于污染源谱的因子荷载的识别当成多参数模式的识别问题,利用快速聚类分析对污染源进行识别,首先进行数据的预处理及初始化;然后输出训练样本对;
(2)利用识别好的分类模型利用化学质量平衡方法实现因子荷载的污染源贡献率的计算,实现特征污染物的源解析。
优选的,所述快速聚类分析对污染源进行识别的方法包括以下步骤:
a)任选n个数据对象中的k个对象作为初始聚类中心;
b)对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇;
c)利用公式Zj=∑ienjXi,其中i=1,2,...,n;j=1,2,...,k重新计算每个类中心,并用公式
计算出准则函数值Ji
d)计算新的分配公式:假设xi在类n中,如果||xi-zm||2<||xi-zn||2,将样本xi分配到类m中,然后计算此时分配后的准则函数值J2
e)如果|J1-J2|<ε停止计算,否则c=c+1,重复c),d),e)步。
优选的,所述应用化学质量平衡方法进行污染源计算依据如下公式:
其中,Ci为第i污染物在受体中的浓度,mj为第j污染源对污染物的贡献率,xij为第j 污染源中i污染物的浓度;αi为不确定性误差。
优选的,所述应用化学质量平衡方法进行污染源计算方法如下:
第一步,数据预处理;
第二步,源贡献率的计算;
第三步,源贡献率迭代偏差的计算;
第四步,源贡献率不确定性偏差计算。
优选的,所述源贡献率的计算依据公式如下:
其中:S为污染源指纹图谱;ST为其转置矩阵;为有效方差对角阵;D为样品浓度。
优选的,所述源贡献率迭代偏差的计算依据的公式如下:
直至偏差小于0.0001为止。
优选的,所述源贡献率不确定性偏差计算依据的公式如下:
与现有技术相比,本发明具有以下有益效果:本发明的的优点和有益的效果如下:
(1)该方法能够快速、准确的追溯污染物的来源,实用性强,有广泛的推广应用价值,为环境管理部门应对污染源事故、控制污染风险提供了可靠的技术保障。
(2)传统的污染物源解析技术只能大致给出对环境受体贡献较大的污染源类别,而不能给出具体排放源对受体贡献的大小,缺乏对污染防治工作的实际指导意义。通过本发明所述方法,全面揭示污染源排放组成特征,筛选能够指示污染来源的特征标识物。
(3)本发明为制定污染源控制对策及环境质量改善提供技术支持,使今后环境管理部门面对污染问题时,可以通过***、完整的源解析方法和相应的数据信息***,迅速识别污染源,从而进行有效污染防控。
具体实施方式
下面结合具体实施例对本发明作进一步阐述。
实施例
一种基于快速聚类和化学质量平衡对污染源进行解析的方法,包括以下步骤:
(1)把基于污染源谱的因子荷载的识别当成多参数模式的识别问题,利用快速聚类分析对污染源进行识别,首先进行数据的预处理及初始化;然后输出训练样本对。
所述快速聚类分析对污染源进行识别的方法包括以下步骤:
a)任选n个数据对象中的k个对象作为初始聚类中心;
b)对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇;
c)利用公式Zj=∑ienjXi,其中i=1,2,...,n;j=1,2,...,k重新计算每个类中心,并用公式
计算出准则函数值Ji
d)计算新的分配公式:假设xi在类n中,如果||xi-zm||2<||xi-zn||2,将样本xi分配到类m中,然后计算此时分配后的准则函数值J2
e)如果|J1-J2|<ε停止计算,否则c=c+1,重复c),d),e)步。
(2)利用识别好的分类模型利用化学质量平衡方法实现因子荷载的污染源贡献率的计算,实现特征污染物的源解析。
所述应用化学质量平衡方法进行污染源计算依据如下公式:
其中,Ci为第i污染物在受体中的浓度,mj为第j污染源对污染物的贡献率,xij为第j 污染源中i污染物的浓度;αi为不确定性误差。
所述应用化学质量平衡方法进行污染源计算方法如下:
第一步,数据预处理;
第二步,源贡献率的计算;
第三步,源贡献率迭代偏差的计算;
第四步,源贡献率不确定性偏差计算。
所述源贡献率的计算依据公式如下:
其中:S为污染源指纹图谱;ST为其转置矩阵;为有效方差对角阵;D为样品浓度。
所述源贡献率迭代偏差的计算依据的公式如下:
直至偏差小于0.0001为止。
所述源贡献率不确定性偏差计算依据的公式如下:
利用本发明对污染源进行解析的方法,可以实现对多环芳烃污染源和重金属污染源进行解析,其检测结果与PAHs污染源指纹谱对比,基本吻合。因污染源谱的不确定性,模型推测原谱在指纹谱的合理误差范围之内。
本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

Claims (7)

1.一种基于快速聚类和化学质量平衡对污染源进行解析的方法,其特征在于,包括以下步骤:
(1)把基于污染源谱的因子荷载的识别当成多参数模式的识别问题,利用快速聚类分析对污染源进行识别,首先进行数据的预处理及初始化;然后输出训练样本对;
(2)利用识别好的分类模型利用化学质量平衡方法实现因子荷载的污染源贡献率的计算,实现特征污染物的源解析。
2.根据权利要求1所述的基于快速聚类和化学质量平衡对污染源进行解析的方法,其特征在于,所述快速聚类分析对污染源进行识别的方法包括以下步骤:
a)任选n个数据对象中的k个对象作为初始聚类中心;
b)对剩余的每个对象,根据其与各个簇中心的距离,将它赋给最近的簇;
c)利用公式Zj=∑ienjXi,其中i=1,2,...,n;j=1,2,...,k重新计算每个类中心,并用公式计算出准则函数值Ji
d)计算新的分配公式:假设xi在类n中,如果||xi-zm||2<||xi-zn||2,将样本xi分配到类m中,然后计算此时分配后的准则函数值J2
e)如果|J1-J2|<ε停止计算,否则c=c+1,重复c),d),e)步。
3.根据权利要求1所述的基于快速聚类和化学质量平衡对污染源进行解析的方法,其特征在于,所述应用化学质量平衡方法进行污染源计算依据如下公式:
其中,Ci为第i污染物在受体中的浓度,mj为第j污染源对污染物的贡献率,xij为第j污染源中i污染物的浓度;αi为不确定性误差。
4.根据权利要求3所述的基于快速聚类和化学质量平衡对污染源进行解析的方法,其特征在于,所述应用化学质量平衡方法进行污染源计算方法如下:
第一步,数据预处理;
第二步,源贡献率的计算;
第三步,源贡献率迭代偏差的计算;
第四步,源贡献率不确定性偏差计算。
5.根据权利要求4所述的基于快速聚类和化学质量平衡对污染源进行解析的方法,其特征在于,所述源贡献率的计算依据公式如下:
其中:S为污染源指纹图谱;ST为其转置矩阵;为有效方差对角阵;D为样品浓度。
6.根据权利要求4所述的基于快速聚类和化学质量平衡对污染源进行解析的方法,其特征在于,所述源贡献率迭代偏差的计算依据的公式如下:
直至偏差小于0.0001为止。
7.根据权利要求4所述的基于快速聚类和化学质量平衡对污染源进行解析的方法,其特征在于,所述源贡献率不确定性偏差计算依据的公式如下:
CN201910449506.3A 2019-05-28 2019-05-28 一种基于快速聚类和化学质量平衡对污染源进行解析的方法 Pending CN110163290A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910449506.3A CN110163290A (zh) 2019-05-28 2019-05-28 一种基于快速聚类和化学质量平衡对污染源进行解析的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910449506.3A CN110163290A (zh) 2019-05-28 2019-05-28 一种基于快速聚类和化学质量平衡对污染源进行解析的方法

Publications (1)

Publication Number Publication Date
CN110163290A true CN110163290A (zh) 2019-08-23

Family

ID=67629249

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910449506.3A Pending CN110163290A (zh) 2019-05-28 2019-05-28 一种基于快速聚类和化学质量平衡对污染源进行解析的方法

Country Status (1)

Country Link
CN (1) CN110163290A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111739587A (zh) * 2020-06-19 2020-10-02 中科三清科技有限公司 一种颗粒物监测数据的处理方法、装置、存储介质及终端
CN113311081A (zh) * 2021-05-17 2021-08-27 清华大学 基于三维液相色谱指纹的污染源识别方法及装置
CN113657698A (zh) * 2020-05-12 2021-11-16 中国环境科学研究院 基于多元统计和受体模型的流域分区污染源识别方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105158353A (zh) * 2015-07-29 2015-12-16 北华航天工业学院 土壤中多环芳烃污染源解析的方法
CN105631203A (zh) * 2015-12-27 2016-06-01 北华航天工业学院 识别土壤中重金属污染源的方法
CN105844301A (zh) * 2016-04-05 2016-08-10 北华航天工业学院 基于贝叶斯源识别的土壤中重金属污染源解析方法
CN105868479A (zh) * 2016-04-05 2016-08-17 北华航天工业学院 多环芳烃源解析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105158353A (zh) * 2015-07-29 2015-12-16 北华航天工业学院 土壤中多环芳烃污染源解析的方法
CN105631203A (zh) * 2015-12-27 2016-06-01 北华航天工业学院 识别土壤中重金属污染源的方法
CN105844301A (zh) * 2016-04-05 2016-08-10 北华航天工业学院 基于贝叶斯源识别的土壤中重金属污染源解析方法
CN105868479A (zh) * 2016-04-05 2016-08-17 北华航天工业学院 多环芳烃源解析方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113657698A (zh) * 2020-05-12 2021-11-16 中国环境科学研究院 基于多元统计和受体模型的流域分区污染源识别方法
CN111739587A (zh) * 2020-06-19 2020-10-02 中科三清科技有限公司 一种颗粒物监测数据的处理方法、装置、存储介质及终端
CN111739587B (zh) * 2020-06-19 2021-02-02 中科三清科技有限公司 一种颗粒物监测数据的处理方法、装置、存储介质及终端
CN113311081A (zh) * 2021-05-17 2021-08-27 清华大学 基于三维液相色谱指纹的污染源识别方法及装置
CN113311081B (zh) * 2021-05-17 2023-08-11 清华大学 基于三维液相色谱指纹的污染源识别方法及装置

Similar Documents

Publication Publication Date Title
CN110163290A (zh) 一种基于快速聚类和化学质量平衡对污染源进行解析的方法
Xing et al. Nonlinear response of ozone to precursor emission changes in China: a modeling study using response surface methodology
CN105631203A (zh) 识别土壤中重金属污染源的方法
CN105868479A (zh) 多环芳烃源解析方法
Gong et al. Evolutionary generation of test data for many paths coverage based on grouping
CN106327087A (zh) 测试任务分派方法
CN105631600A (zh) 车险查勘任务的发布方法及***
CN110489785A (zh) 一种大气污染物在线源解析方法及***
CN102360335B (zh) 定量评估核电厂安全级dcs***应用软件缺陷价值的方法
CN103257917A (zh) 软件测评***管理方法
CN102208058A (zh) 基于虚拟仪器技术的实验管理方法及其***
CN113282514B (zh) 问题数据的处理方法、装置、计算机设备和存储介质
CN105844301A (zh) 基于贝叶斯源识别的土壤中重金属污染源解析方法
CN108898504B (zh) 一种移动查勘定损***的智能训练及完善方法
Xi et al. A hybrid algorithm of traffic accident data mining on cause analysis
CN115357906A (zh) 面向网络安全等级保护2.0的智能辅助测评方法及***
CN117999478A (zh) 用于将色谱数据和元数据链接到合规风险的方法、介质和***
Fox et al. An agent-based model for estimating emissions reduction equivalence among leak detection and repair programs
Roshan et al. Review of search based techniques in software testing
CN106296038A (zh) 测试任务触发方法
Wang et al. An Ensemble Learning Model for Short‐Term Passenger Flow Prediction
Doğan et al. A v-model software development application for sustainable and smart campus analytics domain
CN104182829A (zh) 仪器研制可靠性管理与保障***
CN102567351A (zh) 一种数据库变更效果的测试方法及测试装置
Hong et al. Fix-filter-fix: Intuitively connect any models for effective bug fixing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200117

Address after: 065000 Langfang City, Hebei province Guangyang District Edmonton East Road No. 133

Applicant after: Beihua Institute of Aerospace Technology

Applicant after: Langfang Shengyao Information Technology Co., Ltd

Address before: 065000 Langfang City, Hebei province Guangyang District Edmonton East Road No. 133

Applicant before: Beihua Institute of Aerospace Technology

RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20190823