CN112991765B - 一种道路高排放源识别模型更新方法、终端及存储介质 - Google Patents

一种道路高排放源识别模型更新方法、终端及存储介质 Download PDF

Info

Publication number
CN112991765B
CN112991765B CN202110150159.1A CN202110150159A CN112991765B CN 112991765 B CN112991765 B CN 112991765B CN 202110150159 A CN202110150159 A CN 202110150159A CN 112991765 B CN112991765 B CN 112991765B
Authority
CN
China
Prior art keywords
emission
data
data set
real
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110150159.1A
Other languages
English (en)
Other versions
CN112991765A (zh
Inventor
李泽瑞
康宇
吕文君
昌吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Original Assignee
Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Artificial Intelligence of Hefei Comprehensive National Science Center filed Critical Institute of Artificial Intelligence of Hefei Comprehensive National Science Center
Priority to CN202110150159.1A priority Critical patent/CN112991765B/zh
Publication of CN112991765A publication Critical patent/CN112991765A/zh
Application granted granted Critical
Publication of CN112991765B publication Critical patent/CN112991765B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/048Detecting movement of traffic to be counted or controlled with provision for compensation of environmental or other condition, e.g. snow, vehicle stopped at detector
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/048Activation functions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G08SIGNALLING
    • G08GTRAFFIC CONTROL SYSTEMS
    • G08G1/00Traffic control systems for road vehicles
    • G08G1/01Detecting movement of traffic to be counted or controlled
    • G08G1/0104Measuring and analyzing of parameters relative to traffic conditions
    • G08G1/0125Traffic data processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • Computing Systems (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Chemical & Material Sciences (AREA)
  • Analytical Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种道路高排放源识别模型更新方法、终端及存储介质,包括S1构建污染排放数据集;S2利用数据集建立标签数据集和无标签数据集;S3根据污染排放数据集中的污染排放数据,计算图拉普拉斯矩阵及模型隐藏层的输出;S4初始化模型输出层的权重为零,设定当前的迭代次数;S5判断当前迭代次数是否小于最大迭代次数,若否执行步骤S8,若是执行步骤S6;S6基于目标函数
Figure DDA0002932033280000011
最小化得到当前迭代次数下模型输出层权重;S7判断
Figure DDA0002932033280000012
若是迭代次数自增1,执行步骤S5,否则执行步骤S8;S8输出当前迭代次数下模型的输出层权重,得到当前更新次数下的模型;S9判断当前的更新次数是否小于最大更新次数,若是执行步骤S2,否则模型更新过程结束。

Description

一种道路高排放源识别模型更新方法、终端及存储介质
技术领域
本发明涉及大气环境监测技术领域,特别涉及一种道路高排放源识别模型更新方法、终端及存储介质。
背景技术
交通污染是城市空气污染的一个重要来源,且在人流密集区域交通污染分布广泛,因此对人类健康造成了巨大威胁,为保障居民身体健康,必须要控制及降低交通污染排放。道路高排放源是指尾气排放量高于正常排放源的道路移动污染源。在城市交通造成的总污染排放量中,高排放源的排放量占了绝大比例,由在路车辆的遥感监测结果发现,排放量最高的前7%的车辆产生了50%的一氧化碳,排放量最高的前10%车辆产生了50%的碳氢化合物和46%的一氧化氮;而排放量最低的60%车辆其排放的污染物总量几乎可以忽略不计。由此可见,道路移动源排放分布是高度偏斜的,高排放源的识别和消除是降低交通污染总排放的关键。
关于道路高排放源的识别方法,由于道路移动源排放检测方法有多种,且检测方法包括模拟检测法和实际工况法,因此针对每种检测手段的高排放源识别方法也有所不同。如在I/M项目中高排放源的识别方法为:首先使用底盘测功机测量机动车的FTP(federal test procedure)循环工况排放,然后计算其单位行驶距离的排放量,如果该排放率高于新车排放率标准的2-3倍,则判定该机动车为高排放源。道路遥感监测技术可以在机动车行驶过程中检测出尾气排放的CO、CO2、HC(碳氢化合物)和NOx等污染物浓度,是一种实时检测技术。这种技术检测速度快、检测范围大,在一天之内即可得到数千甚至数万辆机动车的尾气排放检测数据,因此在道路高排放源的筛选中可发挥重要作用。当前基于道路遥感监测技术的高排放源识别方法大致包括:设定统一的遥感检测数据各污染成分排放限值、设定多重污染排放状况判定规则、及建立数据驱动的高排放源识别模型。已有研究中基于同一排放限值的识别方法有:Rueff在文献The cost of reducing emissions fromlate-model high-emitting vehicles detected via remote sensing中设定CO排放限值为4%;Bishop等人在文献A cost-effectiveness study of carbon monoxide emissionsreduction utilizing remote sensing中设定CO排放限值为3%;Stephens等人在文献Analysis of remote sensing errors of omission and commission under FTPconditions中为CO、HC及NO分别设定排放限值4%、0.3%及0.2%;Bishop等人在文献Drive-by motor vehicle emissions:immediate feedback in reducing air pollution中根据遥感监测设备得到的CO排放数据将车辆分为三类:浓度小于1.3%的为排放状况良好车辆,浓度在1.3%和4.5%之间的为排放状况一般车辆,浓度大于4.5%的为排放状况较差车辆;文献High emitter remote sensing project,Southeast Michigan Council ofGovernments分别为CO、HC、NO及PM四种污染物设定排放限值3%、500ppm、2000ppm及0.75。已有研究中基于多重判定规则的识别方法有:文献Remote sensing measurements ofreal world high exhaust emitters中设置了多种排放限值,分别针对由一次遥感检测结果判定高排放源,及由两次遥感检测结果来判定高排放源,并且排放限值包括由一种污染物浓度来判定或由两种污染物浓度共同判定,如CO浓度大于3%,或者CO浓度大于2%并且HC浓度大于250ppm;文献The Colorado remote sensing program January–December2010中认为两次遥感检测结果均满足CO浓度小于0.5%、HC浓度小于200ppm、NO浓度小于1000ppm,可判定为清洁车辆;文献Enhanced remote sensing performance based pilotprogram中为不同年限的车辆设定了CO、HC、NO的不同排放限值;文献Greater vancouverregional district remote sensing device trial for monitoring heavy-dutyvehicle emissions同样考虑不同年限对机动车排放状况的影响,并为柴油车设定了两套高排放源判定规则,根据NO和PM的排放量识别高排放源。数据驱动的高排放源识别方法有:Guo等人在文献Neural network modeling of vehicle gross emitter predictionbased on remote sensing data中根据怠速检测的结果采用神经网络模型判定在路机动车是否为高排放源,采用道路遥感监测数据的HC、CO、NOx、CO2的排放浓度,烟羽量,及车辆的速度、加速度7个特征,使用单隐层的BP(Back Propagation)神经网络,用176组训练数据得到81.63%的准确率。Zeng等人在文献Artificial neural network model foridentifying taxi gross emitter from remote sensing data of vehicle emission中根据怠速检测的结果判定在路的出租车是否为高排放源,首先使用主成分分析法从12个道路遥感监测数据特征(包括各污染成分的排放浓度、车辆特征及检测条件等)中提取8个主要的特征,然后输入一个单隐层的神经网络,用200组数据来训练该网络,最终得到超过93%的预测精度。曾君等人在文献《基于遥感监测的PKGV-ANN高排污车辆鉴别模型研究》中同样结合怠速检测结果和道路遥感监测数据,使用主成分分析法、K近邻法、遗传算法,并引入车辆比功率,用454组数据训练BP神经网络,建立的模型预测精度达到89.4%。Xie等人在文献Automatic and fast recognition of on-road high-emitting vehicles using anoptical remote sensing system中提出一种快速的高排放源自动识别方法,该方法实时获取道路遥感监测数据并自适应地更新数据聚类,更新判定规则,实验结果发现该方法对异常点不敏感,且收敛速度较快。
上述已有研究中无论是单一排放限值,还是多重判定规则,他们在考虑实时在路运行条件下的尾气排放状况方面有所欠缺,而已有的数据驱动的方法虽然将车辆运行条件相关测量值作为输入训练识别模型,但尚未考虑道路排放源数据中存在的实际问题,如分布极不均衡问题、数据噪声问题等等,因此选有方法仍然存在其局限性。
发明内容
本发明的目的在于克服上述背景技术中的不足,设计一种可自动更新的识别模型对高排放源进行识别。
为实现以上目的,一方面,采用一种道路高排放源识别模型更新方法,包括如下步骤:
S1、收集排放源的实时污染排放数据,并将收集的实时污染排放数据组成数据集X,并设定高排放源识别模型的最大更新次数Tupd以及当前的更新次数ζ=1;
S2、根据当前的更新次数ζ,将数据集构建为标签数据集和无标签数据集;
S3、设定高排放源识别模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的污染排放数据,计算图拉普拉斯矩阵以及计算模型隐藏层的输出;
S4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
S5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤S8,若是执行步骤S6;
S6、利用有标签数据集中的污染排放数据、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033260000041
最小化得到当前迭代次数下模型的输出层权重;
S7、判断是否满足
Figure BDA0002932033260000042
ε为预先设定的阈值,若是则ξ自增1,并执行步骤S5,否则执行步骤S8;
S8、输出当前迭代次数下模型的输出层权重,得到当前的更新次数下的高排放源识别模型;
S9、判断当前的更新次数ζ是否小于最大更新次数Tupd,若是则执行步骤S2,否则执行步骤S10;
S10、模型更新过程结束。
进一步地,所述步骤S1:收集排放源的实时污染排放数据,并将收集的实时污染排放数据组成数据集,包括如下步骤:
对每个排放源进行监测并记录对应排放源的编号,得到实时污染排放数据
Figure BDA0002932033260000051
NI为实时排放数据维度;
将所有收集到的实时排放数据组成数据集
Figure BDA0002932033260000052
其中,N表示X中包含的实时排放数据总数,并定义有标签数据集
Figure BDA0002932033260000053
定义无标签数据集Xu=X,分别用nl和nu表示有标签数据集
Figure BDA0002932033260000054
和无标签数据集Xu中包含的实时排放数据数量,当前nl=0,nu=N。
进一步地,所述步骤S2:根据当前的更新次数ζ,将数据集构建为标签数据集和无标签数据集,包括如下步骤:
S21、判断是否满足ζ>1,若否执行步骤S22,若是执行步骤S23;
S22、采用k-means聚类方法将所述数据集X聚为ne个簇,并取出每个簇中距离中心最近的数据点,得到ne条实时排放数据以构成选取数据集Xe,然后执行步骤S24;
S23、将所述无标签数据集Xu输入所述高排放源识别模型F(ζ-1),得到nu条实时排放数据的预测排放结果和置信度,根据nu条实时排放数据的预测排放结果和置信度构建选取数据集Xe,然后执行步骤S24;
S24、根据选取数据集Xe,构建当前选取的有标签数据集
Figure BDA0002932033260000055
S25、令
Figure BDA0002932033260000056
Xu=Xu-Xe,nl=nl+ne,nu=nu-ne
进一步地,所述根据nu条实时排放数据的预测排放结果和置信度构建选取数据集Xe,包括:
将所述nu条实时排放数据按照预测排放结果分为预测排放结果为超标的数据和预测排放结果为正常的数据;
将预测排放结果为超标的数据和预测排放结果为正常的数据分别按置信度从低到高排列,并分别取每部分里的前
Figure BDA0002932033260000061
条数据,共取出ne条数据构成所述选取数据集Xe
进一步地,所述根据选取数据集Xe,构建当前选取的有标签数据集
Figure BDA0002932033260000062
包括:
对所述选取数据集Xe中实时污染排放数据对应的排放源在排放检测机构进行排放监测,得到对应的排放源排放是否超标的真实结果,构建排放结果向量
Figure BDA0002932033260000063
其第i(i=1,2,…,ne)个元素表示第i条实时排放数据的排放结果是否超标,为1则表示超标,否则表示正常;
利用ne条实时污染排放数据Xe与其对应的排放结果向量Ye形成当前选取的有标签数据集
Figure BDA0002932033260000064
其中
Figure BDA0002932033260000065
表示第i条实时排放数据,
Figure BDA0002932033260000066
表示其对应的排放结果。
进一步地,所述根据有标签数据集和无标签数据集中的污染排放数据,计算图拉普拉斯矩阵以及计算模型隐藏层的输出,包括:
利用所述有标签数据集和无标签数据集中的污染排放数据,计算相似性矩阵A;
计算图拉普拉斯矩阵L=D-A,其中D为一个对角矩阵;
随机生成所述高排放源识别模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
进一步地,所述利用有标签数据集中的污染排放数据、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033260000071
最小化得到当前迭代次数下模型的输出层权重,包括:
计算所述有标签数据集
Figure BDA0002932033260000072
中污染排放数据的预测误差ej
根据预测误差ej计算N维对角矩阵A,第j(j=1,2,…,nl)个元素
Figure BDA0002932033260000073
c表示高斯核函数的中心;
利用N维对角矩阵A、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033260000074
最小化得到当前迭代次数下模型的输出层权重β(ξ)
进一步地,所述目标函数
Figure BDA0002932033260000075
为:
Figure BDA0002932033260000076
其中,||β||F表示β的Frobenius范数,ρ、λ分别为对应两项的权衡系数,
Figure BDA0002932033260000077
表示一个函数,L为图拉普拉斯矩阵,H为隐藏层的输出,
Figure BDA0002932033260000078
表示宽度为σq的高斯核函数,γq(0≤γq≤1)表示第q个高斯核函数的权重,ψ为一个常数。
第二方面,采用一种终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述道路高排放源识别模型更新方法。
第三方面,采用一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现上述道路高排放源识别模型更新方法。
与现有技术相比,本发明存在以下技术效果:由于交通污染源的数量分布极不均衡,高排放源虽排放了绝大多数的污染物,但其数量很少,绝大部分的排放源是正常排放源,本发明在考虑交通污染源数量分布极不均衡的情况下,通过请求少量的标签来有效的更新道路高排放源识别模型,节约了检测成本,同时本发明所设计的目标函数引入相关熵,从而使得所建立的高排放源识别模型有更好的鲁棒性;由于引入加权机制,使得所建立模型对高排放源有更高的识别准确度。
附图说明
下面结合附图,对本发明的具体实施方式进行详细描述:
图1是一种道路高排放源识别模型更新方法的流程图。
具体实施方式
为了更进一步说明本发明的特征,请参阅以下有关本发明的详细说明与附图。所附图仅供参考与说明之用,并非用来对本发明的保护范围加以限制。
如图1所示,本实施例公开了一种道路高排放源识别模型更新方法,包括如下步骤S1至S9:
S1、收集排放源的实时污染排放数据,并将收集的实时污染排放数据组成数据集X,并设定高排放源识别模型的最大更新次数Tupd以及当前的更新次数ζ=1;
S2、根据当前的更新次数ζ,将数据集构建为标签数据集和无标签数据集;
S3、设定高排放源识别模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的污染排放数据,计算图拉普拉斯矩阵以及计算模型隐藏层的输出;
S4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
S5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤S8,若是执行步骤S6;
S6、利用有标签数据集中的污染排放数据、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033260000091
最小化得到当前迭代次数下模型的输出层权重;
S7、判断是否满足
Figure BDA0002932033260000092
ε为预先设定的阈值,若是则ξ自增1,并执行步骤S5,否则执行步骤S8;
S8、输出当前迭代次数下模型的输出层权重,得到当前的更新次数下的高排放源识别模型;
S9、判断当前的更新次数ζ是否小于最大更新次数Tupd,若是则执行步骤S2,否则执行步骤S10;
S10、模型更新过程结束。
作为进一步优选的技术方案,所述步骤S1:收集排放源的实时污染排放数据,并将收集的实时污染排放数据组成数据集,包括如下步骤:
对每个排放源进行监测并记录对应排放源的编号,得到实时污染排放数据
Figure BDA0002932033260000093
NI为实时排放数据维度;
将所有收集到的实时排放数据组成数据集
Figure BDA0002932033260000094
其中,N表示X中包含的实时排放数据总数,并定义有标签数据集
Figure BDA0002932033260000095
定义无标签数据集Xu=X,分别用nl和nu表示有标签数据集
Figure BDA0002932033260000096
和无标签数据集Xu中包含的实时排放数据数量,nl=0,nu=N。
由于交通污染源的数量分布极不均衡,高排放源虽然贡献了绝大多数污染物,但是其数量很少,而绝大部分的排放源是正常排放源,本方法在考虑交通污染源数量分布极不均衡的情况下,设计样本选取方法,本发明中的样本选取方法基于样本的预测置信度,并考虑数据集的不均衡性而设计,采用这样的样本选取方法可在保证更新模型识别性能的同时减少待标注样本数量,降低标注成本。本实施例中样本选取过程即步骤S2:根据当前的更新次数ζ,将数据集构建为标签数据集和无标签数据集,包括如下细分步骤:
S21、判断是否满足ζ>1,若否执行步骤S22,若是执行步骤S23;
S22、采用k-means聚类方法将所述数据集X聚为ne个簇,并取出每个簇中距离中心最近的数据点,得到ne条实时排放数据以构成选取数据集Xe,然后执行步骤S24;
S23、将所述无标签数据集Xu输入所述高排放源识别模型F(ζ-1),得到nu条实时排放数据的预测排放结果和置信度,根据nu条实时排放数据的预测排放结果和置信度构建选取数据集Xe,然后执行步骤S24;
S24、根据选取数据集Xe,构建当前选取的有标签数据集
Figure BDA0002932033260000104
S25、令
Figure BDA0002932033260000101
Xu=Xu-Xe,nl=nl+ne,nu=nu-ne
作为进一步优选的技术方案,所述步骤S23中:根据nu条实时排放数据的预测排放结果和置信度构建选取数据集Xe,包括:
将所述nu条实时排放数据按照预测排放结果分为预测排放结果为超标的数据和预测排放结果为正常的数据;
将预测排放结果为超标的数据和预测排放结果为正常的数据分别按置信度从低到高排列,并分别取每部分里的前
Figure BDA0002932033260000102
条数据,共取出ne条数据构成所述选取数据集Xe
作为进一步优选的技术方案,上述步骤S24:根据选取数据集Xe,构建当前选取的有标签数据集
Figure BDA0002932033260000103
包括:
对所述选取数据集Xe中实时污染排放数据对应的排放源在排放检测机构进行排放监测,得到对应的排放源排放是否超标的真实结果,构建排放结果向量
Figure BDA0002932033260000114
其第i(i=1,2,…,ne)个元素表示第i条实时排放数据的排放结果是否超标,为1则表示超标,否则表示正常;
利用ne条实时污染排放数据Xe与其对应的排放结果向量Ye形成当前选取的有标签数据集
Figure BDA0002932033260000111
其中
Figure BDA0002932033260000112
表示第i条实时排放数据,
Figure BDA0002932033260000113
表示其对应的排放结果。
作为进一步优选的技术方案,上述步骤S3中设置的高排放源识别模型参数包括τ、λ、ρ、α、k、Nh、ψ、Q、σq(q=1,2,…,Q)、c、γq(q=1,2,…,Q)、ε。
具体地,一组可用参数具体设置如下:λ=0.8、ρ=5、α=1、k=10、Nh=10、ψ=90、Q=2、σ1=1、σ2=1、c=0、γ1=0.5、γ2=0.5、ε=0.001、Titer=200、Tupd=10。
作为进一步优选的技术方案,上述步骤S3中:根据有标签数据集和无标签数据集中的污染排放数据,计算图拉普拉斯矩阵以及计算模型隐藏层的输出,包括:
利用所述有标签数据集和无标签数据集中的污染排放数据,计算相似性矩阵A;
计算图拉普拉斯矩阵L=D-A,其中D为一个对角矩阵;
随机生成所述高排放源识别模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H。
需要说明的是,所述隐藏层的权重和偏置随机生成的方法可以是从高斯分布中采样。
作为进一步优选的技术方案,上述步骤S6:利用有标签数据集中的污染排放数据、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033260000121
最小化得到当前迭代次数下模型的输出层权重,包括:
计算所述有标签数据集
Figure BDA0002932033260000122
中污染排放数据的预测误差ej
根据预测误差ej计算N维对角矩阵A,第j(j=1,2,…,nl)个元素
Figure BDA0002932033260000123
c表示高斯核函数的中心;
利用N维对角矩阵Λ、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure BDA0002932033260000124
最小化得到当前迭代次数下模型的输出层权重β(ξ)
所述目标函数
Figure BDA0002932033260000125
为:
Figure BDA0002932033260000126
其中,||β||F表示β的Frobenius范数,ρ、λ分别为对应两项的权衡系数,
Figure BDA0002932033260000127
表示一个函数,L为图拉普拉斯矩阵,H为隐藏层的输出,
Figure BDA0002932033260000128
表示宽度为σq的高斯核函数,γq(0≤γq≤1)表示第q个高斯核函数的权重,ψ为一个常数。
以下对本实施例方案的实施步骤进行详细说明:
(1)收集监测到的排放源实时排放数据,所述实时排放数据一般包括一氧化碳、碳氢化合物、一氧化氮的排放量,及检测时的周围环境变量,包括温度、气压、湿度等;设实时排放数据维度为NI,则一个排放源经过一次检测得到实时排放数据
Figure BDA0002932033260000129
在排放监测的同时记录对应排放源的编号,包括汽车、摩托车的车牌号码;所有收集到的实时排放数据组成数据集
Figure BDA00029320332600001210
其中N表示X中包含的实时排放数据总数;
(2)设定模型更新最大次数为Tupd;定义有标签数据集
Figure BDA0002932033260000131
定义无标签数据集Xu=X;并分别用nl和nu表示有标签数据集和无标签数据集中包含的实时排放数据数量,则nl=0,nu=N;
(3)设当前模型更新次数为ζ=1;
(4)如果ζ=1,则转到第(5)步;如果ζ>1,则转到第(6)步;
(5)采用k-means聚类方法将数据集X聚为ne个簇,取出每个簇中距离中心最近的数据点,得到ne条实时排放数据构成的选取数据集Xe;然后转至第(7)步;
(6)将无标签数据集Xu输入神经网络F(ζ-1),得到nu条实时排放数据的预测排放结果和置信度,将nu条实时排放数据按照预测排放结果分为两部分,一部分的预测排放结果为超标,另一部分的预测排放结果为正常;将两部分数据分别按置信度从低到高排列,并分别取每部分里的前
Figure BDA0002932033260000132
条数据,则共取出ne条数据,这些数据构成选取数据集Xe;然后转至第(7)步;
(7)通知选取数据集Xe中实时排放数据对应的排放源到排放检测机构进行全面的排放检测,得到其排放是否超标的真实结果,得到排放结果向量
Figure BDA0002932033260000133
其第i(i=1,2,…,ne)个元素表示第i条实时排放数据的排放结果是否超标,为1则表示超标,否则表示正常;ne条实时排放数据Xe与其对应的排放结果向量Ye形成当前选取的有标签数据集
Figure BDA0002932033260000134
其中
Figure BDA0002932033260000135
表示Xe中第i条实时排放数据,
Figure BDA0002932033260000141
表示其对应的排放结果;
(8)令
Figure BDA0002932033260000142
Xu=Xu-Xe;同时令nl=nl+ne,nu=nu-ne;记
Figure BDA0002932033260000143
中包含的实时排放数据分别为x1,x2,…,
Figure BDA00029320332600001413
Xu中包含的实时排放数据分别为
Figure BDA0002932033260000144
(9)设定参数λ>0、ρ>0、α>0、k>1、Nh>0、ψ>1、Q1、σq>0(q=1,2,…,Q)、c、γq>0(q=1,2,…,Q)、ε>0的值,设定最大迭代次数Titerx2;
(10)计算相似性矩阵和图拉普拉斯矩阵,计算方法为:
相似性矩阵A的元素amn为:
Figure BDA0002932033260000145
其中m,n=1,2,…,N,α>0表示计算相似性的高斯核宽度,
Figure BDA0002932033260000146
表示实时排放数据xn的k个最近邻集合;
则图拉普拉斯矩阵L=D-A,D为一个对角矩阵,其第m个对角元素值
Figure BDA0002932033260000147
(11)随机生成神经网络的隐藏层神经元的权重
Figure BDA00029320332600001414
和偏置bp,其中p=1,2,…,Nh,Nh表示隐藏神经元数量,则对于第m(m=1,2,…,N)条实时排放数据,隐藏层的输出为hm=h(xm)=sigmoid(wTxm+b),其中
Figure BDA0002932033260000148
Figure BDA0002932033260000149
对于N条实时排放数据,隐藏层的输出为
Figure BDA00029320332600001410
Figure BDA00029320332600001411
随机生成隐藏层神经元的权重和偏置的方法可以从
Figure BDA00029320332600001412
均匀分布中采样得到;
(12)初始化输出层权重β(0)=0,并设当前迭代次数ξ=1;
(13)如果ξ<Titer,则转到第(14)步,否则转到第(18)步;
(14)计算
Figure BDA0002932033260000151
中数据的预测误差
Figure BDA0002932033260000152
(15)计算N维对角矩阵Λ,其中第j(j=1,2,…,nl)个元素
Figure BDA0002932033260000153
其余元素等于0;其中Q表示此处使用的高斯核函数数量,σq表示第q(q=1,2,…,Q)个高斯核函数宽度,
Figure BDA0002932033260000154
即表示宽度为σq的高斯核函数,c表示高斯核函数的中心,γq(0≤γq≤1)表示第q个高斯核函数的权重,满足
Figure BDA0002932033260000155
(16)通过最小化如下目标函数得出输出层权重β(ξ)
Figure BDA0002932033260000156
其中‖β||F表示β的Frobenius范数,ρ、λ分别为对应两项的权衡系数;函数
Figure BDA0002932033260000157
的取值如下:
Figure BDA0002932033260000158
Figure BDA0002932033260000159
则有:
Figure BDA00029320332600001510
Figure BDA0002932033260000161
其中,
Figure BDA0002932033260000162
为Nh维的单位矩阵,ψ为N维对角矩阵,第j(j=1,2,…,nl)个对角元素等于
Figure BDA0002932033260000163
第(nl+1)到第N个对角元素均为0;
Figure BDA0002932033260000164
为N维向量,它的第j(j=1,2,…,nl)个元素
Figure BDA0002932033260000165
第(nl+1)到第N个元素均为0;
(17)计算
Figure BDA0002932033260000166
Figure BDA0002932033260000167
如果
Figure BDA0002932033260000168
则令ξ自增1,并转至第(13)步,否则转至第(18)步;
(18)输出β(ξ),得到参数为w、b、β(ξ)的神经网络F(ζ)即为第ζ次更新得到的识别模型,可用于预测实时排放数据的排放结果;比较ζ和Tupd,如果ζ<Tupd,则转至第(4)步,否则停止运算。
在本文中,x的上标(o)标明该x属于X,x的上标(e)标明该x属于Xe
令模型的输出为yo,δ0=|yo-0|,δ1=|yo-1|,则δ0>δ1时,预测结果为“超标”,其置信度为
Figure BDA0002932033260000169
否则预测结果为“合格”,其置信度为
Figure BDA00029320332600001610
本实施例还公开了一种终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述实施例公开的道路高排放源识别模型更新方法。
本实施例还公开了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行可实现上述实施例公开的道路高排放源识别模型更新方法。
本领域普通技术人员可以理解:实现上述方法实施例的全部或部分步骤可以通过程序指令相关的硬件来完成,前述的程序可以存储于一计算机可读取存储介质中,该程序在执行时,执行包括上述方法实施例的步骤;而前述的存储介质包括:ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (3)

1.一种道路高排放源识别模型更新方法,其特征在于,包括如下步骤:
S1、收集道路排放源的实时污染排放数据,并将收集的实时污染排放数据组成数据集X,并设定高排放源识别模型的最大更新次数Tupd以及当前的更新次数ζ=1;
S2、根据当前的更新次数ζ,将数据集构建为标签数据集和无标签数据集;
S3、设定高排放源识别模型参数的值以及最大迭代次数Titer,并根据有标签数据集和无标签数据集中的污染排放数据,计算图拉普拉斯矩阵以及计算模型隐藏层的输出;
S4、初始化模型输出层的权重为零,并设定当前的迭代次数ξ=1;
S5、判断当前的迭代次数ξ是否小于最大迭代次数Titer,若否执行步骤S8,若是执行步骤S6;
S6、利用有标签数据集中的污染排放数据、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0003534642850000011
最小化得到当前迭代次数下模型的输出层权重;
S7、判断是否满足
Figure FDA0003534642850000012
ε为预先设定的阈值,若是则ξ自增1,并执行步骤S5,否则执行步骤S8;
S8、输出当前迭代次数下模型的输出层权重,得到当前的更新次数下的高排放源识别模型;
S9、判断当前的更新次数ζ是否小于最大更新次数Tupd,若是则执行步骤S2,否则执行步骤S10;
S10、模型更新过程结束;
所述步骤S1:收集道路排放源的实时污染排放数据,并将收集的实时污染排放数据组成数据集,包括如下步骤:
对每个道路排放源进行监测并记录对应排放源的编号,得到实时污染排放数据
Figure FDA0003534642850000021
NI为实时排放数据维度;
将所有收集到的实时排放数据组成数据集
Figure FDA0003534642850000022
其中,N表示X中包含的实时排放数据总数,并定义有标签数据集
Figure FDA0003534642850000023
定义无标签数据集Xu=X,分别用nl和nu表示有标签数据集
Figure FDA0003534642850000024
和无标签数据集Xu中包含的实时排放数据数量,当前nl=0,nu=N;
所述步骤S2:根据当前的更新次数ζ,构建标签数据集和无标签数据集,包括如下步骤:
S21、判断是否满足ζ>1,若否执行步骤S22,若是执行步骤S23;
S22、采用k-means聚类方法将所述数据集X聚为ne个簇,并取出每个簇中距离中心最近的数据点,得到ne条实时排放数据以构成选取数据集Xe,然后执行步骤S24;
S23、将所述无标签数据集Xu输入所述高排放源识别模型F(ζ-1),得到nu条实时排放数据的预测排放结果和置信度,根据nu条实时排放数据的预测排放结果和置信度构建选取数据集Xe,然后执行步骤S24;
S24、根据选取数据集Xe,构建当前选取的有标签数据集
Figure FDA0003534642850000025
S25、令
Figure FDA0003534642850000026
Xu=Xu-Xe,nl=nl+ne,nu=nu-ne
其中,所述根据nu条实时排放数据的预测排放结果和置信度构建选取数据集Xe,包括:
将所述nu条实时排放数据按照预测排放结果分为预测排放结果为超标的数据和预测排放结果为正常的数据;
将预测排放结果为超标的数据和预测排放结果为正常的数据分别按置信度从低到高排列,并分别取每部分里的前
Figure FDA0003534642850000031
条数据,共取出ne条数据构成所述选取数据集Xe
所述根据选取数据集Xe,构建当前选取的有标签数据集
Figure FDA0003534642850000032
包括:
对所述选取数据集Xe中实时污染排放数据对应的排放源在排放检测机构进行排放监测,得到对应的排放源排放是否超标的真实结果,构建排放结果向量
Figure FDA0003534642850000033
其第i个元素表示第i条实时排放数据的排放结果是否超标,为1则表示超标,否则表示正常,i=1,2,…,ne
利用ne条实时污染排放数据Xe与其对应的排放结果向量Ye形成当前选取的有标签数据集
Figure FDA0003534642850000034
其中
Figure FDA0003534642850000035
表示Xe中第i条实时排放数据,
Figure FDA0003534642850000036
表示其对应的排放结果,i=1,2,…,ne
所述根据有标签数据集和无标签数据集中的污染排放数据,计算图拉普拉斯矩阵以及计算模型隐藏层的输出,包括:
利用所述有标签数据集和无标签数据集中的污染排放数据,计算相似性矩阵A;
计算图拉普拉斯矩阵L=D-A,其中D为一个对角矩阵;
随机生成所述高排放源识别模型的隐藏层神经元的权重和偏置,并根据隐藏层神经元的权重和偏置计算隐藏层的输出H;
所述利用有标签数据集中的污染排放数据、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0003534642850000037
最小化得到当前迭代次数下模型的输出层权重,包括:
计算所述有标签数据集
Figure FDA0003534642850000041
中污染排放数据的预测误差ej
根据预测误差ej计算N维对角矩阵Λ,第j个元素
Figure FDA0003534642850000042
Figure FDA0003534642850000043
c表示高斯核函数的中心,j=1,2,…,nl
利用N维对角矩阵Λ、图拉普拉斯矩阵以及隐藏层的输出,基于目标函数
Figure FDA0003534642850000044
最小化得到当前迭代次数下模型的输出层权重β(ξ)
所述目标函数
Figure FDA0003534642850000045
为:
Figure FDA0003534642850000046
其中,‖β‖F表示β的Frobenius范数,ρ、λ分别为对应两项的权衡系数,
Figure FDA0003534642850000047
表示一个函数,L为图拉普拉斯矩阵,H为隐藏层的输出,
Figure FDA0003534642850000048
表示宽度为σq的高斯核函数,γq表示第q个高斯核函数的权重,ψ为一个常数,0≤γq≤1。
2.一种终端,包含存储器、处理器及存储在存储器并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1所述的道路高排放源识别模型更新方法。
3.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行可实现如权利要求1所述的道路高排放源识别模型更新方法。
CN202110150159.1A 2021-02-03 2021-02-03 一种道路高排放源识别模型更新方法、终端及存储介质 Active CN112991765B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110150159.1A CN112991765B (zh) 2021-02-03 2021-02-03 一种道路高排放源识别模型更新方法、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110150159.1A CN112991765B (zh) 2021-02-03 2021-02-03 一种道路高排放源识别模型更新方法、终端及存储介质

Publications (2)

Publication Number Publication Date
CN112991765A CN112991765A (zh) 2021-06-18
CN112991765B true CN112991765B (zh) 2022-05-10

Family

ID=76346491

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110150159.1A Active CN112991765B (zh) 2021-02-03 2021-02-03 一种道路高排放源识别模型更新方法、终端及存储介质

Country Status (1)

Country Link
CN (1) CN112991765B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114819191B (zh) * 2022-06-24 2022-10-11 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 一种高排放道路移动源识别方法、***及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105095275B (zh) * 2014-05-13 2019-04-05 中国科学院自动化研究所 文档聚类的方法及装置
CN104408257A (zh) * 2014-11-28 2015-03-11 江苏大学 基于模拟退火粒子群算法的混合动力汽车参数优化方法
CN105258680B (zh) * 2015-09-30 2017-12-01 西安电子科技大学 一种目标位姿测量方法和装置
US20180284745A1 (en) * 2016-05-09 2018-10-04 StrongForce IoT Portfolio 2016, LLC Methods and systems for self-organization of collected data using 3rd party data from a data marketplace in an industrial internet of things environment
CN106845371B (zh) * 2016-12-31 2019-10-25 中国科学技术大学 一种城市路网机动车尾气排放遥感监控***
CN109409287B (zh) * 2018-10-25 2021-05-14 山东大学 一种由宏表情到微表情的迁移学习方法
CN110135466B (zh) * 2019-04-23 2022-07-15 中国科学技术大学 一种污染物排放超标车辆判断方法及***
CN111619545B (zh) * 2020-05-08 2021-10-01 北京航空航天大学 基于交通信息的混合动力汽车能量管理方法
CN112132264B (zh) * 2020-09-11 2023-04-07 合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室) 基于时空残差感知网络的区域尾气排放预测方法及***

Also Published As

Publication number Publication date
CN112991765A (zh) 2021-06-18

Similar Documents

Publication Publication Date Title
Shang et al. A novel model for hourly PM2. 5 concentration prediction based on CART and EELM
CN108426812B (zh) 一种基于记忆神经网络的pm2.5浓度值预测方法
CN110782093B (zh) 融合ssae深度特征学习和lstm的pm2.5小时浓度预测方法及***
Hu et al. Prediction of fuel consumption for enroute ship based on machine learning
CN108268935B (zh) 一种基于时序循环神经网络的pm2.5浓度值预测方法及***
CN106022954B (zh) 基于灰色关联度的多重bp神经网络负荷预测方法
Bernal et al. Financial market time series prediction with recurrent neural networks
CN111709549A (zh) 一种基于svd-pso-lstm的短时交通流预测的导航提醒方法
CN114781538A (zh) 一种ga-bp神经网络耦合决策树的空气质量预测方法和***
Shang et al. A hybrid method for traffic incident detection using random forest-recursive feature elimination and long short-term memory network with Bayesian optimization algorithm
CN111024898A (zh) 一种基于CatBoost模型的车辆尾气浓度超标判别方法
CN112434735B (zh) 一种动态行驶工况构建方法、***及设备
CN114036135A (zh) 利用不完全信息估计城市移动源污染排放方法及***
CN112991765B (zh) 一种道路高排放源识别模型更新方法、终端及存储介质
Sun et al. Long short-term memory network-based emission models for conventional and new energy buses
Motallebiaraghi et al. High-fidelity modeling of light-duty vehicle emission and fuel economy using deep neural networks
CN110988263B (zh) 一种基于改进的Stacking模型的车辆尾气浓度估计方法
CN114764682B (zh) 一种基于多机器学习算法融合的大米安全风险评估方法
CN109409541A (zh) 实现报废汽车蓄电池逆向物流可行性评价的方法
CN113192569B (zh) 基于改进粒子群和误差反馈神经网络的有害气体监测方法
CN109376903B (zh) 一种基于博弈神经网络的pm2.5浓度值预测方法
CN116946183A (zh) 一种考虑驾驶能力的商用车驾驶行为预测方法及车用设备
Hamami et al. Classification of air pollution levels using artificial neural network
Li et al. A data-driven rutting depth short-time prediction model with metaheuristic optimization for asphalt pavements based on RIOHTrack
CN115048875A (zh) 基于机动车排放数据的城市大气环境指标预警方法及***

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant