CN107066501B - 一种基于道路相似性的机动车尾气遥测设备布点方法 - Google Patents
一种基于道路相似性的机动车尾气遥测设备布点方法 Download PDFInfo
- Publication number
- CN107066501B CN107066501B CN201611267879.1A CN201611267879A CN107066501B CN 107066501 B CN107066501 B CN 107066501B CN 201611267879 A CN201611267879 A CN 201611267879A CN 107066501 B CN107066501 B CN 107066501B
- Authority
- CN
- China
- Prior art keywords
- clustering
- sample
- samples
- classes
- road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 39
- 230000008569 process Effects 0.000 claims abstract description 6
- 238000001514 detection method Methods 0.000 claims description 12
- 238000007621 cluster analysis Methods 0.000 claims description 10
- 239000010755 BS 2869 Class G Substances 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 239000000779 smoke Substances 0.000 claims description 7
- 238000005259 measurement Methods 0.000 claims description 6
- 239000003344 environmental pollutant Substances 0.000 claims description 5
- 231100000719 pollutant Toxicity 0.000 claims description 5
- 230000001133 acceleration Effects 0.000 claims description 4
- 238000013501 data transformation Methods 0.000 claims description 4
- 238000010586 diagram Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 238000011524 similarity measure Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims 2
- 230000004931 aggregating effect Effects 0.000 claims 1
- 238000007405 data analysis Methods 0.000 claims 1
- 238000011835 investigation Methods 0.000 claims 1
- 238000012800 visualization Methods 0.000 claims 1
- 230000007613 environmental effect Effects 0.000 abstract 1
- 239000000284 extract Substances 0.000 abstract 1
- 230000000875 corresponding effect Effects 0.000 description 10
- 230000008901 benefit Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000003915 air pollution Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000003337 fertilizer Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000007417 hierarchical cluster analysis Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000011895 specific detection Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/26—Government or public services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Educational Administration (AREA)
- Development Economics (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于道路相似性的机动车尾气遥测设备布点方法。该方法以城市路网机动车尾气为研究对象,充分考虑了城市道路拓扑结构特征和道路旁环境因素等影响属性,提取出其中相关性较高的属性作为聚类变量,采用层次聚类的方法对城市路网中获得的机动车尾气数据进行了分析与处理。本发明结合聚类分析的结果与尾气遥测设备实际布点的相关要求,提出了能够将任意数目的尾气遥测设备进行优化布设的算法。本发明通过对大量尾气数据的处理与分析,从中得到布点规律,也可为其它规律的进一步发现提供参考。
Description
技术领域
本发明属于智能交通的数据处理领域,涉及一种基于道路相似性的机动车尾气遥测设备布点方法。
背景技术
当今社会,由于持续快速发展,人民群众收入稳步增加,全国机动车数量呈现逐年增加的趋势,伴随而来的机动车尾气问题也日益凸显。机动车尾气作为城市空气污染的主要源头,不仅造成城市大气污染的加重,导致雾霾天气的频发,还引发城市居民呼吸***疾病患病风险的增加,对城市居民的日常生活和身体健康造成不良影响。汽车尾气已经成为城市在大型化发展和环境改善两者之间的一个非常突出的矛盾,为了解决这一问题,对机动车尾气进行有效检测和控制是必要的。同时,结合信息技术、数据通讯传输技术、电子传感技术、控制技术及计算机技术的智能交通已经成为未来城市交通的必然发展方向,面对智能交通***中不断产生的大量的数据,采用数据挖掘的方法对数据进行分析处理、发现其中隐含的规则,已经成为智能交通发展中的一个重要环节。通过对机动车尾气数据的获取、分析、预测,从而能够准确、全面、迅速地掌控机动车尾气数据的变化,为相关分析工作及发展战略制定提供决策依据,以满足管理部门对机动车排气污染防控和节能减排的需要。
聚类分析是一种统计分析的方法,通过数据建模简化数据,目的是在相似性的基础上对数据进行分类。因为路网拓扑结构、道路周围环境等的相似,各路段的尾气数据也具有一定相似性。直接采集得到的尾气数据都是原始的和粗糙的,不能得到有效组织和利用,采用聚类分析的方法对城市路网中获得的机动车尾气数据进行分析处理,有助于得到尾气数据中的一些有价值规律,对于指导布点方案等具有重要的现实意义。
由于道路交通网庞大的规模,在每条道路上均安装遥测设备显然难以实现,为了在遥测设备数量有限的情况下,通过合理的布点方式,发挥遥测设备的最大效益,扩大设备检测的范围是工程上亟待解决的问题。对所考察的路段赋予权重,权重综合考虑该路段的设备布设成本、该路段区域的经济价值和管理部门人员意见等要素后利用模糊综合评价方法确定,选取每一类中权重最大的路段布设遥测设备,这样将有限的资源集中到高价值的部分,实现了效益最大化的目标。将任意数目的尾气遥测设备进行优化布设使得布点方案更加灵活,一方面,避免了设备的闲置与资金的浪费,能够使每台遥测设备物尽其用;另一方面,能够最大限度的获得尽可能多的尾气信息并对全路网尾气信息做出预测。
与现有的方法进行比较,较为相似的是题目为“一种城市路网机动车尾气实时遥感监测基址选取方法”(申请号为201510214145.6),这是申请人的先期成果,其使用了车辆是否出现的单一属性作为聚类特征,对道路进行分类并对每个分类结果进行评估,选出最优方案。其不足之处在于获取道路上出现的每辆车的信息难度很大,采取的聚类方法所得结果可能依赖于初始聚类中心的选择,可能使得结果产生明显偏差,布点精度低。
发明内容
本发明技术解决问题:为了解决尾气检测中将任意数目的尾气遥测设备进行布设的问题,克服现有技术的不足,提供一种基于道路相似性的机动车尾气遥测设备布点方法,采用聚类分析方法对城市路网中获得的机动车尾气数据的相关特征进行了提取分析,最后提出了在路网中布设任意数目的尾气遥测设备的方法,具有更高的布点精度和更好的适用性。
为了解决上述问题,本发明所采取的技术方案是:
一种基于道路相似性的机动车尾气遥测设备布点方法,包括以下步骤:
步骤一:采集所需样本数据并对样本数据进行预处理,所述所需样本数据是指用尾气遥测设备获得目标路网中每条路段一段时间内的尾气检测信息、道路车流量信息、天气信息和道路相关信息;数据预处理包括数据清洗、数据规约和数据变换三个方面;
步骤二:采用层次聚类的方法对步骤一中经过数据预处理处理后的样本数据进行聚类分析;采用欧几里德距离作为聚类距离的度量,首先将每个样本都归为一类,计算每两个类之间的相似度,也就是样本与样本两两之间距离进行度量;然后把其中相似程度最高也就是距离最小的样本聚成一类,循环重复相似性度量并进行最近类的合并,每次减少一类,最后直到所有的样本被聚到一类中去,得到聚类结果;
步骤三:根据步骤二中的聚类结果,绘制聚类谱系图,将每一步聚类的结果直观的显示在聚类谱系图上;
步骤四:对所考察的路段赋予权重,代表路段的重要程度以及优先考虑程度,将任意数目的尾气遥测设备对应相应数目的聚类结果,在聚类谱系图上找到包含类数目等于对应数目的聚类结果,选取每个类中权重最大的路段布设尾气遥测设备,最终得到将任意数目的尾气遥测设备进行布点的方案。
步骤一中,聚类前采集所需样本数据并对样本数据进行预处理,具体实现如下:
(1)聚类前的样本数据采集,将目标路网中的每条路段作为一个样本,获得每个样本路段一段时间内的具体尾气检测信息,包括的数据项有:检测设备编号,检测时间,检测的车牌号码,车速,车辆加速度,车辆长度,CO2、CO、HC、NO浓度,烟度值,抓拍照片等。
道路车流量信息,包括的数据项有:道路名称,时间,小型客车、中型客车等不同类型车辆的车流量。
天气信息,包括的数据项有:时间,城市,天气状况,温度,湿度,风速,PM2.5,PM10,AQI等。
道路相关信息,包括的数据项有:地理位置id,所在省份,所在城市,所在街道,连接方式,路旁植被面积,建筑物平均高度等。
(2)样本数据预处理部分包括数据清洗、数据规约和数据变换三个方面。数据清洗,就是通过对数据的分析,找出缺失值、偏离过大的个别极端值进行丢弃处理,由于原始数据量很大,这类数据所占的比例非常小,对问题影响不会很大,所以可用进行丢弃处理。数据规约,就是删除与所考虑问题不相关、弱相关或冗余的属性,合并相同属性,由于原始数据中属性很多,不一定与本发明所考虑问题相关,需要不断的对相关属性的选择进行修改,才能达到比较好的聚类效果。数据变换,就是将数据进行标准化处理,转化为便于处理的适当格式,以适应聚类分析及算法的需要,由于不同属性对应的数据取值范围差异可能很大,为了消除不同数量级数据带来的影响,对数据进行标准化处理是必要的。
经过数据预处理,本发明排除了干扰聚类结果的坏数据,选取出了其中适当的属性作为样本点的属性,并且对每个属性对应的数据进行了标准化处理,表示为矩阵形式如下:
其中n表示样本个数(目标路段的条数),m表示选取的相关属性的个数(相关属性包括属性合并后的污染物总浓度、烟度值、属性合并后的总车流量、连接方式、路旁植被面积、建筑物平均高度等),x表示经过标准化处理后的属性的具体数值。
步骤二中,采用层次聚类的方法对步骤一中处理得到的样本数据进行聚类分析具体包括以下步骤:
(1)将步骤一中处理得到样本中的每一个样本都归为一类,计算每两个类之间的相似度,也就是对样本与样本两两之间的距离进行度量。度量样本之间的相似性最常采用的有欧几里德距离、曼哈顿距离和闵可夫斯基距离,本发明经过反复试验采用欧几里德距离作为聚类距离的度量,欧几里得距离如下:
其中,d(i,j)表示欧几里得距离,i和j为第i个样本和第j个样本的样本标号,分别代表第i条路段和第j条路段,m表示选取的相关属性个数(相关属性包括属性合并后的污染物总浓度、烟度值、属性合并后的总车流量、连接方式、路旁植被面积、建筑物平均高度等),x表示相关属性经过标准化后的数值,xi1表示第i个样本的第1个属性,xi2表示第i个样本的第2个属性,xim表示第i个样本的第m个属性,xj1表示第j个样本的第1个属性,xj2表示第j个样本的第2个属性,xjm表示第j个样本的第m个属性。
(2)把(1)中相似程度最高也就是距离最小的两个样本聚成一类,假设为样本s和样本t,将样本s,t合并为一新类,记为G1={s,t},新产生的类G1的相关属性用路段s,t对应属性的均值表示,即新类的属性可表示为其中,s和t为第s个样本和第t个样本的样本标号,m表示选取的相关属性个数,x表示相关属性经过标准化后的数值,xs1表示第s个样本的第1个属性,xsm表示第s个样本的第m个属性,xt1表示第t个样本的第1个属性,xtm表示第t个样本的第m个属性;
(3)新类和其他类一起可得到一个n-1容量的样本,计算样本中所有样本点每两个之间的相似度,也就是两两之间的距离进行度量。将其中使得距离最小的两个样本聚成一类,记为G2,新产生的类G2的相关属性用类中包含的两个样本的对应属性的均值表示。
(4)类似地,重复进行相似性度量和最近类的合并,每次减少一类,可以依次得到新类G3,G4,…,Gn-1,最后类的个数减少为1,所有的样本被聚到一类中去。
步骤三中,根据聚类信息绘制聚类谱系图,横坐标为1处代表第一次聚类的结果,横坐标为2处代表第二次聚类的结果,依次类推,将每一步聚类的结果直观的显示在聚类谱系图上。聚类谱系图充分展示了聚类的每一步过程,让从可视化的层面了解到每一步被聚为一类的路段,每一步聚类结束后不同类的数目和这些类中分别包含的路段。
步骤四中,对所考察的路段赋予权重w,权重综合考虑该路段的设备布设成本、设备布设难易程度等要素后确定,权重越大代表路段的重要程度越大以及优先考虑程度越高。假设需要将数目为k的尾气遥测设备进行,从聚类谱系图找到对应类数目为k的聚类结果,即第n-k次聚类后的结果,选取这k个类中每个类的权重最大的路段布设尾气遥测设备,最终得到对任意数目的尾气遥测设备进行布点的方案。
本发明与现有技术相比的优点在于:
(1)在属性的选取方面,获取道路上出现的每辆车的信息难度很大,而交通流的获取相对容易(比如浮动车方法)。相比较单一选取道路上车辆是否出现,本发明采用聚类分析方法对城市路网中获得的机动车尾气数据的相关特征进行了提取分析,最后提出了在路网中布设任意数目的尾气遥测设备的方法,综合考虑了各种相关属性的影响,提高了聚类分析的精度,具有更高的布点精度。
(2)其次,聚类过程不依赖于遥测设备数目k的选取,使得具有更高的灵活性和适用性。
(3)最后,已有的算法对于不同数目的遥测设备布点需要重新进行聚类分析,而本发明提出的方法只需进行一次聚类分析,便可得到对应不同数目遥测设备的所有布点方案。
(4)本发明一方面避免了设备的闲置与资金的浪费,能够使每台遥测设备物尽其用;另一方面,能够最大限度的获得尽可能多的尾气信息并对全路网尾气信息做出预测。本发明通过对大量尾气数据的处理与分析,从中得到布点规律,也可为其它规律的进一步发现提供参考。
附图说明
图1为本发明方法的实现流程图;
图2为本发明实施实例聚类谱系图示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面结合附图对本发明作进一步的详细描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
实施实例选取合肥市某地区某路网一段时间内的具体检测数据,该路网包含路段数目为n=10,利用聚类分析得到能够将任意数目为k的尾气遥测设备进行优化布设的方案,如图1所示,具体实现过程如下所示。
步骤一:聚类前采集所需样本数据并对样本数据进行预处理。将目标路网中的每条路段作为一个样本,获得每个样本路段一段时间内的具体尾气检测信息,包括的数据项有:检测设备编号,检测时间,检测的车牌号码,车速,车辆加速度,车辆长度,CO2、CO、HC、NO浓度,烟度值,抓拍照片等。道路车流量信息,包括的数据项有:道路名称,时间,小型客车、中型客车等不同类型车辆的车流量。天气信息,包括的数据项有:时间,城市,天气状况,温度,湿度,风速,PM2.5,PM10,AQI等。道路相关信息,包括的数据项有:地理位置id,所在省份,所在城市,所在街道,连接方式,路旁植被面积,建筑物平均高度等。
首先进行数据清洗,通过对数据的分析,找出缺失值、偏离过大的个别极端值进行丢弃处理,这步需要花费较多的时间。然后进行数据规约,删除与所考虑问题不相关、弱相关或冗余的属性(如温度,湿度,风速,检测的车牌号码,车速,车辆加速度等),合并类似属性(小型客车、中型客车等不同类型车辆的车流量合并为车流量,CO2、CO、HC、NO浓度合并为污染物浓度),最终选取了其中m=8个相关属性(相关属性包括属性合并后的污染物总浓度、烟度值、属性合并后的总车流量、连接方式、路旁植被面积、建筑物平均高度等)。最后进行数据变换,将不同单位、不同数量级的数据进行标准化处理。
步骤二:采用层次聚类的方法对步骤一中处理得到的样本数据进行层次聚类分析具体包括以下步骤:
(1)将步骤一中处理得到样本中的每一个样本都归为一类,共计10个类,计算每两个类之间的相似度,也就是计算样本点两两之间的欧几里德距离,得到距离矩阵如下:
其中d表示欧几里得距离。
(2)选取对角线以下下三角中最小的元素为d(3,6),将路段3和路段6合并为一新类,记为G1={3,6},利用路段3和路段6的相关属性重新计算得到新类G1的属性。
(3)新类和其他类一起可得到一个n-1=9容量的样本,计算新样本中所有样本点两两之间的距离,其中使得距离最小的为d(4,10),将路段4和路段10聚成一类,记为G2={4,10},类的数目减少为9个。利用路段4和路段10的相关属性重新计算得到新类G2的属性。
(4)类似地,重复进行相似性度量和距离最小类的合并,每次减少一类,可以依次得到新类G3,G4,…,G9,在第9步聚类时,类的个数减少为1,所有的样本被聚为一类,得到聚类结果。聚类结果如下表所示:
聚类步数 | 聚类选择 | 聚类结果 |
1 | 3,6 | 1,2,4,5,7,8,9,10,{3,6} |
2 | 4,10 | 1,2,5,7,8,9,{3,6},{4,10} |
3 | 8,9 | 1,2,5,7,{8,9},{3,6},{4,10} |
4 | G2,G3 | 1,2,5,7,{3,6},{4,8,9,10} |
5 | 5,G4 | 1,2,7,{3,6},{4,5,8,9,10} |
6 | 7,G5 | 1,2,{3,6},{4,5,7,8,9,10} |
7 | 1,2 | {1,2},{3,6},{4,5,7,8,9,10} |
8 | G1,G7 | {1,2,3,6},{4,5,7,8,9,10} |
9 | G6,G8 | {1,2,3,4,5,6,7,8,9,10} |
步骤三:根据步骤二中的聚类结果绘制聚类谱系图,将每一步聚类的结果直观的显示在聚类谱系图上如图2所示。横坐标为1处代表第一次聚类的结果,包含9个类{{1},{2},{4},{5},{7},{8},{9},{10},{3,6}}。横坐标为2处代表第二次聚类的结果,包含8个类{{1},{2},{5},{7},{8},{9},{4,10},{3,6}},依次类推。
步骤四:对所考察的路段赋予权重,代表路段的重要程度以及优先考虑程度,权重综合考虑该路段的设备布设成本、设备布设难易程度等要素后确定。路段1权重为4,路段2,3,4权重为3,路段5,6权重为2,路段7,8,9,10权重为1。假设需要将数目为k=3的尾气遥测设备布设到该路网中,从聚类谱系图找到对应类数目为3的聚类结果,即第7次聚类后的结果为{{1,2},{3,6},{4,5,7,8,9,10}},选取这3个类中每个类的权重最大的路段{1,3,4}布设尾气遥测设备,最终得到对尾气遥测设备进行布点的方案为在路段1,路段3,路段4上布点。
以上显示和描述了本发明的基本原理和主要特征。本行业的技术人员应该了解,本发明不受上述实例的限制,上述实例和说明书中的描述只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的发明范围内。本发明要求保护范围由所附权利要求书及其等效物界定。
Claims (3)
1.一种基于道路相似性的机动车尾气遥测设备布点方法,其特征在于包括以下步骤:
步骤一:采集所需样本数据并对样本数据进行预处理,所述所需样本数据是指用尾气遥测设备获得目标路网中每条路段一段时间内的尾气检测信息、道路车流量信息、天气信息和道路相关信息;数据预处理包括数据清洗、数据规约和数据变换三个方面;
步骤二:采用层次聚类的方法对步骤一中经过数据预处理处理后的样本数据进行聚类分析;采用欧几里德距离作为聚类距离的度量,首先将每个样本都归为一类,计算每两个类之间的相似度,也就是样本与样本两两之间距离进行度量;然后把其中相似程度最高也就是距离最小的样本聚成一类,循环重复相似性度量并进行最近类的合并,每次减少一类,最后直到所有的样本被聚到一类中去,得到聚类结果;
步骤三:根据步骤二中的聚类结果,绘制聚类谱系图,将每一步聚类的结果直观的显示在聚类谱系图上;
步骤四:对所考察的路段赋予权重,代表路段的重要程度以及优先考虑程度,将任意数目的尾气遥测设备对应相应数目的聚类结果,在聚类谱系图上找到包含类数目等于对应数目的聚类结果,选取每个类中权重最大的路段布设尾气遥测设备,最终得到将任意数目的尾气遥测设备进行布点的方案;
所述步骤一中,具体实现如下:
(1)聚类前的样本数据采集,将目标路网中的每条路段作为一个样本,获得每个样本路段一段时间内的尾气检测信息、道路车流量信息、天气信息和道路相关信息;其中:
尾气检测信息,包括的数据项有:检测设备编号,检测时间,检测的车牌号码,车速,车辆加速度,车辆长度,CO2、CO、HC、NO浓度,烟度值,抓拍照片;
道路车流量信息,包括的数据项有:道路名称,时间,小型客车、中型客车不同类型车辆的车流量;
天气信息,包括的数据项有:时间,城市,天气状况,温度,湿度,风速,PM2.5,PM10,AQI;
道路相关信息,包括的数据项有:地理位置id,所在省份,所在城市,所在街道,连接方式,路旁植被面积,建筑物平均高度;
(2)样本数据预处理部分包括数据清洗、数据规约和数据变换三个方面;数据清洗,就是通过对数据的分析,找出缺失值、偏离过大的个别极端值进行丢弃处理;数据规约,删除与所考虑问题不相关、弱相关或冗余的属性,合并相同属性,同时不断的对相关属性的选择进行修改,以达到所要求的聚类效果;数据变换,将数据规约后的数据进行标准化处理,转化为便于处理的适当格式,以适应聚类分析的需要;
所述步骤二中,采用层次聚类的方法对步骤一中处理得到的样本数据进行聚类分析具体包括以下步骤:
(1)将步骤一中处理得到样本中的每一个样本都归为一类,计算每两个类之间的相似度,即对样本与样本两两之间的距离进行度量;度量样本之间的相似性采用欧几里德距离作为聚类距离的度量,欧几里得距离如下:
其中,d(i,j)表示欧几里得距离,i和j为第i个样本和第j个样本的样本标号,分别代表第i条路段和第j条路段,m表示选取的相关属性个数,相关属性包括属性合并后的污染物总浓度、烟度值、属性合并后的总车流量、连接方式、路旁植被面积、建筑物平均高度,x表示相关属性经过标准化后的数值,xi1表示第i个样本的第1个属性,xi2表示第i个样本的第2个属性,xim表示第i个样本的第m个属性,xj1表示第j个样本的第1个属性,xj2表示第j个样本的第2个属性,xjm表示第j个样本的第m个属性;
(2)把步骤(1)中相似程度最高也就是距离最小的两个样本聚成一类,假设为样本s和样本t,将样本s,t合并为一新类,记为G1={s,t},新产生的类G1的相关属性用路段s,t对应属性的均值表示,即新类的属性表示为
其中,s和t为第s个样本和第t个样本的样本标号,m表示选取的相关属性个数,x表示相关属性经过标准化后的数值,xs1表示第s个样本的第1个属性,xsm表示第s个样本的第m个属性,xt1表示第t个样本的第1个属性,xtm表示第t个样本的第m个属性;
(3)新类和其他类一起得到一个n-1容量的样本,计算样本中所有样本点每两个之间的相似度,即两两之间的距离进行度量;将其中使得距离最小的两个样本聚成一类,记为G2,新产生的类G2的相关属性用类中包含的两个样本的对应属性的均值表示;n表示样本个数;
(4)类似地,重复进行相似性度量和最近类的合并,每次减少一类,依次得到新类G3,G4,…,Gn-1,最后类的个数减少为1,所有的样本被聚到一类中去,得到聚类结果。
2.根据权利要求1所述的基于道路相似性的机动车尾气遥测设备布点方法,其特征在于:所述步骤三中,根据聚类过程绘制聚类谱系图,横坐标为1处代表第一次聚类的结果,横坐标为2处代表第二次聚类的结果,依次类推,将每一步聚类的结果直观的显示在聚类谱系图上,聚类谱系图充分展示了聚类的每一步过程,让从可视化的层面了解到每一步被聚为一类的路段,每一步聚类结束后不同类的数目和这些类中分别包含的路段。
3.根据权利要求1所述的基于道路相似性的机动车尾气遥测设备布点方法,其特征在于:所述步骤四中,对所考察的路段赋予权重w,权重综合考虑该路段的设备布设成本、设备布设难易程度要素后确定,权重越大代表路段的重要程度越大以及优先考虑程度越高;假设需要将数目为k的尾气遥测设备进行,从聚类谱系图找到对应类数目为k的聚类结果,即第n-k次聚类后的结果,选取这k个类中每个类的权重最大的路段布设尾气遥测设备,最终得到对任意数目的尾气遥测设备进行布点的方案。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611267879.1A CN107066501B (zh) | 2016-12-31 | 2016-12-31 | 一种基于道路相似性的机动车尾气遥测设备布点方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201611267879.1A CN107066501B (zh) | 2016-12-31 | 2016-12-31 | 一种基于道路相似性的机动车尾气遥测设备布点方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107066501A CN107066501A (zh) | 2017-08-18 |
CN107066501B true CN107066501B (zh) | 2020-01-31 |
Family
ID=59623872
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201611267879.1A Active CN107066501B (zh) | 2016-12-31 | 2016-12-31 | 一种基于道路相似性的机动车尾气遥测设备布点方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107066501B (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107976514B (zh) * | 2017-11-20 | 2019-06-21 | 中国科学技术大学 | 一种基于机动车尾气浓度分布预测的遥测设备布点方法 |
CN109508727B (zh) * | 2018-04-23 | 2021-07-16 | 北京航空航天大学 | 一种基于加权欧氏距离的度量功能间相似性的方法 |
CN109150629B (zh) * | 2018-10-12 | 2021-05-14 | 中交第一公路勘察设计研究院有限公司 | 一种路网多类型监测设备组合布设方法 |
CN111241720B (zh) * | 2020-04-27 | 2020-07-17 | 北京英视睿达科技有限公司 | 一种道路扬尘模型的建模方法和装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104835099A (zh) * | 2015-04-29 | 2015-08-12 | 中国科学技术大学 | 一种城市路网机动车尾气实时遥感监测基址选取方法 |
CN204945122U (zh) * | 2015-09-16 | 2016-01-06 | 张世达 | 一种车辆尾气污染物监测*** |
CN105259304A (zh) * | 2015-09-16 | 2016-01-20 | 张世达 | 一种车辆尾气污染物在线监测***和方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9508085B2 (en) * | 2015-02-23 | 2016-11-29 | Iogen Corporation | Pipeline arrangement for utilizing a gas comprising biomethane |
-
2016
- 2016-12-31 CN CN201611267879.1A patent/CN107066501B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104835099A (zh) * | 2015-04-29 | 2015-08-12 | 中国科学技术大学 | 一种城市路网机动车尾气实时遥感监测基址选取方法 |
CN204945122U (zh) * | 2015-09-16 | 2016-01-06 | 张世达 | 一种车辆尾气污染物监测*** |
CN105259304A (zh) * | 2015-09-16 | 2016-01-20 | 张世达 | 一种车辆尾气污染物在线监测***和方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107066501A (zh) | 2017-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107066501B (zh) | 一种基于道路相似性的机动车尾气遥测设备布点方法 | |
CN108109382B (zh) | 基于复合网络的拥堵点、拥堵线、拥堵区域的发现方法 | |
CN107248283B (zh) | 一种考虑路段关键度的城市区域路网运行状态评价方法 | |
CN109871876B (zh) | 一种基于浮动车数据的高速公路路况识别与预测方法 | |
Ferreira et al. | The impact of driving styles on fuel consumption: A data-warehouse-and-data-mining-based discovery process | |
WO2021051609A1 (zh) | 细颗粒物污染等级的预测方法、装置及计算机设备 | |
CN111539454B (zh) | 一种基于元学习的车辆轨迹聚类方法及*** | |
Morris et al. | Real-time video-based traffic measurement and visualization system for energy/emissions | |
CN104318324B (zh) | 基于出租车gps记录的机场巴士站点及路线规划方法 | |
CN106529608B (zh) | 一种机动车尾气遥测设备综合布点*** | |
CN111651545A (zh) | 一种基于多源数据融合的城市边缘区提取方法 | |
CN106097755A (zh) | 用于识别泊车场地和/或空出场地的方法 | |
CN111210612A (zh) | 基于公交gps数据与站点信息提取公交线路轨迹的方法 | |
AU2011306659A1 (en) | Driver profiling system and method | |
Abou Chacra et al. | Fully automated road defect detection using street view images | |
CN106023592A (zh) | 一种基于gps数据的交通拥堵检测方法 | |
Sadahiro et al. | Exploratory analysis of time series data: Detection of partial similarities, clustering, and visualization | |
CN116628455A (zh) | 一种城市交通碳排放监测与决策支持方法及*** | |
CN112463898A (zh) | 一种结合速度与噪声监测数据的噪声地图更新方法 | |
CN117238126A (zh) | 一种连续流道路场景下的交通事故风险评估方法 | |
CN115311229A (zh) | 基于激光雷达的路面病害检测分类方法、***和存储介质 | |
CN111414878A (zh) | 一种关于地块的社会属性分析、图像处理方法及装置 | |
CN113379269B (zh) | 多因素空间聚类的城市商业功能区划方法、装置及介质 | |
Vámosi et al. | Development of bus driving cycle for debrecen on the basis of real-traffic data | |
CN112101132B (zh) | 一种基于图嵌入模型和度量学习的交通状况预测方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CP02 | Change in the address of a patent holder | ||
CP02 | Change in the address of a patent holder |
Address after: No.443 Huangshan Road, Shushan District, Hefei City, Anhui Province 230022 Patentee after: University of Science and Technology of China Address before: 230026 Jinzhai Road, Baohe District, Hefei, Anhui Province, No. 96 Patentee before: University of Science and Technology of China |