CN110688436B - 一种基于行车轨迹的改进型GeoHash道路聚类方法 - Google Patents
一种基于行车轨迹的改进型GeoHash道路聚类方法 Download PDFInfo
- Publication number
- CN110688436B CN110688436B CN201910764610.1A CN201910764610A CN110688436B CN 110688436 B CN110688436 B CN 110688436B CN 201910764610 A CN201910764610 A CN 201910764610A CN 110688436 B CN110688436 B CN 110688436B
- Authority
- CN
- China
- Prior art keywords
- time
- points
- omega
- latitude
- road
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Traffic Control Systems (AREA)
Abstract
本发明公开了一种基于行车轨迹的改进型GeoHash道路聚类方法,包括以下步骤:S1由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D;S2向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置;S3遍历样本集中的所有点,找出其中的噪声点和非噪声点,若存在非噪声点则进行继续;S4样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置;S5遍历Ωcur中的所有点,找出其中的非噪声点,服务端进行第三次初始化设置;S6循环进行S5至Ωcur为空集,将Ck更新至簇划分C={C1,C2,...,Ck},并将Ck从Ω移除,跳转入S3;S7输出簇划分C={C1,C2,...,Ck}。本发明能够有效降低乡镇道路信息采集成本,改善乡镇道路信息更新滞后的问题。
Description
技术领域
本发明涉及定位***技术领域,尤其涉及一种基于行车轨迹的改进型GeoHash道路聚类方法。
背景技术
农村道路交通是全国交通网络的重要组成部分,随着国家经济的发展,农村交通出行量增加。而偏远农村地区道路信息不全、采集难度较大等多方面问题,制约着手机等智能终端设备在农村地区的导航应用。随着大数据时代的到来以及智慧交通推广落地,运管局等交通管理机构源源不断的采集到乡镇客运班车行车轨迹数据,如何根据班车等车辆行驶轨迹对农村等乡镇道路进行主动发现、道路异常进行精确预警已成为一项重要的研究课题。
传统的基于车辆的道路采集设备对道路信息进行随车采集,存在采集成本过高、采集信息覆盖不全、道路信息更新滞后等诸多问题。传统道路聚类算法通常采用基于密度的聚类算法,因为设备点数据较多,因此传统的道路聚类算法存在计算量过大、时间复杂度较高等问题。
发明内容
本发明的目的就在于为了解决上述问题而提供一种基于行车轨迹的改进型GeoHash道路聚类方法。
为了实现上述目的,本公开提供一种基于行车轨迹的改进型GeoHash道路聚类方法,包括以下步骤:
S1,由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D;
S2,向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置:核心对象集合Ω为空集,未访问样本集合Γ=D,簇划分C为空集;
S3,遍历样本集中的所有点,找出其中的噪声点和非噪声点,若样本集中的所有点均为噪声点,则结束流程,若存在非噪声点则进行S4;
S4,样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置:于Ω中随机抽取核心对象O加入到簇核心对象队列Ωcur,且将O加入簇样本集合Ck,将O从Γ中移除;
S5,遍历Ωcur中的所有点,找出其中的非噪声点,服务端进行第三次初始化设置:将Ωcur的非噪声点加入Ck、,并将Ωcur的非噪声点从Γ中移除,将Ωcur的非噪声点加入Ωcur,并将O从Ωcur中移除;
S6,循环进行S5至Ωcur为空集,将Ck更新至簇划分C={C1,C2,...,Ck},并将Ck从Ω移除,跳转入S3;
S7,输出簇划分C={C1,C2,...,Ck},即得主干道路区域信息。
优选地,随车采集的道路经度/纬度/时间的Hash运算过程如下:
随车采集的道路经度/纬度/时间范围(Xmin,Xmax)均分为前区间(Xmin,(Xmin+Xmax)/2)和后区间((Xmin+Xmax)/2,Xmax),若目标经度/纬度/时间X位于前区间,则编码为0,否则编码为1;
若编码为0,则将前区间再次均分为前后两个区间,若目标经度/纬度/时间X位于再次均分后的前区间,则编码为0,否则编码为1;
以此种方式均分经度/纬度/时间范围2n次至达到精度要求,得经度/纬度/时间编码。
优选地,将经度编码、纬度编码、时间编码合并后进行Base64编码,Base64编码长度n与误差关系如下:
优选地,遍历集合找出非噪声点的方法如下:
于集合中取对象点,找到对象点同一Hash领域内的子集,若子集中的点个数大于及等于MinPts,则该对象点位非噪声点,否则为噪声点。
本发明的有益效果在于:
本发明研发出一种基于行车轨迹的改进型GeoHash道路聚类方法,有效降低乡镇道路信息采集成本,改善乡镇道路信息更新滞后的问题。本发明涉及的聚类方法与传统的基于距离的密度聚类算法相比(例如DBscan算法),该发明的不同在于不需要计算两点之间的距离,而是通过是否为同一个Hash来确定是否为同一个簇,故大大降低了其时间复杂度。
附图说明
附图是用来提供对本公开的进一步理解,并且构成说明书的一部分,与下面的具体实施方式一起用于解释本公开,但并不构成对本公开的限制。在附图中:
图1是本发明所述的一种基于行车轨迹的改进型GeoHash道路聚类方法的流程图。
具体实施方式
以下结合附图对本公开的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本公开,并不用于限制本公开。
如图1所示,本公开提供一种基于行车轨迹的改进型GeoHash道路聚类方法,包括以下步骤:
S1,由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得样本集D。
S2,向服务端输入样本集,领域参数(hash,MinPts),设置样本距离度量方式,服务端进行第一次初始化设置:核心对象集合Ω为空集,未访问样本集合Γ=D,簇划分C为空集。
领域参数(hash,MinPts)描述领域的样本分布紧密程度,其中hash描述了某一样本的所处区域的hash值,MinPts描述了某一样本在所处hash区域内的样本个数阈值。
S3,遍历样本集中的所有点,找出其中的噪声点和非噪声点,若样本集中的所有点均为噪声点,则结束流程,若存在非噪声点则进行S4;
S4,样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置:于Ω中随机抽取核心对象O加入到簇核心对象队列Ωcur,且将O加入簇样本集合Ck,将O从Γ中移除;
S5,遍历Ωcur中的所有点,找出其中的非噪声点,服务端进行第三次初始化设置:将Ωcur的非噪声点加入Ck、,并将Ωcur的非噪声点从Γ中移除,将Ωcur的非噪声点加入Ωcur,并将O从Ωcur中移除;
S6,循环进行S5至Ωcur为空集,将Ck更新至簇划分C={C1,C2,...,Ck},并将Ck从Ω移除,跳转入S3;
S7,输出簇划分C={C1,C2,...,Ck},即得主干道路区域信息。
优选地,随车采集的道路经度/纬度/时间的Hash运算过程如下:
随车采集的道路经度/纬度/时间范围(Xmin,Xmax)均分为前区间(Xmin,(Xmin+Xmax)/2)和后区间((Xmin+Xmax)/2,Xmax),若目标经度/纬度/时间X位于前区间,则编码为0,否则编码为1;
若编码为0,则将前区间再次均分为前后两个区间,若目标经度/纬度/时间X位于再次均分后的前区间,则编码为0,否则编码为1;
以此种方式均分经度/纬度/时间范围2n次至达到精度要求,得经度/纬度/时间编码。
优选地,将经度编码、纬度编码、时间编码合并,第1、4位为经度编码,第2、5位为纬度编码、第3、6位为时间编码,后进行Base64编码,base64编码对照参照表1-1。
Decimal | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 |
Base64 | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | a | b | c | d | e |
Decimal | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 |
Base64 | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t |
Decimal | 30 | 31 | 32 | 33 | 34 | 35 | 36 | 37 | 38 | 39 | 40 | 41 | 42 | 43 | 44 |
Base64 | u | v | w | x | y | z | A | B | C | D | E | F | G | H | I |
Decimal | 45 | 46 | 47 | 48 | 49 | 50 | 51 | 52 | 53 | 54 | 55 | 56 | 57 | 58 | 59 |
Base64 | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X |
Decimal | 60 | 61 | 62 | 63 | |||||||||||
Base64 | Y | Z | + | / |
表1-1对照表
Base64编码长度n与误差关系如下,具体参照表1-2:
表1-2Base64编码长度与精度对照表
优选地,遍历集合找出非噪声点的方法如下:
于集合中取对象点,找到对象点同一Hash领域内的子集,若子集中的点个数大于及等于MinPts,则该对象点位非噪声点,否则为噪声点。
以下详细说明随车采集的39.928167,116.389550,30600(上午8点30的秒数)的Hash运算过程如下:
1.1根据纬度进行二进制编码
1.1.1纬度区间[-90,90]进行二分[-90,0),[0,90],分隔为左右区间,39.928167属于有区间[0,90],标记为1;
1.1.2将[0,90]进行二分[0,45),[45,90],确定39.928167属于左区间,[0,45),标记为0;
1.1.3重复上述过程,39.928167总属于某个区间[a,b],且随着每次迭代[a,b]范围随之缩小,逼近39.92816;
1.1.4如果给定的纬度x(39.928167)属于左区间,则记录0,如果属于右区间则记录1,这样随着算法的进行会产生一个序列1011100,序列的长度跟给定的区间划分次数有关。
根据纬度计算编码
1.2根据经度进行二进制编码
1.2.1同理,经度区间为[-180,180],对116.389550进行二进制编码。
根据经度计算编码
bit | min | mid | max |
1 | -180 | 0.000 | 180 |
1 | 0.000 | 90 | 180 |
0 | 90 | 135 | 180 |
1 | 90 | 112.5 | 135 |
0 | 112.5 | 123.75 | 135 |
0 | 112.5 | 118.125 | 123.75 |
1 | 112.5 | 115.3125 | 118.125 |
0 | 115.3125 | 116.71875 | 118.125 |
1 | 115.3125 | 116.015625 | 116.71875 |
1 | 116.015625 | 116.3671875 | 116.71875 |
1.3根据时间进行二进制编码
1.3.1同理,时间区间为[0,86400],对30600进行二进制编码
根据时间计算编码
bit | min | mid | max |
0 | 0 | 43200 | 86400 |
1 | 0 | 21600 | 43200 |
0 | 21600 | 32400 | 43200 |
1 | 21600 | 27000 | 32400 |
1 | 27000 | 29700 | 32400 |
0 | 29700 | 31500 | 32400 |
1 | 29700 | 30375 | 31500 |
0 | 30375 | 30937.5 | 31500 |
0 | 30375 | 30656.25 | 30937.5 |
1 | 30375 | 30515.5 | 30656.25 |
2组码
通过上述计算,经度产生的编码为1101001011,纬度产生的编码为1011100011,时间产生的编码为0101101001。第一、四位放经度,第二、五位放纬度,第三、六位放时间,把三串编码组合生成新的二进制编码:111000
最后使用0-9、a-z、A-Z、+、/这64个字母进行base64编码,首先将110101010111011000101000110111转成十进制,对应着53、23、24、40、55,十进制对应的编码为RnoET。
本发明涉及的一种基于行车轨迹的改进型GeoHash道路聚类方法,有效降低乡镇道路信息采集成本,改善乡镇道路信息更新滞后的问题。本发明涉及的聚类方法与传统的基于距离的密度聚类算法相比(例如DBscan算法),该发明的不同在于不需要计算两点之间的距离,而是通过是否为同一个Hash来确定是否为同一个簇,故大大降低了其时间复杂度。
以上结合附图详细描述了本公开的优选实施方式,但是,本公开并不限于上述实施方式中的具体细节,在本公开的技术构思范围内,可以对本公开的技术方案进行多种简单变型,这些简单变型均属于本公开的保护范围。
另外需要说明的是,在上述具体实施方式中所描述的各个具体技术特征,在不矛盾的情况下,可以通过任何合适的方式进行组合,为了避免不必要的重复,本公开对各种可能的组合方式不再另行说明。
此外,本公开的各种不同的实施方式之间也可以进行任意组合,只要其不违背本公开的思想,其同样应当视为本公开所公开的内容。
Claims (4)
1.一种基于行车轨迹的改进型GeoHash道路聚类方法,其特征在于,包括以下步骤:
S1,由随车采集的道路经度、纬度及时间信息通过Hash运算和base64编码得到样本集D;
S2,向服务端输入样本集、领域参数(hash,MinPts),领域参数(hash,MinPts)描述领域的样本分布紧密程度,其中hash描述了某一样本的所处区域的hash值,MinPts描述了某一样本在所处hash区域内的样本个数阈值;
设置样本距离度量方式,服务端进行第一次初始化设置:核心对象集合Ω为空集,未访问样本集合Γ=D,簇划分C为空集;
S3,遍历样本集中的所有点,找出其中的噪声点和非噪声点,若样本集中的所有点均为噪声点,则结束流程,若存在非噪声点则进行S4;
S4,样本集中的所有非噪声点集中为核心对象集Ω,服务端进行第二次初始化设置:于Ω中随机抽取核心对象O加入到簇核心对象队列Ωcur,且将O加入簇样本集合Ck,将O从Γ中移除;
S5,遍历Ωcur中的所有点,找出其中的非噪声点,服务端进行第三次初始化设置:将Ωcur的非噪声点加入Ck,并将Ωcur的非噪声点从Γ中移除,将Ωcur的非噪声点加入Ωcur,并将O从Ωcur中移除;
S6,循环进行S5至Ωcur为空集,将Ck更新至簇划分C={C1,C2,...,Ck},并将Ck从Ω移除,跳转入S3;
S7,输出簇划分C={C1,C2,...,Ck},即得主干道路区域信息。
2.根据权利要求1所述的一种基于行车轨迹的改进型GeoHash道路聚类方法,其特征在于,随车采集的道路经度/纬度/时间的Hash运算过程如下:
随车采集的道路经度/纬度/时间范围(Xmin,Xmax)均分为前区间(Xmin, (Xmin+Xmax)/2)和后区间((Xmin+Xmax)/2,Xmax),若目标经度/纬度/时间X位于前区间,则编码为0,否则编码为1;
若编码为0,则将前区间再次均分为前后两个区间,若目标经度/纬度/时间X位于再次均分后的前区间,则编码为0,否则编码为1;
以此种方式均分经度/纬度/时间范围2n次至达到精度要求,得到经度/纬度/时间编码。
4.根据权利要求1所述的一种基于行车轨迹的改进型GeoHash道路聚类方法,其特征在于,遍历集合找出非噪声点的方法如下:
于集合中取对象点,找到对象点同一Hash领域内的子集,若子集中的点个数大于及等于MinPts,则该对象点为 非噪声点,否则为噪声点。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910764610.1A CN110688436B (zh) | 2019-08-19 | 2019-08-19 | 一种基于行车轨迹的改进型GeoHash道路聚类方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910764610.1A CN110688436B (zh) | 2019-08-19 | 2019-08-19 | 一种基于行车轨迹的改进型GeoHash道路聚类方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110688436A CN110688436A (zh) | 2020-01-14 |
CN110688436B true CN110688436B (zh) | 2021-06-08 |
Family
ID=69108427
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910764610.1A Active CN110688436B (zh) | 2019-08-19 | 2019-08-19 | 一种基于行车轨迹的改进型GeoHash道路聚类方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110688436B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113378922B (zh) * | 2021-06-09 | 2022-07-15 | 南京邮电大学 | 一种基于GeoHash的地理坐标点密度聚类方法 |
CN114500872B (zh) * | 2021-12-30 | 2024-06-07 | 浙江大华技术股份有限公司 | 摄像机与道路信息的匹配方法、计算机设备和存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107766808A (zh) * | 2017-09-30 | 2018-03-06 | 北京泓达九通科技发展有限公司 | 道路网络空间中车辆对象移动轨迹聚类的方法及*** |
CN109934265A (zh) * | 2019-02-15 | 2019-06-25 | 同盾控股有限公司 | 一种常驻地址的确定方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101687124B1 (ko) * | 2013-04-09 | 2016-12-15 | 엔이씨 유럽 리미티드 | 위치 기반 서비스를 위한 데이터세트 구조를 생성하는 방법 및 모바일 디바이스에 위치 기반 서비스를 제공하기 위한 방법 및 시스템 |
-
2019
- 2019-08-19 CN CN201910764610.1A patent/CN110688436B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107766808A (zh) * | 2017-09-30 | 2018-03-06 | 北京泓达九通科技发展有限公司 | 道路网络空间中车辆对象移动轨迹聚类的方法及*** |
CN109934265A (zh) * | 2019-02-15 | 2019-06-25 | 同盾控股有限公司 | 一种常驻地址的确定方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN110688436A (zh) | 2020-01-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110413905B (zh) | 获取道路线形的方法、装置、设备及存储介质 | |
CN112015835B (zh) | Geohash压缩的地图匹配方法 | |
CN107270922B (zh) | 一种基于poi索引的交通事故空间定位方法 | |
EP3349126B1 (en) | Method, device, storage medium, and apparatus for automatically discovering fuel station poi | |
CN110688436B (zh) | 一种基于行车轨迹的改进型GeoHash道路聚类方法 | |
CN109029472A (zh) | 基于低采样率gps轨迹点的地图匹配方法 | |
CN104331422A (zh) | 一种路段类型推测方法 | |
CN108362293A (zh) | 一种基于关键点技术的车辆轨迹匹配方法 | |
CN111460508B (zh) | 一种基于差分隐私技术的轨迹数据保护方法 | |
CN109634946B (zh) | 一种基于大数据挖掘的轨迹智能匹配关联分析方法 | |
Mohamed et al. | Accurate and efficient map matching for challenging environments | |
CN109635914B (zh) | 基于混合智能遗传粒子群的优化极限学习机轨迹预测方法 | |
CN111292356B (zh) | 运动轨迹与道路的匹配方法及装置 | |
CN114446051A (zh) | 一种城市路网交通韧性薄弱识别方法 | |
CN107545318B (zh) | 公交线路优先级确定、公交换乘线路排序方法及装置 | |
WO2021236006A1 (en) | Route deviation quantification and vehicular route learning based thereon | |
CN104850649A (zh) | 一种在地图上进行兴趣点采样的方法及*** | |
Song et al. | Hidden Markov model and driver path preference for floating car trajectory map matching | |
CN111222381A (zh) | 用户出行方式识别方法、装置、电子设备及存储介质 | |
CN113609240B (zh) | 基于海量卡口数据的车辆出行轨迹重构方法 | |
CN113240265B (zh) | 一种基于多模式交通数据的城市空间划分方法 | |
Li et al. | An automatic extraction method of coach operation information from historical trajectory data | |
CN108877210B (zh) | 一种实时路况数据生产方法及车载终端 | |
CN103218406B (zh) | 兴趣点的地址信息的处理方法及设备 | |
CN111444286A (zh) | 一种基于轨迹数据的远距离交通节点关联性挖掘方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |