CN111582380A - 一种基于时空特征的船舶轨迹密度聚类方法及装置 - Google Patents
一种基于时空特征的船舶轨迹密度聚类方法及装置 Download PDFInfo
- Publication number
- CN111582380A CN111582380A CN202010388175.XA CN202010388175A CN111582380A CN 111582380 A CN111582380 A CN 111582380A CN 202010388175 A CN202010388175 A CN 202010388175A CN 111582380 A CN111582380 A CN 111582380A
- Authority
- CN
- China
- Prior art keywords
- track
- sub
- ship
- time
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 9
- 238000004364 calculation method Methods 0.000 claims description 16
- 230000015654 memory Effects 0.000 claims description 16
- 230000002123 temporal effect Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000005259 measurement Methods 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000002159 abnormal effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 2
- 239000006185 dispersion Substances 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000004576 sand Substances 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000007417 hierarchical cluster analysis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/251—Fusion techniques of input or preprocessed data
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Navigation (AREA)
Abstract
本发明涉及一种基于时空特征的船舶轨迹密度聚类方法及装置;其主要是对获取的船舶的运行轨迹数据提取特征点,根据提取的特征点进行轨迹划分,得到各船舶轨迹的子轨迹段;计算任意两子轨迹段之间的空间距离和时间距离,对得到的空间距离和时间距离进行加权求和得到时空距离;其中空间距离是根据船舶位置信息计算得到的,时间距离是根据各子轨迹段的航速信息、各子轨迹段的时间信息和相应的两子轨迹段的时间差计算得到的;根据获取的时空距离,并通过DBSCAN算法对各子轨迹段进行聚类。即本发明通过将子轨迹段的航速信息作为时间距离的因素之一,能够更加真实地反映不同子轨迹段的时间距离信息,准确度量时间距离,最终准确地对船舶运行轨迹进行聚类。
Description
技术领域
本发明涉及一种基于时空特征的船舶轨迹密度聚类方法及装置,属于海上交通领域。
背景技术
随着我国对外贸易的日益扩大,海上交通量的迅猛增长,海上交通环境越来越复杂,船舶在生产活动中产生的时空轨迹越来越多,海上巨大的交通压力对交通控制和管理提出了更高的要求,及时发现并有效地监测和管理船舶的异常轨迹是智能海上交通的重要组成部分,而发现船舶的异常轨迹的前提是需要得到典型的船舶运动轨迹。其中,通过收集船舶播发的海量的AIS(Automatic Identification System)数据,利用其中蕴藏的海上交通特征信息,对船舶轨迹数据进行挖掘可发现船舶群体运动规律,分析其形成原因并预测未来发展,为海上通道安全保障、海洋空间规划优化,乃至维护海洋生态的多样性等奠定基础。
目前,针对船舶轨迹聚类方法主要是利用AIS数据中船舶运动信息进行聚类分析。如申请公布号为CN109447135A,名称为“一种基于AIS数据提取船舶轨迹的聚类方法”的一篇中国专利申请文件,其公开的是将每条船舶轨迹的起始点的经纬度和终点的经纬度作为船舶轨迹的特征值;利用k-means空间聚类法对船舶轨迹进行聚类。但是该方法使用的k-means算法存在对初始值不敏感等问题,使其在船舶轨迹聚类中存在聚类效率和稳定性不高的问题。
此外,如申请公布号为CN104680187A,名称为“基于缓冲区相似性度量的舰船轨迹层次聚类分析方法”的中国专利申请文件,其公开了利用缓冲区分析对航道轨迹线聚类的相似性度量,通过层次聚类方法,设置簇间的相似性阈值;将相似性度量最大的两根船舶轨迹线聚为一类,并将该聚类内的轨迹线缓冲区的并集作为新的缓冲区参与到下一次相似性度量计算和聚类中去,直到两聚类的船舶轨迹线簇之间的相似性最大值小于簇间相似性阈值时完成聚类。但是该方法依然依赖于人工设置的缓冲区半径和簇间的相似性阈值,若设置不当,会导致局部船舶群体运动规律特征的丧失或对轨迹的过度分类。同时,其仅考虑了空间运动规律的相似性,忽略了发生在同一位置不同时间的轨迹的关联性,这样就导致聚类不准确,无法真实地衡量出轨迹线聚类。
而基于密度的轨迹聚类方法(DBSCAN算法),该方法能够有效地进行移动目标的轨迹研究,如一篇为“基于密度的轨迹时空聚类分析(吴笛等著,《地球信息科学》,2015年10月第17卷第10期)”的文献公开的基于密度的轨迹时空聚类方法,在对移动的物体的聚类过程中同时考虑轨迹的空间距离信息和时间距离信息,并且,对于时间距离的度量,其考虑了时间差和时间跨度,其并未考虑移动物体的速度信息,仅仅是将不同子轨迹段的速度信息看作相同,但是,实际上对于移动的物体的轨迹,其中的不同子轨迹段的速度差异很大,那么,仅用时间来度量时间距离必然存在不准确的问题,这样也就无法准确地衡量时空距离,最终导致聚类的不准确。
发明内容
本发明的目的是提供一种基于时空特征的船舶轨迹密度聚类方法及装置,以解决现有技术中无法准确地衡量时空距离,最终导致轨迹聚类的不准确的问题。
为实现上述目的,本发明的一种基于时空特征的船舶轨迹密度聚类方法的技术方案,包括以下步骤:
1)获取船舶的运行轨迹数据,所述运行轨迹数据包括船舶位置信息、航速和时间信息;
2)对船舶的运行轨迹数据提取特征点,根据提取的特征点进行轨迹划分,得到各船舶轨迹的子轨迹段;
3)计算任意两子轨迹段之间的空间距离和时间距离,对得到的空间距离和时间距离进行加权求和得到融合后的时空距离;
所述空间距离是根据船舶位置信息计算得到的;所述时间距离是根据各子轨迹段的航速、各子轨迹段的时间信息和相应的两子轨迹段的时间差计算得到的;
4)根据获取的时空距离,并通过DBSCAN算法对各子轨迹段进行聚类。
本发明的有益效果是:
本发明通过计算任意两子轨迹段之间的空间距离和时间距离,对得到的空间距离和时间距离进行加权求和得到融合后的时空距离,其中对于时间距离的计算引入了船舶航速信息这一参量,通过将不同子轨迹段的航速信息作为时间距离的因素之一,能够更加真实地反映不同子轨迹段的时间距离信息,使其与实际的子轨迹段的时间距离更加接近,能够准确度量时间距离,进而准确地衡量时空距离,最终准确地对船舶运行轨迹进行聚类,更加有效地反映出发生在同一海域不同时间的船舶轨迹区分开来,得到更为细化、准确的船舶轨迹移动规律,能够为合理的航路规划及海事监管中的热点航道提取和异常事件预防提供有效的决策手段和参考信息。
其中,Vi为子轨迹段Li的航速,Vj为子轨迹段Lj的航速,Ti为子轨迹段Li的时间信息,Tj为子轨迹段Lj的时间信息,ΔTij为子轨迹段Li和Lj之间的时间差。
进一步的,所述航速为对应子轨迹段的速度均值。
其中,vs、ve分别为子轨迹段的起点速度和终点速度。
进一步的,其特征在于,所述时间差为Tij=max(tie,tje)-min(tis,tjs),
其中,tis、tie为子轨迹段Li所跨时间区间的起点和终点,tjs、tje为子轨迹段Lj所跨时间区间的起点和终点。
进一步的,还包括对获取的船舶的运行轨迹数据进行预处理,以滤除噪声或偏差大的数据,获取有效的船舶运行轨迹数据的步骤。
进一步的,步骤2)中提取的特征点为OD点、SP点和TF点中的至少两种,所述OD点为每条船舶运行轨迹的起点和终点;所述SP点为停泊点,所述TF点为轨迹特征点。
进一步的,步骤3)中,还包括对所述时间距离和空间距离进行标准化处理的步骤。
进一步的,所述时空距离DST为:
DST=ωs×Dsn+ωt×Dtn
其中,Dsn是对空间距离进行标准化处理得到的,Dtn是对时间距离DT进行标准化处理得到的,ws为空间距离的权重系数,wt为时间距离的权重系数,满足ωs+ωt=1。
本发明还提供了一种基于时空特征的船舶轨迹密度聚类装置的技术方案,包括处理器和存储器,所述处理器执行所述存储器存储的上述的基于时空特征的船舶轨迹密度聚类方法的技术方案。
附图说明
图1是本发明的基于时空特征的船舶轨迹密度聚类方法实施例的方法流程图;
图2是本发明的基于时空特征的船舶轨迹密度聚类方法实施例的特征点提取示意图;
图3是本发明的基于时空特征的船舶轨迹密度聚类方法实施例的子轨迹段示意图;
图4是本发明的基于时空特征的船舶轨迹密度聚类方法实施例的子轨迹段之间的空间距离度量示意图;
图5是本发明的时空特征的船舶轨迹密度聚类方法实施例的子轨迹段在不同权重系数下的聚类质量示意图;
图6是本发明的基于时空特征的船舶轨迹密度聚类装置实施例的结构示意图。
具体实施方式
下面结合附图对本发明方案进行介绍。
基于时空特征的船舶轨迹密度聚类方法实施例:
本发明的基于时空特征的船舶轨迹密度聚类方法,如图1所示,包括如下步骤:
步骤一:获取船舶的运行轨迹数据,所述运行轨迹数据包括船舶位置信息、航速和时间信息;
其中,本实施例中是通过围绕船舶轨迹时空聚类模型建立的船舶AIS数据库,主要包括:MMSI码、船舶位置信息、航向信息、航速、船舶大小、时间信息等。
从船舶AIS数据库中获取船舶的运行轨迹数据;由于船舶AIS设备以“明码”和“暗码”两种压缩编码的形式传输数据,因此在获取运行轨迹数据时,需要运用AIS数据解析程序从原始数据中提取所需内容并导入数据库。
为了保证后续轨迹特征点选取的精度和速度,准确地获取时空距离,本实施例中还包括对获取的船舶运行轨迹数据进行预处理,以去除噪声或者偏差大的数据,获取有效的船舶运行轨迹数据:删除MMSI码错误的数据;删除船舶位置的经纬度出现负值或是经度大于180°、纬度大于90°的数据;删除航速为负值或大于60kn的数据;删除超过研究水域范围的数据等。
步骤二:对船舶的运行轨迹数据提取特征点,根据提取的特征点进行轨迹划分,得到船舶轨迹的子轨迹段;
1)特征点的提取:
本实施例中,提取的特征点包括OD(Origin-Destination)点、SP(Stay-Point)点和TF(Trajectory-Feature)点;其中,OD点为每条船舶轨迹的起点和终点。SP点为船舶轨迹的停泊点,其的选取方法为:当两个相邻轨迹点之间时间差大于特定的时间阈值,且两个轨迹点的速度值都小于设定的速度阈值的两个相邻的轨迹点。TF点为利用曲线边缘检测法对每条船舶轨迹的所有轨迹点进行识别,符合判定条件的轨迹点。
其中,如图2所示,TF点的判定条件为:
假设给定一条船舶运行轨迹,其中的P1(x1,y1),P2(x2,y2),P3(x3,y3),P4(x4,y4)(x1<x2<x3<x4)是轨迹上相继的4个点。
(1)连接轨迹点P1(x1,y1)和P2(x2,y2)构成一条关于轨迹的正向直线T12,对应的正向直线方程:
T12(x,y)=(y2-y1)(x-x1)+(y-y1)(x2-x1)
计算轨迹点P3(x3,y3)关于正向直线方程T12的值,若T12(x3,y3)<0,则称轨迹点P3(x3,y3)是关于正向直线的内点;若T12(x3,y3)>0,则称轨迹点P3(x3,y3)是关于正向直线外点。
(2)连接轨迹点P2(x2,y2)P和3(x3,y3)构成一条关于轨迹的正向直线T23,对应的正向直线方程:
T23(x,y)=(y3-y2)(x-x2)+(y-y2)(x3-x2)
计算轨迹点P4(x4,y4)关于正向直线方程T23的值,并根据上述方法判断轨迹点P4(x4,y4)为内点或外点。
(3)若T12(x3,y3)·T23(x4,y4)<0,说明轨迹在P3(x3,y3)处方向有所改变,则轨迹点P3(x3,y3)是特征点,即为TF点,否则P3(x3,y3)不是特征点。
(4)依次循环判断,直到最后一个轨迹点,即可识别出船舶运行轨迹的轨迹特征点。
为了降低特征点提取的复杂度,作为其他实施方式,本实施例中提取的特征点也可以为OD点、SP点和TF点中的其中两种。
2)子轨迹段的划分:根据上述提取出的三类轨迹特征点(OD点、SP点和TF点)组成该船舶运行轨迹的特征点集合,将特征点集合中的相邻特征点按时间先后顺序排列,依此连接生成该条轨迹的子轨迹,其中相邻两个特征点的线段称为子轨迹段,如图3所示。
步骤三,计算任意两子轨迹段之间的空间距离和时间距离,对得到的空间距离和时间距离进行加权求和得到融合后的时空距离;
本实施例中的两子轨迹段之间的空间距离是根据船舶位置信息计算得到的,包括平行距离、垂直距离和角度距离。
具体的,设两条子轨迹段Li和Lj,记为Li(si,ei)和Lj(sj,ej),其中si、ei和sj、ej分别为子轨迹段Li和子轨迹段Lj的起点和终点的位置信息,由子轨迹段Lj向Li垂直投影,如图4所示,,其中,Ps和Pe为Lj在Li上的垂直投影点。
则子轨迹段Li和Lj之间的垂直距离为:
子轨迹段Li和Lj之间的平行距离为:
d||(Li,Lj)=MIN(l||1,l||2)
子轨迹段Li和Lj之间的角度距离为:
综上,得到子轨迹段Li和子轨迹段Lj之间的空间距离为:
DS=d⊥(Li,Lj)+d||(Li,Lj)+dθ(Li,Lj)
本实施例中的时间距离是根据各子轨迹段的航速信息、各子轨迹段的时间信息和两子轨迹段的时间差计算得到的;
具体的是,设两条子轨迹段Li和Lj对应的时间信息分别为Ti(tis,tie)和Tj(tjs,tje),其中tis、tie和tjs、tje分别为子轨迹段Li和Lj所跨时间区间的起点和终点:
则两条子轨迹段之间的时间差为:
ΔTij=max(tie,tje)-min(tis,tjs)
其中,两条子轨迹段Li和Lj对应的速度信息分别为Vi(vis,vie)和Vj(vjs,vje),vis、vie分别为子轨迹段Li的起点速度和终点速度,vjs、vje分别为子轨迹段Lj的起点速度和终点速度。
那么,子轨迹段Li和Lj之间的时间距离DT:
本实施例中的两子轨迹段之间的时间距离由时间跨度、时间差和航速的速度均值共同决定。作为其他实施方式,为了更简单地进行时间距离的计算,上述中的速度均值也可以采用子轨迹段中的任一点的速度,这是由于在短时间内,子轨迹段内的船舶航速基本不会变化。
本实施例中的时空距离,是对上述计算得到的空间距离和时间距离进行加权求和得到的;具体的过程为:
首先,对空间距离和时间距离进行标准化处理;由于空间距离和时间距离的数量级不相同,本实施例中采用Z-Score分数对空间距离和时间距离进行标准化处理。
以空间距离Ds标准化的处理过程为例,设Dsi(i=1,2,…,n)构成n个空间距离度量值,其均值为:
计算Ds的均值绝对偏差:
使用均值绝对偏差对空间距离Ds标准化为:
其中,Dsn服从高斯分布。
本实施例中的时间距离也按照上述标准化,得到Dtn,具体的计算过程,此处不再详细介绍。
其次,计算时空距离DST,其表达式为:
DST=ωs×Dsn+ωt×Dtn
其中,Dsn为将空间距离通过Z-Score分数方法进行标准化处理得到的,Dtn为将时间距离DT通过Z-Score分数方法进行标准化处理得到的,ws为空间距离的权重系数,wt为时间距离的权重系数,满足ωs+ωt=1。
需要说明的是,本实施例中的权重系数ws和wt,用来调整对空间距离和时间距离的敏感度,其是根据经验提前设定的,通常取0.5和0.5、0.6和0.4、0.7和0.3等几组数值中的一组或多组。
步骤四:根据获取的时空距离,并通过DBSCAN算法对各子轨迹段进行聚类。
本实施例中通过DBSCAN算法对各子轨迹段进行聚类时,从任一子轨迹段出发,计算与其他所有子轨迹线段间的时空距离,根据获取的各子轨迹段间的时空距离,给定ε-邻域范围和最小线段参数(MinLns),统计满足ε-邻域范围的线段个数,并与最小线段参数(MinLns)进行比较,当ε-邻域范围内的线段数目大于给定的最小线参数(MinLns)时,该子轨迹段即为核心轨迹,形成一个聚类,其邻域内的直接密度可达线段也将聚到该类中,再对剩余的其他子轨迹段按照同样的方式依次进行聚类扩展,得到最终的聚类结果;而其中未被聚成一类的子轨迹段则是孤立轨迹,不作处理。
其中,ε-邻域范围Nε:Nε(Li)为子轨迹段Li在线段集D(Li∈D)内所有与其时空距离不超过ε的轨迹集合;
Nε(Li)={Li∈D|Ddist(Li,Lj)≤ε},
核心轨迹:子轨迹段Li的线段集为D(Li∈D),给定邻域范围ε和最小线段参数MinLns,若满足|Nε(Li)|≥MinLns,则认为Li为核心轨迹。
直接密度可达:子轨迹段Li的线段集为D(Li∈D),给定参数邻域范围ε和最小线段参数MinLns,若Li为核心轨迹且Lj在Li的ε邻域范围内,则称Lj从Li直接密度可达。
密度可达:子轨迹段Li的线段集为D(Li∈D),给定参数邻域范围ε和最小线段参数MinLns,若存在从Li到Lk直接密度可达,从Lk到Lj直接密度可达,则从Li到Lj密度可达。
密度相连:子轨迹段Li的线段集为D(Li∈D),给定参数邻域范围ε和最小线段参数MinLns,若存在Li和Lj均由Lk密度可达,则Li和Lj密度相连。
为了得到更好的聚类分析结果,本实施例中通过DBI(Davies Bouldin index)指数来衡量不同权重系数下的子轨迹段的聚类质量。
需要说明的是,由于DBI指数是聚类效果评价指标,在聚类得出结果之后得到的具体数值(介于0和1之间),通过计算DBI指数的大小评价聚类效果的优劣。因此,通过DBI(Davies Bouldin index)指数能够直观地分析出不同权重下聚类结果质量的高低,从而确定聚类质量最优的权重系数,进而准确地对船舶运行的子轨迹进行聚类。
具体的,戴维森堡丁指数(DBI,Davies Bouldin index),又称为分类适确性指标,是一种评估聚类算法优劣的指标。
首先假设实验数据有m个时间序列,这些时间序列聚类为n个簇。m个时间序列设为输入矩阵x,n个簇类设为N作为参数传入算法,使用下列公式进行计算:
DBI的含义是度量每个簇类最大相似度的均值;它能够较好的体现不同权重系数取值的聚类质量,DBI的值最小是0,值越小,代表聚类质量越好。
具体计算步骤:
(1)计算Si;定义分散度值Si为:第i个类中,类内数据到簇质心的平均距离,代表了簇类i中各样本的分散程度,计算公式为:
其中,Xj代表簇类i中第j个数据点,也就是一个样本点,Ai是簇类的质心,Ti是簇类中数据的个数。
(2)计算Mi,j;
定义距离值Mi,j,表示第i类与第j类的距离。分子之和计算完后,需计算分母Mi,j,定义为簇类i与簇类j的距离,计算公式为:
ak,i代表簇类i质心点的第k个值,Mi,j就是簇类i与簇类j质心的距离,即ak,i表示第i类的中心点的第k个属性的值,Mi,j则就是第i类与第j类中心的距离。
(3)计算Ri,j;
定义相似度值Ri,j,用于衡量第i类与第j类的相似度。计算公式:
(4)计算DBI;
通过以上公式的计算,做一个基于簇类数n的n2的嵌套循环,对每一个簇类i计算最大值的Ri,j,记为Di,Di=max(Ri,j),即簇类i和其他类的最大的相似度值。然后对所有类的最大相似度取平均值就得到了DBI指数,计算公式为:
本实施例中是基于步骤三中选取的不同的权重系数,进行调参,这个调参过程是与密度聚类的ε-邻域范围和最小线段参数(MinLns)两个参数的调参同步进行的。由于选取的不同的权重系数得到的聚类结果可能都达到聚类要求,这时就需要通过计算DBI指数,当该DBI指数值越小,则该DBI指数对应的权重系数下的子轨迹段的聚类结果越好。
如图5所示,本实施例中在权重系数为ws=0.7和wt=0.3时,聚类质量达到最优,并且数据对权重设置有一定的敏感度。
基于时空特征的船舶轨迹密度聚类装置实施例:
本实施例提出的一种基于时空特征的船舶轨迹密度聚类装置,如图6所示,包括处理器、存储器,存储器中存储有可在处理器上运行的计算机程序,处理器在执行计算机程序时实现上述聚类方法实施例的方法。
也就是说,以上聚类方法实施例的方法应理解可由计算机程序指令实现基于时空特征的船舶轨迹密度聚类方法的流程。可提供这些计算机程序指令到处理器,使得通过处理器执行这些指令产生用于实现上述方法流程所指定的功能。
本实施例所指的处理器是指微处理器MCU或可编程逻辑器件FPGA等的处理装置;
本实施例所指的存储器包括用于存储信息的物理装置,通常是将信息数字化后再以利用电、磁或者光学等方式的媒体加以存储。例如:利用电能方式存储信息的各式存储器,RAM、ROM等;利用磁能方式存储信息的的各式存储器,硬盘、软盘、磁带、磁芯存储器、磁泡存储器、U盘;利用光学方式存储信息的各式存储器,CD或DVD。当然,还有其他方式的存储器,例如量子存储器、石墨烯存储器等等。
通过上述存储器、处理器以及计算机程序构成的装置,在计算机中由处理器执行相应的程序指令来实现,处理器可以搭载各种操作***,如windows操作***、linux***、android、iOS***等。
作为其他实施方式,装置还可以包括显示器,显示器用于将诊断结果展示出来,以供工作人员参考。以上所述仅为本发明的优选实施例,已经用一般性说明、具体实施方式对本发明作了详尽的描述,但并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种修改或改进。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。
Claims (10)
1.一种基于时空特征的船舶轨迹密度聚类方法,其特征在于,包括以下步骤:
1)获取船舶的运行轨迹数据,所述运行轨迹数据包括船舶位置信息、航速和时间信息;
2)对船舶的运行轨迹数据提取特征点,根据提取的特征点进行轨迹划分,得到各船舶轨迹的子轨迹段;
3)计算任意两子轨迹段之间的空间距离和时间距离,对得到的空间距离和时间距离进行加权求和得到融合后的时空距离;
所述空间距离是根据船舶位置信息计算得到的;所述时间距离是根据各子轨迹段的航速、各子轨迹段的时间信息和相应的两子轨迹段的时间差计算得到的;
4)根据获取的时空距离,并通过DBSCAN算法对各子轨迹段进行聚类。
3.根据权利要求2所述的基于时空特征的船舶轨迹密度聚类方法,其特征在于,所述航速为对应子轨迹段的速度均值。
5.根据权利要求2所述的基于时空特征的船舶轨迹密度聚类方法,其特征在于,所述时间差为Tij=max(tie,tje)-min(tis,tjs),
其中,tis、tie为子轨迹段Li所跨时间区间的起点和终点,tjs、tje为子轨迹段Lj所跨时间区间的起点和终点。
6.根据权利要求1所述的基于时空特征的船舶轨迹密度聚类方法,其特征在于,还包括对获取的船舶的运行轨迹数据进行预处理,以滤除噪声或偏差大的数据,获取有效的船舶运行轨迹数据的步骤。
7.根据权利要求1所述的基于时空特征的船舶轨迹密度聚类方法,其特征在于,步骤2)中提取的特征点为OD点、SP点和TF点中的至少两种,所述OD点为每条船舶运行轨迹的起点和终点;所述SP点为停泊点,所述TF点为轨迹特征点。
8.根据权利要求5所述的基于时空特征的船舶轨迹密度聚类方法,其特征在于,步骤3)中,还包括对所述时间距离和空间距离进行标准化处理的步骤。
9.根据权利要求7所述的基于时空特征的船舶轨迹密度聚类方法,其特征在于,所述时空距离DST为:
DST=ωs×Dsn+ωt×Dtn
其中,Dsn是对空间距离进行标准化处理得到的,Dtn是对时间距离DT进行标准化处理得到的,ws为空间距离的权重系数,wt为时间距离的权重系数,满足ωs+ωt=1。
10.一种基于时空特征的船舶轨迹密度聚类装置,包括处理器和存储器,其特征在于,所述处理器执行所述存储器存储的如权利要求1-9所述的基于时空特征的船舶轨迹密度聚类方法的程序。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010388175.XA CN111582380B (zh) | 2020-05-09 | 2020-05-09 | 一种基于时空特征的船舶轨迹密度聚类方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010388175.XA CN111582380B (zh) | 2020-05-09 | 2020-05-09 | 一种基于时空特征的船舶轨迹密度聚类方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111582380A true CN111582380A (zh) | 2020-08-25 |
CN111582380B CN111582380B (zh) | 2024-05-24 |
Family
ID=72124752
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010388175.XA Active CN111582380B (zh) | 2020-05-09 | 2020-05-09 | 一种基于时空特征的船舶轨迹密度聚类方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111582380B (zh) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112164247A (zh) * | 2020-09-03 | 2021-01-01 | 重庆大学 | 一种基于船舶轨迹聚类的船舶航线预测方法 |
CN112556698A (zh) * | 2020-12-17 | 2021-03-26 | 广州博进信息技术有限公司 | 船舶行为变化及异常识别方法、设备及介质 |
CN112613677A (zh) * | 2020-12-29 | 2021-04-06 | 武汉理工大学 | 一种航路网络生成方法、装置及计算机存储介质 |
CN112633389A (zh) * | 2020-12-28 | 2021-04-09 | 西北工业大学 | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 |
CN113887590A (zh) * | 2021-09-22 | 2022-01-04 | 中国电子科技集团公司第二十九研究所 | 一种目标典型航迹及区域分析方法 |
CN114065520A (zh) * | 2021-11-17 | 2022-02-18 | 西安理工大学 | 一种鱼类洄游通道确定方法及*** |
CN115270920A (zh) * | 2022-06-21 | 2022-11-01 | 中国人民解放军91977部队 | 一种基于密度空间聚类的舰船目标经典轨迹生成方法 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120170802A1 (en) * | 2010-12-30 | 2012-07-05 | Pelco Inc. (Clovis, CA) | Scene activity analysis using statistical and semantic features learnt from object trajectory data |
US20150039217A1 (en) * | 2013-07-31 | 2015-02-05 | International Business Machines Corporation | Computing a similarity measure over moving object trajectories |
CN106383868A (zh) * | 2016-09-05 | 2017-02-08 | 电子科技大学 | 一种基于道路网络的时空轨迹聚类方法 |
CN108764111A (zh) * | 2018-05-23 | 2018-11-06 | 长安大学 | 一种车辆异常驾驶行为的检测方法 |
CN110033051A (zh) * | 2019-04-18 | 2019-07-19 | 杭州电子科技大学 | 一种基于多步聚类的拖网渔船行为判别方法 |
CN110175633A (zh) * | 2019-04-29 | 2019-08-27 | 杭州电子科技大学 | 一种基于北斗卫星传输数据的渔船轨迹异常检测方法 |
CN110309383A (zh) * | 2019-06-17 | 2019-10-08 | 武汉科技大学 | 基于改进的dbscan算法的船舶轨迹聚类分析方法 |
CN110991475A (zh) * | 2019-10-17 | 2020-04-10 | 中国科学院电子学研究所苏州研究院 | 一种基于多维距离度量的移动对象轨迹聚类方法 |
-
2020
- 2020-05-09 CN CN202010388175.XA patent/CN111582380B/zh active Active
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120170802A1 (en) * | 2010-12-30 | 2012-07-05 | Pelco Inc. (Clovis, CA) | Scene activity analysis using statistical and semantic features learnt from object trajectory data |
CN103392187A (zh) * | 2010-12-30 | 2013-11-13 | 派尔高公司 | 利用从物体轨迹数据获取的统计和语义特征的场景活动分析 |
US20150039217A1 (en) * | 2013-07-31 | 2015-02-05 | International Business Machines Corporation | Computing a similarity measure over moving object trajectories |
CN106383868A (zh) * | 2016-09-05 | 2017-02-08 | 电子科技大学 | 一种基于道路网络的时空轨迹聚类方法 |
CN108764111A (zh) * | 2018-05-23 | 2018-11-06 | 长安大学 | 一种车辆异常驾驶行为的检测方法 |
CN110033051A (zh) * | 2019-04-18 | 2019-07-19 | 杭州电子科技大学 | 一种基于多步聚类的拖网渔船行为判别方法 |
CN110175633A (zh) * | 2019-04-29 | 2019-08-27 | 杭州电子科技大学 | 一种基于北斗卫星传输数据的渔船轨迹异常检测方法 |
CN110309383A (zh) * | 2019-06-17 | 2019-10-08 | 武汉科技大学 | 基于改进的dbscan算法的船舶轨迹聚类分析方法 |
CN110991475A (zh) * | 2019-10-17 | 2020-04-10 | 中国科学院电子学研究所苏州研究院 | 一种基于多维距离度量的移动对象轨迹聚类方法 |
Non-Patent Citations (5)
Title |
---|
LIU FAGUI 等: "Adaptive density trajectory cluster based on time and space distance", PHYSICA A: STATISTICAL MECHANICS AND ITS APPLICATIONS, vol. 484, 30 April 2017 (2017-04-30) * |
吴笛 等: "基于密度的轨迹时空聚类分析", 地球信息科学学报, no. 10, 31 October 2015 (2015-10-31) * |
夏英 等: "基于RFID位置语义的室内移动轨迹聚类算法", 重庆邮电大学学报(自然科学版), no. 03, 15 June 2018 (2018-06-15) * |
张延玲 等: "移动对象子轨迹段分割与聚类算法", 计算机工程与应用, no. 10, 1 April 2009 (2009-04-01) * |
石陆魁 等: "基于时空模式的轨迹数据聚类算法", 计算机应用, no. 03, 10 March 2017 (2017-03-10) * |
Cited By (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112164247A (zh) * | 2020-09-03 | 2021-01-01 | 重庆大学 | 一种基于船舶轨迹聚类的船舶航线预测方法 |
CN112556698A (zh) * | 2020-12-17 | 2021-03-26 | 广州博进信息技术有限公司 | 船舶行为变化及异常识别方法、设备及介质 |
CN112556698B (zh) * | 2020-12-17 | 2023-12-15 | 广州博进信息技术有限公司 | 船舶行为变化及异常识别方法、设备及介质 |
CN112633389A (zh) * | 2020-12-28 | 2021-04-09 | 西北工业大学 | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 |
CN112633389B (zh) * | 2020-12-28 | 2024-01-23 | 西北工业大学 | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 |
CN112613677A (zh) * | 2020-12-29 | 2021-04-06 | 武汉理工大学 | 一种航路网络生成方法、装置及计算机存储介质 |
CN113887590A (zh) * | 2021-09-22 | 2022-01-04 | 中国电子科技集团公司第二十九研究所 | 一种目标典型航迹及区域分析方法 |
CN114065520A (zh) * | 2021-11-17 | 2022-02-18 | 西安理工大学 | 一种鱼类洄游通道确定方法及*** |
CN115270920A (zh) * | 2022-06-21 | 2022-11-01 | 中国人民解放军91977部队 | 一种基于密度空间聚类的舰船目标经典轨迹生成方法 |
Also Published As
Publication number | Publication date |
---|---|
CN111582380B (zh) | 2024-05-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111582380A (zh) | 一种基于时空特征的船舶轨迹密度聚类方法及装置 | |
CN110210352B (zh) | 基于航道模型的船舶轨迹异常检测方法 | |
Gao et al. | Ship-handling behavior pattern recognition using AIS sub-trajectory clustering analysis based on the T-SNE and spectral clustering algorithms | |
CN110378869B (zh) | 一种样本自动标注的钢轨扣件异常检测方法 | |
Fu et al. | Similarity based vehicle trajectory clustering and anomaly detection | |
CN110033051B (zh) | 一种基于多步聚类的拖网渔船行为判别方法 | |
CN108961758B (zh) | 一种基于梯度提升决策树的路口展宽车道探测方法 | |
Entezami et al. | A novel double-hybrid learning method for modal frequency-based damage assessment of bridge structures under different environmental variation patterns | |
CN101403676A (zh) | 基于d-s证据理论的绝缘子憎水性等级融合判决方法 | |
CN110196962A (zh) | 一种基于核密度估计的飞机速度异常识别方法 | |
CN105654139A (zh) | 一种采用时间动态表观模型的实时在线多目标跟踪方法 | |
CN110705582A (zh) | 一种基于改进K-Means聚类算法的船舶过桥行为特征提取方法 | |
CN113312438A (zh) | 融合航线提取与趋势判断的海上目标位置预测方法 | |
CN110674858A (zh) | 一种基于时空关联与大数据挖掘的交通拥堵检测方法 | |
CN115050214B (zh) | 一种基于ais数据的船舶碰撞风险预测方法 | |
CN111179592A (zh) | 基于时空数据流融合分析的城市交通预测方法和*** | |
Xu et al. | Research on ship trajectory extraction based on multi-attribute DBSCAN optimisation algorithm | |
CN114550498B (zh) | 一种海量ais数据驱动的船舶偏离航道智能预警*** | |
CN113284369B (zh) | 一种基于ads-b实测航路数据的预测方法 | |
Wang et al. | Classification of ship trajectories by using naive Bayesian algorithm | |
Xin et al. | Accurate and complete line segment extraction for large-scale point clouds | |
CN116681653A (zh) | 一种三维点云提取方法及提取*** | |
Li et al. | Automatic recognition of marine traffic flow regions based on Kernel Density Estimation | |
CN111553405B (zh) | 一种基于像素密度k均值聚类团雾识别算法 | |
CN113887590A (zh) | 一种目标典型航迹及区域分析方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |