CN110033051A - 一种基于多步聚类的拖网渔船行为判别方法 - Google Patents
一种基于多步聚类的拖网渔船行为判别方法 Download PDFInfo
- Publication number
- CN110033051A CN110033051A CN201910314059.0A CN201910314059A CN110033051A CN 110033051 A CN110033051 A CN 110033051A CN 201910314059 A CN201910314059 A CN 201910314059A CN 110033051 A CN110033051 A CN 110033051A
- Authority
- CN
- China
- Prior art keywords
- trawler
- point
- tracing point
- behavior
- distance
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 37
- 239000011159 matrix material Substances 0.000 claims abstract description 14
- 238000004364 calculation method Methods 0.000 claims abstract description 12
- 238000005520 cutting process Methods 0.000 claims description 9
- 230000001427 coherent effect Effects 0.000 claims 1
- 241001269238 Data Species 0.000 abstract description 2
- 238000000605 extraction Methods 0.000 abstract description 2
- 238000002474 experimental method Methods 0.000 abstract 1
- 230000006399 behavior Effects 0.000 description 41
- 238000009826 distribution Methods 0.000 description 13
- 238000011160 research Methods 0.000 description 11
- 230000000694 effects Effects 0.000 description 9
- 230000004069 differentiation Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241000251468 Actinopterygii Species 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000002123 temporal effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- 241000208340 Araliaceae Species 0.000 description 1
- 206010020751 Hypersensitivity Diseases 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000008033 biological extinction Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007797 corrosion Effects 0.000 description 1
- 238000005260 corrosion Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012467 final product Substances 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 230000009610 hypersensitivity Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/02—Agriculture; Fishing; Forestry; Mining
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Life Sciences & Earth Sciences (AREA)
- Agronomy & Crop Science (AREA)
- Probability & Statistics with Applications (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Animal Husbandry (AREA)
- Marine Sciences & Fisheries (AREA)
- Mining & Mineral Resources (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多步聚类的拖网渔船行为判别方法。本发明综合考虑速度、角度、经纬度、时间等时空数据建立多维距离模型,并采用时序近邻计算准则计算轨迹点间相似度距离矩阵,大幅降低了矩阵计算时间,使用OPTICS算法与ξ‑steep自动识别簇方法实现基于非全局参数的轨迹划分,得到轨迹段,再基于轨迹段之间相似度距离使用k‑means算法实现轨迹段再次聚类,从而实现轨迹点的分类,再通过对分类进行特征提取,建立拖网渔船行为判别模型,实现拖网渔船行为的快速判别。实验表明,本发明具有低参数敏感性、高精度、高通用性、耗时少等优点,可应用于大批量拖网渔船行为的快速判定。
Description
技术领域
本发明属于渔业领域与数据挖掘技术领域,具体涉及一种基于多步聚类的拖网渔船行为判别方法。
背景技术
渔船监控***(VMS)是基于卫星导航***、地理信息***、互联网、移动通信网络等的综合信息服务平台。在中国,随着北斗卫星定位***的应用推广,北斗卫星***可以每隔10min获取一条记载有渔船航速、航向、时间、位置、舰艏方向、报警等信息的轨迹数据,这为海上船舶导航、渔业生产、海上监控、海上救援等应用场景提供数据支持。受技术限制,VMS***无法直接获取渔船实时行为状态,因而利用渔船时序轨迹数据实现拖网渔船行为判别成为主要的研究方法。
渔船捕捞状态轨迹点判定在渔场识别、捕捞强度计算、渔业资源评估、渔业生态保护等场景中有着重要的应用价值,是核心技术之一。在渔场识别方面,通过识别所有渔船的捕捞轨迹点,统计一定时间内捕捞状态轨迹点的在海图中的热力分布,热力值高的区域即为渔场区域。在捕捞强度计算方面,通过统计某区域内捕捞轨迹点个数,结合拖网渔船的功率,计算累计捕捞量,从而得到捕捞强度。在渔业资源评估方面,通过计算捕捞强度,进而得到渔业资源消亡量的动态信息,为渔业资源的动态评估提供支撑。在渔业生态保护方面,通过对拖网渔船捕捞行为的判别,进一步评估捕捞努力量的时空分布,加强渔业资源的管理与养护,这对渔业生态可持续发展具有重要意义。
本发明的研究对象为拖网拖网渔船。拖网渔船行为状态可以通过捕捞日志获得,也可以通过拖网渔船轨迹数据分析获得。捕捞日志是由船员手动记录放网收网时刻等数据,可以获取精确的行为状态,但这种方式存在因手动登记的不规范,存在漏记、捕捞时刻记录不精确等问题,另外由于近海拖网渔船并没有被强制记录捕捞日志的要求,因而无法得到大量近海拖网渔船的捕捞日志,因而基于拖网渔船轨迹数据分析获得船只行为状态的方法成为主流研究方法。现有基于轨迹数据的研究主要包括三个方面:基于轨迹点的分类方法、基于轨迹段的分类方法和其他的识别方法。
基于轨迹点的行为判别方法是以单个轨迹点为研究对象,利用轨迹点分布特征,实现轨迹点的分类。一条轨迹点数据中包含船只ID、航速、方向、longitude、latitude、positionDate、mmsi等,研究人员利用其中一种或几种特征来挖掘其与拖网渔船行为状态的关系,其中利用速度特征加以研究的最多。
拖网渔船主要有三种行为状态:停泊、捕捞和航行。拖网渔船不同行为状态下速度与角度存在较明显不同。在速度方面,停泊状态的轨迹点船速最低,捕鱼时的船速次之,航行状态时的船速最高。在角度方面,相邻轨迹点处航向转角较小时,拖网渔船行为几乎不发生改变,而在行为改变时,相邻轨迹点间航向转角较大。与此同时,不同行为状态下,轨迹点的经纬度分布也具有不同的特性,停泊状态下的轨迹点的经纬度几乎不改变。通过利用以上不同行为状态下速度、角度经纬度的分布特征,研究人员实现了多种船舶工作的判别。
现有的基于轨迹点的方法,以速度为主,角度、轨迹点研究为辅。而在对速度的处理方法中,主要是获取捕捞状态下的速度的上下阈值,尽可能地使捕捞状态轨迹点的速度落入阈值区间内,先后出现了手动设置速度阈值区间,基于EM算法的GMM自动设置速度阈值的方法。
基于轨迹点的分类方法简单且具有较好的分类效果。但这些分析都是基于以下两种假设:(1)船只行为状态稳定且速度、角度等区分明显,但由于海洋水文状态不稳定,会导致船只轨迹状态的波动,易于造成误判;(2)拖网渔船在不同行为下的速度分布已知,但一定时间段内轨迹速度值并非服从独立同分布,轨迹数据具有明显的时空局部性特征,尤其当数据量较少时,其速度的分布并不总是服从同一分布特征,先验分布并不明显,基于速度分布的方法的效果就会变差。
相对于轨迹点的研究方法,基于轨迹段的研究方法是针对拖网渔船行为的连续性,将相邻轨迹点整体考虑的方法。现有基于轨迹段的研究方法可分为两类,一类为基于轨迹点分类的采用移动滑窗方式对分类结果进行的二次调整,另一类为引入时间变量,突出轨迹点之间的时序关系。
利用移动滑窗方法是在基于轨迹点分类结果,进行的分类再调整过程。基于轨迹点分类的方法会因偶然数据造成该点处拖网渔船行为的误判,考虑到误判点数量较少,因而可以通过移动滑窗的方式,对比各轨迹点前后一定时间段内的所有轨迹点的状态,若周围点属于同一类,则将该点状态进行调整。
引入时间变量的方法是利用轨迹数据的时间局部性,将轨迹整体考虑,从而将问题的重点由轨迹点的分类转为轨迹段分割与聚类上。研究方法主要有三步:(1)构建轨迹点距离模型(2)将轨迹划分为子轨迹段(3)对子轨迹段再进行聚类。
在拖网渔船行为的判别研究方向上,2018年Zhang等人提出MSC-FBI,该方法首先建立时空距离模型,然后采用基于DBSCAN的多步聚类算法识别捕鱼行为。其中多步聚类环节中采用DBSCAN算法将状态相似度高的轨迹点进行第一次聚类,然后再使用K-means算法将轨迹段二次聚类,从而完成轨迹段的分类。MSC-FBI算法的优点是简单、可解释性强,但是该方法仍存在以下问题:(1)分类的好坏直接取决于DBSCAN算法中全局变量邻域半径以及邻域内最小数目的选取,不仅调参困难,且可能造成批量误判;(2)算法存在耗时高、通用性不佳等缺点,不适合批量船只的快速分类。
除了上述两种方法以外,还有其他基于轨迹特征的分类方法,例如基于数学形态学和基于概率分布的分类方法。基于数学形态学的方法,主要针对拖网渔船在不同行为下轨迹呈现出的线与团等不同形态,使用数学形态学的处理方法加以区分,如1987年YuanZong等人对轨迹图加以膨胀、腐蚀处理,从而达到消除航行与停泊轨迹点只保留捕捞轨迹的目的。数学形态学方法操作简单,但无法区分出捕捞区域中其他行为的轨迹点。
基于概率的拖网渔船行为判别方法主要通过确定拖网渔船各个状态之间的转换概率,从而确轨迹点对应的拖网渔船的行为。2008年D.L.Borchers基于拖网渔船速度的变化,建立隐式马尔科夫模型,通过大量已标注的样本来训练模型,求出状态转换的概率矩阵,利用概率的方式来预测拖网渔船的状态。2010年Gerritsen Hans等人建立了一个基于隐式马尔科夫的贝叶斯层次模型(HBM),通过分析拖网渔船轨迹数据,进而区分拖网渔船在捕鱼过程中的不同状态。
这些基于概率转换的方法虽然具有很强的鲁棒性,不受速度等轨迹点属性分布的影响,但是依然存在以下两个方面的缺点:(1)训练这些模型需要大量的先验数据;(2)这些模型只是基于当前轨迹点状态,输入概率矩阵后判断下一个轨迹点处的状态,并没有考虑拖网渔船轨迹的时空局部性,会带来判别误差。
发明内容
本发明针对现有技术的不足,提出一种基于多步聚类的拖网渔船行为判别方法。
本发明首先综合考虑速度、角度、经纬度、时间等时空数据建立多维距离模型,并采用时序近邻计算准则(TSNCP)计算轨迹点间相似度距离矩阵,以降低了矩阵计算时间,再使用OPTICS算法与ξ-steep自动识别簇方法实现基于非全局参数的拖网渔船轨迹划分,得到轨迹子段,然后基于轨迹段之间相似度距离使用k-means算法实现轨迹段再次聚类,从而实现轨迹点的行为分类,最后对不同聚类簇的进行特征提取,并建立拖网渔船行为判别模型,实现拖网渔船行为的快速判别。
本发明具有低参数敏感性、高精度、高通用性、耗时少等优点,可实现大批量拖网渔船行为的快速判定。
附图说明
图1本发明方法流程图;
图2拖网渔船轨迹数据有序可达图;
图3拖网渔船轨迹子段平均速度分布图。
具体实施方式
如图1所示,本发明方法的具体步骤是:
步骤1.建立轨迹点间相似度距离模型,其为两轨迹点间速度距离、角度距离、时间距离以及空间距离的加权和,具体如下:
(1)速度距离:两轨迹点之间的速度距离为两点速度差值的平方,记为V(i,j);
(2)角度距离:两轨迹点之间的角度距离为两点航向的夹角大小,记为D(i,j);
(3)时间距离:两轨迹点之间的时间距离为两点毫秒时间的差值绝对值,记为T(i,j);
(4)空间距离:两轨迹点之间的空间距离为两点经纬度差值的平方和,记为S(i,j);
将两点间相似度距离模型取为上述四种距离的加权和,记为
D(i,j)=θV×V(i,j)+θD×D(i,j)+θT×T(i,j)+θS×S(i,j)
其中,θ={θV,θD,θT,θS}为权重矩阵,所有的权重和为1。轨迹点相似度距离模型通过加权求和的方式实现了速度、角度与时间、位置属性的融合,并可以通过调节权重的方式调整各参数对轨迹点相似度距离的影响比重。
步骤2.按照时序近邻计算准则(TSNCP)计算轨迹点间相似度矩阵。在增大时间距离权重后,仅计算时序相邻n个点之间的相似度距离,其他距离直接以无穷大表示。
本发明提出了一种矩阵计算准则——时序近邻计算准则(Time Series NeighborComputer principle,TSNCP)准则。该准则指出,在时序数据相似度矩阵计算中,若后续计算只与时序相近的点有关,则可以不用计算时序时间距离较大的点之间的相似度距离。在计算两点间相似度距离时,通过加大时序距离的权重,在后续OPTICS算法等中,可以做到,对后续计算有影响的相似度距离仅出现在在时序相邻点之间。因而对于任意一个轨迹点,仅需计算与该点时序相邻的n个轨迹点的相似度距离即可,其他数据可直接标定为无穷大INF。假设有m条轨迹点数据,按时序相邻计算准则,相似度距离矩阵计算的范围为如下式表示:
其计算次数为次,其中k<m,其时间复杂度为O(kn),相比于传统计算方式,遵循时序相邻计算准则的轨迹点间相似度距离矩阵,可极大降低计算时间。
步骤3.使用OPTICS算法获得轨迹点有序可达图。
在基于密度的聚类方法的核心思想是用一个点ε邻域内邻居数衡量该点所在空间的密度。常见的基于密度的聚类算法有DBSCAN算法和OPTICS算法,后者是前者的高级演化。DBSCAN聚类的思想,即由密度可达关系导出的最大密度相连的样本集合,即一个簇。算法无须指定聚类个数,可以对任何形状的实现聚类。但DBSCAN存在高参数敏感问题,原因在于,DBSCAN通过手动输入全局参数ε(邻域的最大半径)与MinPts(核心对象的邻域中要求的最少点数),它把选择能产生可接受的聚类结果的参数值的责任留给了用户。全局参数造成算法的参数高敏感性,设置的细微不同可能导致聚类的批量误判。现有针对拖网渔船轨迹进行切分的MSC-FBI算法即是基于DBSCAN算法。
OPTICS兼具了DBCSAN的优点,并克服了高参数敏感性缺点。OPTICS算法从任意一个数据对象开始,尽量向着密度大的地方扩张。它并不显示地产生数据集聚类,而是得到的是每个数据对象的可达距离及扩张顺序图,即有序可达图,该排序代表了各数据对象基于密度的聚类簇结构,可达距离数值越大,表明该点处越稀疏,可达距离越小,意味着点处越密集,每个凹陷代表一个聚类,聚类问题转换为有序可达图的凹陷截取问题。
从拖网渔船轨迹数据有序可达图可知,见图2,它有着以下特征,凹陷区域内部较低且较平整、凹陷边缘较为陡峭。这说明相同行为拖网渔船的轨迹点的内聚程度很高,主要原因在于拖网渔船行为状态的稳定性与时空局部性,拖网渔船在同种行为下速度、角度基本不变,时间与经纬度距离也相差较小,因此相似度距离相差不大。反之,拖网渔船行为的切变使得切变点与相邻轨迹点之间的距离陡然增大,使得该点在有序可达图中值很大。因此通过识别陡然增大的点,可以实现有序可达图的凹陷分割。
若设置参数ε截取有序可达图,其得到的聚类效果,与DBSCAN算法设置全局参数ε得到聚类的效果相同,换句话说,DBSCAN算法是OPTICS算法的一种特例。本发明采用OPTICS算法旨在获得有序可达图,在聚类的过程并不设置全局参数ε,而是采取ξ-steep自动识别簇的方式截取每个凹陷(聚类簇),以得到更好的聚类效果。因此采用非全局参数的OPTICS克服了现有基于轨迹段聚类方法的强参数依赖问题。
步骤4.使用ξ-steep自动识别簇算法将有序可达图切分得到轨迹子段,实现对轨迹点初步聚类;
OPTICS算法并没有显式地给出聚类结果,而是用有序可达图来反映簇结构,因此如何在其得到的有序可达图中识别出各个簇也是很重要的一方面。拖网渔船轨迹数据点的有序可达图,它有着以下特征,凹陷区域内部较低且较平整、凹陷边缘较为陡峭。这说明相同行为拖网渔船的轨迹点的内聚程度很高,主要原因在于拖网渔船行为状态的稳定性与时空局部性,拖网渔船在同种行为下速度、角度基本不变,时间与经纬度距离也相差较小,因此相似度距离相差不大。反之,拖网渔船行为的切变使得切变点与相邻轨迹点之间的距离陡然增大,使得该点在有序可达图中值很大。因此通过识别陡然增大的点,可以实现有序可达图的凹陷分割。
问题由有序可达图凹陷的识别转换为陡峭点的识别。因此本发明针对有序可达图中陡峭边缘的特点,设计了一种自动识别簇算法,下面引出的定义:
定义1:有序可达图中,若点p∈{1,...,n-1}可达距离r(p)与r(p+1)差值大于可达距离均值avr_r的ξ倍,则称点p为ξ-steep point,记为Pointξ(p),其中,若前者大则称p为ξ-up point,若前者小,则称p为ξ-down point。
由上式可知,有序可达图中,所有陡峭点程度大于一定值的点将被记录为ξ-steeppoint,这些是聚类簇的边界。
稀疏点是聚类簇边缘的可达距离较大的点,稀疏点与密集区内的轨迹点同样具有三种行为状态,需要通过二次聚类实现状态的划分,因此本发明将稀疏轨迹点按长度为1的轨迹段处理。下面在有序可达图中给出稀疏点的定义:
定义2有序可达图中,若点p∈{1,...,n}的可达距离r(p)大于可达距离均值avr_r的η倍,或点p∈{2,...,n}前一个值为ξ-up point,且r(p)不小于r(p-1),则称p点为sparsepoint。
在轨迹切割中,按ξ-steep point和sparse point将完整轨迹段切割成轨迹子段,即实现了拖网渔船轨迹子段的切割。
步骤5.计算轨迹子段的速度平均值,使用k-means算法实现轨迹段再次聚类,从而实现拖网轨迹点的分类;
通过对轨迹子段的切分,将轨迹子段整体考虑,从而减少了波动数据对状态判断的影响。研究发现,在不同行为状态的轨迹子段在平均速度方面存在明显差异。航行状态下的轨迹子段的平均速度较大,捕鱼轨迹子段中平均速度较慢,而停泊状态时的平均速度最低。因此,本发明采用基于子轨迹段平均速度的K-means算法完成子轨迹段的聚类,实现了拖网渔船轨迹点的分类。
从拖网渔船轨迹子段平均速度分布图中可以看出,见图3,在不同行为状态的轨迹子段在平均速度方面存在明显差异。航行状态下的轨迹子段的平均速度较大,捕鱼轨迹子段中平均速度较慢,而停泊状态时的平均速度最低。区别明显,可使用聚类算法加以区分。
步骤6.对于多步聚类结果,建立Fisher判别模型,实现拖网渔船轨迹点处行为的快速判别。
为了能实现对轨迹数据的实时判别,OMSC-FBI算法需要建立一个拖网渔船行为判别模型。
假设通过OMSC-FBI算法,将一条长度为n的拖网渔船的轨迹TR的轨迹点分为k组,分别记为G1,G2,…Gk,且每组轨迹的长度分别为n1,n2,…,nk,满足n=n1+n2+…+nk。每个轨迹点由一个p维的向量(如速度、方向、时间、经纬度等)x=(x1,x2,…xp)T表示。根据轨迹点的p维属性信息,构造拖网渔船行为判别函数如下:
其中,判别系数向量a=(a1,a2,…,ap)T待求,且能够使得同组内的离差最小。
为了表达的方便,假设代表第i类行为的第a个样品的观测向量。m代表所有轨迹点的均值向量,mi代表第i组Gi的样本均值。组间平方和为SSG,组内平方和为SSE,则在k>1的情况下,Fisher判别准则就是选取合适的判别系数向量a,使得
F取最大值。即求a,使得为保证取得唯一性,设aTEa=1。因而构造辅助函数得:
χ(a)=aTBa-λ(aTEa-1)
求导可得:
即得
这说明λ和a分别为矩阵E-1B的特征根与相应的特征向量。由此可知,拖网渔船行为判别模型总共由m个判别是组成,这m个公式利用轨迹点数据共同完成拖网渔船行为的判别。
依据上述设计,本发明的主要部分伪代码如下所示:
应该理解到的是:上述实施例只是对本发明的说明,而不是对本发明的限制,任何不超出本发明实质精神范围内的发明创造,均落入本发明的保护范围之内。
Claims (1)
1.一种基于多步聚类的拖网渔船行为判别方法,其特征在于该方法包括如下步骤:
步骤1.建立轨迹点间相似度距离模型;
所述的轨迹点间相似度距离模型,是对两轨迹点间速度距离、角度距离、时间距离以及空间距离的加权和,其中,速度距离为两点间速度差值的平方,角度距离为两点船只航行角度的夹角平方,时间距离为两点之间毫秒时间差值的平方,空间距离为两点经纬度距离的平方;
步骤2. 按照时序近邻计算准则计算轨迹点间相似度矩阵;
拖网渔船轨迹数据具有状态一致性,时序近邻计算准则不计算所有任意两点间的相似度距离,而仅计算时间相邻n个点之间的相似度距离,其他距离直接取值无穷大;
步骤3.使用OPTICS算法获得轨迹点有序可达图;
步骤4.使用ξ-steep自动识别簇算法将有序可达图切分得到轨迹子段,实现对轨迹点初步聚类;
拖网渔船状态具有状态一致性,相邻时间段内同一状态的拖网渔船轨迹点的聚集状态明显,其对应的有序可达图内部平缓边缘陡立的特征,利用ξ-steep自动识别簇算法对陡峭边缘点的识别与切割,从而完成对轨迹子段的切割,实现轨迹点的初步聚类;
步骤5. 计算轨迹子段的速度平均值,使用k-means算法实现轨迹段再次聚类,从而实现轨迹点的状态判别;
切分后的轨迹子段内部状态一致,取轨迹子段内部所有轨迹点的速度平均值,以消除轨迹段内的波动数据影响,使用k-means算法实现对轨迹子段的聚类;
步骤6.对于多步聚类结果,建立Fisher判别模型,实现拖网渔船轨迹点处行为的快速判别。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910314059.0A CN110033051B (zh) | 2019-04-18 | 2019-04-18 | 一种基于多步聚类的拖网渔船行为判别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910314059.0A CN110033051B (zh) | 2019-04-18 | 2019-04-18 | 一种基于多步聚类的拖网渔船行为判别方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110033051A true CN110033051A (zh) | 2019-07-19 |
CN110033051B CN110033051B (zh) | 2021-08-20 |
Family
ID=67239114
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910314059.0A Active CN110033051B (zh) | 2019-04-18 | 2019-04-18 | 一种基于多步聚类的拖网渔船行为判别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110033051B (zh) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111178433A (zh) * | 2019-12-30 | 2020-05-19 | 中国电子科技集团公司第三十六研究所 | 一种渔船作业方式识别方法、装置与*** |
CN111260218A (zh) * | 2020-01-16 | 2020-06-09 | 中国水产科学研究院东海水产研究所 | 拖网渔船燃油效率分析方法 |
CN111582380A (zh) * | 2020-05-09 | 2020-08-25 | 中国人民解放军92493部队试验训练总体研究所 | 一种基于时空特征的船舶轨迹密度聚类方法及装置 |
CN111694913A (zh) * | 2020-06-05 | 2020-09-22 | 海南大学 | 一种基于卷积自编码器的船舶ais轨迹聚类方法和装置 |
CN111739283A (zh) * | 2019-10-30 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 一种基于聚类的路况计算方法、装置、设备及介质 |
CN112309118A (zh) * | 2020-11-03 | 2021-02-02 | 广州市交通规划研究院 | 一种基于时空相似度的车辆轨迹推算方法 |
CN112418521A (zh) * | 2020-11-23 | 2021-02-26 | 青岛科技大学 | 一种短时海洋鱼群和鱼量的预测方法 |
CN112561948A (zh) * | 2020-12-22 | 2021-03-26 | 中国联合网络通信集团有限公司 | 基于时空轨迹的伴随轨迹识别方法、设备及存储介质 |
CN112633389A (zh) * | 2020-12-28 | 2021-04-09 | 西北工业大学 | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 |
CN112766308A (zh) * | 2020-12-29 | 2021-05-07 | 中国水产科学研究院东海水产研究所 | 一种远洋船舶分类方法 |
CN112907632A (zh) * | 2021-03-11 | 2021-06-04 | 三亚海兰寰宇海洋信息科技有限公司 | 一种单拖船只目标的识别方法及装置 |
CN113360544A (zh) * | 2021-06-04 | 2021-09-07 | 中国海洋大学 | 基于捕捞时序关系的短时捕捞努力量分布预测方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7406200B1 (en) * | 2008-01-08 | 2008-07-29 | International Business Machines Corporation | Method and system for finding structures in multi-dimensional spaces using image-guided clustering |
CN103593430A (zh) * | 2013-11-11 | 2014-02-19 | 胡宝清 | 一种基于移动对象时空信息轨迹分段聚类的方法 |
CN104657424A (zh) * | 2015-01-21 | 2015-05-27 | 段炼 | 一种多时空特征融合下的兴趣点轨迹聚类方法 |
CN104899263A (zh) * | 2015-05-22 | 2015-09-09 | 华中师范大学 | 一种基于特定区域的船舶轨迹挖掘分析与监控方法 |
US9645212B2 (en) * | 2014-10-21 | 2017-05-09 | The Regents Of The University Of California | Fiber tractography using entropy spectrum pathways |
CN107278262A (zh) * | 2016-11-14 | 2017-10-20 | 深圳市大疆创新科技有限公司 | 飞行轨迹的生成方法、控制装置及无人飞行器 |
CN107392245A (zh) * | 2017-07-19 | 2017-11-24 | 南京信息工程大学 | 一种出租车载客轨迹聚类算法Tr‑OPTICS |
US20180000441A1 (en) * | 2016-06-30 | 2018-01-04 | Shanghai United Imaging Healthcare Co., Ltd. | Methods and systems for extracting blood vessel |
CN107766808A (zh) * | 2017-09-30 | 2018-03-06 | 北京泓达九通科技发展有限公司 | 道路网络空间中车辆对象移动轨迹聚类的方法及*** |
CN109377757A (zh) * | 2018-11-16 | 2019-02-22 | 宁波工程学院 | 基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法 |
-
2019
- 2019-04-18 CN CN201910314059.0A patent/CN110033051B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7406200B1 (en) * | 2008-01-08 | 2008-07-29 | International Business Machines Corporation | Method and system for finding structures in multi-dimensional spaces using image-guided clustering |
CN103593430A (zh) * | 2013-11-11 | 2014-02-19 | 胡宝清 | 一种基于移动对象时空信息轨迹分段聚类的方法 |
US9645212B2 (en) * | 2014-10-21 | 2017-05-09 | The Regents Of The University Of California | Fiber tractography using entropy spectrum pathways |
CN104657424A (zh) * | 2015-01-21 | 2015-05-27 | 段炼 | 一种多时空特征融合下的兴趣点轨迹聚类方法 |
CN104899263A (zh) * | 2015-05-22 | 2015-09-09 | 华中师范大学 | 一种基于特定区域的船舶轨迹挖掘分析与监控方法 |
US20180000441A1 (en) * | 2016-06-30 | 2018-01-04 | Shanghai United Imaging Healthcare Co., Ltd. | Methods and systems for extracting blood vessel |
CN107278262A (zh) * | 2016-11-14 | 2017-10-20 | 深圳市大疆创新科技有限公司 | 飞行轨迹的生成方法、控制装置及无人飞行器 |
CN107392245A (zh) * | 2017-07-19 | 2017-11-24 | 南京信息工程大学 | 一种出租车载客轨迹聚类算法Tr‑OPTICS |
CN107766808A (zh) * | 2017-09-30 | 2018-03-06 | 北京泓达九通科技发展有限公司 | 道路网络空间中车辆对象移动轨迹聚类的方法及*** |
CN109377757A (zh) * | 2018-11-16 | 2019-02-22 | 宁波工程学院 | 基于含多源粗差的车牌识别数据的车辆出行轨迹提取方法 |
Non-Patent Citations (2)
Title |
---|
JILIN ZHANG等: "An Automatically Learning and Discovering Human Fishing Behaviors Scheme for CPSCN", 《IEEE ACCESS》 * |
党秋月 等: "基于OPTICS可达图的自动识别簇方法", 《计算机应用》 * |
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111739283B (zh) * | 2019-10-30 | 2022-05-20 | 腾讯科技(深圳)有限公司 | 一种基于聚类的路况计算方法、装置、设备及介质 |
CN111739283A (zh) * | 2019-10-30 | 2020-10-02 | 腾讯科技(深圳)有限公司 | 一种基于聚类的路况计算方法、装置、设备及介质 |
CN111178433A (zh) * | 2019-12-30 | 2020-05-19 | 中国电子科技集团公司第三十六研究所 | 一种渔船作业方式识别方法、装置与*** |
CN111260218B (zh) * | 2020-01-16 | 2023-10-17 | 中国水产科学研究院东海水产研究所 | 拖网渔船燃油效率分析方法 |
CN111260218A (zh) * | 2020-01-16 | 2020-06-09 | 中国水产科学研究院东海水产研究所 | 拖网渔船燃油效率分析方法 |
CN111582380B (zh) * | 2020-05-09 | 2024-05-24 | 中国人民解放军92493部队试验训练总体研究所 | 一种基于时空特征的船舶轨迹密度聚类方法及装置 |
CN111582380A (zh) * | 2020-05-09 | 2020-08-25 | 中国人民解放军92493部队试验训练总体研究所 | 一种基于时空特征的船舶轨迹密度聚类方法及装置 |
CN111694913A (zh) * | 2020-06-05 | 2020-09-22 | 海南大学 | 一种基于卷积自编码器的船舶ais轨迹聚类方法和装置 |
CN112309118A (zh) * | 2020-11-03 | 2021-02-02 | 广州市交通规划研究院 | 一种基于时空相似度的车辆轨迹推算方法 |
CN112418521A (zh) * | 2020-11-23 | 2021-02-26 | 青岛科技大学 | 一种短时海洋鱼群和鱼量的预测方法 |
CN112561948A (zh) * | 2020-12-22 | 2021-03-26 | 中国联合网络通信集团有限公司 | 基于时空轨迹的伴随轨迹识别方法、设备及存储介质 |
CN112561948B (zh) * | 2020-12-22 | 2023-11-21 | 中国联合网络通信集团有限公司 | 基于时空轨迹的伴随轨迹识别方法、设备及存储介质 |
CN112633389A (zh) * | 2020-12-28 | 2021-04-09 | 西北工业大学 | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 |
CN112633389B (zh) * | 2020-12-28 | 2024-01-23 | 西北工业大学 | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 |
CN112766308A (zh) * | 2020-12-29 | 2021-05-07 | 中国水产科学研究院东海水产研究所 | 一种远洋船舶分类方法 |
CN112907632A (zh) * | 2021-03-11 | 2021-06-04 | 三亚海兰寰宇海洋信息科技有限公司 | 一种单拖船只目标的识别方法及装置 |
CN113360544A (zh) * | 2021-06-04 | 2021-09-07 | 中国海洋大学 | 基于捕捞时序关系的短时捕捞努力量分布预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN110033051B (zh) | 2021-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110033051A (zh) | 一种基于多步聚类的拖网渔船行为判别方法 | |
Zhao et al. | Maritime anomaly detection using density-based clustering and recurrent neural network | |
Zhang et al. | A predictive analytics method for maritime traffic flow complexity estimation in inland waterways | |
CN113780395B (zh) | 海量高维ais轨迹数据聚类方法 | |
Yao et al. | Trajectory clustering via deep representation learning | |
CN110188093A (zh) | 一种基于大数据平台针对ais信息源的数据挖掘*** | |
CN113269121B (zh) | 一种基于融合cnn模型的渔船捕捞状态识别方法 | |
CN110018453A (zh) | 基于飞机航迹特征的智能机型识别方法 | |
Yang et al. | Maritime traffic flow clustering analysis by density based trajectory clustering with noise | |
Zhang et al. | An automatically learning and discovering human fishing behaviors scheme for CPSCN | |
CN107392311A (zh) | 序列切分的方法和装置 | |
CN101877134B (zh) | 一种机场监视视频目标鲁棒跟踪方法 | |
Thongniran et al. | Spatio-temporal deep learning for ocean current prediction based on HF radar data | |
Lu et al. | Shape-based vessel trajectory similarity computing and clustering: A brief review | |
Sun et al. | Image target detection algorithm compression and pruning based on neural network | |
CN114398996A (zh) | 目标处理方法以及控制*** | |
Xu et al. | Hyperparameter configuration learning for ship detection from synthetic aperture radar images | |
Qiao et al. | Rapid trajectory clustering based on neighbor spatial analysis | |
Li et al. | Street tree crown detection with mobile laser scanning data using a grid index and local features | |
CN112633389A (zh) | 一种基于mdl和速度方向的飓风运动轨迹趋势计算方法 | |
Yuan et al. | An optimized initialization center K-means clustering algorithm based on density | |
CN115310682A (zh) | 复杂水域船舶交通划分方法、装置、设备和介质 | |
Zhang et al. | Machine Learning‐Based Multitarget Tracking of Motion in Sports Video | |
CN114693088A (zh) | 一种水库温度场影响因素分析方法、装置及存储介质 | |
Xu et al. | Research on fishery trajectory analysis and fishing ground discrimination based on CNN |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |