CN111708853A - 特征化密度峰聚类的出租车热点区域提取方法 - Google Patents

特征化密度峰聚类的出租车热点区域提取方法 Download PDF

Info

Publication number
CN111708853A
CN111708853A CN202010449285.2A CN202010449285A CN111708853A CN 111708853 A CN111708853 A CN 111708853A CN 202010449285 A CN202010449285 A CN 202010449285A CN 111708853 A CN111708853 A CN 111708853A
Authority
CN
China
Prior art keywords
clustering
points
point
feature
feature point
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010449285.2A
Other languages
English (en)
Other versions
CN111708853B (zh
Inventor
汪小寒
罗永龙
张泽培
何增宇
胡王悟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui Normal University
Original Assignee
Anhui Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui Normal University filed Critical Anhui Normal University
Priority to CN202010449285.2A priority Critical patent/CN111708853B/zh
Publication of CN111708853A publication Critical patent/CN111708853A/zh
Application granted granted Critical
Publication of CN111708853B publication Critical patent/CN111708853B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/40Business processes related to the transportation industry

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Remote Sensing (AREA)
  • Probability & Statistics with Applications (AREA)
  • Evolutionary Biology (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Image Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种特征化密度峰聚类的出租车热点区域提取方法,方法具体包括如下步骤:S1、选取一定数量的特征点放入特征点集合中,计算特征点集合中每个特征点的支持度;S2、计算密度峰聚类过程中的聚类指标,即特征点的局部密度和聚类中心距离,基于将特征化过程中得到的支持度结合聚类指标构建三维决策图;S3、基于三维决策图来选取聚类中心、基本聚类点以及噪声点;S4、基于聚类中心对基本聚类点进行聚类,形成聚类簇,一个聚类簇对应出租车的一个热点区域。基于特征化原理采用三维决策图来准确定位聚类中心、基本聚类点以及噪声点,由于采用特征点以及支持度模拟原始数据,进而提高了聚类效率,同时解决二维决策图无法处理重合点的问题。

Description

特征化密度峰聚类的出租车热点区域提取方法
技术领域
本发明属于数据聚类技术领域,提供了一种特征化密度峰聚类的出租车热点区域提取方法。
背景技术
聚类作为无监督机器学习方法已广泛应用于模式识别,图像分割,文档聚类等许多领域,其中DBSCAN和密度峰聚类等在识别目标数据集的高密度区域中起着重要作用,因此可以用于位置数据中的城市热点区域挖掘。但是出租车GPS位置数据的数据量大且存在稀疏点,如何避免噪声影响以及高效挖掘城市热点区域已成为急需解决的问题。针对现有密度峰聚类方法在处理大规模数据时,需要计算每两个位置点的距离矩阵,计算量巨大造成聚类低效,并且传统方法决策图无法识别重合点导致聚类结果不准确的问题。
发明内容
本发明提供了一种特征化密度峰聚类的出租车热点区域提取方法,旨在解决上述问题。
本发明是这样实现的,一种特征化密度峰聚类的出租车热点区域提取方法,所述方法具体包括如下步骤:
S1、GPS数据特征化:选取一定数量的特征点放入特征点集合中,计算特征点集合中每个特征点的支持度;
S2、计算密度峰聚类过程中的聚类指标,即特征点的局部密度和聚类中心距离,基于将特征化过程中得到的支持度结合聚类指标构建三维决策图;
S3、基于三维决策图来选取聚类中心、基本聚类点以及噪声点;
S4、基于聚类中心对基本聚类点进行聚类,形成聚类簇,一个聚类簇对应出租车的一个热点区域。
进一步的,特征点的选取方法具体如下:
根据特征化规模参数α及采样点个数Ts确定特征点个数;
从采样点中随机确定第1个临时特征点,将距第1个临时特征点距离最远的采样点作为第2个临时特征点,将距第2个临时特征点距离最远的采样点作为第3个临时特征点,以此类推,直至临时特征点数量满足特征点个数;
将原始数据集中所有采样点添加到距离他们最近的临时特征点集合中,并计算每个临时特征点集合中的采样点中心,将采样点中心更新为新的临时特征点,并重新将原始数据采样点添加到新的临时点特征集合中,再次计算每个新临时点集合中的采样点中心,迭代上述步骤,直到两次计算的采样点中心不变,则将临时特征点作为特征点输出。
进一步的,特征点对应临时特征点集合中的采样点个数,即为该特征点的支持度。
进一步的,特征点的局部密度获取过程具体如下:
计算该特征点到其他特征点的欧式距离,若该欧式距离小于截断距离,则该特征点的特征点局部密度自加1,遍历所有其他特征点,即生成该特征点的特征点局部密度。
进一步的,特征点的聚类中心距离获取方法具体如下:
循环遍历特征点集合,找到特征点集合中局部密度最大的特征点,该点的聚类中心距离是:该点到离他距离最远的特征点的欧式距离,对于其他特征点,聚类中心距离取离该点最近的特征点的欧式距离。
进一步的,三维决策图中X轴是特征点局部密度,Y轴表示特征点聚类中心距离,Z轴是特征点支持度,则聚类中心、基本聚类点及噪音点的选择方法具体如下:
支持度、局部密度、聚类中心距离均较大的特征点即为聚类中心;
聚类中心距离较短、局部密度较高的特征点即为基本聚类点;
聚类中心距离较高、局部密度较低的特征点即为噪音点。
本发明提供的特征化密度峰聚类的出租车热点区域提取方法具有如下有益技术效果:
1)在原始数据集特征化阶段定义了位置特征点以及支持度概念,特征点选取可以简化输入数据且较准确地在聚类过程中代表原始数据,使得聚类过程更加高效;2)通过参数来灵活的调整特征点个数使得本发明提出的聚类方法可应用于不同数据量的数据集内;3)在特征点聚类阶段提出特征点局部密度以及特征点聚类中心距离进行后续聚类分析,基于特征化原理采用三维决策图来准确定位聚类中心、基本聚类点以及噪声点,由于采用特征点以及支持度模拟原始数据,进而提高了聚类效率,同时解决二维决策图无法处理重合点的问题。
附图说明
图1为本发明实施例提供的特征化密度峰聚类的出租车热点区域提取方法流程图;
图2为本发明实施例提供的特征点与支持度计算过程示意图;
图3为本发明实施例提供的局部密度与聚类中心距离计算过程示意图;
图4为本发明实施例提供的聚类过程示意图;
图5为本发明实施例提供的聚类结果在三维决策图的分布图。
具体实施方式
下面对照附图,通过对实施例的描述,对本发明的具体实施方式作进一步详细的说明,以帮助本领域的技术人员对本发明的发明构思、技术方案有更完整、准确和深入的理解。
首先给出发明中部分术语的定义,
特征点和支持度计数:特征点是用于代表原始位置采样点的位置点集合,该集合根据特征化算法产生,特征点集合表示为:
FeaturePoints={p1,p2,p3,...,pn} (4-1)
其中每个特征点表示为
pi={ln g,lat,sup portIndex} (4-2)
sup portIndex即pi的支持度计数,该值表示单个特征点在原始数据集中占有的权重,ln g及lat分别表示特征点的经度和纬度;
特征点局部密度:表示在密度峰聚类过程中,每个特征点周围的相邻特征点个数,根据密度峰聚类的思想,密度峰值点的密度较高,代表周围存在较多的特征点。轨迹特征点的局部密度定义为:
Figure BDA0002506938950000041
其中distcutoff表示截断距离,函数χ(x)表示特征点集合内如果其他特征点到该点的距离小于截断距离,则该点的局部密度加1。
特征点聚类中心距离:聚类中心距离的定义分为两类,一类是特征点集合中密度最大的点,定义为该点到其他特征点最远的距离。另一类则是密度并非为最大的特征点,定义为该点到其他特征点最近的距离。特征点的聚类中心距离定义如下:
Figure BDA0002506938950000051
聚类中心:假设一个聚类簇内位置采样点数据集合为cluster={p1,p2,p3,...pn},则该聚类簇的聚类中心即为其中一个点pi,使得
Figure BDA0002506938950000052
值最小。
基本聚类点:基本聚类点是有较高的局部密度同时具有较低的聚类中心距离,代表着位置相近、较密集、构成聚类簇的基本采样点。
噪声点:噪声点有较低的局部密度而同时具有较高的聚类中心距离,表明该点离聚类中心较远。现实意义是远离聚类中心的孤立点。
图1为本发明实施例提供的特征化密度峰聚类的出租车热点区域提取方法流程图,该方法具体包括如下步骤:
S1、GPS数据特征化:选取一定数量的特征点放入特征点集合中,计算特征点集合中每个特征点的支持度;
特征点确定过程具体如下:
首先采用特征化规模参数α(为设置值,例如5)来确定特征点个数;先随机选择一个临时特征点,并按照距离最远原则选取相应个数的临时特征点。然后将原始位置点分配到距离它们最近的临时特征点构成集合,再以集合平均位置点代替临时特征点,并且重新分配原始位置点。迭代上述过程,直到临时特征点位置不再变化,至此将临时特征点作为特征点输出。支持度计算则将遍历特征点集合,将每个特征点的原始位置点集合计数作为该特征点的支持度。
经过特征化后,原始数据集由特征点集合和对应的支持度计数来表示。如图2所示,灰色点表示特征点集合,由箭头指向的黑色点表示该特征点的支持度计数。特征化的核心思想是先对原始采样点进行预处理,从数据集中选出可以代表本数据集的特征点以及对应的支持度,通过使用数据量较小的特征点和支持度来代替原始轨迹数据集进行密度峰聚类,从而在不影响聚类精度的境况下提高算法的时间效率,实现快速精确的城市热点信息挖掘。
算法1是特征点选取和支持度计算过程,首先根据输入的特征化规模参数α结合采样点个数Ts确定特征点个数(line 1)Ts/α,随后,先随机确定第1个临时特征点,然后将距第1个临时特征点距离最远的采样点作为第2个临时特征点,使其,将距第2个临时特征点距离最远的采样点作为第3个临时特征点,以此类推,当临时特征点数量满足特征点个数时停止(line 2-5);
再将原始数据集中所有采样点添加到距离他们最近的临时特征点集合中(line6-8);随后计算每个临时特征点集合中的采样点中心,将采样点中心更新为新的临时特征点(line 11-13),并且重新将原始数据采样点添加到新的临时点特征集合中,再次计算每个新临时点集合中的采样点中心,迭代上述步骤,直到两次计算的采样点中心不变,则特征化完成(line 9-10),每个临时特征点集合中的采样点中心坐标为特征点,临时特征点集合中对应的采样点个数即该特征点的支持度计数(line 14-15)。下面给出算法伪代码。
Figure BDA0002506938950000061
Figure BDA0002506938950000071
S2、计算密度峰聚类过程中的聚类指标,即特征点的局部密度和聚类中心距离,基于将特征化过程中得到的支持度结合聚类指标构建三维决策图;
图3是特征点的局部密度与聚类中心距离的计算过程,灰色点表示特征点集合,由箭头指向的黑色点表示该特征点的支持度计数。在密度峰聚类中,采用特征点的局部密度来计算密集程度,每个点的局部密度即代表该点周围的其他采样点数目的密集程度。特征点的局部密度与聚类中心距离计算过程是:首先,遍历所有特征点,每一个特征点根据其截断距离内的特征点总数,计算出局部密度,图3中虚线圆表示的截断距离圆中,圆心所表示的特征点,因为截断距离圆内有3个特征点,因此其局部密度计数为3。
根据特征点之间的欧式距离判断聚类中心距离,聚类中心距离判断需要分两种情况,第一种:若该点为局部密度最大的特征点,则该点聚类中心距离为该特征点与其他特征点的最远距离,即图3中虚线表示的欧式距离值。另一种情况:该特征点不是局部密度最大点,则聚类中心距离为该特征点到其他特征点的最近距离。
基于特征化后生成的特征点和支持度计数来计算特征点的局部密度和聚类中心距离,算法2和算法3是其伪代码描述,
算法2是计算特征点的局部密度计算,算法输入数据是特征点集合、截断距离distcutoff,算法步骤如下:循环遍历特征点集合(line 1-2),计算每个特征点到其他特征点的欧式距离,如果该距离小于截断距离则局部密度自加1(line 3-4),遍历结束返回每个特征点的局部密度(line 6)。
Figure BDA0002506938950000081
算法3是特征点的聚类中心距离计算,算法输入数据为特征点集合、局部密度集合,执行步骤如下:循环遍历特征点集合,找到特征点集合中局部密度最大的特征点,该点的聚类中心距离是:该点到离他距离最远的特征点的欧式距离(line 1-3),对于其他特征点,聚类中心距离取离该点最近的特征点的欧式距离(line 4-5),为了方便在决策图中观察相关聚类结果所以在最后将聚类中心距离归一化统一到[0,1]区间中(line 6-8)。根据上面集合中局部密度最大的特征点的特殊聚类中心距离计算方式,这里经过归一化后的1一般即为集合中局部密度最大的特征点。
Figure BDA0002506938950000082
Figure BDA0002506938950000091
S3、基于三维决策图来选取聚类中心、基本聚类点以及噪声点;
根据构建的三维决策图,需要识别三类点,分别为聚类中心点、基本聚类点和噪声点。根据聚类原理,整个采样点数据空间被划分为多个不相交的聚类簇,聚类簇的簇内存在多个相近邻的数据点,而簇间距离较大。聚类中心点是使得每个聚类簇中内采样点到该点的距离之和最低的位置点。基本聚类点是聚类簇中围绕着聚类中心的采样点,这些点是构成聚类簇的基石,占大部分。噪声点往往指一些离大部分位置采样点都较远而自身周围也没有足够的数据采样点来构成聚类簇的一类点,这类点不参与到聚类簇的构成中。聚类簇中的聚类中心、基本聚类点和噪声点如图4所示。
图4中点p1,p2,p3,p4,p5,p6,p7,p8是位置特征点集合。在经过判断和聚类后,形成了一个虚线表示的五个点特征构成的圆形聚类簇,该簇中灰色点p8为聚类中心,因为p8到其他各点p4,p5,p6,p7的距离之和最小。p4,p5,p6,p7是基本聚类点,与聚类中心p8形成聚类簇。p1,p2,p3点均为孤立点,因为它们分布稀疏且远离其他点。
上述的三类点是根据三维决策图判断的,挖掘原则如下:
如图5所示,三维决策图中X轴是特征点局部密度,此值越大就越容易成为聚类中心。Y轴表示聚类中心距离,由于在计算特征点聚类中心距离最后会进行归一化处理,因此所有三维决策图取值均在[0,1]区间内,此值表示聚类中每个簇之间的距离,一般来说,值越大则表示簇间距离越大。Z轴是特征点支持度,该值在特征化过程中求得,表示特征点在原始数据集中的周围点的状况,值越大则表示该特征点越适合成为聚类中心。
在三维决策图中聚类中心就是密度峰值,在三维决策图中越靠近与坐标原点中心对称点的坐标越容易成为聚类中心,如图5白色点所示,表现为三个聚类指标即特征点的支持度、局部密度、聚类中心距离均较大的峰值点。基本聚类点一般较为密集,表现在三维决策图中即聚类中心距离较短而局部密度较高,因此靠近XZ轴平面的点适合作为基本聚类点,如图5黑色点所示。与基本聚类点相反的是噪声点,一般分布较为稀疏,它们的三维决策图特征为聚类中心距离较高而局部密度较短,因此靠近YZ轴平面的点适合作为噪声点,如图5灰色点所示。至此,利用三维决策图进行聚类的过程结束。
在本发明的一实施例中,聚类中心的选取原则是:
首先选取靠近XZ轴平面的点,计算该点支持度、局部密度、聚类中心距离三者的乘积,将乘积进行降序排列,计算相邻乘积的差值,将较大差值作为聚类中心点和非聚类中心点的分隔点,将分隔点之上,即乘积值大的点作为聚类中心;
将靠近XZ轴平面的点适合作为基本聚类点,靠近YZ轴平面的点适合作为噪声点,对于既靠近XZ轴平面又靠近YZ轴平面的点而言,检测这样点的周边是否为孤立的点,即其周边不存在其他基本聚类点,若是,则标识为噪音点,否则标识为基本聚类点。
S4、基于聚类中心对基本聚类点进行聚类,形成聚类簇,一个聚类簇对应出租车的一个热点区域。
本发明提供的特征化密度峰聚类的出租车热点区域提取方法具有如下有益技术效果:
1)在原始数据集特征化阶段定义了位置特征点以及支持度概念,特征点选取可以简化输入数据且较准确地在聚类过程中代表原始数据,使得聚类过程更加高效;
2)通过参数来灵活的调整特征点个数使得本发明提出的聚类方法可应用于不同数据量的数据集内;
3)在特征点聚类阶段提出特征点局部密度以及特征点聚类中心距离进行后续聚类分析,基于特征化原理采用三维决策图来准确定位聚类中心、基本聚类点以及噪声点,由于采用特征点以及支持度模拟原始数据,进而提高了聚类效率,同时解决二维决策图无法处理重合点的问题。
上面结合附图对本发明进行了示例性描述,显然本发明具体实现并不受上述方式的限制,只要采用了本发明的方法构思和技术方案进行的各种非实质性的改进,或未经改进将本发明的构思和技术方案直接应用于其它场合的,均在本发明的保护范围之内。

Claims (6)

1.一种特征化密度峰聚类的出租车热点区域提取方法,其特征在于,所述方法具体包括如下步骤:
S1、GPS数据特征化:选取一定数量的特征点放入特征点集合中,计算特征点集合中每个特征点的支持度;
S2、计算密度峰聚类过程中的聚类指标,即特征点的局部密度和聚类中心距离,基于将特征化过程中得到的支持度结合聚类指标构建三维决策图;
S3、基于三维决策图来选取聚类中心、基本聚类点以及噪声点;
S4、基于聚类中心对基本聚类点进行聚类,形成聚类簇,一个聚类簇对应出租车的一个热点区域。
2.如权利要求1所述特征化密度峰聚类的出租车热点区域提取方法,其特征在于,特征点的选取方法具体如下:
根据特征化规模参数α及采样点个数Ts确定特征点个数;
从采样点中随机确定第1个临时特征点,将距第1个临时特征点距离最远的采样点作为第2个临时特征点,将距第2个临时特征点距离最远的采样点作为第3个临时特征点,以此类推,直至临时特征点数量满足特征点个数;
将原始数据集中所有采样点添加到距离他们最近的临时特征点集合中,并计算每个临时特征点集合中的采样点中心,将采样点中心更新为新的临时特征点,并重新将原始数据采样点添加到新的临时点特征集合中,再次计算每个新临时点集合中的采样点中心,迭代上述步骤,直到两次计算的采样点中心不变,则将临时特征点作为特征点输出。
3.如权利要求1所述特征化密度峰聚类的出租车热点区域提取方法,其特征在于,特征点对应临时特征点集合中的采样点个数,即为该特征点的支持度。
4.如权利要求1所述特征化密度峰聚类的出租车热点区域提取方法,其特征在于,特征点的局部密度获取过程具体如下:
计算该特征点到其他特征点的欧式距离,若该欧式距离小于截断距离,则该特征点的特征点局部密度自加1,遍历所有其他特征点,即生成该特征点的特征点局部密度。
5.如权利要求1所述特征化密度峰聚类的出租车热点区域提取方法,其特征在于,特征点的聚类中心距离获取方法具体如下:
循环遍历特征点集合,找到特征点集合中局部密度最大的特征点,该点的聚类中心距离是:该点到离他距离最远的特征点的欧式距离,对于其他特征点,聚类中心距离取离该点最近的特征点的欧式距离。
6.如权利要求1所述特征化密度峰聚类的出租车热点区域提取方法,其特征在于,三维决策图中X轴是特征点局部密度,Y轴表示特征点聚类中心距离,Z轴是特征点支持度,则聚类中心、基本聚类点及噪音点的选择方法具体如下:
支持度、局部密度、聚类中心距离均较大的特征点即为聚类中心;
聚类中心距离较短、局部密度较高的特征点即为基本聚类点;
聚类中心距离较高、局部密度较低的特征点即为噪音点。
CN202010449285.2A 2020-05-25 2020-05-25 特征化密度峰聚类的出租车热点区域提取方法 Active CN111708853B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010449285.2A CN111708853B (zh) 2020-05-25 2020-05-25 特征化密度峰聚类的出租车热点区域提取方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010449285.2A CN111708853B (zh) 2020-05-25 2020-05-25 特征化密度峰聚类的出租车热点区域提取方法

Publications (2)

Publication Number Publication Date
CN111708853A true CN111708853A (zh) 2020-09-25
CN111708853B CN111708853B (zh) 2022-08-30

Family

ID=72537833

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010449285.2A Active CN111708853B (zh) 2020-05-25 2020-05-25 特征化密度峰聚类的出租车热点区域提取方法

Country Status (1)

Country Link
CN (1) CN111708853B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116739320A (zh) * 2023-08-15 2023-09-12 北京阿帕科蓝科技有限公司 车站布局方法、装置、计算机设备和存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326923A (zh) * 2016-08-23 2017-01-11 福州大学 一种顾及位置重复和密度峰值点的签到位置数据聚类方法
CN108280472A (zh) * 2018-01-18 2018-07-13 安徽师范大学 一种基于局部密度和聚类中心优化的密度峰聚类方法
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
US20190012430A1 (en) * 2017-07-10 2019-01-10 Chang Gung Memorial Hospital, Linkou Method of Creating Characteristic Peak Profiles of Mass Spectra and Identification Model for Analyzing and Identifying Microorganizm
CN110232414A (zh) * 2019-06-11 2019-09-13 西北工业大学 基于k近邻与共享近邻的密度峰值聚类算法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106326923A (zh) * 2016-08-23 2017-01-11 福州大学 一种顾及位置重复和密度峰值点的签到位置数据聚类方法
US20190012430A1 (en) * 2017-07-10 2019-01-10 Chang Gung Memorial Hospital, Linkou Method of Creating Characteristic Peak Profiles of Mass Spectra and Identification Model for Analyzing and Identifying Microorganizm
CN108280472A (zh) * 2018-01-18 2018-07-13 安徽师范大学 一种基于局部密度和聚类中心优化的密度峰聚类方法
CN108427965A (zh) * 2018-03-05 2018-08-21 重庆邮电大学 一种基于路网聚类的热点区域挖掘方法
CN110232414A (zh) * 2019-06-11 2019-09-13 西北工业大学 基于k近邻与共享近邻的密度峰值聚类算法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
WENG YU,等: "Detecting threshold parameters using entropy analysis in density peaks clustering", 《ICIAI "18: PROCEEDINGS OF THE 2ND INTERNATIONAL CONFERENCE ON INNOVATION IN ARTIFICIAL INTELLIGENCE》, 31 March 2018 (2018-03-31), pages 38 - 43 *
鲍舒婷,等: "基于共享近邻相似度的密度峰聚类算法", 《计算机应用》, 10 June 2018 (2018-06-10), pages 1601 - 1607 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116739320A (zh) * 2023-08-15 2023-09-12 北京阿帕科蓝科技有限公司 车站布局方法、装置、计算机设备和存储介质
CN116739320B (zh) * 2023-08-15 2023-12-26 北京阿帕科蓝科技有限公司 车站布局方法、装置、计算机设备和存储介质

Also Published As

Publication number Publication date
CN111708853B (zh) 2022-08-30

Similar Documents

Publication Publication Date Title
CN110443281B (zh) 基于hdbscan聚类的文本分类自适应过采样方法
US6507669B1 (en) Method of selecting clusters of items using a fuzzy histogram analysis
CN113344019A (zh) 一种决策值选取初始聚类中心改进的K-means算法
CN112561849B (zh) 晶圆缺陷检测方法
CN111062425B (zh) 基于c-k-smote算法的不平衡数据集处理方法
CN116258707A (zh) 一种基于改进的YOLOv5算法的PCB表面缺陷检测方法
CN113344113B (zh) 一种基于改进k-means聚类的Yolov3锚框确定方法
CN113484837B (zh) 一种面向电磁大数据的未知雷达辐射源智能识别方法
CN111507297B (zh) 一种基于度量信息矩阵的雷达信号识别方法及***
CN111708853B (zh) 特征化密度峰聚类的出租车热点区域提取方法
CN112712102A (zh) 可同时识别已知和未知雷达辐射源个体的识别仪
CN114663373A (zh) 一种用于零件表面质量检测的点云配准方法及装置
CN114358166B (zh) 一种基于自适应k均值聚类的多目标定位方法
CN116610987A (zh) 基于分布式样本筛选的kmeans日志分类方法和装置
CN115797926A (zh) 质谱成像图的空间区域分型方法、装置及电子设备
CN115690434A (zh) 一种基于专家场去噪结果优选的噪声图像识别方法及***
CN115687352A (zh) 一种存储的方法及装置
CN113378986A (zh) 密度峰值聚类算法的聚类策略优化
CN111539576B (zh) 一种风险识别模型的优化方法及装置
CN113361616A (zh) 一种优化聚类中心的k-means算法
CN110956177A (zh) 一种混合型验证码的识别方法及***
CN114492225B (zh) 一种基于聚类筛选的流线可视化方法
CN113095359B (zh) 一种射线图像标记信息检测方法及***
CN114565878B (zh) 一种支持类别可配置的视频标志物检测方法
CN110968690A (zh) 词语的聚类划分方法和装置、设备以及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant