CN109657027A - 一种聚类选址的方法、装置、存储介质及电子设备 - Google Patents
一种聚类选址的方法、装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN109657027A CN109657027A CN201811557341.3A CN201811557341A CN109657027A CN 109657027 A CN109657027 A CN 109657027A CN 201811557341 A CN201811557341 A CN 201811557341A CN 109657027 A CN109657027 A CN 109657027A
- Authority
- CN
- China
- Prior art keywords
- trouble ticket
- ticket data
- history trouble
- addressing
- place
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
- G06Q30/0205—Location or geographical consideration
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- Entrepreneurship & Innovation (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Marketing (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种聚类选址的方法、装置、存储介质及电子设备,其中,该方法包括:获取预设范围内的历史工单数据,历史工单数据包括位置信息;根据历史工单数据的位置信息进行聚类分析,将历史工单数据分为N类,N为预定的选址地点的数量;确定每一类历史工单数据对应的中心位置信息,并将中心位置信息所指示的地点确定为每一类历史工单数据的选址地点。通过本发明实施例提供的聚类选址的方法、装置、存储介质及电子设备,不需要人工进行选址,可以快速确定选址地点,效率较高;将中心位置信息对应的位置作为选址地点,使得该选址地点适合更多的用户,选址效果更好。
Description
技术领域
本发明涉及点位选址的技术领域,具体而言,涉及一种聚类选址的方法、装置、存储介质及电子设备。
背景技术
随着业务的发展,定点服务的业务越来越多,比如二手车行业中定点收车业务、定点评估业务等,此时需要选择特定的位置提供定点服务。当前的选址方案主要以熟悉当地情况的相关人员在地图上手工选址为主。
现有选址的方式主要存在以下问题:
1、需要相关人员一个个地进行手工点位选址,效率低下;
2、高度依赖于选址人员的经验,容易导致点位地区大面积覆盖重复或覆盖不到的问题,选址效果较差。
发明内容
为解决上述问题,本发明实施例的目的在于提供一种聚类选址的方法、装置、存储介质及电子设备。
第一方面,本发明实施例提供了一种聚类选址的方法,包括:
获取预设范围内的历史工单数据,所述历史工单数据包括位置信息;
根据所述历史工单数据的位置信息进行聚类分析,将所述历史工单数据分为N类,N为预定的选址地点的数量;
确定每一类历史工单数据对应的中心位置信息,并将所述中心位置信息所指示的地点确定为所述每一类历史工单数据的选址地点。
第二方面,本发明实施例还提供了一种聚类选址的装置,包括:
获取模块,用于获取预设范围内的历史工单数据,所述历史工单数据包括位置信息;
聚类模块,用于根据所述历史工单数据的位置信息进行聚类分析,将所述历史工单数据分为N类,N为预定的选址地点的数量;
处理模块,用于确定每一类历史工单数据对应的中心位置信息,并将所述中心位置信息所指示的地点确定为所述每一类历史工单数据的选址地点。
第三方面,本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于上述任意一项所述的聚类选址的方法
第四方面,本发明实施例还提供了一种电子设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述任意一项所述的聚类选址的方法
本发明实施例上述第一方面提供的方案中,提前设置分类数量,之后通过对历史工单数据的位置信息进行聚类分析,即可确定每一类的中心位置信息,进而确定选址地点的位置。该过程不需要人工进行选址,可以快速确定选址地点,效率较高;将中心位置信息对应的位置作为选址地点,使得该选址地点适合更多的用户,选址效果更好。
为使本发明的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本发明实施例所提供的一种聚类选址的方法的流程图;
图2示出了本发明实施例所提供的聚类选址的方法中,确定选址地点的数量的具体方法的流程图;
图3示出了本发明实施例所提供的聚类选址的方法中,可视化显示的一种示意图;
图4示出了本发明实施例所提供的一种聚类选址的装置的结构示意图;
图5示出了本发明实施例所提供的另一种聚类选址的装置的结构示意图;
图6示出了本发明实施例所提供的用于执行聚类选址的方法的电子设备的结构示意图。
具体实施方式
在本发明的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本发明的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、“固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本发明实施例提供的一种聚类选址的方法,参见图1所示,包括:
步骤101:获取预设范围内的历史工单数据,历史工单数据包括位置信息。
本发明实施例中,基于包含位置信息的历史工单数据进行选址。具体的,在预设范围内选取历史工单数据,本发明实施例中的“预设范围”指的是预设时间范围和/或预设空间范围,例如,所获取的历史工单数据可以是去年一年的历史工单数据,或者是北京市的历史工单数据等。历史工单数据为之前生成的工单数据,历史工单数据的位置信息具体可以为以经纬度表示的位置,或者以长度坐标值所表示的位置等。例如,当完成一笔交易或业务时,生成相应的工单数据,此时通过调用终端的地理位置或人工输入位置信息等方式即可为该工单数据匹配相应的位置信息。
步骤102:根据历史工单数据的位置信息进行聚类分析,将历史工单数据分为N类,N为预定的选址地点的数量。
本发明实施例中,首先确定选址地点的数量N,即首先确定需要选择多少个地点,之后即可将所有的历史工单数据划分为相应数量的类组。本发明实施例中以位置信息进行聚类分析,将距离较近的历史工单数据分为一类,共分为N类。
其中,根据历史工单数据的位置信息进行聚类分析具体可以包括:
步骤A1:预设N个初始的中心坐标点,分别确定历史工单数据与每个初始的中心坐标点之间的距离,将最小距离对应的中心坐标点作为与该历史工单数据匹配的中心坐标点。
步骤A2:将与中心坐标点匹配的所有历史工单数据作为该中心坐标点对应的数据集,并将中心坐标点更新为该数据集的中心位置的坐标,继续确定历史工单数据与每个中心坐标点之间的距离,并确定与中心坐标点相匹配的历史工单数据。
步骤A3:重复上述步骤A2的过程,直至更新前后的两个中心坐标点之间的距离小于预设阈值;此时,将与该中心坐标点相匹配的所有历史工单数据作为一类,中心坐标点的位置信息即为相应类的中心位置信息。
步骤103:确定每一类历史工单数据对应的中心位置信息,并将中心位置信息所指示的地点确定为每一类历史工单数据的选址地点。
本发明实施例中,在通过聚类分析确定每一类的历史工单数据之后,即可确定每一类的中心位置信息。其中,该中心位置信息具体可以分别根据每一类的历史工单数据的位置信息确定,例如,将当前类的所有历史工单数据的位置信息的平均值作为当前类的中心位置信息,或者将当前类的所有历史工单数据的位置信息的质心作为当前类的中心位置信息。对于每一类的历史工单数据,该中心位置信息可以表示最中心的位置,该类中历史工单数据到该中心位置的距离总体较小,将与中心位置信息对应的点位作为该类的选址地点,之后即可方便该选址地点附近的用户去该选址地点享受定点服务业务。
本发明实施例提供的一种聚类选址的方法,提前设置分类数量,之后通过对历史工单数据的位置信息进行聚类分析,即可确定每一类的中心位置信息,进而确定选址地点的位置。该过程不需要人工进行选址,可以快速确定选址地点,效率较高;将中心位置信息对应的位置作为选址地点,使得该选址地点适合更多的用户,选址效果更好。
在上述实施例的基础上,本发明实施例中基于业务需求设置选址地点的数量。具体的,参见图2所示,上述步骤102中的选址地点的数量N具体通过以下方式获得:
步骤1021:预设定点工单占所有工单的占比r,并预设每个选址地点在预设周期内可承载的工单数量n。
本发明实施例中,将工单分为定点工单和非定点工单,其中,定点工单指的是提供定点服务的工单;相应的,其余工单即为非定点工单。例如,某工单为用户自行到指定地点进行二手车评估,则该工单为定点工单;若某工单为评估师到用户住处进行二手车评估,则该工单为上门工单,即属于非定点工单。本发明实施例中的占比r是人为预先设置的,可以根据经验值来设置。同时,在确定占比r时,可以与获取相同预设范围内的工单,之后确定所有工单中定点工单的数量,也可以获取其他范围内的工单,本实施例对此不做限定。
在实际情况下,每个选址地点的业务处理量是有限的,根据业务需求或内部要求,即可以预先设置选址地点在预设周期内可承载的工单数量,该预设周期可以为1天、1周、1个月等。例如,可以预设每个选址地点每天可承载的工单数量。
步骤1022:根据历史工单数据的数量确定选址地点的数量N:
或
其中,M表示历史工单数据的总数量,t表示历史工单数据在时间跨度上的预设周期的周期数,函数f()表示取整函数或计数保留函数,Nmin表示预设的选址地点的最小数量。
本发明实施例中,由于目前的工单数据暂时并未区分定点工单和非定点工单,故历史工单数据包括定点工单和非定点工单,此时的M×r即可大体表示历史工单数据中的定点工单;若工单数据可以区分定点工单和非定点工单,则在步骤101中获取的历史工单数据也可以为定点工单,此时步骤101中获取的历史工单数据的数量即为上式中的M×r。同时,步骤101中获取的预设范围内的历史工单数据一定具有时间跨度,比如所获取的历史工单数据为1月份的所有历史工单数据,则该时间跨度即为1月1日至1月31日;相应的,对于在确定可承载工单数量n时的预设周期,该时间跨度可以包含t个预设周期。例如,n表示选址地点在一天内可承载的工单数量,所获取的历史工单数据为1月份的所有工单数据,由于1月份有31天,则t=31。函数f()表示取整函数,例如上取整函数、或下取整函数等,也可以为计数保留函数,本实施例中的计数保留函数指的是可以保留部分数值的函数,例如四舍五入函数、六舍七入函数等。
可选的,还可以设置选址地点的最小数量Nmin,以保证选址地点不至于过少。
本发明实施例中,可以基于预设的定点工单占比和可承载数量来确定选址地点的数量,既可满足业务需求,也能够方便后续的处理;同时,在业务需求发生变化导致定点工单占比和可承载数量相应改变时,也可以方便地确定新的选址地点的数量。
在上述实施例的基础上,在步骤102“将历史工单数据分为N类”之后,该方法还包括确定每一类历史工单数据的地点覆盖半径的过程,该过程具体包括:根据每一类历史工单数据的位置信息确定每一类历史工单数据对应的地点覆盖半径;根据每一类历史工单数的选址地点和地点覆盖半径确定每一类历史工单数据的覆盖范围。
本发明实施例中,在聚类分析后,可以确定每一类的地点覆盖半径,结合每一类的选址地点即可确定相应的覆盖范围,方便后续对选址效果的评估,也方便后续可视化显示该覆盖范围。
可选的,根据每一类历史工单数据的位置信息确定每一类历史工单数据对应的地点覆盖半径包括:
步骤B1:根据位置信息中横坐标的大小对每一类历史工单数据进行排序,确定每一类历史工单数据中与第一上分位数对应的第一横坐标x1以及与第一下分位数对应的第二横坐标x2。
步骤B2:根据位置信息中纵坐标的大小对每一类历史工单数据进行排序,确定每一类历史工单数据中与第二上分位数对应的第一纵坐标y1以及与第二下分位数对应的第二纵坐标y2;其中,历史工单数据的位置信息包括横坐标和纵坐标。
本发明实施例中,历史工单数据的位置信息包括横坐标和纵坐标,之后根据横坐标和纵坐标的大小即可分别对历史工单数据进行排序,排序的目的是方便后续通过分位数剔除边缘数据或异常数据,进而确定在横向方向和纵向方向上的覆盖范围。本实施例中,第一上分位数、第一下分位数、第二上分位数、第二下分位数均为预设的分位数;例如,上分位数可以为90%、98%等,下分位数可以为2%、5%等,具体可根据实际情况而定。且第一上分位数与第二上分位数可以相同,也可以不同;同样的,第一下分位数和第二下分位数可以相同,也可以不同。在基于横坐标进行排序后,利用第一上分位数和第二下分位数即可确定历史工单数据在横向方向上的极大值x1和极小值x2;同理,在基于纵坐标进行排序后,利用第二上分位数和第二下分位数即可确定历史工单数据在纵向方向上的极大值y1和极小值y2。
例如,当前类包括100个历史工单数据,且100个历史工单数据的横坐标依次为a1~a100,在基于横坐标排序后,排序后的100个历史工单数据的横坐标依次为b1~b100。若第一上分位数为98%,第一下分位数为2%,则将横坐标b98作为第一横坐标x1,将横坐标b2作为第二横坐标x2。第一横坐标x1与第二横坐标x2之间的差值即可表示该类历史工单数据在横向方向上的跨度;同理,第一纵坐标y1与第二纵坐标y2之间的差值即可表示该类历史工单数据在纵向方向上的跨度,之后利用两个差值即可确定该类历史工单数据所覆盖的范围半径。
步骤B3:当位置信息中的横坐标和纵坐标为长度单位时,该地点覆盖半径R为:
函数g1()为调整函数,ω1和ω2为两个预设的权重值;或者
当历史工单数据的横坐标和纵坐标为经纬度单位时,当前类的地点覆盖半径R为:
函数g2()为调整函数,ω3和ω4也为两个预设的权重值,θ为每一类的历史工单数据中所有纬度的平均值。
本发明实施例中,第一横坐标x1与第二横坐标x2之间的差值即可表示该类历史工单数据在横向方向上的跨度,若以圆形区域表示当前类的历史工单数据的覆盖范围,则该差值x1-x2可以表示横向方向上的直径长度,相应的,y1-y2即可表示纵向方向上的直径长度,利用两个差值即可确定覆盖范围的地点覆盖半径R:
其中,函数g1()为调整函数,ω1和ω2为两个预设的权重值。
本发明实施例中,ω1和ω2分别表示横向方向半径的权重和纵向方向半径的权重,通过两个权重值调节横坐标和纵坐标的权重,一般情况下,ω1+ω2=1。函数g1()为调整函数,用于对由横向方向半径和纵向方向半径初步确定的半径值进行微调,比如增加或减少预设长度、设置地点覆盖半径R的最小值、设置地点覆盖半径R的最大值等。同时,在步骤B1和B2中,一般以从小到大的顺序进行排序,若是以从大到小的顺序排序,则调整函数g1()还对初步确定的参数进行绝对值处理。
可选的,横向方向半径和纵向方向半径具有相同的权重值,即ω1=ω2=0.5,此时地点覆盖半径R可以为:
当历史工单数据的横坐标和纵坐标为长度单位时,可以采用上述的计算过程,而在本发明实施例中,由于历史工单数据的横坐标和纵坐标可能以经纬度的形式表示,此时需要对经纬度换算到长度单位,再计算地点覆盖半径。
具体的,由于在经度方向(即纵向方向)上,1纬度的距离大约为111km;而在纬度方向(即横向方向)上,1经度的距离大约为111×cosθkm,该角度θ为纬度。故,此时的地点覆盖半径R为:
函数g2()为调整函数,ω3和ω4为两个预设的权重值,θ为每一类的历史工单数据中所有纬度的平均值。
本发明实施例中,调整函数g2()与调整函数g1()相似,此处不做赘述;同时,将历史工单数据中的纬度(即纵坐标)的平均值作为角度θ,方便后续计算。
可选的,也可以不考虑角度θ,以进一步减小数据量,此时地点覆盖半径R为:
其中,横坐标和纵坐标的单位均为度数。
本发明实施例中,利用上述步骤B1-B3,即可分别确定N类历史工单数据的地点覆盖半径。本实施例中对历史工单数据排序后,通过设置分位数剔除边缘数据,进而结合历史工单数据在横向方向和纵向方向上的跨度来确定地点覆盖半径,计算简单、迅速,也可以有效地确定选址地点的覆盖范围。
可选的,在确定地点覆盖半径后,即可以可视化显示每一类的覆盖范围,该覆盖范围为以选址地点为圆心、以地点覆盖半径为半径所确定的圆形区域。一种可视化显示的示意图参见图3所示,图3中每个点代表历史工单数据的位置,每个圆圈代表一类历史工单数据的覆盖范围。
需要说明的是,图3仅仅示出了可视化的一种表现形式,并不用于限定本发明。
在上述实施例的基础上,在确定每一类的选址地点和地点覆盖半径后,该方法还包括对选址地点进行评估的过程,该过程具体包括:
步骤C1:分别确定每一类的历史工单数据的数量mi,并确定每一类的历史工单数据中、位于覆盖范围内的历史工单数据的数量ci,覆盖范围为以选址地点为圆心、以地点覆盖半径为半径所确定的圆形区域。
步骤C2:确定每一类的工单覆盖率并根据工单覆盖率确定选址地点是否合适。
本发明实施例中,在步骤102进行聚类分析之后,即可确定每一类历史工单数据的数量mi,其中,i∈[1,N],且M为获取的预设范围内的历史工单数据的总数量。对于每一类的历史工单数据,在确定覆盖范围后,即可确定其中哪些历史工单数据位于该覆盖范围内,此类历史工单数据的数量总和为ci,进而即可确定由本实施例所确定的覆盖范围所能覆盖的比率,即工单覆盖率工单覆盖率越大,说明所确定的覆盖范围与当前类的工单数据越匹配,即选址效果越好。
基于同样的方式,还可以确定所有历史工单数据的总覆盖率,结合总覆盖率对整体的选址效果进行评估。
可选的,上述步骤C2“根据工单覆盖率确定选址地点是否合适”具体可以包括:确定每一类的重要工单覆盖率和工单重复率rri,根据工单覆盖率cri、重要工单覆盖率和工单重复率rri确定选址地点是否合适。
其中, 表示每一类的历史工单数据中重要历史工单数据的数量,表示每一类的历史工单数据中位于覆盖范围内的重要历史工单数据的数量,ei表示位于覆盖范围内的历史工单数据中同时被其他类历史工单数据对应的覆盖范围所覆盖的历史工单数据的数量。
本发明实施例中,重要历史工单数据指的是重要程度较高的历史工单数据、或者与某些重要客户相关的历史工单数据、或者金额超过预设值的历史工单数据等,也可以是人为设置的历史工单数据。不同工单的重要程度也不同,一般选址过程中更要考虑对重要工单的适用性。例如,工单可以分为普通工单和保卖工单,一般保卖工单比较重要,在确定覆盖范围后即可通过评估保卖工单的覆盖率来确定该选址是否合适。具体的,在确定每一类的历史工单数据mi后,即可确定其中重要历史工单数据的数量而在个重要历史工单数据中,若有个重要历史工单数据落入该覆盖范围内,则可确定重要工单覆盖率同样的,重要工单覆盖率越大,说明选址效果越好。
此外,在该类mi个历史工单数据中,有ci个历史工单数据位于该类的覆盖范围内,同时还存在ei个即落入本类的覆盖范围、有落入其他类的覆盖范围,此时根据ei和ci即可该类的工单重复率rri。工单重复率越小,说明选址效果越好。根据工单覆盖率cri、重要工单覆盖率和工单重复率rri,可以综合确定选址地点是否合适,对选址效果的评估更加准确、可靠。
本发明实施例提供的一种聚类选址的方法,提前设置分类数量,之后通过对历史工单数据的位置信息进行聚类分析,即可确定每一类的中心位置信息,进而确定选址地点的位置。该过程不需要人工进行选址,可以快速确定选址地点,效率较高;将中心位置信息对应的位置作为选址地点,使得该选址地点适合更多的用户,选址效果更好。可以基于预设的定点工单占比和可承载数量来确定选址地点的数量,既可满足业务需求,也能够方便后续的处理;同时,在业务需求发生变化导致定点工单占比和可承载数量相应改变时,也可以方便地确定新的选址地点的数量。对历史工单数据排序后,通过设置分位数剔除边缘数据,进而结合历史工单数据在横向方向和纵向方向上的跨度来确定地点覆盖半径,计算简单、迅速,也可以有效地确定选址地点的覆盖范围。利用工单覆盖率可以比较准确地评价选址地点的效果,可以为选址效果评价提供参考依据。
以上详细介绍了聚类选址的方法流程,该方法也可以通过相应的装置实现,下面详细介绍该装置的结构和功能。
本发明实施例提供的一种聚类选址的装置,参见图4所示,包括:
获取模块41,用于获取预设范围内的历史工单数据,所述历史工单数据包括位置信息;
聚类模块42,用于根据所述历史工单数据的位置信息进行聚类分析,将所述历史工单数据分为N类,N为预定的选址地点的数量;
处理模块43,用于确定每一类历史工单数据对应的中心位置信息,并将所述中心位置信息所指示的地点确定为所述每一类历史工单数据的选址地点。
在上述实施例的基础上,所述所述N通过以下公式获取到:
预设定点工单占所有工单的占比r,并预设每个选址地点在预设周期内可承载的工单数量n;则:
或
其中,M表示历史工单数据的总数量,t表示历史工单数据在时间跨度上的所述预设周期的周期数,函数f()表示取整函数或计数保留函数,Nmin表示预设的选址地点的最小数量。
在上述实施例的基础上,参见图5所示,该装置还包括半径确定模块44;
在所述聚类模块42将所述历史工单数据分为N类之后,所述半径确定模块44用于:
根据每一类历史工单数据的位置信息确定每一类历史工单数据对应的地点覆盖半径;根据每一类历史工单数的选址地点和地点覆盖半径确定每一类历史工单数据的覆盖范围。
在上述实施例的基础上,所述半径确定模块44用于:
根据位置信息中横坐标的大小对每一类历史工单数据进行排序,确定每一类历史工单数据中与第一上分位数对应的第一横坐标x1以及与第一下分位数对应的第二横坐标x2;
根据位置信息中纵坐标的大小对每一类历史工单数据进行排序,确定每一类历史工单数据中与第二上分位数对应的第一纵坐标y1以及与第二下分位数对应的第二纵坐标y2;其中,所述历史工单数据的位置信息包括横坐标和纵坐标;
当位置信息中横坐标和纵坐标为长度单位时,所述地点覆盖半径R为:
函数g1()为调整函数,ω1和ω2为两个预设的权重值;
当位置信息中横坐标和纵坐标为经纬度单位时,所述地点覆盖半径R为:
函数g2()为调整函数,ω3和ω4为两个预设的权重值,θ为每一类历史工单数据中所有纬度的平均值。
在上述实施例的基础上,参见图5所示,该装置还包括评估模块45;
所述评估模块45用于:
分别确定每一类历史工单数据的数量mi,并确定每一类历史工单数据中、位于覆盖范围内的历史工单数据的数量ci;确定每一类的工单覆盖率并根据所述工单覆盖率确定所述选址地点是否合适。
在上述实施例的基础上,所述评估模块45根据所述工单覆盖率确定所述选址地点是否合适包括:
确定每一类的重要工单覆盖率和工单重复率rri,根据所述工单覆盖率cri、所述重要工单覆盖率和所述工单重复率rri综合确定所述选址地点是否合适;
其中, 表示每一类的历史工单数据中重要历史工单数据的数量,表示每一类的历史工单数据中位于覆盖范围内的重要历史工单数据的数量,ei表示位于覆盖范围内的历史工单数据中同时被其他类历史工单数据对应的覆盖范围所覆盖的历史工单数据的数量。
在上述实施例的基础上,参见图5所示,该装置还包括显示模块46;
在所述处理模块43将所述中心位置信息所指示的地点确定为所述每一类历史工单数据的选址地点之后,所述显示模块46用于:
可视化显示每一类的选址地点;或者
可视化显示每一类的覆盖范围,所述覆盖范围为以选址地点为圆心、以地点覆盖半径为半径所确定的圆形区域,所述地点覆盖半径为根据每一类的历史工单数据的位置信息所确定的半径。
本发明实施例提供的一种聚类选址的装置,提前设置分类数量,之后通过对历史工单数据的位置信息进行聚类分析,即可确定每一类的中心位置信息,进而确定选址地点的位置。该过程不需要人工进行选址,可以快速确定选址地点,效率较高;将中心位置信息对应的位置作为选址地点,使得该选址地点适合更多的用户,选址效果更好。可以基于预设的定点工单占比和可承载数量来确定选址地点的数量,既可满足业务需求,也能够方便后续的处理;同时,在业务需求发生变化导致定点工单占比和可承载数量相应改变时,也可以方便地确定新的选址地点的数量。对历史工单数据排序后,通过设置分位数剔除边缘数据,进而结合历史工单数据在横向方向和纵向方向上的跨度来确定覆盖半径,计算简单、迅速,也可以有效地确定选址地点的覆盖范围。利用工单覆盖率可以比较准确地评价选址地点的效果,可以为选址效果评价提供参考依据。
本发明实施例还提供了一种计算机存储介质,所述计算机存储介质存储有计算机可执行指令,其包含用于执行上述的聚类选址的方法的程序,该计算机可执行指令可执行上述任意方法实施例中的方法。
其中,所述计算机存储介质可以是计算机能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器(例如软盘、硬盘、磁带、磁光盘(MO)等)、光学存储器(例如CD、DVD、BD、HVD等)、以及半导体存储器(例如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD))等。
图6示出了本发明的另一个实施例的一种电子设备的结构框图。所述电子设备1100可以是具备计算能力的主机服务器、个人计算机PC、或者可携带的便携式计算机或终端等。本发明具体实施例并不对电子设备的具体实现做限定。
该电子设备1100包括至少一个处理器(processor)1110、通信接口(Communications Interface)1120、存储器(memory array)1130和总线1140。其中,处理器1110、通信接口1120、以及存储器1130通过总线1140完成相互间的通信。
通信接口1120用于与网元通信,其中网元包括例如虚拟机管理中心、共享存储等。
处理器1110用于执行程序。处理器1110可能是一个中央处理器CPU,或者是专用集成电路ASIC(Application Specific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。
存储器1130用于可执行的指令。存储器1130可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。存储器1130也可以是存储器阵列。存储器1130还可能被分块,并且所述块可按一定的规则组合成虚拟卷。存储器1130存储的指令可被处理器1110执行,以使处理器1110能够执行上述任意方法实施例中的聚类选址的方法。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应所述以权利要求的保护范围为准。
Claims (10)
1.一种聚类选址的方法,其特征在于,包括:
获取预设范围内的历史工单数据,所述历史工单数据包括位置信息;
根据所述历史工单数据的位置信息进行聚类分析,将所述历史工单数据分为N类,N为预定的选址地点的数量;
确定每一类历史工单数据对应的中心位置信息,并将所述中心位置信息所指示的地点确定为所述每一类历史工单数据的选址地点。
2.根据权利要求1所述的方法,其特征在于,所述N通过以下公式获取到:
预设定点工单占所有工单的占比r,并预设每个选址地点在预设周期内可承载的工单数量n,则:
或
其中,M表示历史工单数据的总数量,t表示历史工单数据在时间跨度上的所述预设周期的周期数,函数f()表示取整函数或计数保留函数,Nmin表示预设的选址地点的最小数量。
3.根据权利要求1所述的方法,其特征在于,在所述将所述历史工单数据分为N类之后,还包括:
根据每一类历史工单数据的位置信息确定每一类历史工单数据对应的地点覆盖半径;根据每一类历史工单数的选址地点和地点覆盖半径确定每一类历史工单数据的覆盖范围。
4.根据权利要求3所述的方法,其特征在于,所述根据每一类历史工单数据的位置信息确定每一类历史工单数据对应的地点覆盖半径包括:
根据位置信息中横坐标的大小对每一类历史工单数据进行排序,确定每一类历史工单数据中与第一上分位数对应的第一横坐标x1以及与第一下分位数对应的第二横坐标x2;
根据位置信息中纵坐标的大小对每一类历史工单数据进行排序,确定每一类历史工单数据中与第二上分位数对应的第一纵坐标y1以及与第二下分位数对应的第二纵坐标y2;其中,所述历史工单数据的位置信息包括横坐标和纵坐标;
当位置信息中横坐标和纵坐标为长度单位时,所述地点覆盖半径R为:
函数g1()为调整函数,ω1和ω2为两个预设的权重值;
当位置信息中横坐标和纵坐标为经纬度单位时,所述地点覆盖半径R为:
函数g2()为调整函数,ω3和ω4为两个预设的权重值,θ为每一类历史工单数据中所有纬度的平均值。
5.根据权利要求3所述的方法,其特征在于,在确定每一类历史工单数据对应的地点覆盖半径后,还包括:
分别确定每一类历史工单数据的数量mi,并确定每一类历史工单数据中、位于覆盖范围内的历史工单数据的数量ci;
确定每一类的工单覆盖率并根据所述工单覆盖率确定所述选址地点是否合适。
6.根据权利要求5所述的方法,其特征在于,所述根据所述工单覆盖率确定所述选址地点是否合适包括:
确定每一类的重要工单覆盖率和工单重复率rri,根据所述工单覆盖率cri、所述重要工单覆盖率和所述工单重复率rri确定所述选址地点是否合适;
其中, 表示每一类的历史工单数据中重要历史工单数据的数量,表示每一类的历史工单数据中位于覆盖范围内的重要历史工单数据的数量,ei表示位于覆盖范围内的历史工单数据中同时被其他类历史工单数据对应的覆盖范围所覆盖的历史工单数据的数量。
7.根据权利要求1所述的方法,其特征在于,在所述将所述中心位置信息所指示的地点确定为所述每一类历史工单数据的选址地点之后,还包括:
可视化显示每一类历史工单数据的选址地点;或者
可视化显示每一类历史工单数据的覆盖范围,所述覆盖范围为以选址地点为圆心、以地点覆盖半径为半径所确定的圆形区域,所述地点覆盖半径为根据每一类的历史工单数据的位置信息所确定的半径。
8.一种聚类选址的装置,其特征在于,包括:
获取模块,用于获取预设范围内的历史工单数据,所述历史工单数据包括位置信息;
聚类模块,用于根据所述历史工单数据的位置信息进行聚类分析,将所述历史工单数据分为N类,N为预定的选址地点的数量;
处理模块,用于确定每一类历史工单数据对应的中心位置信息,并将所述中心位置信息所指示的地点确定为所述每一类历史工单数据的选址地点。
9.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机可执行指令,所述计算机可执行指令用于执行权利要求1-7任意一项所述的聚类选址的方法。
10.一种电子设备,其特征在于,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7任意一项所述的聚类选址的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811557341.3A CN109657027B (zh) | 2018-12-19 | 2018-12-19 | 一种聚类选址的方法、装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201811557341.3A CN109657027B (zh) | 2018-12-19 | 2018-12-19 | 一种聚类选址的方法、装置、存储介质及电子设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109657027A true CN109657027A (zh) | 2019-04-19 |
CN109657027B CN109657027B (zh) | 2020-11-03 |
Family
ID=66114925
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201811557341.3A Active CN109657027B (zh) | 2018-12-19 | 2018-12-19 | 一种聚类选址的方法、装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109657027B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111626777A (zh) * | 2020-05-25 | 2020-09-04 | 泰康保险集团股份有限公司 | 选址方法、选址决策***、存储介质及电子设备 |
CN111831760A (zh) * | 2019-04-23 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN112215580A (zh) * | 2020-10-23 | 2021-01-12 | 岭东核电有限公司 | 核电作业区域设置方法、装置、计算机设备和存储介质 |
CN112883126A (zh) * | 2019-11-29 | 2021-06-01 | 京东安联财产保险有限公司 | 社区中心的选择方法及相关设备 |
CN113537808A (zh) * | 2021-07-27 | 2021-10-22 | 石家庄开发区天远科技有限公司 | 基于时空大数据的工程机械配件库选址的方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451673A (zh) * | 2017-06-14 | 2017-12-08 | 北京小度信息科技有限公司 | 配送区域划分方法和装置 |
CN107844885A (zh) * | 2017-09-05 | 2018-03-27 | 北京小度信息科技有限公司 | 信息推送方法和装置 |
CN108985694A (zh) * | 2018-07-17 | 2018-12-11 | 北京百度网讯科技有限公司 | 用于确定配送中心地址的方法和装置 |
CN109003028A (zh) * | 2018-07-17 | 2018-12-14 | 北京百度网讯科技有限公司 | 用于划分物流区域的方法和装置 |
-
2018
- 2018-12-19 CN CN201811557341.3A patent/CN109657027B/zh active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107451673A (zh) * | 2017-06-14 | 2017-12-08 | 北京小度信息科技有限公司 | 配送区域划分方法和装置 |
CN107844885A (zh) * | 2017-09-05 | 2018-03-27 | 北京小度信息科技有限公司 | 信息推送方法和装置 |
CN108985694A (zh) * | 2018-07-17 | 2018-12-11 | 北京百度网讯科技有限公司 | 用于确定配送中心地址的方法和装置 |
CN109003028A (zh) * | 2018-07-17 | 2018-12-14 | 北京百度网讯科技有限公司 | 用于划分物流区域的方法和装置 |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111831760A (zh) * | 2019-04-23 | 2020-10-27 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN111831760B (zh) * | 2019-04-23 | 2023-08-18 | 腾讯科技(深圳)有限公司 | 处理位置数据的方法及相应的装置、计算机可读存储介质 |
CN112883126A (zh) * | 2019-11-29 | 2021-06-01 | 京东安联财产保险有限公司 | 社区中心的选择方法及相关设备 |
CN111626777A (zh) * | 2020-05-25 | 2020-09-04 | 泰康保险集团股份有限公司 | 选址方法、选址决策***、存储介质及电子设备 |
CN111626777B (zh) * | 2020-05-25 | 2023-04-18 | 泰康保险集团股份有限公司 | 选址方法、选址决策***、存储介质及电子设备 |
CN112215580A (zh) * | 2020-10-23 | 2021-01-12 | 岭东核电有限公司 | 核电作业区域设置方法、装置、计算机设备和存储介质 |
CN112215580B (zh) * | 2020-10-23 | 2024-02-06 | 岭东核电有限公司 | 核电作业区域设置方法、装置、计算机设备和存储介质 |
CN113537808A (zh) * | 2021-07-27 | 2021-10-22 | 石家庄开发区天远科技有限公司 | 基于时空大数据的工程机械配件库选址的方法 |
Also Published As
Publication number | Publication date |
---|---|
CN109657027B (zh) | 2020-11-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109657027A (zh) | 一种聚类选址的方法、装置、存储介质及电子设备 | |
US10684753B2 (en) | Systems and methods for geospatial value subject analysis and management | |
CN104933870B (zh) | 基于车辆行为分析的车辆套牌识别方法与装置 | |
CN106338705A (zh) | 一种用于三相电能计量装置的校验误差的方法和装置 | |
WO2013148897A1 (en) | Systems and methods for certified location data collection, management, and utilization | |
CN108062674A (zh) | 基于gps的订单欺诈识别方法、***、存储介质和电子设备 | |
CN111709756A (zh) | 一种可疑社团的识别方法、装置、存储介质和计算机设备 | |
CN110097068A (zh) | 相似车辆的识别方法和装置 | |
CN109714784A (zh) | 一种天线方位角的优化方法和装置 | |
CN109255006A (zh) | 一种热门景点显示方法与装置 | |
CN107589391A (zh) | 一种检测电能计量装置整体误差的方法、装置和*** | |
CN113486880A (zh) | 图像采集设备布置方法、装置、电子设备及存储介质 | |
CN109711720A (zh) | 一种应用于群智感知的数据质量评估方法 | |
CN110414784A (zh) | 考勤方法、装置、电子设备及存储介质 | |
CN108627796A (zh) | 一种电能表的检测方法、检测装置及终端 | |
CN103150098B (zh) | 一种展现移动终端拍摄的图像的方法及装置 | |
CN107704942A (zh) | 配送路径确定方法、装置和设备 | |
CN106530841B (zh) | 机场延误预测方法及装置 | |
CN114614525A (zh) | 一种智能充电桩管理*** | |
CN110648213A (zh) | 地址验证方法、装置、设备及计算机可读介质 | |
CN109302674A (zh) | 一种基于多重滤波的WiFi室内定位方法 | |
US9014978B2 (en) | Upgrading location-related data | |
CN109636437A (zh) | 小区均价预估方法、电子装置及存储介质 | |
US20230027383A1 (en) | Prediction system and prediction method | |
CN108960111A (zh) | 人脸识别方法、***及终端设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |