CN115525841A - 兴趣点信息的获取方法、电子设备及存储介质 - Google Patents
兴趣点信息的获取方法、电子设备及存储介质 Download PDFInfo
- Publication number
- CN115525841A CN115525841A CN202211262586.XA CN202211262586A CN115525841A CN 115525841 A CN115525841 A CN 115525841A CN 202211262586 A CN202211262586 A CN 202211262586A CN 115525841 A CN115525841 A CN 115525841A
- Authority
- CN
- China
- Prior art keywords
- information
- cluster
- name
- order address
- address information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 238000012216 screening Methods 0.000 claims abstract description 7
- 238000004422 calculation algorithm Methods 0.000 claims description 21
- 238000000605 extraction Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 11
- 238000012545 processing Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 238000004590 computer program Methods 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000012549 training Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 3
- 238000005065 mining Methods 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 2
- 238000004220 aggregation Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000006399 behavior Effects 0.000 description 2
- 230000003203 everyday effect Effects 0.000 description 2
- 238000013507 mapping Methods 0.000 description 2
- 235000012054 meals Nutrition 0.000 description 2
- 238000009877 rendering Methods 0.000 description 2
- 235000011888 snacks Nutrition 0.000 description 2
- 230000009471 action Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000010410 layer Substances 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000002356 single layer Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开实施例公开了一种兴趣点信息的获取方法、电子设备及存储介质,该方法包括:获取多个订单地址信息;根据订单地址信息中的名称信息和位置信息,对多个订单地址信息进行聚类处理,得到至少一个聚类簇,每个聚类簇中包含至少两个订单地址信息,每个聚类簇对应一个兴趣点;针对每个聚类簇,从聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为聚类簇对应的兴趣点的名称;根据聚类簇内至少两个订单地址信息的位置信息,确定聚类簇对应的兴趣点的地址坐标。该技术方案可以高时效且低成本地获取兴趣点信息。
Description
技术领域
本公开涉及地理信息处理技术领域,具体涉及一种兴趣点信息的获取方法、电子设备及存储介质。
背景技术
兴趣点(Point Of Interest,POI)泛指可以抽象为点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院、超市等。在现实环境中,兴趣点每天都有可能新增或者变更,例如,某地新开发了一块商业用地,很多新的商铺纷纷在此设立,也即商铺类的兴趣点大量新增,或者原有的超市类兴趣点变更为小吃店类兴趣点等等。服务提供商为了能够给用户提供更好的导航、地图检索等相关服务,需要对兴趣点的变化状况进行掌握,以便及时根据实际兴趣点的变化,更新导航、地图等相关产品的兴趣点信息。
目前,行业内更新兴趣点的普遍做法是定期实地采集最新的兴趣点信息进行兴趣点更新,一般需要很长一段时间才进行一次兴趣点的采集更新,这样就不能保证兴趣点的时效性,如果要保证兴趣点的高时效,需要提高兴趣点的采集频率,但是这样会耗费大量的人力和物力,因此,如何能够高时效、低成本的获取兴趣点信息成为目前亟待解决的问题。
发明内容
为了解决相关技术中的问题,本公开实施例提供一种兴趣点信息的获取方法、电子设备及存储介质。
第一方面,本公开实施例中提供了一种兴趣点信息的获取方法。
具体地,所述兴趣点的获取方法,包括:
获取多个订单地址信息,其中,所述订单地址信息包括名称信息和位置信息;
根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类处理,得到至少一个聚类簇,每个聚类簇中包含至少两个订单地址信息,每个聚类簇对应一个兴趣点;
针对每个聚类簇,从所述聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称;
根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标。
第二方面,本公开实施例中提供了一种兴趣点信息的获取装置,包括:
获取模块,被配置为获取多个订单地址信息,其中,所述订单地址信息包括名称信息和位置信息;
聚类模块,被配置为根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类处理,得到至少一个聚类簇,每个聚类簇中包含至少两个订单地址信息,每个聚类簇对应一个兴趣点;
名称筛选模块,被配置为针对每个聚类簇,从所述聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称;
坐标确定模块,被配置为根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标。
第三方面,本公开实施例提供了一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器执行以实现如第一方面中任一项所述的方法。
第四方面,本公开实施例中提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现如第一方面中任一项所述的方法。
第五方面,本公开实施例中提供了一种计算机程序产品,包括计算机指令,该计算机指令被处理器执行时实现如第一方面中任一项所述的方法步骤。
根据本公开实施例提供的技术方案,可以获取多个包括名称信息和位置信息的订单地址信息,然后,根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类,得到至少一个聚类簇,每个聚类簇内聚合的是同一个兴趣点的不同名称信息和位置信息,每个聚类簇代表一个兴趣点,可以从所述聚类簇内的名称信息中择优筛选一个名称信息作为所述聚类簇代表的兴趣点的名称,并根据所述聚类簇内至少两个订单地址信息的位置信息进行综合推断,确定所述聚类簇代表的兴趣点的地址坐标;如此就获取到该聚类簇代表的兴趣点的名称和地址坐标,进而可以根据获取的兴趣点的名称和地址坐标进行兴趣点信息更新。这样通过订单地址信息来获取兴趣点信息,不需要耗费人力物力进行实地采集,且可以高频次如每天一次采用本方案来获取兴趣点信息来进行兴趣点更新,实现了低成本,高时效的兴趣点获取,保证了地图服务中的兴趣点的及时更新,提高用户使用地图服务的体验。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
结合附图,通过以下非限制性实施方式的详细描述,本公开的其它特征、目的和优点将变得更加明显。在附图中:
图1示出根据本公开的实施例的兴趣点信息的获取方法的流程图;
图2示出根据本公开一实施方式的兴趣点信息的获取方法的应用场景示意图;
图3示出根据本公开的实施例的兴趣点信息的获取装置的结构框图;
图4示出根据本公开的实施例的电子设备的结构框图;
图5示出适于用来实现根据本公开实施例的方法的计算机***的结构示意图。
具体实施方式
下文中,将参考附图详细描述本公开的示例性实施例,以使本领域技术人员可容易地实现它们。此外,为了清楚起见,在附图中省略了与描述示例性实施例无关的部分。
在本公开中,应理解,诸如“包括”或“具有”等的术语旨在指示本说明书中所公开的特征、数字、步骤、行为、部件、部分或其组合的存在,并且不欲排除一个或多个其他特征、数字、步骤、行为、部件、部分或其组合存在或被添加的可能性。
另外还需要说明的是,在不冲突的情况下,本公开中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本公开。
在本公开中,对用户信息或用户数据的获取均为经用户授权、确认,或由用户主动选择的操作。
如上文所述,兴趣点(Point Of Interest,POI)泛指可以抽象为点的地理对象,尤其是一些与人们生活密切相关的地理实体,如学校、银行、餐馆、加油站、医院、超市等。在现实环境中,兴趣点每天都有可能新增或者变更,例如,某地新开发了一块商业用地,很多新的商铺纷纷在此设立,也即商铺类的兴趣点大量新增,或者原有的超市类兴趣点变更为小吃店类兴趣点等等。服务提供商为了能够给用户提供更好的导航、地图检索等相关服务,需要对兴趣点的变化状况进行掌握,以便及时根据实际兴趣点的变化,更新导航、地图等相关产品的兴趣点信息。
目前,行业内更新兴趣点的普遍做法是定期实地采集最新的兴趣点信息进行兴趣点更新,一般需要很长一段时间才进行一次兴趣点的采集更新,这样就不能保证兴趣点的时效性,如果要保证兴趣点的高时效,需要提高兴趣点的采集频率,但是这样会耗费大量的人力和物力,因此,如何能够高时效、低成本的获取兴趣点信息成为目前亟待解决的问题。
本公开提供了一种兴趣点信息的获取方法,该方法可以通过对订单地址信息进行地址聚类得到聚类簇,每个聚类簇对应一个兴趣点,然后从聚类簇内各订单地址信息的名称信息中选取高质量的名称信息作为兴趣点名称,根据聚类簇内各订单地址信息的位置信息确定兴趣点地址坐标,这样通过订单地址信息可以低成本且高时效地获取兴趣点信息,进而低成本且高时效地进行兴趣点更新,提高用户使用地图服务的体验。
图1示出根据本公开的实施例的兴趣点信息的获取方法的流程图。如图1所示,所述车道线数据处理方法包括以下步骤S101-S104:
在步骤S101中,获取多个订单地址信息,其中,所述订单地址信息包括名称信息和位置信息;
在步骤S102中,根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类处理,得到至少一个聚类簇,每个聚类簇中包含至少两个订单地址信息,每个聚类簇对应一个兴趣点;
在步骤S103中,针对每个聚类簇,从所述聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点名称;
在步骤S104中,根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点地址坐标。
在一种可能的实施方式中,该兴趣点信息的获取方法适用于可执行兴趣点信息获取的计算机、计算设备、服务器、服务器集群等设备。
在一种可能的实施方式中,该订单地址信息可以是订单的发货方位置信息和/或订单的收货方位置信息,其中,订单的发货方位置信息是发货方输入的,订单的收货方地址是收货方输入的。在下单成功时生成的订单数据中包含该订单的订单地址信息,故可以从订单数据库中获取多个订单地址信息。
在一种可能的实施方式中,该订单地址信息中包括某个地理对象的位置信息和名称信息,示例的,某个订单地址信息可以是“XX市XX区XX路X号,YY广场”,其中,“XX市XX区XX路X号”是地理对象的位置信息,“YY广场”是地理对象的名称信息。
在一种可能的实施方式中,对于同一个兴趣点,不同的用户输入的订单地址信息可能不同,例如对于某个商场,有的用户输入的订单地址信息为“XX市XX区XX路X号,YY购物中心”,有的用户输入的订单地址信息为“XX市XX区XX路与ZZ路交叉口,YY商场”,故可以按照订单地址信息中的名称信息和位置信息,将相似的订单地址信息聚为一类,形成一个聚类簇,每个聚类簇内的各订单地址信息就是同一个兴趣点的不同名称信息和地址信息,每个聚类簇对应一个兴趣点。
在一种可能的实施方式中,对于每个聚类簇,可以从该聚类簇内至少两个订单地址信息的名称信息中择优筛选一个名称信息,筛选出的名称信息可以作为该聚类簇对应的兴趣点的名称。这里,该筛选出的名称信息需要满足兴趣点命名条件,示例的,该兴趣点命名条件可以是该聚类簇内至少两个订单地址信息的名称信息中出现频次最高的名称信息,或者也可以是该聚类簇内至少两个订单地址信息的名称信息中通顺度、清晰度或完整度最高的名称信息。
在一种可能的实施方式中,对于每个聚类簇,可以根据所述聚类簇内至少两个订单地址信息的位置信息进行地址坐标综合推断,确定所述聚类簇对应的兴趣点的地址坐标,示例的,同一个聚类簇内,有的位置信息为“XX路与ZZ路交叉口”,有的位置信息为“XX路东侧”,“ZZ路南侧”,等等,通过这些信息就可以综合推断出该聚类簇对应的兴趣点的位置在“XX路与ZZ路交叉口东南角”,进而可以确定该聚类簇对应的兴趣点的地址坐标。
在一种可能的实施方式中,获取到各个聚类簇对应的兴趣点的名称和地址坐标后,就可以根据所述聚类簇对应的兴趣点名称和兴趣点地址坐标进行兴趣点信息更新,比如可以将这些兴趣点的名称和地址坐标与原有的兴趣点进行比对,获取新增的兴趣点和/或名称变化的兴趣点(如兴趣点的名称由之前的AA大厦变化为BB大厦等),将新增兴趣点的名称和地址坐标加入兴趣点数据库,用新获取的兴趣点的名称替换位于同一地址坐标的原有的兴趣点的名称,如此完成兴趣点信息的更新替换。
这里需要说明的是,本实施方式中用于挖掘兴趣点信息的订单地址信息可以是最近新增的订单地址信息,如此可以保证挖掘的兴趣点信息的高时效性,同时,本实施方式还可以高频次如每天一次获取当天新增的订单地址信息,并采用本方案来获取兴趣点信息来进行兴趣点更新,保证兴趣点的及时更新,这样就可以保证兴趣点信息获取的高时效性。
本实施方式可以获取多个包括名称信息和位置信息的订单地址信息,然后,根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类,得到至少一个聚类簇,每个聚类簇内聚合的是同一个兴趣点的不同名称信息和位置信息,每个聚类簇代表一个兴趣点,可以从所述聚类簇内的名称信息中择优筛选一个名称信息作为所述聚类簇代表的兴趣点的名称,并根据所述聚类簇内至少两个订单地址信息的位置信息进行综合推断,确定所述聚类簇代表的兴趣点的地址坐标;如此就获取到该聚类簇代表的兴趣点的名称和地址坐标,进而可以根据获取的兴趣点的名称和地址坐标进行兴趣点信息更新。这样通过订单地址信息来获取兴趣点信息,不需要耗费人力物力进行实地采集,且可以高频次如每天一次获取新增的订单地址信息来挖掘兴趣点信息进行兴趣点更新,实现了低成本,高时效的兴趣点获取,保证了地图服务中的兴趣点的及时更新,提高用户使用地图服务的体验。
在一种可能的实施方式中,上述兴趣点信息的获取方法中,所述根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类处理,得到至少一个聚类簇,包括:
根据所述订单地址信息中的名称信息和位置信息,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇,每个初始聚类簇中包含多个候选信息,每个候选信息为所述多个订单地址信息中的一个;
获取所述候选信息对应的多维度特征信息,所述多维度特征信息包括所述候选信息对应的文本特征、用户位置特征和位置坐标中的至少一个;
根据所述候选信息对应的多维度特征信息,使用第二聚类算法对所述至少一个初始聚类簇进行聚类簇拆分和合并,得到至少一个聚类簇。
在该实施方式中,可以先根据所述多个订单地址信息的名称信息和位置信息,使用第一聚类算法对这多个订单地址信息进行粗略的聚类,得到至少一个初始聚类簇,然后根据各候选信息对应的维度更多更精细的多维度特征信息,使用第二聚类算法进行更精细的聚类,将初始聚类簇进行拆分和合并,在进行精细聚类时,针对每个初始聚类簇,根据该初始聚类簇内候选信息对应的多维度特征信息对初始聚类簇内的候选信息进行精细聚类,如果初始聚类簇内有两种或两种以上不同类的候选信息,可以将初始聚类簇拆分成两种或两种以上的备选聚类簇,如果初始聚类簇内只有一种候选信息,该初始聚类簇就不需要拆分,将各初始聚类簇进行精细聚类拆分得到备选聚类簇后,可以从备选聚类簇中选取一个候选信息的多维度特征信息作为该备选聚类簇的信息,基于所述备用聚类簇的信息,确定各备用聚类簇之间的相似度,根据各备用聚类簇之间的相似度,将各备用聚类簇进行合并,如相似度超过预设阈值的备用聚类簇合并在一起,如此就可以聚类得到至少一个聚类簇。
本实施方式可以先使用订单地址信息中的名称信息和位置信息进行粗略聚类的都初始聚类簇,再对初始聚类簇进行更精细的划分和合并,可以使相似订单地址信息的聚集准度更高且聚集效率更快。
在一种可能的实施方式中,上述兴趣点信息的获取方法中,所述根据所述订单地址信息中的名称信息和位置信息,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇,包括:
根据所述多个订单地址信息的名称信息和位置信息,确定所述多个订单地址信息之间的名称相似度和位置相似度;
根据各订单地址信息之间的名称相似度和位置相似度,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇。
在该实施方式中,针对多个订单地址信息中的任意两个订单地址信息,可以根据这两个订单地址信息的名称信息确定这两个订单地址信息之间的名称相似度,根据这两个订单地址信息的位置信息确定这两个订单地址信息之间的位置相似度,然后对这两个订单地址信息的名称相似度和位置相似度进行加权平均,得到这两个订单地址信息之间的相似度,如此就可以得到多个订单地址信息之间的相似度,根据多个订单地址信息之间的相似度,采用第一聚类算法对多个订单地址信息进行初始聚类,就可以得到至少一个初始聚类簇。
在该实施方式中,该第一聚类算法可以是凝聚层次聚类算法,该凝聚层次聚类算法首先假定每个订单地址信息都是一个独立的聚类,如果统计出来的聚类数大于预定的期望聚类数,则从每个订单地址信息出发寻找与自己相似度最大的另一个订单地址信息与之聚集,形成更大的聚类,同时令总聚类数减少,不断重复以上过程,直到统计出来的聚类数达到预定的期望聚类数为止,如此可以聚类得到预设聚类数的初始聚类簇,当然,该第一聚类算法还可以是其他聚类算法,本领域人员可以根据需要选择各种聚类算法进行初始聚类,在此不一一例举。
在本实施方式中根据各订单地址信息之间的名称相似度和位置相似度进行聚类,聚类信息简单,可以快速聚类得到初始聚类簇。
在一种可能的实施方式中,上述兴趣点信息的获取方法中,所述获取所述候选信息对应的多维度特征信息包括以下至少一个步骤:
使用第一特征提取模型从所述候选信息中提取所述候选信息对应的文本特征;
获取所述候选信息对应的用户在历史时间段内的定位信息,并使用第二特征提取模型从所述定位信息中提取所述候选信息对应的用户位置特征;
根据所述候选信息中的位置信息确定所述候选信息对应的位置坐标。
在该实施方式中,该第一特征提取模型可以是双塔-GEOBERT(GeographicalBidirectional Encoder Representation from Transformers,一种面向中文地址文本的预训练语言表征模型)。可以使用双塔-GEOBERT提取该从所述候选信息中计算候选信息文本的embedding(嵌入)特征向量,生成候选信息对应的文本特征。
在该实施方式中,该候选信息对应的用户指的是输入该候选信息的用户,比如说该候选信息是收货方A输入的,则该候选信息对应的用户就是收货方A。
在该实施方式中,可以获取该候选信息对应的用户在历史时间段(如最近三个月)内的定位信息,从该定位信息中提取该候选信息的用户位置特征。
在该实施方式中,该第二特征提取模型可以是CNN(Convolutional NeuralNetwork,卷积神经网络)模型,使用该CNN模型可以从定位信息中提取到用户位置特征。
这里需要说明的是,该第一特征提取模型和第二特征提取模型还可以是其他特征提取模型,本领域人员可以根据需要选择各种特征提取模型进行特征提取,在此不一一例举。
在一种可能的实施方式中,上述兴趣点信息的获取方法中,所述使用第二聚类算法,对所述至少一个初始聚类簇进行聚类簇的拆分和合并,得到至少一个聚类簇,包括:
针对每个初始聚类簇,根据所述初始聚类簇中每个候选信息对应的多维度特征信息,确定所述初始聚类簇内各候选信息之间的相似度;
根据所述初始聚类簇内各候选信息之间的相似度,对所述初始聚类簇进行拆分,得到备用聚类簇;
从所述备用聚类簇中选取一个候选信息,并将选取的候选信息对应的多维度特征信息确定为所述备用聚类簇的信息;
根据所述备用聚类簇的信息,确定各备用聚类簇之间的相似度;
根据所述各备用聚类簇之间的相似度,对所述备用聚类簇进行合并,得到至少一个聚类簇。
在该实施方式中,可以使用Wide&Deep(线形和深度神经网络)模型来计算初始聚类簇内各候选信息的相似度。Wide&Deep模型是由单层的Wide部分和多层的Deep部分组成的混合模型,其中,Wide部分的主要作用是让模型具有较强的“记忆能力”;Deep部分的主要作用是让模型具有“泛化能力”,正是这样的结构特点,使Wide&Deep模型兼具了逻辑回归和深度神经网络的优点—能够快速处理并记忆大量特征,并且具有强大的表达能力。示例的,可以使用Wide&Deep模型,对文本特征和/或用户位置特征这些深度特征以及位置坐标这些浅层次特征进行处理,计算得到各候选信息的相似度。
在该实施方式中,针对每个初始聚类簇,可以根据该初始聚类簇内各候选信息之间的相似度将所述初始聚类簇内的候选信息重新聚类,如可以将相似度超过预设值的候选信息聚为一类,这样,可以将一个初始聚类簇重新聚类为一个或多个备用聚类簇。
在该实施方式中,将各初始聚类簇进行精细聚类拆分得到备选聚类簇后,可以从备选聚类簇中选取一个候选信息,将选取的候选信息对应的多维度特征信息作为该备选聚类簇的信息,然后,使用Wide&Deep模型计算各备用聚类簇之间的相似度,根据各备用聚类簇之间的相似度,将各备用聚类簇进行合并,如相似度超过预设阈值的备用聚类簇合并在一起,如此就可以将备用聚类簇聚类得到至少一个聚类簇。
本实施方式在使用多维度信息进行精细聚类时,不需要计算全部候选信息之间的相似度,只需要计算初始聚类簇内各候选信息之间的相似度以及备用聚类簇之间的相似度,计算量减少,聚类速度加快,提高聚类效率,而且聚类使用的多维度信息更精细,聚类准确度更高。
在一种可能的实施方式中,上述兴趣点信息的获取方法中,所述从所述聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称,包括:
根据所述聚类簇内每个订单地址信息的名称信息,确定所述每个订单地址信息的名称信息的命名质量指标,所述命名质量指标包括名称通顺度、名称困惑度和名称完整度中的至少一个;
根据所述每个订单地址信息的名称信息的命名质量指标,对所述聚类簇内至少两个订单地址信息的名称信息进行排序,并选择排序第一的名称信息作为所述聚类簇对应的兴趣点名称。
在该实施方式中,可以将该订单地址信息的名称信息输入至名称通顺度模型,执行该名称通顺度模型,就可以得到该名称通顺度模型输出的该订单地址信息的名称信息的名称通顺度。该名称通顺度模型可以是利用BERT模型进行有监督训练得到模型,示例的,可以获取带标签的样本名称信息,该标签可以是该样本名称信息的名称通顺度,将该样本名称信息输入至名称通顺度模型中的BERT子模型,得到该BERT子模型输出的名称特征向量,将该名称特征向量输入至该名称通顺度模型的输出子模型,得到该输出子模型输出的名称通顺度,如此进行模型训练,直至名称通顺度模型输出的名称通顺度的正确率达到一定值,如此就得到名称通顺度模型。
在该实施方式中,可以将该订单地址信息的名称信息输入至名称困惑度模型,执行该名称困惑度模型,就可以得到该名称困惑度模型输出的该订单地址信息的名称信息的名称困惑度。该名称困惑都模型可以是利用BERT模型计算PPL(Perplexity,困惑度),可以该订单地址信息的名称信息输入至名称困惑都模型的BERT子模型,得到该BERT子模型输出的embedding向量,然后使用困惑都计算子模块计算知道前n个embedding向量的情况下,第n+1个embedding向量的概率,输出的概率值越高,表示困惑越小。该名称困惑度模型也可以是有监督训练得到模型,在此不再赘述。
在该实施方式中,可以使用CRF(Conditional Random Field,条件随机场)模型,将该名称信息切分为预设类别的词如“专用词、通用词、结尾词”等,获取该名称信息对应的名称结构,根据该名称信息对应的名称结构确定名称的完整度,示例的,如果某名称信息为“老王家常菜饭馆”包含专用词“老王”、通用词“家常菜”和结尾词“饭馆”,则确定该名称信息的完整度为1,如果某名称信息为“老王家常菜”包含专用词“老王”和通用词“家常菜”,则确定该名称信息的完整度为0.7等等。
在该实施方式中,可以对该命名质量指标中的各指标进行加权平均计算,得到命名质量值,按照对应的命名质量值的高低对聚类簇内至少两个订单地址信息的名称信息进行排序,排序最前的名称信息的命名质量值最高,故可以选择排序第一的名称信息作为该聚类簇对应的兴趣点的名称。
本实施方式可以选取命名质量最高的名称信息来对该聚类簇对应的兴趣点进行命名,提高兴趣点的命名质量。
在一种可能的实施方式中,上述兴趣点信息的获取方法中,所述根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标,包括:
根据所述聚类簇内至少两个订单地址信息中的位置信息,确定所述聚类簇对应的兴趣点的地址范围;
根据所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息,以及所述地址范围,确定所述聚类簇对应的兴趣点的地址坐标。
在该实施方式中,可以根据所述聚类簇内至少两个订单地址信息中的位置信息,搜索定位得到该聚类簇对应的兴趣点的地址范围。
在该实施方式中,该订单地址信息对应的用户通常都会在该订单地址信息表示的兴趣点周围活动或驻留,比如说,收货方输入的订单地址信息通常都是收货方方便收货的兴趣点的地址,收货方会经常在该订单地址信息表示的兴趣点附近活动或驻留,因此将所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息与该地址范围进行数据比对分析如通过用户定位点聚类等方法获取用户在该地址范围内的常驻区域坐标,如此就可以深度挖掘出该聚类簇对应的兴趣点的地址坐标。
在一种可能的实施方式中,上述兴趣点信息的获取方法中,所述根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标,包括:
根据所述聚类簇内至少两个订单地址信息中的位置信息,确定所述聚类簇对应的地址范围;
根据所述地址范围以及预存的WIFI的名称信息和定位信息,确定所述聚类簇对应的兴趣点的地址坐标。
在该实施方式中,可以根据所述聚类簇内至少两个订单地址信息中的位置信息,搜索定位得到该聚类簇对应的兴趣点的地址范围。
在该实施方式中,兴趣点内的WIFI(移动热点)在很多情况下都会使用该兴趣点的名称进行命名,故可以使用WIFI的名称信息和定位信息来进行兴趣点的地址挖掘。
在该实施方式中,可以获取各用户连接过的WIFI的名称信息和定位信息,并存储。在进行兴趣点的地址挖掘时,将预存的WIFI的名称信息与该聚类簇对应的兴趣点的名称信息进行相似度计算,获取相似度超过预设值的WIFI,这些名称相似的WIFI很可能是兴趣点内的WIFI,将这些名称相似的WIFI的定位信息与该地址范围进行比对分析,就可以获取该聚类簇对应的兴趣点的地址坐标。
在一种可能的实施方式中,上述兴趣点信息的获取方法还可以包括以下步骤:
根据所述聚类簇内的至少两个订单地址信息,确定所述聚类簇对应的兴趣点的存在性指标值;
若所述聚类簇对应的兴趣点的存在性指标值超过预设标准值,则根据所述聚类簇对应的兴趣点的名称和地址进行兴趣点信息更新。
在该实施方式中,如果该聚类簇内聚类有很多订单地址信息,则说明很多用户将该聚类簇对应的兴趣点的地址信息输入为相似的文本信息,这就说明该聚类簇对应的兴趣点有很高的存在性,如果聚类簇对应的兴趣点的存在性指标值超过预设标准值,说明该聚类簇对应的兴趣点是真实存在的,此时就可以根据所述聚类簇对应的兴趣点的名称和地址进行兴趣点信息更新;如果聚类簇对应的兴趣点的存在性指标值未超过预设标准值,说明该聚类簇对应的兴趣点可能不是真实存在的,此时就不记录该聚类簇对应的兴趣点的名称和地址坐标。
本实施方式可以通过判断该聚类簇对应的兴趣点是否真实存在,来确定是否使用该聚类簇对应的兴趣点的名称和地址坐标进行兴趣点更新,可以保证更新的兴趣点的真实性和准确性。
在一种可能的实施方式中,所述根据所述聚类簇内的至少两个订单地址信息,确定所述聚类簇对应的兴趣点的存在性指标值,包括:
针对每个聚类簇,获取所述聚类簇内订单地址信息的数量信息;
获取所述聚类簇对应的兴趣点的名称与WIFI名称的相似度信息;
获取所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息;
根据所述数量信息、相似度信息以及定位信息中的至少一个,确定所述兴趣点的存在性指标值。
在该实施方式中,针对每个聚类簇,可以统计获取该聚类簇内聚合的订单地址信息的数量信息,数量越多,说明该聚类簇对应的兴趣点的存在性越高。
在该实施方式中,可以计算聚类簇对应的兴趣点的名称与预存的各WIFI的名称信息之间的相似度,相似度超过预设阈值的WIFI的数量越多,说明该聚类簇对应的兴趣点的存在性越高。
在该实施方式中,可以统计所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息,通常情况下,用户的定位信息会在很长时间内驻留在该兴趣点的地址坐标附近,故越多的用户定位在该兴趣点的地址坐标附近,说明该聚类簇对应的兴趣点的存在性越高。
在该实施方式中,可以根据所述数量信息计算该聚类簇对应的兴趣点的存在性指标值,也可以根据该相似度信息计算该聚类簇对应的兴趣点的存在性指标值,也可以根据该定位信息计算该聚类簇对应的兴趣点的存在性指标值。或者,也可以根据数量信息计算该聚类簇对应的兴趣点的第一存在性指标值,根据该相似度信息计算该聚类簇对应的兴趣点的第二存在性指标值,根据该定位信息计算该聚类簇对应的兴趣点的第三存在性指标值,然后对该第一存在性指标值、第二存在性指标值和第三存在性指标值中的两个或三个做加权平均计算就可以得到该聚类簇对应的兴趣点的存在性指标值。
根据本公开一实施方式的基于位置的服务提供装置,该基于位置的服务提供装置根据上述兴趣点信息的获取方法得到兴趣点信息进行兴趣点信息更新,以利用所述兴趣点信息为被服务对象提供基于位置的服务,所述基于位置的服务包括:导航、地图渲染、路线规划中的一种或多种。
本公开实施例,可以通过上述兴趣点信息的获取方法对海量的订单地址信息进行处理,得到兴趣点的名称和地址坐标,从而可以低成本且高时效地更新兴趣点信息,兴趣点信息的具体获取细节可以参见上述对兴趣点信息的获取方法的描述,在此不再赘述。
本实施例中,该基于位置的服务提供装置可以在位置服务终端上执行,位置服务终端是手机、ipad、电脑、智能手表、车载设备等。被服务对象可以是手机、ipad、电脑、智能手表、自动驾驶车辆、机器人等。位置服务终端在为被服务对象导航、规划路径或者渲染地图上的道路时,可以基于地图服务提供的地图数据输出导航动作。
图2示出根据本公开一实施方式的兴趣点信息的获取方法的应用场景示意图。如图2所示,数据处理服务器201可以从订单数据库202中获取多个订单地址信息,并利用上文中的兴趣点信息的获取方法对其进行处理后,获得兴趣点的名称和地址坐标,并将该兴趣点的名称和地址坐标提供给地图制作服务器203,该地图制作服务器203可以据此制作形成地图数据中的兴趣点数据,该地图数据可以提供给导航服务器204。该导航服务器204可以依据该地图数据为位置服务终端205提供导航数据,进行导航、规划路径等服务。
图3示出根据本公开的实施例的兴趣点信息的获取装置的结构框图。其中,该装置可以通过软件、硬件或者两者的结合实现成为电子设备的部分或者全部。如图3所示,所述兴趣点信息的获取装置包括:
获取模块301,被配置为获取多个订单地址信息,其中,所述订单地址信息包括名称信息和位置信息;
聚类模块302,被配置为根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类处理,得到至少一个聚类簇,每个聚类簇中包含至少两个订单地址信息,每个聚类簇对应一个兴趣点;
名称筛选模块303,被配置为针对每个聚类簇,从所述聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称;
坐标确定模块304,被配置为根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标。
在一种可能的实施方式中,所述聚类模块被配置为:
根据所述订单地址信息中的名称信息和位置信息,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇,每个初始聚类簇中包含多个候选信息,每个候选信息为所述多个订单地址信息中的一个;
获取所述候选信息对应的多维度特征信息,所述多维度特征信息包括所述候选信息对应的文本特征、用户位置特征和位置坐标中的至少一个;
根据所述候选信息对应的多维度特征信息,使用第二聚类算法对所述至少一个初始聚类簇进行聚类簇拆分和合并,得到至少一个聚类簇。
在一种可能的实施方式中,所述聚类模块中所述根据所述订单地址信息中的名称信息和位置信息,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇的部分被配置为包括:
根据所述多个订单地址信息的名称信息和位置信息,确定所述多个订单地址信息之间的名称相似度和位置相似度;
基于各订单地址信息之间的名称相似度和位置相似度,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇。
在一种可能的实施方式中,所述聚类模块中所述获取所述候选信息对应的多维度特征信息的部分被配置为包括以下至少一个步骤:
使用第一特征提取模型从所述候选信息中提取所述候选信息对应的文本特征;
获取所述候选信息对应的用户在历史时间段内的定位信息,并使用第二特征提取模型从所述定位信息中提取所述候选信息对应的用户位置特征;
根据所述候选信息中的位置信息确定所述候选信息对应的位置坐标。
在一种可能的实施方式中,所述聚类模块中所述根据所述候选信息对应的多维度特征信息,使用第二聚类算法对所述至少一个初始聚类簇进行聚类簇拆分和合并,得到至少一个聚类簇的部分被配置为包括:
针对每个初始聚类簇,根据所述初始聚类簇中每个候选信息对应的多维度特征信息,确定所述初始聚类簇内各候选信息之间的相似度;
根据所述初始聚类簇内各候选信息之间的相似度,对所述初始聚类簇进行拆分,得到备用聚类簇;
从所述备用聚类簇中选取一个候选信息,并将选取的候选信息对应的多维度特征信息确定为所述备用聚类簇的信息;
根据所述备用聚类簇的信息,确定各备用聚类簇之间的相似度;
根据所述各备用聚类簇之间的相似度,对所述备用聚类簇进行合并,得到至少一个聚类簇。
在一种可能的实施方式中,所述名称筛选模块被配置为:
根据所述聚类簇内每个订单地址信息的名称信息,确定所述每个订单地址信息的名称信息的命名质量指标,所述命名质量指标包括名称通顺度、名称困惑度和名称完整度中的至少一个;
根据所述每个订单地址信息的名称信息的命名质量指标,对所述聚类簇内至少两个订单地址信息的名称信息进行排序,并选择排序第一的名称信息作为所述聚类簇对应的兴趣点的名称。
在一种可能的实施方式中,所述坐标确定模块被配置为:
根据所述聚类簇内至少两个订单地址信息中的位置信息,确定所述聚类簇对应的兴趣点的地址范围;
根据所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息,以及所述地址范围,确定所述聚类簇对应的兴趣点的地址坐标。
在一种可能的实施方式中,所述坐标确定模块被配置为:
根据所述聚类簇内至少两个订单地址信息中的位置信息,确定所述聚类簇对应的地址范围;
根据所述地址范围内的WIFI的名称信息和定位信息,确定所述聚类簇对应的兴趣点的地址坐标。
在一种可能的实施方式中,所述装置还包括:
存在性确定模块,被配置为根据所述聚类簇内的至少两个订单地址信息,确定所述聚类簇对应的兴趣点的存在性指标值;
信息更新模块,被配置为若所述聚类簇对应的兴趣点的存在性指标值超过预设标准值,则根据所述聚类簇对应的兴趣点的名称和地址坐标进行兴趣点信息更新。
在一种可能的实施方式中,所述存在性确定模块被配置为:
针对每个聚类簇,获取所述聚类簇内订单地址信息的数量信息;
获取所述聚类簇对应的兴趣点的名称与预存的WIFI的名称信息之间的相似度信息;
获取所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息;
根据所述数量信息、相似度信息以及定位信息中的至少一个,确定所述聚类簇对应的兴趣点的存在性指标值。
本装置实施方式中提及的技术术语和技术特征相同或相似,对于本装置中涉及的技术术语和技术特征的解释和说明可参考上述方法实施方式的解释的说明,此处不再赘述。
本公开还公开了一种电子设备,图4示出根据本公开的实施例的电子设备的结构框图。
如图4所示,所述电子设备400包括存储器401和处理器402,其中,存储器401用于存储一条或多条计算机指令,其中,所述一条或多条计算机指令被所述处理器402执行以实现根据本公开的实施例的方法。
图5示出适于用来实现根据本公开实施例的方法的计算机***的结构示意图。
如图5所示,计算机***500包括处理单元501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行上述实施例中的各种处理。在RAM 503中,还存储有计算机***500操作所需的各种程序和数据。处理单元501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。
以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。其中,所述处理单元501可实现为CPU、GPU、TPU、FPGA、NPU等处理单元。
特别地,根据本公开的实施例,上文描述的方法可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括计算机指令,该计算机指令被处理器执行时实现上文所述的方法步骤。在这样的实施例中,该计算机程序产品可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。
附图中的流程图和框图,图示了按照本公开各种实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元或模块可以通过软件的方式实现,也可以通过可编程硬件的方式来实现。所描述的单元或模块也可以设置在处理器中,这些单元或模块的名称在某种情况下并不构成对该单元或模块本身的限定。
作为另一方面,本公开还提供了一种计算机可读存储介质,该计算机可读存储介质可以是上述实施例中电子设备或计算机***中所包含的计算机可读存储介质;也可以是单独存在,未装配入设备中的计算机可读存储介质。计算机可读存储介质存储有一个或者一个以上程序,所述程序被一个或者一个以上的处理器用来执行描述于本公开的方法。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (12)
1.一种兴趣点信息的获取方法,包括:
获取多个订单地址信息,其中,所述订单地址信息包括名称信息和位置信息;
根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类处理,得到至少一个聚类簇,每个聚类簇中包含至少两个订单地址信息,每个聚类簇对应一个兴趣点;
针对每个聚类簇,从所述聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称;
根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标。
2.根据权利要求1所述的方法,其中,所述根据所述订单地址信息中的名称信息和位置信息,对所述多个订单地址信息进行聚类处理,得到至少一个聚类簇,包括:
根据所述订单地址信息中的名称信息和位置信息,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇,每个初始聚类簇中包含多个候选信息,每个候选信息为所述多个订单地址信息中的一个;
获取所述候选信息对应的多维度特征信息,所述多维度特征信息包括所述候选信息对应的文本特征、用户位置特征和位置坐标中的至少一个;
根据所述候选信息对应的多维度特征信息,使用第二聚类算法对所述至少一个初始聚类簇进行聚类簇拆分和合并,得到至少一个聚类簇。
3.根据权利要求2所述的方法,其中,所述根据所述订单地址信息中的名称信息和位置信息,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇,包括:
根据所述多个订单地址信息的名称信息和位置信息,确定所述多个订单地址信息之间的名称相似度和位置相似度;
基于各订单地址信息之间的名称相似度和位置相似度,使用第一聚类算法对所述多个订单地址信息进行初始聚类,得到至少一个初始聚类簇。
4.根据权利要求2所述的方法,其中,所述获取所述候选信息对应的多维度特征信息包括以下至少一个步骤:
使用第一特征提取模型从所述候选信息中提取所述候选信息对应的文本特征;
获取所述候选信息对应的用户在历史时间段内的定位信息,并使用第二特征提取模型从所述定位信息中提取所述候选信息对应的用户位置特征;
根据所述候选信息中的位置信息确定所述候选信息对应的位置坐标。
5.根据权利要求2所述的方法,其中,所述根据所述候选信息对应的多维度特征信息,使用第二聚类算法对所述至少一个初始聚类簇进行聚类簇拆分和合并,得到至少一个聚类簇,包括:
针对每个初始聚类簇,根据所述初始聚类簇中每个候选信息对应的多维度特征信息,确定所述初始聚类簇内各候选信息之间的相似度;
根据所述初始聚类簇内各候选信息之间的相似度,对所述初始聚类簇进行拆分,得到备用聚类簇;
从所述备用聚类簇中选取一个候选信息,并将选取的候选信息对应的多维度特征信息确定为所述备用聚类簇的信息;
根据所述备用聚类簇的信息,确定各备用聚类簇之间的相似度;
根据所述各备用聚类簇之间的相似度,对所述备用聚类簇进行合并,得到至少一个聚类簇。
6.根据权利要求1所述的方法,其中,所述从所述聚类簇内至少两个订单地址信息的名称信息中筛选一个满足兴趣点命名条件的名称信息作为所述聚类簇对应的兴趣点的名称,包括:
根据所述聚类簇内每个订单地址信息的名称信息,确定所述每个订单地址信息的名称信息的命名质量指标,所述命名质量指标包括名称通顺度、名称困惑度和名称完整度中的至少一个;
根据所述每个订单地址信息的名称信息的命名质量指标,对所述聚类簇内至少两个订单地址信息的名称信息进行排序,并选择排序第一的名称信息作为所述聚类簇对应的兴趣点的名称。
7.根据权利要求1所述的方法,其中,所述根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标,包括:
根据所述聚类簇内至少两个订单地址信息中的位置信息,确定所述聚类簇对应的兴趣点的地址范围;
根据所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息,以及所述地址范围,确定所述聚类簇对应的兴趣点的地址坐标。
8.根据权利要求1所述的方法,其中,所述根据所述聚类簇内至少两个订单地址信息的位置信息,确定所述聚类簇对应的兴趣点的地址坐标,包括:
根据所述聚类簇内至少两个订单地址信息中的位置信息,确定所述聚类簇对应的地址范围;
根据所述地址范围内的移动热点WIFI的名称信息和定位信息,确定所述聚类簇对应的兴趣点的地址坐标。
9.根据权利要求2所述的方法,其中,所述方法还包括:
根据所述聚类簇内的至少两个订单地址信息,确定所述聚类簇对应的兴趣点的存在性指标值;
若所述聚类簇对应的兴趣点的存在性指标值超过预设标准值,则根据所述聚类簇对应的兴趣点的名称和地址坐标进行兴趣点信息更新。
10.根据权利要求9所述的方法,其中,所述根据所述聚类簇内的至少两个订单地址信息,确定所述聚类簇对应的兴趣点的存在性指标值,包括:
针对每个聚类簇,获取所述聚类簇内订单地址信息的数量信息;
获取所述聚类簇对应的兴趣点的名称与预存的WIFI的名称信息之间的相似度信息;
获取所述聚类簇内至少两个订单地址信息对应的用户在历史时间段内的定位信息;
根据所述数量信息、相似度信息以及定位信息中的至少一个,确定所述聚类簇对应的兴趣点的存在性指标值。
11.一种电子设备,包括存储器和处理器;其中,所述存储器用于存储一条或多条计算机指令,所述一条或多条计算机指令被所述处理器执行以实现权利要求1至10任一项所述的方法步骤。
12.一种计算机可读存储介质,其上存储有计算机指令,其中,该计算机指令被处理器执行时实现权利要求1至10任一项所述的方法步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211262586.XA CN115525841B (zh) | 2022-10-14 | 2022-10-14 | 兴趣点信息的获取方法、电子设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211262586.XA CN115525841B (zh) | 2022-10-14 | 2022-10-14 | 兴趣点信息的获取方法、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115525841A true CN115525841A (zh) | 2022-12-27 |
CN115525841B CN115525841B (zh) | 2024-02-02 |
Family
ID=84701527
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211262586.XA Active CN115525841B (zh) | 2022-10-14 | 2022-10-14 | 兴趣点信息的获取方法、电子设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115525841B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116842123A (zh) * | 2023-08-28 | 2023-10-03 | 北京高德云信科技有限公司 | 搬迁位置预测方法、地图更新方法、装置及设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110999331A (zh) * | 2017-08-04 | 2020-04-10 | 北京嘀嘀无限科技发展有限公司 | 一种命名接载位置的方法和*** |
WO2020093420A1 (en) * | 2018-11-09 | 2020-05-14 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for emergency order request identification |
CN111782741A (zh) * | 2020-06-04 | 2020-10-16 | 汉海信息技术(上海)有限公司 | 兴趣点挖掘方法、装置、电子设备及存储介质 |
CN111881377A (zh) * | 2020-08-05 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 位置兴趣点的处理方法及装置 |
CN113868351A (zh) * | 2021-09-09 | 2021-12-31 | 同盾科技有限公司 | 一种地址聚类方法、装置、电子设备及存储介质 |
CN114595266A (zh) * | 2022-01-26 | 2022-06-07 | 高德软件有限公司 | 到达点挖掘方法、电子设备及存储介质 |
-
2022
- 2022-10-14 CN CN202211262586.XA patent/CN115525841B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110999331A (zh) * | 2017-08-04 | 2020-04-10 | 北京嘀嘀无限科技发展有限公司 | 一种命名接载位置的方法和*** |
WO2020093420A1 (en) * | 2018-11-09 | 2020-05-14 | Beijing Didi Infinity Technology And Development Co., Ltd. | Systems and methods for emergency order request identification |
CN111782741A (zh) * | 2020-06-04 | 2020-10-16 | 汉海信息技术(上海)有限公司 | 兴趣点挖掘方法、装置、电子设备及存储介质 |
CN111881377A (zh) * | 2020-08-05 | 2020-11-03 | 腾讯科技(深圳)有限公司 | 位置兴趣点的处理方法及装置 |
CN113868351A (zh) * | 2021-09-09 | 2021-12-31 | 同盾科技有限公司 | 一种地址聚类方法、装置、电子设备及存储介质 |
CN114595266A (zh) * | 2022-01-26 | 2022-06-07 | 高德软件有限公司 | 到达点挖掘方法、电子设备及存储介质 |
Non-Patent Citations (2)
Title |
---|
KUO, CL 等: "Efficient Method for POI/ROI Discovery Using Flickr Geotagged Photos", 《ISPRS INTERNATIONAL JOURNAL OF GEO-INFORMATION》, pages 1 - 19 * |
马理博;秦小麟;: "话题-位置-类别感知的兴趣点推荐", 计算机科学, no. 09, pages 87 - 93 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116842123A (zh) * | 2023-08-28 | 2023-10-03 | 北京高德云信科技有限公司 | 搬迁位置预测方法、地图更新方法、装置及设备 |
CN116842123B (zh) * | 2023-08-28 | 2023-11-28 | 北京高德云信科技有限公司 | 搬迁位置预测方法、地图更新方法、装置及设备 |
Also Published As
Publication number | Publication date |
---|---|
CN115525841B (zh) | 2024-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11118921B2 (en) | Vehicle routing guidance to an authoritative location for a point of interest | |
CN108268573B (zh) | 用于推送信息的方法和装置 | |
CN108182253B (zh) | 用于生成信息的方法和装置 | |
CN109376205B (zh) | 挖掘地址兴趣点关系的方法、装置、设备及存储介质 | |
CN110309433B (zh) | 一种数据处理方法、装置及服务器 | |
CN110968654A (zh) | 文本数据的地址类目确定方法、设备以及*** | |
CN112861972B (zh) | 一种展业区域的选址方法、装置、计算机设备和介质 | |
JP6725718B2 (ja) | 位置基盤情報探索方法およびコンピュータ装置 | |
CN111931077B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
CN113360792B (zh) | 信息推荐方法、装置、电子设备以及存储介质 | |
CN111782741A (zh) | 兴趣点挖掘方法、装置、电子设备及存储介质 | |
CN112836128A (zh) | 信息推荐方法、装置、设备和存储介质 | |
CN115525841B (zh) | 兴趣点信息的获取方法、电子设备及存储介质 | |
CN110083677B (zh) | 联系人的搜索方法、装置、设备及存储介质 | |
CN114329240A (zh) | 选址特征筛选方法、装置、电子设备及存储介质 | |
CN110674208A (zh) | 用于确定用户的职住地信息的方法和装置 | |
CN117079148B (zh) | 城市功能区的识别方法、装置、设备和介质 | |
CN114036414A (zh) | 兴趣点的处理方法、装置、电子设备、介质及程序产品 | |
CN110781283B (zh) | 连锁品牌词库生成方法、装置以及电子设备 | |
CN115168542A (zh) | 兴趣点搜索方法、***、电子设备及程序产品 | |
CN113537671B (zh) | 分拣时效预测方法及装置、存储介质、电子设备 | |
CN113761381A (zh) | 兴趣点推荐的方法、装置、设备以及存储介质 | |
CN111797183A (zh) | 挖掘信息点的道路属性的方法、装置及电子设备 | |
CN116541474B (zh) | 对象获取方法、装置、电子设备及存储介质 | |
CN113905070B (zh) | 一种服务提供方法和*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |