CN111797183A - 挖掘信息点的道路属性的方法、装置及电子设备 - Google Patents
挖掘信息点的道路属性的方法、装置及电子设备 Download PDFInfo
- Publication number
- CN111797183A CN111797183A CN202010475445.0A CN202010475445A CN111797183A CN 111797183 A CN111797183 A CN 111797183A CN 202010475445 A CN202010475445 A CN 202010475445A CN 111797183 A CN111797183 A CN 111797183A
- Authority
- CN
- China
- Prior art keywords
- road
- information point
- target information
- determining
- feature
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000005065 mining Methods 0.000 title claims abstract description 17
- 238000012545 processing Methods 0.000 claims description 32
- 238000012549 training Methods 0.000 claims description 22
- 238000010801 machine learning Methods 0.000 claims description 17
- 230000009286 beneficial effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 13
- 230000002776 aggregation Effects 0.000 description 10
- 238000004220 aggregation Methods 0.000 description 10
- 238000003860 storage Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 7
- 238000004590 computer program Methods 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 108010015046 cell aggregation factors Proteins 0.000 description 2
- 238000003066 decision tree Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001902 propagating effect Effects 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 239000013598 vector Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/29—Geographical information databases
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Remote Sensing (AREA)
- Navigation (AREA)
Abstract
本公开涉及挖掘信息点的道路属性的方法、装置及电子设备。该方法包括:获取以目标信息点为中心的预设范围内的至少一条道路,其中,道路包括至少一个道路单元;根据目标信息点和道路单元之间的空间相似特征、语义相似特征和距离特征,确定目标信息点和道路单元之间的第一关联度评分;根据目标信息点和道路单元之间的第一关联度评分,确定目标信息点和道路之间的第二关联度评分;根据第二关联度评分,确定目标信息点的道路属性。该方法能够对道路属性做出合理量化,有利于提升地图搜索结果的质量。
Description
技术领域
本公开涉及信息处理技术领域,更具体地,涉及一种挖掘信息点的道路属性的方法、一种挖掘信息点的道路属性的装置以及一种电子设备。
背景技术
POI是“PointofInformation”的缩写,中文可以翻译为“信息点”。在地理信息***中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。在地图检索中,当用户输入搜索词后,可以查找该搜索词对应的POI并推荐给用户,从而方便用户选择所需的POI。
现有技术中,POI相关信息中通常不包含道路属性,因此在搜索词为道路名的情况下,会出现向用户推荐不相干POI的情况,使得推荐结果不合理,影响了用户的使用体验。
因此,有必要提出一种对信息点的道路属性进行挖掘的新的技术方案。
发明内容
本公开的一个目的是提供一种对信息点的道路属性进行挖掘的新的技术方案。
根据本发明的第一方面,提供了一种挖掘信息点的道路属性的方法,包括:
获取以目标信息点为中心的预设范围内的至少一条道路,其中,所述道路包括至少一个道路单元;
根据所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征,确定所述目标信息点和所述道路单元之间的第一关联度评分;
根据所述目标信息点和所述道路单元之间的第一关联度评分,确定所述目标信息点和所述道路之间的第二关联度评分;
根据所述第二关联度评分,确定所述目标信息点的道路属性。
可选地,所述方法还包括:根据地图信息点数据、地图道路数据、地图搜索日志数据中的至少一项,确定至少一个道路标签;
在所述确定所述目标信息点和所述道路之间的第二关联度评分后,所述方法还包括:
计算所述道路标签和所述道路的道路名称之间的语义相似度;
根据所述语义相似度和所述第二关联度评分,确定所述目标信息点和所述道路标签之间的第三关联度评分。
可选地,所述方法还包括:
获取所述道路标签与多个信息点中每个信息点之间的第三关联度评分;
接收终端设备发送的搜索词;
检测所述搜索词是否与所述道路标签一致;
在所述搜索词与所述道路标签一致的情况下,根据所述道路标签与多个信息点中每个信息点之间的第三关联度评分,从所述多个信息点中确定至少一个推荐信息点;
将所述推荐信息点发送至所述终端设备。
可选地,所述空间相似特征是通过以下步骤获取的:
确定所述目标信息点对应的信息点位置集合;
确定所述道路单元对应的道路节点位置集合;
计算所述信息点位置集合和所述道路节点位置集合之间的豪斯多夫距离,得到所述空间相似特征。
可选地,所述确定所述目标信息点对应的信息点位置集合,包括:
对多个信息点位置进行聚类处理,得到至少一个所述信息点位置集合。
可选地,所述确定所述道路单元对应的道路节点集合,包括:
按照预设的距离间隔,在所述道路单元的已有节点之间增加插值节点;
根据所述已有节点和所述插值节点,得到所述道路节点集合。
可选地,所述语义相似特征通过以下方式获取:
计算所述目标信息点所属街道的名称和所述道路单元的名称之间的第一语义相似度;
计算所述目标信息点所在地址和所述道路单元的名称之间的第二语义相似度;
根据所述第一语义相似度和所述第二语义相似度中的至少一项,确定所述语义相似特征。
可选地,所述根据所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征,确定所述目标信息点和所述道路单元之间的第一关联度评分,包括:
基于预先训练的机器学习模型对所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征进行处理,得到所述第一关联度评分。
可选地,所述机器学习模型通过以下方式获取:
获取训练样本,其中,每个所述训练样本包括一个信息点与一个道路单元之间的空间相似特征、语义相似特征和距离特征,以及表示所述训练样本中的信息点和道路单元是否存在关联关系的标签;
基于所述训练样本进行机器学习训练,得到所述机器学习模型。
根据本发明的第二方面,提供了一种挖掘信息点的道路属性的装置,包括:
获取模块,用于获取以目标信息点为中心的预设范围内的至少一条道路,其中,所述道路包括至少一个道路单元;
第一处理模块,用于根据所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征,确定所述目标信息点和所述道路单元之间的第一关联度评分;
第二处理模块,用于根据所述目标信息点和所述道路单元之间的第一关联度评分,确定所述目标信息点和所述道路之间的第二关联度评分;
第三处理模块,用于根据所述第二关联度评分,确定所述目标信息点的道路属性。
根据本发明的第三方面,提供了一种电子设备,包括:
存储器,用于存储可执行命令;
处理器,用于在所述可执行命令的控制下,实现如本发明第一方面所述的方法。
本实施例中挖掘信息点的道路属性的方法,根据空间相似特征、语义相似特征和距离特征,确定信息点和道路单元之间的第一关联度评分,进而确定信息点和道路之间的第二关联度评分,基于第二关联度评分确定信息点的道路属性,综合空间相似特征、语义相似特征和距离特征来挖掘信息点的道路属性,考虑了信息点聚集因素的影响并且能够对道路属性做出合理量化,有利于提升地图搜索结果的质量,进而改善用户的使用体验。
通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。
附图说明
被结合在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且连同其说明一起用于解释本公开的原理。
图1是可用于实现本公开实施例的电子设备的示意图。
图2是根据本公开实施例的挖掘信息点的道路属性的方法的流程图。
图3是根据本公开实施例的聚类结果的示意图。
具体实施方式
现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。
以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。
对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,技术、方法和设备应当被视为说明书的一部分。
在这里示出和讨论的所有例子中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它例子可以具有不同的值。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。
<硬件配置>
图1示出了可用于实现本公开的实施例的电子设备的硬件配置。
参见图1,电子设备1000包括处理器1100、存储器1200、接口装置1300、通信装置1400、显示装置1500和输入装置1600。处理器1100例如可以是中央处理器CPU、微控制单元MCU等。存储器1200例如包括ROM(只读存储器)、RAM(随机存取存储器)、诸如硬盘的非易失性存储器等。接口装置1300例如包括USB接口、串行接口等。通信装置1400例如是有线网卡或无线网卡。显示装置1500例如是液晶显示屏。输入装置1600例如包括触摸屏、键盘、鼠标、麦克风等。
应用于本说明书的实施例中,电子设备1000的存储器1200用于存储指令,该指令用于控制处理器1100进行操作以支持实现根据本说明书任意实施例的方法。本领域技术人员可以根据本说明书所公开方案设计指令。指令如何控制处理器进行操作,这是本领域公知,故在此不再详细描述。
本领域技术人员应当理解,尽管在图1中示出了电子设备1000的多个装置,但是,本说明书实施例的电子设备1000可以仅涉及其中的部分装置,例如,只涉及处理器1100、存储器1200和通信装置1400。
图1所示的电子设备1000例如是用于提供地图服务的服务器。
图1所示的硬件配置仅是解释性的,并且决不是为了要限制本公开、其应用或用途。
<方法实施例>
本实施例提供了一种挖掘信息点的道路属性的方法,例如由图1所示的电子设备1000实施。
本实施例中,信息点的道路属性例如与该信息点具有一定关联性的道路的信息。信息点的道路属性可用于确定地图搜索结果,即在搜索词与信息点的关联道路相同或相似的情况下,向用户推荐该信息点作为搜索结果。
本实施例中,道路是指供各种无轨车辆和行人通行的基础设施,包括公路、城市道路、乡村道路等。本实施例中的道路包括至少一个道路单元。上述道路单元例如是导航***中的“link(线)”。在导航***中,道路模型通常以“link”作为基本单位。“link”是指一段道路,一条实际道路在地图数据中体现为一个或者多个“link”,例如,同一条道路中不同方向的两个车道在地图中体现为两个不同方向的“link”。“link”进一步包括“node(节点)”,可以分为端点、交叉点、形状点等。
如图2所示,该方法包括以下步骤S1100-S1400。
在步骤S1100中,获取以目标信息点为中心的预设范围内的至少一条道路,其中,道路包括至少一个道路单元。
本实施例中,可以通过地图中的信息点数据获取目标信息点的有关信息,例如信息点唯一标识、信息点名称、信息点经纬度坐标、信息点所属街道、信息点地址等。
本实施例中,可以通过路网数据获取道路的有关信息,例如道路名称、道路单元经纬度坐标、道路节点经纬度坐标等。
本实施例中,目标信息点和某个道路之间的距离,例如是该道路包括的道路单元和目标信息点之间距离的平均值。其中,信息点和道路单元之间的距离,可以是该信息点到该道路单元(视为直线或者曲线)之间的距离,可以是该信息点到该道路单元每个节点距离中的最小值,可以是该信息点到该道路单元每个节点距离中的最大值,还可以是该信息点到该道路单元的每个节点距离的平均值。采用统一方式计算信息点和道路单元之间的距离即可,对具体计算方式不做限定。在信息点属于某个聚集区的情况下,还可以将该聚集区中心点到该道路单元的距离作为信息点和道路单元之间的距离。
本实施例中,以目标信息点为中心的预设范围内道路进行后续处理,可以去除与信息点和距离较远的道路,避免进行不必要的数据处理。
在一个例子中,上述预设范围例如是以目标信息点为中心、半径为2km的圆形区域内,即,在某个道路与目标信息点的距离小于2km情况下,通过后续步骤计算该道路与目标信息点之间的关联度评分。
在步骤S1200中,根据目标信息点和道路单元之间的空间相似特征、语义相似特征和距离特征,确定目标信息点和道路单元之间的第一关联度评分。
空间相似特征,是指目标信息点所在聚集区的信息点位置集合(记为X集合)与道路单元对应的道路节点位置集合(记为Y集合)之间的相似程度。上述X集合和Y集合之间的相似程度可以通过豪斯多夫(Hausdorff)距离来衡量。
Hausdorff距离是描述两组点集之间相似程度的一种量度,它是两个点集之间距离的一种定义形式。假设有两组集合A={a1,…,ap},B={b1,…,bq},则这两个点集合之间的Hausdorff距离定义为:
H(A,B)=max(h(A,B),h(B,A)) 式(1)
h(A,B)=max(a∈A)min(b∈B)‖a-b‖ 式(2)
h(B,A)=max(b∈B)min(a∈A)‖b-a‖ 式(3)
其中,‖·‖是A点集和B点集间的距离范式。式(1)称为双向Hausdorff距离,是Hausdorff距离的最基本形式。式(2)中的h(A,B)和式(3)中的h(B,A)分别称为从A集合到B集合和从B集合到A集合的单向Hausdorff距离,即h(A,B)实际上首先对点集A中的每个点ai到距离此点ai最近的B集合中点bj之间的距离‖ai-bj‖进行排序,然后取该距离中的最大值作为h(A,B)的值。h(B,A)同理可得。由式(1)知,双向Hausdorff距离H(A,B)是单向距离h(A,B)和h(B,A)两者中的较大者,它度量了两个点集间的最大不匹配程度。
除了豪斯多夫距离外,还可以采用其他方式度量X集合和Y集合之间的相似程度,本实施例对此不作限定。
在一个例子中,空间相似特征是通过以下步骤获取的:确定目标信息点对应的信息点位置集合;确定道路单元对应的道路节点位置集合;计算信息点位置集合和道路节点位置集合之间的豪斯多夫距离,得到空间相似特征。
本实施例中,目标信息点对应的信息点位置集合,是指目标信息点所属聚集区中全部信息点的位置形成的集合。
本实施例中,聚集区是指在空间分布上较为聚集多个信息点所形成的信息点集合。将聚集区视为一个整体来分析其道路属性的特征。
在上述例子中,确定目标信息点对应的信息点位置集合,包括:对多个信息点位置进行聚类处理,得到至少一个信息点位置集合。
例如,采用DBSCAN聚类算法对POI点采用短距离低密度的参数设置进行聚类处理,聚类结果中每个团簇为一个POI聚集区,该POI聚集区中全部信息点位置的集合即为信息点位置集合。此外,聚类结果中还包括噪声点即POI孤立点。
图3示出了根据本公开实施例的聚类结果的示意图,其中,L为一个道路单元,a1和a2为聚类结果中的两个团簇,即两个聚集区,每个聚集区内包括多个信息点,a3为聚类结果中的噪点,即孤立信息点。在计算空间相似特征时,将聚集区a1、a2分别作为整体来看待,将孤立点a3单独处理。
在上述例子中,获取道路单元对应的道路节点集合的过程例如是:按照预设的距离间隔,在道路单元的已有节点之间增加插值节点;根据已有节点和插值节点,得到道路节点集合。其中,道路单元的已有节点是指路网数据中现有的道路节点,包括端点、形状点等。为了提高处理精度,本实施例在已有节点之间增加了插值点。例如,首先遍历每个已有节点,计算第i个节点及第i+1个节点之间的距离distance(i,i+1)并计算n=distance(i,i+1)/5,其中“5”代表每隔5米增加一个插值点。其次,对n进行四舍五入处理得到m,在第i个点及第i+1个点之间等距***m个点。最后,将已有节点和插值点共同作为道路节点集合中的元素。
目标信息点和道路单元之间的语义相似特征,是指信息点和道路单元在名称语义上的相似程度。
在一个例子中,获取语义相似特征,包括:计算信息点所属街道的名称与道路单元的名称之间的第一语义相似度;计算信息点所在地址的名称与道路单元的名称之间的第二语义相似度;根据第一语义相似度、第二语义相似度中的至少一项,得到语义相似特征。其中,信息点所属街道,是指信息点所在地的街道地区。信息点的地址,例如是信息点的通讯地址。
例如,将信息点所属街道的名称与道路单元的名称之间的第一语义相似度记为b1,将信息点所在地址的名称与道路单元的名称之间的第二语义相似度记为b2,可取二者中的较大值作为语义相似特征的数值。
上述语义相似度例如通过词移距离(Word Mover's Distance,WMD)来度量。词移距离是在词向量的基础上发展而来的用来衡量文档相似性的度量,是一种计算词句之间距离的方法,距离越小,相似度越高。
目标信息点和道路单元之间的距离特征,是指信息点和道路单元在空间上的远近程度。
在一个例子中,获取目标信息点和道路单元之间的距离特征,包括:计算信息点和道路单元之间的最近距离,得到距离特征。例如,将道路单元向某一方向平行扩张至刚好覆盖信息点,此时的扩张距离即为信息点和道路单元之间的距离特征。
在一个例子中,步骤S1200进一步包括:基于预先训练的机器学习模型对目标信息点和道路单元之间的空间相似特征、语义相似特征和距离特征进行处理,得到第一关联度评分。
上述机器学习模型用于获取第一关联度评分,其输入为各个特征,输出为第一关联度评分。
上述识别模型例如通过以下方式获取:获取训练样本,其中,每个训练样本包括一个信息点与一个道路单元之间的空间相似特征、语义相似特征和距离特征,以及表示训练样本中的信息点和道路单元是否存在关联关系的标签;基于训练样本进行机器学习训练,得到机器学习模型。其中,信息点和道路单元存在关联关系是指:在某一条搜索日志中,用户的搜索词与该道路单元的名称相同或相似,并且用户点击了该信息点作为搜索结果。
上述机器学习训练过程例如是,通过GBDT(GradientBoostingDecisionTree,梯度提升迭代决策树)算法训练有监督学习模型。梯度提升算法是一种用于回归、分类和排序任务的机器学习技术,属于提升算法族的一部分,通过集成多个弱学习器(决策树),来构建最终的预测模型。
在上述例子中,将机器模型中表示信息点和道路单元存在关联关系的概率值作为第一关联度评分。
在步骤S1300中,根据目标信息点和道路单元之间的第一关联度评分,确定目标信息点和道路之间的第二关联度评分。
作为一个例子,某个道路为way(其名称为wayname),它包括两个道路单元link1和link2。某个信息点为poi。那么,可以根据poi-link1的第一关联度评分和poi-link2的第一关联度评分来计算poi-way(或者记为poi-wayname)的第二关联度评分,例如计算poi-link1的第一关联度评分和poi-link2的第一关联度评分的平均值,作为poi-wayname的第二关联度评分。
在步骤S1400中,根据第二关联度评分,确定目标信息点的道路属性。
本实施例中,如果第二关联度评分达到一定程度,例如第二关联度评分大于某个预设阈值,就可以将道路的名称+第二关联度评分,作为目标信息点的道路属性
本实施例中挖掘信息点的道路属性的方法,根据空间相似特征、语义相似特征和距离特征,确定信息点和道路单元之间的第一关联度评分,进而确定信息点和道路之间的第二关联度评分,基于第二关联度评分确定信息点的道路属性,综合空间相似特征、语义相似特征和距离特征来挖掘信息点的道路属性,考虑了信息点聚集因素的影响并且能够对道路属性做出合理量化,有利于提升地图搜索结果的质量,进而改善用户的使用体验。
在一个例子中,在步骤S1400之后,还包括:根根据地图信息点数据、地图道路数据、地图搜索日志数据中的至少一项,确定至少一个道路标签;在确定目标信息点和道路之间的第二关联度评分后,计算道路标签和道路的道路名称之间的语义相似度;根据语义相似度和第二关联度评分,确定目标信息点和道路标签之间的第三关联度评分。
上述道路标签是指可能作为搜索词的、与道路相关的标签,可以通过从相关数据中筛选形如“xx路”、“xx道”的关键词的方式来获取。
上述例子中,获取第三关联度评分的过程例如是:将根据第二关联度评分与道路标签和道路名称的语义相似度相乘,得到的乘积作为第三关联度评分。其中,道路标签和道路名称的语义相似度也可以通过词移距离来度量。
例如,前文描述的poi-wayname的关联度评分为p1,某个道路标签waytag与道路名称wayname的关联度评分为p2,则该信息点和该道路标签(poi-waytag)之间的第三关联度评分p3=p1×p2。
通过上述方式,将道路属性的挖掘结果处理为更显性的形式,即第三关联度评分,更适合应用在搜索场景中。
在一个例子中,将第三关联度评分应用于搜索场景中,包括以下步骤:获取道路标签与多个信息点中每个信息点之间的第三关联度评分;接收终端设备发送的搜索词;检测搜索词是否与道路标签一致;在搜索词与道路标签一致的情况下,根据道路标签与多个信息点中每个信息点之间的第三关联度评分,从多个信息点中确定至少一个推荐信息点;将推荐信息点发送至终端设备。
作为一个例子,用户输入的搜索词恰好为已有的道路标签waytag1,该道路标签waytag1对应于多个兴趣点,例如为poi1-waytag1、poi2-waytag1、poi3-waytag1,兴趣点和道路标签之间的第三关联度评分依次为p1、p2和p3且p2>p1>p3,则按照第三关联度评分由高到低的顺序,确定推荐列表中信息点的先后顺序依次为poi2、poi1和poi3。按照上述方式将信息点推荐给用户,处理速度快、推荐结果准确,还可以保证与搜索词关联度高的信息点排序靠前,有利于提高用户的使用体验。
<装置实施例>
本实施例提供一种挖掘信息点的道路属性的装置,包括获取模块、第一处理模块、第二处理模块和第三处理模块。
获取模块,用于获取以目标信息点为中心的预设范围内的至少一条道路,其中,道路包括至少一个道路单元;
第一处理模块,用于根据目标信息点和道路单元之间的空间相似特征、语义相似特征和距离特征,确定目标信息点和道路单元之间的第一关联度评分;
第二处理模块,用于根据目标信息点和道路单元之间的第一关联度评分,确定目标信息点和道路之间的第二关联度评分;
第三处理模块,用于根据第二关联度评分,确定目标信息点的道路属性。
在一个例子中,该装置还包括道路标签获取模块和第四处理模块。道路标签获取模块用于:根据地图信息点数据、地图道路数据、地图搜索日志数据中的至少一项,确定至少一个道路标签。第四处理模块用于:在确定目标信息点和道路之间的第二关联度评分后,计算道路标签和道路的道路名称之间的语义相似度;根据语义相似度和第二关联度评分,确定目标信息点和道路标签之间的第三关联度评分。
在一个例子中,该装置还包括推荐模块,用于:获取道路标签与多个信息点中每个信息点之间的第三关联度评分;接收终端设备发送的搜索词;检测搜索词是否与道路标签一致;在搜索词与道路标签一致的情况下,根据道路标签与多个信息点中每个信息点之间的第三关联度评分,从多个信息点中确定至少一个推荐信息点;将推荐信息点发送至终端设备。
在一个例子中,该装置还包括空间相似特征获取模块,用于:确定目标信息点对应的信息点位置集合;确定道路单元对应的道路节点位置集合;计算信息点位置集合和道路节点位置集合之间的豪斯多夫距离,得到空间相似特征。
在一个例子中,空间相似特征获取模块进一步用于:对多个信息点位置进行聚类处理,得到至少一个信息点位置集合。
在一个例子中,空间相似特征获取模块进一步用于:按照预设的距离间隔,在道路单元的已有节点之间增加插值节点;根据已有节点和插值节点,得到道路节点集合。
在一个例子中,该装置还包括语义相似特征获取模块,用于:计算目标信息点所属街道的名称和道路单元的名称之间的第一语义相似度;计算目标信息点所在地址和道路单元的名称之间的第二语义相似度;根据第一语义相似度和第二语义相似度中的至少一项,确定语义相似特征。
在一个例子中,第一处理模块进一步用于:基于预先训练的机器学习模型对目标信息点和道路单元之间的空间相似特征、语义相似特征和距离特征进行处理,得到第一关联度评分。
在一个例子中,该装置还包括模型训练模块,用于:获取训练样本,其中,每个训练样本包括一个信息点与一个道路单元之间的空间相似特征、语义相似特征和距离特征,以及表示训练样本中的信息点和道路单元是否存在关联关系的标签;基于训练样本进行机器学习训练,得到机器学习模型。
<电子设备实施例>
本实施例一种电子设备,包括存储器和处理器。存储器,用于存储可执行命令。处理器,用于在可执行命令的控制下,实现如本发明方法实施例描述的方法。
本公开可以是***、方法和/或计算机程序产品。计算机程序产品可以包括计算机可读存储介质,其上载有用于使处理器实现本公开的各个方面的计算机可读程序指令。
计算机可读存储介质可以是可以保持和存储由指令执行设备使用的指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤电缆的光脉冲)、或者通过电线传输的电信号。
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
用于执行本公开操作的计算机程序指令可以是汇编指令、指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计算机可读程序指令,从而实现本公开的各个方面。
这里参照根据本公开实施例的方法、装置(***)和计算机程序产品的流程图和/或框图描述了本公开的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
附图中的流程图和框图显示了根据本公开的多个实施例的***、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的***来实现,或者可以用专用硬件与计算机指令的组合来实现。对于本领域技术人员来说公知的是,通过硬件方式实现、通过软件方式实现以及通过软件和硬件结合的方式实现都是等价的。
以上已经描述了本公开的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。本公开的范围由所附权利要求来限定。
Claims (11)
1.一种挖掘信息点的道路属性的方法,包括:
获取以目标信息点为中心的预设范围内的至少一条道路,其中,所述道路包括至少一个道路单元;
根据所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征,确定所述目标信息点和所述道路单元之间的第一关联度评分;
根据所述目标信息点和所述道路单元之间的第一关联度评分,确定所述目标信息点和所述道路之间的第二关联度评分;
根据所述第二关联度评分,确定所述目标信息点的道路属性。
2.根据权利要求1所述的方法,其中,所述方法还包括:根据地图信息点数据、地图道路数据、地图搜索日志数据中的至少一项,确定至少一个道路标签;
在所述确定所述目标信息点和所述道路之间的第二关联度评分后,所述方法还包括:
计算所述道路标签和所述道路的道路名称之间的语义相似度;
根据所述语义相似度和所述第二关联度评分,确定所述目标信息点和所述道路标签之间的第三关联度评分。
3.根据权利要求2所述的方法,其中,所述方法还包括:
获取所述道路标签与多个信息点中每个信息点之间的第三关联度评分;
接收终端设备发送的搜索词;
检测所述搜索词是否与所述道路标签一致;
在所述搜索词与所述道路标签一致的情况下,根据所述道路标签与多个信息点中每个信息点之间的第三关联度评分,从所述多个信息点中确定至少一个推荐信息点;
将所述推荐信息点发送至所述终端设备。
4.根据权利要求1所述的方法,其中,所述空间相似特征是通过以下步骤获取的:
确定所述目标信息点对应的信息点位置集合;
确定所述道路单元对应的道路节点位置集合;
计算所述信息点位置集合和所述道路节点位置集合之间的豪斯多夫距离,得到所述空间相似特征。
5.根据权利要求4所述的方法,其中,所述确定所述目标信息点对应的信息点位置集合,包括:
对多个信息点位置进行聚类处理,得到至少一个所述信息点位置集合。
6.根据权利要求4所述的方法,其中,所述确定所述道路单元对应的道路节点集合,包括:
按照预设的距离间隔,在所述道路单元的已有节点之间增加插值节点;
根据所述已有节点和所述插值节点,得到所述道路节点集合。
7.根据权利要求1所述的方法,其中,所述语义相似特征通过以下方式获取:
计算所述目标信息点所属街道的名称和所述道路单元的名称之间的第一语义相似度;
计算所述目标信息点所在地址和所述道路单元的名称之间的第二语义相似度;
根据所述第一语义相似度和所述第二语义相似度中的至少一项,确定所述语义相似特征。
8.根据权利要求1所述的方法,其中,所述根据所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征,确定所述目标信息点和所述道路单元之间的第一关联度评分,包括:
基于预先训练的机器学习模型对所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征进行处理,得到所述第一关联度评分。
9.根据权利要求8所述的方法,其中,所述机器学习模型通过以下方式获取:
获取训练样本,其中,每个所述训练样本包括一个信息点与一个道路单元之间的空间相似特征、语义相似特征和距离特征,以及表示所述训练样本中的信息点和道路单元是否存在关联关系的标签;
基于所述训练样本进行机器学习训练,得到所述机器学习模型。
10.一种挖掘信息点的道路属性的装置,包括:
获取模块,用于获取以目标信息点为中心的预设范围内的至少一条道路,其中,所述道路包括至少一个道路单元;
第一处理模块,用于根据所述目标信息点和所述道路单元之间的空间相似特征、语义相似特征和距离特征,确定所述目标信息点和所述道路单元之间的第一关联度评分;
第二处理模块,用于根据所述目标信息点和所述道路单元之间的第一关联度评分,确定所述目标信息点和所述道路之间的第二关联度评分;
第三处理模块,用于根据所述第二关联度评分,确定所述目标信息点的道路属性。
11.一种电子设备,包括:
存储器,用于存储可执行命令;
处理器,用于在所述可执行命令的控制下,实现如权利要求1-9中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475445.0A CN111797183A (zh) | 2020-05-29 | 2020-05-29 | 挖掘信息点的道路属性的方法、装置及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010475445.0A CN111797183A (zh) | 2020-05-29 | 2020-05-29 | 挖掘信息点的道路属性的方法、装置及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111797183A true CN111797183A (zh) | 2020-10-20 |
Family
ID=72806574
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010475445.0A Pending CN111797183A (zh) | 2020-05-29 | 2020-05-29 | 挖掘信息点的道路属性的方法、装置及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111797183A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559660A (zh) * | 2020-12-11 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 一种道路数据处理方法、装置、电子设备和存储介质 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5276785A (en) * | 1990-08-02 | 1994-01-04 | Xerox Corporation | Moving viewpoint with respect to a target in a three-dimensional workspace |
US20070050135A1 (en) * | 2005-08-24 | 2007-03-01 | Xanavi Informatics Corporation | Navigation apparatus and navigation processing method |
CN103884345A (zh) * | 2012-12-20 | 2014-06-25 | ***通信集团辽宁有限公司 | 兴趣点信息采集方法、显示方法、装置及*** |
CN104572902A (zh) * | 2014-12-26 | 2015-04-29 | 北京中交兴路车联网科技有限公司 | 一种信息点匹配的方法及装置 |
CN106484845A (zh) * | 2016-09-30 | 2017-03-08 | 北京百度网讯科技有限公司 | 基于电子地图的信息点区域确定方法及装置 |
CN106681996A (zh) * | 2015-11-05 | 2017-05-17 | 腾讯科技(深圳)有限公司 | 确定地理范围内兴趣区域、兴趣点的方法和装置 |
US20170278402A1 (en) * | 2016-03-25 | 2017-09-28 | Toyota Jidosha Kabushiki Kaisha | Understanding Road Scene Situation and Semantic Representation of Road Scene Situation for Reliable Sharing |
CN108304423A (zh) * | 2017-03-29 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种信息识别方法及装置 |
CN109145219A (zh) * | 2018-09-10 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 |
CN109636049A (zh) * | 2018-12-19 | 2019-04-16 | 浙江工业大学 | 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法 |
CN110309433A (zh) * | 2018-06-14 | 2019-10-08 | 腾讯大地通途(北京)科技有限公司 | 一种数据处理方法、装置及服务器 |
CN110992681A (zh) * | 2019-07-10 | 2020-04-10 | 当家移动绿色互联网技术集团有限公司 | 交通路网属性信息生成方法、装置、存储介质及电子设备 |
-
2020
- 2020-05-29 CN CN202010475445.0A patent/CN111797183A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5276785A (en) * | 1990-08-02 | 1994-01-04 | Xerox Corporation | Moving viewpoint with respect to a target in a three-dimensional workspace |
US20070050135A1 (en) * | 2005-08-24 | 2007-03-01 | Xanavi Informatics Corporation | Navigation apparatus and navigation processing method |
CN103884345A (zh) * | 2012-12-20 | 2014-06-25 | ***通信集团辽宁有限公司 | 兴趣点信息采集方法、显示方法、装置及*** |
CN104572902A (zh) * | 2014-12-26 | 2015-04-29 | 北京中交兴路车联网科技有限公司 | 一种信息点匹配的方法及装置 |
CN106681996A (zh) * | 2015-11-05 | 2017-05-17 | 腾讯科技(深圳)有限公司 | 确定地理范围内兴趣区域、兴趣点的方法和装置 |
US20170278402A1 (en) * | 2016-03-25 | 2017-09-28 | Toyota Jidosha Kabushiki Kaisha | Understanding Road Scene Situation and Semantic Representation of Road Scene Situation for Reliable Sharing |
CN106484845A (zh) * | 2016-09-30 | 2017-03-08 | 北京百度网讯科技有限公司 | 基于电子地图的信息点区域确定方法及装置 |
CN108304423A (zh) * | 2017-03-29 | 2018-07-20 | 腾讯科技(深圳)有限公司 | 一种信息识别方法及装置 |
CN110309433A (zh) * | 2018-06-14 | 2019-10-08 | 腾讯大地通途(北京)科技有限公司 | 一种数据处理方法、装置及服务器 |
CN109145219A (zh) * | 2018-09-10 | 2019-01-04 | 百度在线网络技术(北京)有限公司 | 基于互联网文本挖掘的兴趣点有效性判断方法和装置 |
CN109636049A (zh) * | 2018-12-19 | 2019-04-16 | 浙江工业大学 | 一种结合道路网络拓扑结构与语义关联的拥堵指数预测方法 |
CN110992681A (zh) * | 2019-07-10 | 2020-04-10 | 当家移动绿色互联网技术集团有限公司 | 交通路网属性信息生成方法、装置、存储介质及电子设备 |
Non-Patent Citations (2)
Title |
---|
单硕堂;陈廷伟;贾梦威;: "融合相对评分的个性化兴趣点推荐算法", 计算机应用与软件, no. 10, 12 October 2018 (2018-10-12) * |
韩军;范举;周立柱;: "一种语义增强的空间关键词搜索方法", 计算机研究与发展, no. 09, 15 September 2015 (2015-09-15), pages 1954 - 1964 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112559660A (zh) * | 2020-12-11 | 2021-03-26 | 腾讯科技(深圳)有限公司 | 一种道路数据处理方法、装置、电子设备和存储介质 |
CN112559660B (zh) * | 2020-12-11 | 2022-06-17 | 腾讯科技(深圳)有限公司 | 一种道路数据处理方法、装置、电子设备和存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11347782B2 (en) | Internet text mining-based method and apparatus for judging validity of point of interest | |
US20200326197A1 (en) | Method, apparatus, computer device and storage medium for determining poi alias | |
US11714832B2 (en) | Method, apparatus, and system for combining location data sources | |
CN111382212B (zh) | 关联地址获取方法、装置、电子设备及存储介质 | |
CN109508361B (zh) | 用于输出信息的方法和装置 | |
US11238111B2 (en) | Response generation | |
CN113837669A (zh) | 一种标签体系的评价指标构建方法和相关装置 | |
CN115982597A (zh) | 语义相似度模型训练方法及装置、语义匹配方法及装置 | |
CN110059172B (zh) | 基于自然语言理解的推荐答案的方法和装置 | |
CN113837268B (zh) | 确定轨迹点状态的方法、装置、设备和介质 | |
CN110674208B (zh) | 用于确定用户的职住地信息的方法和装置 | |
CN111797183A (zh) | 挖掘信息点的道路属性的方法、装置及电子设备 | |
CN111191107B (zh) | 使用标注模型召回兴趣点的***和方法 | |
JP2023027250A (ja) | 道路情報更新方法、装置、電子機器、記録媒体及びコンピュータプログラム | |
CN108733702B (zh) | 用户查询上下位关系提取的方法、装置、电子设备和介质 | |
CN113807102B (zh) | 建立语义表示模型的方法、装置、设备和计算机存储介质 | |
CN112381166B (zh) | 信息点识别方法、装置及电子设备 | |
CN112417260B (zh) | 本地化推荐方法、装置及存储介质 | |
CN116821327A (zh) | 文本数据处理方法、装置、设备、可读存储介质及产品 | |
CN110781283B (zh) | 连锁品牌词库生成方法、装置以及电子设备 | |
CN115129885A (zh) | 实体链指方法、装置、设备及存储介质 | |
CN114297235A (zh) | 风险地址识别方法、***及电子设备 | |
CN113515687A (zh) | 物流信息的获取方法和装置 | |
CN112861023A (zh) | 地图信息处理方法、装置、设备、存储介质及程序产品 | |
CN114861062B (zh) | 信息过滤方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |