CN105209858B - 企业场所数据的非确定性消岐和匹配 - Google Patents

企业场所数据的非确定性消岐和匹配 Download PDF

Info

Publication number
CN105209858B
CN105209858B CN201480028006.8A CN201480028006A CN105209858B CN 105209858 B CN105209858 B CN 105209858B CN 201480028006 A CN201480028006 A CN 201480028006A CN 105209858 B CN105209858 B CN 105209858B
Authority
CN
China
Prior art keywords
address
attribute
processing
section
polygon
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201480028006.8A
Other languages
English (en)
Other versions
CN105209858A (zh
Inventor
迈克尔·克莱内
安东尼·J·斯克里菲尼亚诺
沃威克·马修斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dun and Bradstreet Inc
Original Assignee
Dun and Bradstreet Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dun and Bradstreet Inc filed Critical Dun and Bradstreet Inc
Publication of CN105209858A publication Critical patent/CN105209858A/zh
Application granted granted Critical
Publication of CN105209858B publication Critical patent/CN105209858B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/29Geographical information databases

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Remote Sensing (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Generation (AREA)
  • Navigation (AREA)

Abstract

提供一种方法,该方法包括:(a)接收对位置进行描述的数据;(b)从该数据外推出与该位置关联的地址;(c)对大道的包括有该地址的区段进行识别;(d)对具有周界的多边形进行限定,该周界包围位于该区段的附近的地理区域;(e)获得多边形内的点的地理坐标;(f)对在该地理坐标处的地址进行识别;以及(g)对与在该地理坐标处的地址关联的实体进行识别。还提供一种执行该方法的***,以及一种包括用于控制处理器执行该方法的指令的存储器装置。

Description

企业场所数据的非确定性消岐和匹配
相关申请的交叉引用
本申请要求于2013年3月15日提交的美国临时专利申请序列No.61/792,762的优先权,其内容通过引用并入本文。
背景技术
1.技术领域
本公开内容涉及通过使用在与标准地址相关的能力之外的方法来创建用于对企业与物理场所的关联进行限定的新的基于地址的企业识别模式,也被称为能力(capability)。在这样的情况下,术语“模式”是指可以通过其将以不同方式限定的地址例如街道编号和名称、纬度/横向坐标或建筑物名称关联至相同物理场所或位置的方式。该能力可以以响应于由终端用户、***、应用或任何其他方法发起的查询的方式来利用,所述查询意在通过使用作为查询属性的包括有多个数据字段中的一个数据字段例如街道名称和编号的地址信息来识别企业实体。该能力可以通过使用包括有例如范围、名称以及基于多边形的地理空间消岐的不同的非确定性方法来执行。在这种背景下,术语“非确定性”意味着通过其将地址限定到查询中的方式和通过其将地址关联至物理场所的方法不是预先确定和限制的,该方式包括对使用被称为灵活的、可替选标记的不同数据成分的多种方式的使用。处理这样的查询的结果包括反映用于确定企业与查询地址和关联的物理场所的联系的推测质量、匹配的模式以及其他属性的反馈。
该能力的示例将使得企业能够与不同于该企业的物理位置和地址的场所进行关联,例如:(a)购物商场中的可以被视为水平物理位置的企业,(b)多层办公建筑物中的可以被视为垂直物理位置的企业,或者(c)被关联至基于周界(perimeter)的区域例如特定税务地段(tax lot)的企业。
2.对现有技术的描述
在本部分所描述的方法是能够实行的方法,但未必是先前已构思或实行的方法。因此,除非另外指出,否则这些方法对于本申请中的权利要求而言可以不是现有技术,并且通过包括在本部分而不被承认是现有技术。
高效的数据库访问和搜索能力对于有效利用参考数据库中保存的数据而言是重要的。该目标的关键是下述能力:使得能够高效检索匹配结果,即,使参考数据与包括有场所标记的查询进行匹配的结果,以便以高效并有效的方式来对匹配结果进行识别和选择,并且提供能够用于做出与匹配结果的使用有关的决策的反馈。
特定于识别地理场所处的企业实体,现有技术考虑了特定并且有限数量的数据字段,例如企业实体的注册的、公开的或另外关联的物理“街道地址”。现有技术通常以下述假设为基础:a)企业实体地址即场所信息将一致地被表示;以及b)针对场所的具体表示例如针对多租户建筑物的单个街道地址的检索方法将必要地被限制成对共享地理场所的上面所提及的表示的那些坐标进行检索。作为示例,该现有技术通常以“街道编号+街道名称+城市”启发式比对为基础,“街道编号+街道名称+城市”启发式比对基于以下各项生成准确性的意见:(a)在查询与候选之间的字符的相似度,(b)在对预先限定的正字法的变形例如拼写特定单词的多种方式包括对连字符、大写、断词、标点符号、已知缩写以及同义词的使用作出解释之后的所匹配的大量字符或其他基本的相关信息,或者(c)用于对数据分量进行比较的其他方法。因此,当场所可以以不同的方式来描述时,例如,当一个位置可能具有多个地址时,该现有技术可能不会引起符合要求的结果。
作为另一示例,现有技术可以使用纬度和经度,以将不同的地址关联至相同的物理场所。当场所分布于广泛的地理区域例如购物中心或商场时,这可能不会引起令人满意的结果,并且使用纬度/经度作为标识符可能对未被关联至商场但位于相同地理区域中的错误实体进行关联。
发明内容
有必要改进现有搜索和匹配的***和方法,该方法包括:(1)通过其对查询进行处理的处理,以便策展和合成查询标记进而最大化对符合要求的候选进行识别的机会,(2)通过其对在数据库或一系列数据库上所保存的参考数据进行访问、评估以及利用以识别针对查询的候选匹配的处理,(3)通过其对候选进行评估、选择以及优先化的处理,以及(4)通过其将与匹配经历有关的匹配结果和数据提供给查询者或查询***的处理,匹配结果和数据包括对匹配查询的相对强度和属性进行描述的置信指示符,以表示用于扩展匹配的数据上的反馈。
为了满足这些需要,提供了一种方法,该方法包括:(a)接收对位置进行描述的数据;(b)从数据外推出与位置关联的地址;(c)对大道的包括有地址的区段进行识别;(d)对具有周界的多边形进行限定,该周界包围位于区段的附近的地理区域;(e)获得多边形内的点的地理坐标;(f)对在地理坐标处的地址进行识别;以及(g)对与在地理坐标处的地址关联的实体进行识别。还提供了一种用于执行该方法的***,以及一种包括用于控制处理器执行该方法的指令的存储器装置。
本公开内容脱离了现有技术,因为本文中公开的处理的目的是对使查询场所作为属性的那些企业实体进行识别,这样的识别以例如范围、名称和基于多边形的地理空间消歧以及灵活、可替选的标记的值为基础,其中,所输入的查询数据是对一个或多个企业实体所位于的假定地址实体(“场所”)进行的描述。
本文件公开了一种用于在机器匹配之间进行鉴别的***和方法,即,在没有人类介入的情况下从而考虑到一致性和可扩展性,将参考数据与查询进行匹配,并且使得人类能够关注到下述情况:要使适当的数据管理工作生效,需要富有洞察力或进一步的研究。术语“可扩展性”意味着该方法不通过特定技术对技术解决方案进行限制。
本文中所描述的技术包括由现有技术未解决的能力。特别地,本文中所描述的技术提供了在对与地理场所关联的高值、预测数据元素或其他派生标记进行的访问、保留以及使用方面的灵活性,与地理场所关联的高值、预测数据元素或其他派生标记已经预先被验证和聚合到场所和场所特定特性、标记或记号的数据库中,以通过匹配处理来使用。本文中所描述的技术使得这样的灵活性能够在使数据元素可用于与所述数据的相对值有关的数据库并且如何通过对匹配和关联的属性进行识别的匹配经历来使用所述数据时被确定,匹配和关联的属性可以由终端用户使用,以做出与所述数据和派生标记的使用有关的决策。
附图说明
图1A和图1B共同是用于对与地理场所相关联的实体进行检索的方法的流程图。
图2是用于采用本文中所描述的方法的***的框图。
具体实施方式
在下面的几个段落中,存在有本文中所使用的几个术语的定义。
场所是物理位置,场所可以包括以不同方式描述的多个地址,并且可以包括被关联至实体例如企业或住宅的地址、在其上不存在物理建筑物或运营的企业的地址或者物理位置的组合。
范围是基于在物理地址例如“商业街123至131号”之间的地理距离对地址进行关联的方式。
名称是对在标准地址例如依据建筑物名称例如“纽约广场1号”或“肖特山的商场”之外的企业场所进行识别的方式。
基于多边形的地理空间消岐是通过使用数学公式和算法来确定多个地址之间的地理邻近的方式。基于多边形的地理空间消岐是地理信息***(GIS)例如全球定位***(GPS)之后的基本概念。
基于周界的区域,也可以被称为区段,是将不同地址关联至公共场所标识符,例如具有多个企业、建筑物、税务地段、开放区域或其他类似单元的住宅综合区或企业园区的方法。
识别模式是确定两个不同值之间,例如基于街道编号和名称的查询地址与具有特定纬度和经度的地址之间的相似度的方式。识别模式包括数据值本身以及与这些值有关的元数据。作为与数据有关的描述性数据的元数据的示例,在这样的情况下将指示查询名称和编号是街道地址。
匹配模式是指可以通过使用本领域技术人员所熟知的处理来执行的不同的处理,以使用来自查询的数据从数据库或其他源对数据进行识别;匹配模式可以包括将查询关联至数据库或其他源的“匹配”、“搜索”、“查找”或其他处理。
标记是指数据的通用术语。可替选标记是可以用于识别特性的不同数据,例如“省份”可以被用作为针对“州”的可替选值。派生标记是可以从其他数据计算或推断出的信息,例如可以从街道地址、城市以及州派生出纬度和经度。
灵活意思是用于识别实体的特性或针对实体的查询的标记的类型对于不同的查询或实体而言可以是不同的。
反馈是与匹配经历的结果例如该经历的推断质量和结果有关的信息。反馈可以用于使得终端用户能够做出与所述经历的结果的消耗量有关的决策。
参考数据库是符合与数据有关的基于质量的准则例如数据的整体性、完整性、准确性以及时效性的数据的仓库。术语“参考数据库”可以涉及一个或多个这样的仓库。
策略是用于接受查询、利用查询数据从参考数据库识别候选、以及提供来自该参考数据库的、对于终端用户是可接受的候选的方法。
本文中所使用的“企业”的概念是在场所处的实体的类型的示例。然而,本公开内容不限制于可以由终端用户所关注的实体的类型;其他示例包括居住住宅、税务地段以及没有任何开发的开放区域。
本文中所描述的***(a)接收查询以发起针对与具体地理场所关联的实体的搜索,(b)使用查询以确定用于执行搜索的策略,(c)识别被关联至地理场所的候选实体,以及(d)当候选与查询相关时,输出实体和与处理有关的相关信息,相关信息包括候选的等级和质量。
本文中所描述的示例假设查询包括实体名称和地址数据两者。这是示例性的;这种能力也可以用于处理仅包括地址的查询,以便对被关联至查询地址的其他地址或在查询地址处和被关联至查询地址的其他地址处的实体进行识别。因此,查询可以包括用于找到特定企业的名称和地址或仅包括用于找到在所述地址处的多个企业的地址。
图1A和图1B共同是对与地理场所关联的实体进行检索的方法100的流程图。图1A通过被标记为“1A”的连接符连接至图1B。
简言之,方法100接收来自用户101的查询110,并且执行处理120、130以及140以提取、生成、辨别以及合格化场所和相关的实体,然后,使用处理150、160、170以及180提交场所和相关的实体用于候选检索。该组处理可以检索多个匹配记录,然后多个匹配记录将在处理181中进行重复记录删除和精炼,并且然后在处理193和194中既客观地又彼此之间地对多个匹配记录进行定性地评分。在处理195中生成输出即结果196并且将结果196返回给用户101。
处理100利用处理规则135、地理实体属性表格137、推出规则145、区段参考数据库155、地理坐标参考数据库165、企业实体参考数据库185、候选列表189、评分规则190、排序规则191以及决策规则192。
地理实体属性表格137是可辨别属性即数据字段的表格,可辨别属性可以被关联至可以识别地理场所的数据。
推出规则145包括用于基于输入值对特定可行地址进行限定的逻辑,例如在美国,在街道的一侧上的地址全部是奇数或偶数编号。
区段参考数据库155包括例如用于对道路或其他大道在重要地标例如街道交叉口之间的连续部分进行识别的与特定场所相关的信息。
地理坐标参考数据库165包括被表示为地理坐标例如针对特定地址的纬度和经度的地理空间信息。
企业实体参考数据库185是被关联至特定地址的企业实体的列表。
候选列表189包括物理上位于从地理坐标参考数据库165中识别的地址和场所处的来自企业实体参考数据库185的企业的列表。
评分规则190包括用于基于候选列表189上的每个项与查询110的相似度而为候选列表189上的每个项分配定性分数的规则。
排序规则191包括基于使用评分规则190所派生的分数来确定如何对候选列表189上的项进行排序的规则。
决策规则192包括基于从排序规则191所派生的排序来确定来自候选列表189的哪些项应该被呈现给用户的规则。
查询110是发起针对与特定场所有关的信息的搜索的请求。该搜索基于查询110中所包括的标记。查询110包括多个数据元素,多个数据元素进而包括与下述数据字段方面的场所有关的特定信息,所述数据字段是可以从终端用户通过与处理100接口的***或应用请求的数据字段的全部或子集,并且查询110还可以潜在地包括与场所有关的附加的和事实上无限制的标记。查询110可以由用户101提供至方法100,用户101即人类用户或自动处理,例如从使用批处理机器能力提交的文件或者从使用在线数据输入画面处理的个体查询所派生的查询。查询110包括可以包括多个数据元素中的一个数据元素的查询标记,例如查询标记可以被表示为街道编号、街道名称以及城市的一个串接字段或(1)街道编号、(2)街道名称以及(3)城市的分开的数据字段。
作为示例,查询110可以包括具有表格1中的信息的分开的数据字段。
表格1
方法100从处理120开始。
处理120接收包括对位置进行描述的数据即查询标记的查询110。处理120将查询标记构造和解释成通用格式即数据122。
作为示例,数据122可以包括表格2中的信息。
表格2
字段 查询标记
名称 ABC公司
街道地址 商业街121-131号
城市 肖特山
NJ
邮政编码 07o78
方法100从处理120进行至处理130。
处理130分析数据122以对与地理实体属性表格137中的属性关联的特定数据字段进行识别,以便通过单个地或多个地使用这些数据字段来增加对来自企业实体参考数据库185的匹配进行识别的机会。作为示例,这可以使街道编号(121-131号)与街道名称(商业街)分离。就这一点而言,处理130从数据122中提取与针对类似于查询的候选的搜索相关的属性,从而生成针对属性132的值。
如上面所提及的,地理实体属性表格137是可辨别属性的表格,可辨别属性是可以被关联至可以识别地理场所的数据的数据字段。地理实体属性表格137包括用于将预测权重(K)分配给每个属性(x)以支持K(x)的计算的数据,其中,K(x)是元素x的预测权重以及与每个属性相关的其他信息。
作为示例,地理实体属性表格137可以包括表格3中的信息。
表格3
字段(x) 预测权重(K)
名称 1
街道地址名称 .7
街道地址编号 .5
建筑物名称 .8
房间编号 .3
楼层编号 .4
城市 .6
.9
邮政编码 .5
国家 1
作为示例,属性132可以包括表格4中的信息。
表格4
字段
企业_名称 ABC公司
街道_名称 商业街
街道_编号 121-131
建筑物名称 <null>
房间编号 <null>
楼层编号 <null>
城市 肖特山
NJ
邮政编码 07o78
国家 美国
处理130使用处理规则135以分析属性132,处理130还可以提供输入以用公式表示此后要存储在处理规则135中的新的企业和元数据规则,在处理规则135中,处理130的未来执行可以利用新的处理规则。
例如,元数据规则可以指示对于美国地址而言使用大写字母的双字符字段是州名缩写,或者后面带数字的字母字段是街道名称。
处理规则135包括自动的和可重复的地址实体以及基于标准化和归一化处理的元数据规则,标准化和归一化处理包括用于解释针对地址的每个成分的查询标记的语义和数字的消岐逻辑。用于标准化和归一化的处理规则135的示例可以包括表格5中的信息。
表格5
处理规则135的新规则的示例可以包括表格6中的信息。
表格6
处理规则135还可以包括用于对属性132的所有成分进行净化、解析以及标准化的信息。
净化包括从数据122中移除无关的值例如标点符号和其他形式的非值字符,例如街道缩写中的标点符号或者用作分隔符的逗号和换行符或回车符。
处理规则135的净化规则的示例可以包括表格7中的信息。
表格7
属性132的值 净化值
07o78 07078(用‘0’替换‘o’)
解析包括将数据122分割,以增加识别针对查询110的匹配和/或关联的地址实体的机会。这可以包括将查询标记解析成分开的数据元素,例如将地址分离成地址的组成的有意义元素。
处理规则135的解析规则的示例可以包括表格8中的信息,表格8中的信息示出了如何将邮政编码和州的串接值分离成两个分开的值。
表格8
属性132的值 经解析的值
NJ07o78 NJ 07078
标准化包括将可替选值关联至数据122,以便增加对匹配进行识别的机会。
处理规则135的标准化规则的示例可以包括表格9中的信息。
表格9
属性132的值 经标准化的值
NJ New Jersey(新泽西州)
方法100从处理130进行至处理140。
处理140使用用于将属性132处理成组合、集合和/或个体元素的推出规则145,以从最初查询属性132派生多个潜在的地址实体,从而生成推出值142。因此,处理140从属性132外推出与查询110中呈现的位置关联的一个或多个地址。外推意味着形成意见或作出与来自已知事实的事物有关的估计。术语“外推(extrapolate)”和术语“推出(extrude)”在本文中可以交换使用。外推地址的示例是从“商业街121-131号”生成“商业街123号”。在该示例中,外推不仅从查询110提取数据,并且例如还可以包括由属性132的处理140的分析所产生的进一步外推“商业街140号”,即使“商业街140号”既未在查询110中明确地列举(明确列举的示例为“商业街131号”),也未由查询110内在地隐含(内在隐含的示例为“商业街123号”)。
处理140使用例如街道地址中内在的地址的基于启发式算法的计算,街道地址被表示为范围并且提供关于什么地址将对例如在某些街道的同一侧上的仅奇数编号的情况有效的指导。例如,由于在美国已知的是,在某些街道的一侧上的地址或者全部是奇数或者全部是偶数,并且由连接符分开的上述两个编号指示开始点和结束点,所以基于启发式算法的计算确定在开始地址与结束地址之间潜在地存在其他地址,并且基于开始地址和结束地址是奇数还是偶数来确定其他地址全部是奇数还是偶数。推出值142是可以在处理170中使用以对来自企业实体参考数据库185的候选进行识别的附加查询标记。
推出规则145的推出规则的示例可以包括表格10中的信息。
表格10
方法100从处理140进行至处理150。
处理150接收推出值142,并且对大道的包括有该地址的区段进行识别。即,处理150参考区段参考数据库155,对与包括在推出值142中的地址中的每个地址关联的地址区段(即道路或其他大道在重要地标例如十字路口之间的连续部分,其本身通常是其他区段的终点)进行计算,然后从区段参考数据库155对与这些区段中的每个区段关联的地址或多个地址进行检索并且将地址或多个地址输出以作为地址数据152,地址数据152现在包括街道地址数据和地理空间位置数据例如经度和纬度(该地理空间数据也被称为“地理代码”或“地理代码数据”)。区段参考数据库155包括由也被称为“周界”的地理区域对地址进行关联的数据,并且已知基于集合周界的数据为“周界参考数据”。就这一点而言,处理150对具有周界的多边形进行限定,该周界包围位于该区段的附近的地理区域。
区段参考数据库155内的区段参考数据的示例可以包括表格11中的信息。
表格11
表格11示出了作为属性的集合沿着具体区段(第一列中所示)存在的地址的示例,属性的集合包括街道编号范围(列4和列6)、街道名称(列3)以及区段终点(列5和列7中的编码格式所示)的笛卡尔坐标。
在区段参考数据库155内的周界参考数据的示例可以包括表格12中的信息。
表格12
形状ID 类型 坐标散列
0A4E98F3 37CE17DF782339B2
3D139E4D 多边形 D956C0BCCD601FEA
B12AE4CE 线段 E82354DBD99B91DF
DBF8F7DD 多边形 DA0C535E76DC4F38
表格12示出了周界参考数据的表示的示例,周界参考数据的表示具有针对每个周界的唯一标识符(列1)、对周界的类型的描述(列2)以及周界的笛卡尔坐标的编码版本(列3)。
再次考虑由处理140和处理150执行的操作中的一些操作以便限定多边形。处理140在外推处理期间获得与地址(例如塞西尔大道123号,其为区段的一端处的地址)关联的第一属性。处理150在识别该区段时获得与该区段关联的第二属性(例如在该区段上的地址具有与地址关联的楼层编号),并且然后,为了对多边形进行限定,处理150基于第一属性和第二属性对多边形的大小和形状进行限定。对多边形进行限定的示例针对处理150将使用用于构建多边形的一条边的第一属性和第二属性以得到该区段的整个长度。
如上面所提及的,多层办公建筑物可以被视为垂直位置。在这样的情况下,处理150将替代地基于第一属性和第二属性对多面体进行限定而不仅对多边形进行限定,其中,多边形是该多面体的横截面。对多面体进行限定的示例针对处理150将使用用于构建多面体的第一属性和第二属性,以基于与该区段关联的楼层编号的最大值来计算海拔。
方法100从处理150进行至处理160。
处理160接收地址数据152,获得多边形内的点的地理坐标以及对地理坐标处的地址进行识别。即,处理160参考地理坐标参考数据库165对针对地址中的每个地址的地理坐标(例如纬度和经度)进行检索,并且然后从企业实体参考数据库185中对与这些坐标中的每个坐标关联的地址或多个地址进行检索,从而生成地址数据162。以这样的方式,处理160对针对推出值142的其他现有的地址值进行识别。
由处理160从地址数据152和地理坐标参考数据库165中识别的地址数据162中的其他地址的示例可以包括表格13中的信息。
表格13
方法100从处理160进行至处理170。
处理170接收地址数据162作为输入,并且对与地理坐标处的地址关联的实体进行识别。更具体地,处理170接收作为地址数据162中的地址的属性的地理代码集(属于地理空间位置例如纬度和经度的数据),并且通过使用匹配处理的各种模式从企业实体参考数据库185中对与那些地址关联的企业进行检索,从而生成地址数据172。企业实体参考数据库185可以具有或可以不具有被关联至由处理160所产生的每个地址的企业。
处理170的输出是归属于地址数据162的企业实体数据,以创建地址数据172。
从企业实体参考数据库185中检索的使用由处理160产生并且被添加到地址数据172的地址的地址数据的子集的示例可以包括表格14中的信息。“HQ”是“headquarters(总部)”的缩写。
表格14
方法100从处理170进行至处理180。
处理180接收地址数据172,并且使用地址数据172中的地址作为输入,使用各种方法(例如基于文本的查找)以辨出企业实体参考数据库185中的候选(即类似于与地址数据172中的地址关联的实体的实体),从而生成数据集182。
表格15示出了由处理180根据企业实体参考数据库185生成的数据集182的示例。
表格15
处理181是下述递归处理:以递归的方式来实例化处理150至处理180,直到满足所限定的准则集中的一个或多个准则,例如检索迭代低于某些定量和定性的水平为止。结果是候选列表189。
表格16提供了可以用在处理181中的定量和定性准则的示例。
表格16
如图1B所示,方法100从处理180进行至处理193。候选列表189在图1A和图1B中均被表示出。
处理193接收候选列表189,并且使用评分规则190以产生候选的定性差别的列表,从而生成列表193A。评分规则190的示例可以包括通过使用尤其基于以下各项的分数来进行区别的规则:(a)在处理150至处理180中用于将具体地址条目或企业实体包括到候选列表189中的检索模式的性质(即,在辨出候选列表189中的个体候选的过程中采用了什么方法或方法的组合),以及(b)在检索模式中所使用的外推(例如具体地址是否由根据查询110或替代地根据本身在递归处理181的先前迭代中已经检索的地址的检索模式的直接操作来检索)或抽象(例如,从与查询110关联的名义上的坐标集检索的地址之间的以米为单位的距离)的程度。
处理193基于地理实体属性表格137和评分规则190使用相对权重方法,以针对候选列表189中的每个条目生成加权子分数集,其中,子分数被用于对候选列表189进行定性地排序。该权重考虑到与元数据值和实际数据值有关的多种特性,使得针对候选的权重可以考虑以下准则,例如迭代序列和候选列表189上的每个条目与源查询110之间的相似度的其他定性评估(例如查询110的街道名称与候选列表189中的条目之间编辑距离的测量),该迭代序列产生候选、被用于辩出候选的检索模式或多种检索模式(以及该迭代序列可以包括向检索模式的组合分配分数的矩阵、迭代编号等)。例如,通过使用区段分析(处理150)和基于名称的检索(处理170和处理180)二者检索到的候选C1针对子分数S1可以得到100分,然而通过使用基于地理坐标的检索(处理160)检索到的候选C2针对子分数S1仅可以得到90分。
表格17是由评分规则190和处理193所使用的加权子分数的示例。
表格17
对于上述表格,列1是指候选列表189中的候选,并且其余列表示基于用于辩出候选的检索模式的交互作用的分数(列2)、候选地址的建筑物密度的评估的分数(列3)、根据多种地理空间位置方法的地址的确证度的分数(列4)以及示出了与用于辩出候选的特定检索方法关联的外推或抽象的水平的分数(列5)。
将使用排序规则191针对每个候选对在处理193中生成(并且在表格17中被例示)的子分数集进行布置和评分。
表格18是执行排序规则191的最终结果的示例。
表格18
候选 加权排序
C005 1
C004 2
C002 3
C001 4
C003 5
方法100从处理193进行至处理194。
处理194从处理193接收所评分的候选列表即列表193A,并且通过移除其排序、分数、子分数或其组合不满足在决定准则192中限定的包括和/或排除准则的那些候选来精炼列表193A,从而生成列表194A。
表格19是在处理194中所使用的评分因素的相对权重的示例。
表格19
因素/分数 权重
地理查找交集分数 0.5
密度分数 0.25
地理查找确证分数 0.6
原始/推出分数 0.33
表格20是处理194中的包括/排除规则的示例。
表格20
表格21是处理194的结果即列表194A的示例。
表格21
候选 加权排序 规则结果
C001 4 合格
C002 3 不合格
C003 5 不合格
C004 2 合格
C005 1 合格
方法100从处理194进行至处理195。
处理195接收列表194A即候选C1……CT的合格列表,在列表194A中,CT是要由方法100返回的结果中被认为可接受为包括的最低质量的候选。
表格22是得到的候选列表189的示例,其中排除了候选C002和C003,因为C002和C003未通过规则执行,即使C002和C003二者的分数处于满足定性的接受准则的水平:
表格22
处理195汇集并且返回包括候选列表197和反馈198的结果196。反馈198是与查询110与候选列表197内的每个候选之间的相似度有关的信息。
反馈198被包括在结果196中以指示候选列表197内的每个候选的质量,例如最佳候选Cn是位于归属于查询110的地址位置处的企业实体的置信水平。反馈198还可以包括相对相似度以及特定数据源,相对相似度由数据122中的每个字段与候选列表197内的每个候选的每个分量之间的相对相关性来表示,特定数据源被用于使用候选列表197内的每个候选的分量来填充企业实体参考数据库185。
表格23是反馈198的示例。
表格23
表格23示出了企业实体(列1)、与该实体关联的地址(列2)、表示该地址与候选列表197中的候选的相似度的分数(列3)、具有表示地址的相似度性质(也称为相关性)的内嵌含义的字符串(列4)以及包含对地址属性进行描述的内嵌含义的串(列5)。
因此,简言之,方法100包括:1)接收查询以发起针对企业实体的搜索,企业实体中的每个企业实体均与特定地理场所相关联;2)对所述查询进行净化、解析以及标准化;3)基于查询地址来推出附加的地址;4)确定最优方法以基于单个或多个经净化、解析以及标准化的查询标记对参考数据库进行搜索;5)检索候选并选择与查询匹配的参考数据库实体;以及6)基于与查询或从查询派生的数据的相似度将来自参考数据库的候选和与相似度有关的反馈一起返回。
处理100包括下述步骤:1)接收包括具有多个元素的搜索串的输入数据;2)将多个元素的子集转换成术语集;3)基于术语对存储的参考数据进行检索,以对与输入数据匹配的最可能候选进行识别;4)基于终端用户查询通过使用灵活标记来推断对匹配候选集进行识别的能力的预测性,该终端用户查询包括预期作为查询的一部分的数据、可以由终端用户提供的可替选数据以及从查询数据派生的数据;5)基于所推断的预测性选择一个或多个匹配候选;以及6)提供使得终端用户能够决定如何使用这些匹配结果的匹配结果和反馈。
方法100包括用于使用有限但暂时无界的标记集来对与地理场所关联的企业实体进行识别的功能性,该标记集可以由方法100内的子处理使用,以形成查询与匹配候选之间的相似度的意见。方法100解决在对地理场所和其与一个或更多个企业实体的关联进行唯一地辨别和合格化方面的某些内在问题,所述某些内在问题包括:1)地理地址标记的概念化和表达中的不精确和自然变化,2)针对地理场所的清楚的标识符或持久的关键字的缺失,以及3)通常在包括“完整”地址的商业用途中所考虑的详情的水平方面的非常广泛的差异。通过将灵活和可变的识别集和匹配属性扩展至地理场所,能够处理这些挑战。技术的灵活性包括元数据值和实际数据值两者,并且将被用于下述两方面:1)使用与地理场所和地理场所与企业实体之间的联系相关的信息来填充数据库;以及2)基于查询和管理针对给定目的的接受阈值的规则从数据库选择企业实体。
方法100可以解决在位置处的单个实体例如单个建筑物中的单个实体的情况,或者单个位置处的多个实体例如购物商场中的多个租户的情况。然而,对于单个位置处的多个实体的情况而言,实体中的每个实体可以具有与其他实体的地址不同的地址。
对于单个实体的情况而言,方法100包括:
(a)在处理120中,接收对位置进行描述的数据即查询110;
(b)在处理140中,从该数据外推出与该位置关联的地址;
(c)在处理150中,对大道的包括有该地址的区段进行识别;
(d)在处理150中,对具有周界的多边形进行限定,该周界包围位于该区段的附近的地理区域;
(e)在处理160中,获得多边形内的点的地理坐标;
(f)在处理160中,对该地理坐标处的地址进行识别;以及
(g)在处理170中,对与该地理坐标处的地址关联的实体进行识别。
对于单个位置处的多个实体的情况而言,考虑两个实体均是购物商场中的租户的情况,其中,每个实体具有不同于另一实体的地址。在处理150中,多边形将具有包围购物商场的周界。因此,假设前述的地理坐标是第一地理坐标,前述的点是第一点,前述的地理坐标处的地址是该地理坐标处的第一地址,以及前述的实体是第一实体。当执行处理160时,处理160获得多边形内的第二点的第二地理坐标,并且对第二地理坐标处的第二地址进行识别。然后,处理170对与第二地址关联的第二实体进行识别。
图2是采用本文中所描述的方法的***200的框图。***200包括耦接至数据通信网络即网络230例如因特网的计算机205。
计算机205包括用户接口210、处理器215以及存储器220。虽然计算机205在本文中被表示为独立装置,但计算机205不限制于此,而是替代地可以耦接至分布式处理***中的其他装置(未示出)。
用户接口210包括用于使得用户101能够将信息和命令选择传达至处理器215的输入装置,例如键盘或语音识别子***。用户接口210还包括输出装置例如显示器或打印机。光标控制器例如鼠标、跟踪球或操纵杆使得用户101能够操纵显示器上的光标,以将附加的信息和命令选择传达至处理器215。
***200还包括经由网络230通信地耦接至计算机205的用户装置240。用户101可以借助于用户装置240与计算机205进行交互,作为替选,借助于用户接口210与计算机205进行交互。
处理器215是配置有对指令进行响应和执行的逻辑电路的电子装置。
存储器220是使用计算机程序进行编码的非暂态计算机可读装置。就这一点而言,存储器220存储能够由处理器215读取并且执行的用于控制处理器215的操作的数据和指令。存储器220可以被实现为随机存取存储器(RAM)、硬盘驱动器、只读存储器(ROM)或其组合。存储器220的部件中的一个部件是程序模块225。
程序模块225包括用于控制处理器215以执行本文中所描述的方法的指令。例如,在程序模块225的控制下,处理器215执行方法100的处理。本文中使用的术语“模块”表示可以实施为独立的部件或多个从属部件的集成配置的功能操作。因此,程序模块225可以实现为单个模块或彼此合作操作的多个模块。此外,虽然程序模块225在本文中被描述成安装在存储器220中并且从而以软件来实现,但是程序模块225可以以硬件(例如电子电路)、固件、软件或其组合的任何形式来实现。
处理器215通过网络230或用户接口210来接收查询110。处理器215对处理规则135、地理实体属性表格137、推出规则145、区段参考数据库155、地理坐标参考数据库165和企业实体参考数据库185、评分规则190、排序规则191以及决策规则192进行访问,这些均可以是计算机205的部件,例如存储在存储器220内,或者可以在计算机205的外部,其中,计算机205经由局部网络(未示出)或经由网络230访问它们。处理器215对处理120、130、140、150、160、170、180、181、193以及194进行访问,这些均可以是计算机205的部件,例如存储在存储器220内,或者可以在计算机205的外部,其中,计算机205经由局部网络或经由网络230访问它们。处理器215在处理195中将结果196返回给用户101。
尽管程序模块225被指示为已经被加载到存储器220中,但是程序模块225还可以被配置在存储器装置235上,以用于随后加载到存储器220中。存储器装置235也是用计算机程序进行编码的非暂态计算机可读装置,并且可以是将程序模块225存储在其上的任何传统存储装置。存储器装置235的示例包括软盘、光盘、磁带、只读存储器、光学存储介质、通用串行总线(USB)闪存驱动器、数字通用盘、或压缩驱动器。存储器装置235还可以是位于远程存储器***处并且经由网络230耦接至计算机205的随机存取存储器或其他类型的电子存储器。
本文中所描述的技术是示例性的,并且不应当被理解为暗示对本公开的任何特定的限制。应当理解的是,可以由本领域的普通技术人员设计各种替换、组合和修改。例如,除非另外指定或由步骤本身指出,否则与本文中所描述的处理相关联的步骤可以以任何顺序来执行。本公开意在包括所有落入所附权利要求的范围内的替换、修改和变型。
术语“包括”或“包含”被解释为指定所述特征、整数、步骤或部件的存在,但不排除存在一个或多个其它特征、整数、步骤或部件或其群组。

Claims (9)

1.一种对与地理场所相关联的实体进行检索的方法,包括:
(a)接收对位置进行描述的数据;
(b)从所述数据外推出与所述位置关联的地址;
(c)执行产生候选列表的处理,其中所述处理包括:
识别通道的包括有所述地址的区段;
获得与所述地址对应的点的地理坐标;
限定具有周界的多边形,所述周界包围包括所述地理坐标的地理区域;
识别与在所述地理坐标处的所述地址关联的实体;
将所述实体包括在所述候选列表中;以及
识别由所述多边形包围的附加地址;
(d)将所述附加地址递归地发送到所述处理直到满足标准;以及
(e)返回所述候选列表。
2.根据权利要求1所述的方法,
其中,所述外推包括获得与所述地址关联的第一属性,
其中,所述区段的所述识别包括获得与所述区段关联的第二属性,以及
其中,所述限定包括基于所述第一属性和所述第二属性限定所述多边形的大小和形状。
3.根据权利要求1所述的方法,
其中,所述外推包括获得与所述地址关联的第一属性,
其中,所述区段的所述识别包括获得与所述区段关联的第二属性,
其中,限定所述多边形包括:基于所述第一属性和所述第二属性限定多面体的大小和形状,以及
其中,所述多边形是所述多面体的横截面。
4.一种对与地理场所相关联的实体进行检索的***,包括:
处理器;以及
存储器,所述存储器通信地耦接至所述处理器并且包括指令,所述指令能够由所述处理器读取以使所述处理器执行下述操作:
(a)接收对位置进行描述的数据;
(b)从所述数据外推出与所述位置关联的地址;
(c)执行产生候选列表的处理,其中所述处理包括:
识别通道的包括有所述地址的区段;
获得与所述地址对应的点的地理坐标;
限定具有周界的多边形,所述周界包围包括所述地理坐标的地理区域;
识别与在所述地理坐标处的所述地址关联的实体;
将所述实体包括在所述候选列表中;以及
识别由所述多边形包围的附加地址;
(d)将所述附加地址递归地发送到所述处理直到满足标准;以及
(e)返回所述候选列表。
5.根据权利要求4所述的***,
其中,所述外推包括获得与所述地址关联的第一属性,
其中,所述区段的所述识别包括获得与所述区段关联的第二属性,以及
其中,所述限定包括基于所述第一属性和所述第二属性限定所述多边形的大小和形状。
6.根据权利要求4所述的***,
其中,所述外推包括获得与所述地址关联的第一属性,
其中,所述区段的所述识别包括获得与所述区段关联的第二属性,
其中,限定所述多边形包括:基于所述第一属性和所述第二属性限定多面体的大小和形状,以及
其中,所述多边形是所述多面体的横截面。
7.一种包括指令的存储器装置,所述指令能够由处理器读取以使所述处理器执行下述操作:
(a)接收对位置进行描述的数据;
(b)从所述数据外推出与所述位置关联的地址;
(c)执行产生候选列表的处理,其中所述处理包括:
识别通道的包括有所述地址的区段;
获得与所述地址对应的点的地理坐标;
限定具有周界的多边形,所述周界包围包括所述地理坐标的地理区域;
识别与在所述地理坐标处的所述地址关联的实体;
将所述实体包括在所述候选列表中;以及
识别由所述多边形包围的附加地址;
(d)将所述附加地址递归地发送到所述处理直到满足标准;以及
(e)返回所述候选列表。
8.根据权利要求7所述的存储器装置,
其中,所述外推包括获得与所述地址关联的第一属性,
其中,所述区段的所述识别包括获得与所述区段关联的第二属性,以及
其中,所述限定包括基于所述第一属性和所述第二属性限定所述多边形的大小和形状。
9.根据权利要求7所述的存储器装置,
其中,所述外推包括获得与所述地址关联的第一属性,
其中,所述区段的所述识别包括获得与所述区段关联的第二属性,
其中,限定所述多边形包括:基于所述第一属性和所述第二属性限定多面体的大小和形状,以及
其中,所述多边形是所述多面体的横截面。
CN201480028006.8A 2013-03-15 2014-03-14 企业场所数据的非确定性消岐和匹配 Active CN105209858B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201361792762P 2013-03-15 2013-03-15
US61/792,762 2013-03-15
PCT/US2014/029282 WO2014144745A1 (en) 2013-03-15 2014-03-14 Non-deterministic disambiguation and matching of business locale data

Publications (2)

Publication Number Publication Date
CN105209858A CN105209858A (zh) 2015-12-30
CN105209858B true CN105209858B (zh) 2018-11-16

Family

ID=51533154

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480028006.8A Active CN105209858B (zh) 2013-03-15 2014-03-14 企业场所数据的非确定性消岐和匹配

Country Status (13)

Country Link
US (1) US9183223B2 (zh)
EP (1) EP2972092A4 (zh)
JP (1) JP6205477B2 (zh)
KR (1) KR101835576B1 (zh)
CN (1) CN105209858B (zh)
AU (1) AU2014228754C1 (zh)
BR (1) BR112015023786B1 (zh)
CA (1) CA2906767A1 (zh)
HK (1) HK1217756A1 (zh)
PH (1) PH12015502104B1 (zh)
RU (1) RU2598165C1 (zh)
SG (1) SG11201507599VA (zh)
WO (1) WO2014144745A1 (zh)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2540817A (en) * 2015-07-30 2017-02-01 Ford Global Tech Llc Improvements in or relating to distributed vehicular data management systems
US20170039258A1 (en) * 2015-08-05 2017-02-09 Microsoft Technology Licensing, Llc Efficient Location-Based Entity Record Conflation
US10234295B2 (en) * 2015-11-06 2019-03-19 Sap Se Address remediation using geo-coordinates
US11284215B2 (en) * 2019-02-20 2022-03-22 Level 3 Communications, Llc Service area determination in a telecommunications network
US11631047B2 (en) * 2019-04-12 2023-04-18 Flipkart Internet Pvt. Ltd. System and method of geocoding
CN110175216B (zh) * 2019-05-15 2021-05-11 腾讯科技(深圳)有限公司 坐标纠错方法、装置和计算机设备
KR102342929B1 (ko) 2019-12-26 2021-12-28 한국국토정보공사 사고 발생패턴 분석을 통한 사고 취약지 분석 장치 및 방법
US11914553B2 (en) 2021-10-07 2024-02-27 T-Mobile Innovations Llc Methods and systems for analyzing similarities across tables and databases to perform de-duplication in a storage server
US11934367B2 (en) * 2021-10-07 2024-03-19 T-Mobile Innovations Llc Data management and de-duplication at a storage server

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7376636B1 (en) * 2002-06-07 2008-05-20 Oracle International Corporation Geocoding using a relational database
CN101769758A (zh) * 2008-12-30 2010-07-07 英华达(上海)科技有限公司 兴趣点搜寻范围的规划方法
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法
CN102483748A (zh) * 2009-07-07 2012-05-30 谷歌公司 用于地图搜索的查询解析

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7006881B1 (en) * 1991-12-23 2006-02-28 Steven Hoffberg Media recording device with remote graphic user interface
JP3206491B2 (ja) * 1997-05-08 2001-09-10 松下電器産業株式会社 地図情報検索装置
JP2001304891A (ja) * 2000-04-27 2001-10-31 Toshiba Corp 道路交通状況の予測システム、車載用ナビゲーションシステム及び道路状況予測方法
US6895126B2 (en) * 2000-10-06 2005-05-17 Enrico Di Bernardo System and method for creating, storing, and utilizing composite images of a geographic location
EP1485825A4 (en) * 2002-02-04 2008-03-19 Cataphora Inc DETAILED EXPLORATION TECHNIQUE OF SOCIOLOGICAL DATA AND CORRESPONDING APPARATUS
US7324666B2 (en) * 2002-11-15 2008-01-29 Whitegold Solutions, Inc. Methods for assigning geocodes to street addressable entities
JP3770325B2 (ja) * 2003-09-09 2006-04-26 アイシン・エィ・ダブリュ株式会社 ナビゲーション装置
US7373244B2 (en) * 2004-04-20 2008-05-13 Keith Kreft Information mapping approaches
US8670925B2 (en) * 2005-06-21 2014-03-11 Calabrese Holdings L.L.C. Navigation system and method
JP5002140B2 (ja) * 2005-08-24 2012-08-15 クラリオン株式会社 ナビゲーション装置およびナビゲーション処理方法
US7606582B2 (en) * 2005-12-13 2009-10-20 Yahoo! Inc. System and method for populating a geo-coding database
US7616964B2 (en) * 2005-12-13 2009-11-10 Yahoo! Inc. System and method for providing geo-relevant information based on a mobile device
US7606581B2 (en) * 2005-12-13 2009-10-20 Yahoo! Inc. System and method for providing geo-relevant information based on a location
US20070150199A1 (en) * 2005-12-13 2007-06-28 Soren Riise System and method for geo-coding using spatial geometry
US8050689B2 (en) * 2005-12-13 2011-11-01 Yahoo! Inc. System and method for creating minimum bounding rectangles for use in a geo-coding system
EP2538356A1 (en) * 2006-01-27 2012-12-26 Google Inc. Geographic coding for location search queries
US20070185649A1 (en) * 2006-02-08 2007-08-09 Tele Atlas North America, Inc. Map database having address points for determining destinations
US7643673B2 (en) * 2006-06-12 2010-01-05 Google Inc. Markup language for interactive geographic information system
JP4822986B2 (ja) * 2006-08-25 2011-11-24 アルパイン株式会社 ナビゲーション装置および行き先検索方法
US7551126B2 (en) * 2007-03-08 2009-06-23 Trimble Navigation Limited GNSS sample processor for determining the location of an event
US20110179066A1 (en) * 2008-06-20 2011-07-21 Business Intelligence Solutions Safe B.V. Methods, apparatus and systems for data visualization and related applications
US20100125560A1 (en) * 2008-11-17 2010-05-20 Michael Asher Uncertainty-based geocoding for risk management
US20100306287A1 (en) * 2009-05-26 2010-12-02 Nabil Raafat Mahrous Raphaeil Method and apparatus for global addressing of parcels of land
RU2415456C1 (ru) * 2009-11-13 2011-03-27 Открытое акционерное общество "Научно-производственное предприятие "Рубин" (ОАО "НПП "Рубин") Модуль планирования
US8930245B2 (en) * 2010-06-23 2015-01-06 Justin Streich Methods, systems and machines for identifying geospatial compatibility between consumers and providers of goods or services
US8442716B2 (en) * 2010-10-31 2013-05-14 Microsoft Corporation Identifying physical locations of entities
US20130035853A1 (en) * 2011-08-03 2013-02-07 Google Inc. Prominence-Based Generation and Rendering of Map Features
EP2565583B1 (en) * 2011-08-29 2018-08-01 Harman Becker Automotive Systems GmbH Navigation device, method of outputting a map, and method of generating a database

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7376636B1 (en) * 2002-06-07 2008-05-20 Oracle International Corporation Geocoding using a relational database
CN101769758A (zh) * 2008-12-30 2010-07-07 英华达(上海)科技有限公司 兴趣点搜寻范围的规划方法
CN102483748A (zh) * 2009-07-07 2012-05-30 谷歌公司 用于地图搜索的查询解析
CN101882163A (zh) * 2010-06-30 2010-11-10 中国科学院地理科学与资源研究所 一种基于匹配规则的模糊中文地址地理赋值方法

Also Published As

Publication number Publication date
CN105209858A (zh) 2015-12-30
PH12015502104A1 (en) 2016-01-18
CA2906767A1 (en) 2014-09-18
US9183223B2 (en) 2015-11-10
RU2598165C1 (ru) 2016-09-20
AU2014228754A1 (en) 2015-10-22
KR101835576B1 (ko) 2018-03-08
HK1217756A1 (zh) 2017-01-20
WO2014144745A1 (en) 2014-09-18
BR112015023786B1 (pt) 2022-05-03
PH12015502104B1 (en) 2016-01-18
KR20150138222A (ko) 2015-12-09
BR112015023786A2 (pt) 2017-07-18
EP2972092A1 (en) 2016-01-20
SG11201507599VA (en) 2015-10-29
AU2014228754B2 (en) 2015-12-24
EP2972092A4 (en) 2016-08-24
US20140280160A1 (en) 2014-09-18
JP6205477B2 (ja) 2017-09-27
AU2014228754C1 (en) 2016-04-28
JP2016515697A (ja) 2016-05-30

Similar Documents

Publication Publication Date Title
CN105209858B (zh) 企业场所数据的非确定性消岐和匹配
WO2021000826A1 (zh) 信息搜索方法、装置、终端及存储介质
Sarawagi et al. Open-domain quantity queries on web tables: annotation, response, and consensus models
CN104216942A (zh) 查询建议模板
Huang et al. Hgamn: Heterogeneous graph attention matching network for multilingual poi retrieval at *** maps
Dalvi et al. Deduplicating a places database
CN106095738B (zh) 推荐表单片段
JP5543384B2 (ja) ローカルクエリ抽出装置、ローカルクエリ抽出プログラム、およびローカルクエリ抽出方法
WO2018090468A1 (zh) 视频节目的搜索方法和装置
CN101147144A (zh) 分类字典更新装置、其计算机程序产品和分类字典更新方法
CN110968800A (zh) 一种信息推荐方法、装置、电子设备及可读存储介质
CN110569367A (zh) 一种基于知识图谱的空间关键字查询方法、装置及设备
JP5345582B2 (ja) シソーラス構築システム、シソーラス構築方法およびシソーラス構築プログラム
KR101747532B1 (ko) 여행성 질의에 대응하는 검색 결과로 코스를 추천하는 방법 및 시스템
KR101768089B1 (ko) 목차를 이용한 문서 관리를 위한 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록매체
Li et al. A probabilistic topic-based ranking framework for location-sensitive domain information retrieval
Chatterjee et al. SAGEL: smart address geocoding engine for supply-chain logistics
CN116662583B (zh) 一种文本生成方法、地点检索方法及相关装置
CN117076590A (zh) 地址标准化方法、装置、计算机设备及可读存储介质
KR101363335B1 (ko) 문서 분류모델 생성장치 및 방법
Wang et al. Interactive trip planning using activity trajectories
Chuang et al. Detecting outdated POI relations via web‐derived features
TWI427494B (zh) 雲端架構的專利文件檢索平台、處理方法及其檢索方法
TW202247002A (zh) 用以去除資料庫之重複興趣點的方法及系統
KR101662527B1 (ko) 메타데이터 라이브러리를 이용한 문서 관리를 위한 장치, 이를 위한 방법 및 이 방법이 기록된 컴퓨터 판독 가능한 기록매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1217756

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant