CN117251554B - 一种非标准地址转标准地址的方法 - Google Patents
一种非标准地址转标准地址的方法 Download PDFInfo
- Publication number
- CN117251554B CN117251554B CN202311522955.9A CN202311522955A CN117251554B CN 117251554 B CN117251554 B CN 117251554B CN 202311522955 A CN202311522955 A CN 202311522955A CN 117251554 B CN117251554 B CN 117251554B
- Authority
- CN
- China
- Prior art keywords
- words
- address
- library
- standard
- auxiliary
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 15
- 238000012216 screening Methods 0.000 claims description 26
- 239000000284 extract Substances 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000012545 processing Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000011425 standardization method Methods 0.000 description 2
- 241000723347 Cinnamomum Species 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Health & Medical Sciences (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种非标准地址转标准地址的方法,包括以下步骤:S1、构建标准地址库;S2、获取非标准地址文本去除冗余词;S3、提取区划词;S4、提取地名词;S5、提取语义关联词,对语义关联词进行关联匹配;S6、提取辅助词;S7、对获取的区划词、地名词和辅助词进行权重排序;S8、根据权重排序结果与全量地址库进行比对获取标准化地址;本发明通过建立全量地址库、行政区划库、语义词库和地名库,通过对非标准文本去除冗余词、提取区划词、地名词、语义关联词、辅助词后对分词按权重排序,然后与全量地址库进行全文检索匹配,通过多层检索,最终输出标准的地址文本信息,获取标准地址文本匹配精准,速度快,准确率高。
Description
技术领域
本发明涉及标准化地址生成技术领域,尤其涉及一种非标准地址转标准地址的方法。
背景技术
标准化地址对于一个城市至关重要,目前城市中存在不少重复或者模糊的地址,地址的不规范和多样性不仅会给社会公众带来一定的困扰,而且还会给城市的决策者在制定政策时产生一定的阻碍,当前政府中拥有地理实体地址的部门有公安、民政等部门,但各个部门之间数据的命名方式不完全一致,同一地理实体可能有多个名称,不利于统一管理。
目前将地理实体的名称进行规范化的方法主要是地名地址匹配技术,采用一定的规则将现有的名称进行分割然后获取关键词,利用获取的关键字对标准地址数据库进行检索进而确定地理实体的标准地址,当前地名地址匹配技术的缺陷如下:1、对非标准地名地址进行分割获取关键字的方法不够精确,有时无法获取关键字;2、对海量数据进行地名地址精确匹配的精度低;3、对海量数据进行地名地址精确匹配的效率差。
文献号为CN110046352A的专利文献,公开一种地址标准化方法及装置,该地址标准化方法包括获取地址信息;利用地址分词器对地址信息进行分词处理,依次将各个地址词条与标准词条库中的标准词条进行匹配;根据预存的标准词条与地址代码之间的对应关系,获取与匹配成功的词条对应的地址代码;形成地址信息对应的地址代码的字符串。其通过获取地址信息中的地址词条的地址代码,从而将地址信息转换为地址代码组合的字符串,很好地实现对地址信息的纠正,便于后续对地址信息的进一步处理。但同时存在:1、该申请输出是对输入地址文字的规范,不是从规范的标准地址库输出的地址,地址信息不完备;2、该申请未涉及对关键词的比对方法,不利于获取精准的标准地址;3、该申请没有地名词权重设置,不利于提高对非标地址的处理速度。
发明内容
本发明的目的在于提供一种非标准地址转标准地址的方法,通过对非标准文本去除冗余词、提取区划词、地名词、语义关联词、辅助词,进行全文检索匹配,获取标准地址文本,文本匹配精准高,速度快,准确率高。
本发明的目的可以通过以下技术方案实现:一种非标准地址转标准地址的方法,包括以下步骤:
S1、构建标准地址库,所述标准地址库包括全量地址库、行政区划库、语义词库和地名库;
S2、获取非标准地址文本,非标准地址文本与语义词库比对提取冗余词;
S3、去除冗余词的非标准地址文本与行政区划库比对提取区划词;
S4、去除区划词的非标准地址文本与地名库比对提取地名词;
S5、去除地名词的非标准地址文本与语义词库比对提取语义关联词,并对提取的语义关联词进行关联匹配;
S6、去除语义关联词的非标准地址文本与语义词库比对提取辅助词;
S7、对获取的区划词、地名词和辅助词进行权重排序;
S8、根据权重排序结果与全量地址库进行比对获取标准化地址。
进一步地:所述语义词库包括辅助词库、冗余词库和关联词库。
进一步地:所述S7权重排序中,地名词的权重排序级别最高。
进一步地:所述S5中对提取的语义关联词进行关联匹配时,包括对区划词、地名词和辅助词进行关联。
进一步地:所述S6中的辅助词包括幢栋辅助词和街区辅助词。
进一步地:所述S8中根据权重排序结果与全量地址库进行比对获取标准化地址的步骤为:
S81a、使用地名词与全量地址库进行比对筛选,获取含有地名词的标准化地址数据;
S82a、使用区划词与含有地名词的标准化地址数据进行比对筛选,获取含有地名词和区划词的标准化地址数据;
S83a、使用幢栋辅助词与含有地名词和区划词的标准化地址数据进行比对筛选,获取含有地名词、区划词和幢栋辅助词的标准化地址数据。
进一步地:所述S81中使用地名词与全量地址库进行比对筛选还包括以下步骤:
S81b、使用地名词与全量地址库进行比对筛选,未获取含有地名词的标准化地址数据;
S82b、使用街区辅助词与全量地址库进行比对筛选,获取含有街区辅助词的标准化地址数据;
S83b、使用区划词与含有街区辅助词的标准化地址数据进行比对筛选,获取含有区划词和街区辅助词的标准化地址数据;
S84b、使用幢栋辅助词与含有区划词和街区辅助词的标准化地址数据进行比对筛选,获取含有地名词、街区辅助词和幢栋辅助词的标准化地址数据。
本发明的有益效果:
1、本发明通过建立全量地址库、行政区划库、语义词库和地名库,通过对非标准文本去除冗余词、提取区划词、地名词、语义关联词、辅助词后对分词按权重排序,然后与全量地址库进行全文检索匹配,通过多层检索,最终输出标准的地址文本信息,获取标准地址文本匹配精准,速度快,准确率高。
2、本发明把提高地名词权重,地名词具有较高的辨识度,把地名词赋予最高的权重,优先进行比对,可以筛选除去大量无用的数据,从而缩小筛选比对量,提高筛选比对的速度。
3、本发明建立关联词库,可以对非标准地址文本中输入错误的区划词、地名词进行关联匹配,提高获取标准地址文本匹配精准。
4、本发明通过地名词与街区辅助词关联,辅助词库中存储的街区辅助词与对应的地名词具有对应性,对非标准地址文本识别度更高,增加了非标准地址文本转为标准地址文本的效率。
附图说明
图1为本发明一种非标准地址转标准地址的方法的流程示意图;
图2为本发明进行标准化地址筛选比对的示例图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中表示,其中自始至终相同或类似的符号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解对本发明的限制。
如图1-图2所示,本发明公开一种非标准地址转标准地址的方法,包括以下步骤:
S1、构建标准地址库,所述标准地址库包括全量地址库、行政区划库、语义词库和地名库;
S2、获取非标准地址文本,非标准地址文本与语义词库比对提取冗余词;
S3、去除冗余词的非标准地址文本与行政区划库比对提取区划词;
S4、去除区划词的非标准地址文本与地名库比对提取地名词;
S5、去除地名词的非标准地址文本与语义词库比对提取语义关联词,并对提取的语义关联词进行关联匹配;
S6、去除语义关联词的非标准地址文本与语义词库比对提取辅助词;
S7、对获取的区划词、地名词和辅助词进行权重排序;
S8、根据权重排序结果与全量地址库进行比对获取标准化地址。
本发明标准化地址是指经过标准化处理存储于全量地址库内的标准化地址,标准化地址具有确定的区划词、地名词和辅助词,能够清晰准确的对地址信息进行表达。
区划词是可以清楚划定省、市、区(县)的行政区域划分词,例如“安徽省”、“合肥市”、“蜀山区”等行政区域词。
地名词是可以清楚划定小区、商业中心或村级的区域划分词。例如“广电中心”、“港汇广场”、“恒润花园”“洪岗村”等区域划分词。
辅助词是可以辅助识别地名词的信息,可以包括幢栋辅助词和街区辅助词,街区辅助词可以辅助识别地名词,与地名词形成对应关系,例如“望江西路900号”;幢栋辅助词用于细化地名词范围, 例如“E区10幢501室”。
语义关联词用于对区划词和地名词进行关联识别,进行关联度级别排序,例如对区划词的“亳州市---毫州市”的对应,如果比对是“毫州市”,通过语义关联词关联,可以把“毫州市”关联为正确的“亳州市”,实现对误输入区划词的纠正,还比如地名词中的“香樟花园---香樟花圆”“安徽省---皖”通过语义关联词可以对误输入地名词进行纠正。
冗余词是指非标准地址文本中与地址信息无关的一些多余词,如“的”、“了”等影响匹配结果的冗余词。
开始前首先构建标准地址库,标准地址库包括全量地址库、行政区划库、语义词库和地名库,其中语义词库又包括辅助词库、冗余词库和关联词库。
全量地址库为包括所有标准地址要素的数据库,用于存储标准地址的数据库。
行政区划库用于保存区划词,地名库用于保存地名词,辅助词库用于保存街区辅助词、幢栋辅助词和街区辅助词关联,冗余词库用于保存冗余词,关联词库用于保存关联词。
获取输入的非标准地址文本,首先比对提取冗余词,去除冗余词,然后依次提取非标准地址文本中的区划词、地名词、语义关联词和辅助词。
然后对获取的区划词、地名词和辅助词进行权重排序。
例如排序后地名词的权重最高,作为优先比对的基础,然后进行区划词和辅助词进行权重排序,根据权重排序结果与全量地址库进行比对获取标准化地址。
具体的,根据权重排序结果与全量地址库进行比对获取标准化地址的步骤可以为:
S81a、使用地名词与全量地址库进行比对筛选,获取含有地名词的标准化地址数据;
S82a、使用区划词与含有地名词的标准化地址数据进行比对筛选,获取含有地名词和区划词的标准化地址数据;
S83a、使用幢栋辅助词与含有地名词和区划词的标准化地址数据进行比对筛选,获取含有地名词、区划词和幢栋辅助词的标准化地址数据。
地名词具有较高的辨识度,把地名词赋予最高的权重,优先进行比对,可以筛选除去大量无用的数据,从而缩小筛选比对量,提高筛选比对的速度。
如图2所示,把“中安创谷”最为地名词进行比对筛选,筛选后的数据中,区划词中包括“合肥市”数据量得到大幅缩减,通过地名词“中安创谷”和区划词“合肥市”可以获取,在地名词前部分包含有“安徽省合肥市望江西路900号中安创谷”信息的标准化地址,对获取含有“安徽省合肥市望江西路900号中安创谷”标准化地址的信息再进行幢栋辅助词筛选比对,最终获取含有地名词、区划词和幢栋辅助词的标准化地址数据。
当获取的非标准地址文本中地名词无法全量地址库筛选,或者非标准地址文本无法找出合适的地名词,此时可以采用以下步骤进行处理
S81b、使用地名词与全量地址库进行比对筛选,未获取含有地名词的标准化地址数据;
S82b、使用街区辅助词与全量地址库进行比对筛选,获取含有街区辅助词的标准化地址数据;
S83b、使用区划词与含有街区辅助词的标准化地址数据进行比对筛选,获取含有区划词和街区辅助词的标准化地址数据;
S84b、使用幢栋辅助词与含有区划词和街区辅助词的标准化地址数据进行比对筛选,获取含有地名词、街区辅助词和幢栋辅助词的标准化地址数据。
例如,如图2所示的,辅助词库中存储的街区辅助词与对应的地名词具有对应性,在辅助词库中“望江西路900号---中安创谷”关联,通过街区辅助词“望江西路900号”可以完成对非标准地址文本筛选比对,输出标准地址文本;还比如“空天信息产业园”是“中安创谷”的另一种称呼,相互之间具有关联性,通过辅助词库把“空天信息产业园---中安创谷”关联,通过辅助词库中“空天信息产业园”可以完成对非标准地址文本筛选比对,输出标准地址文本。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
需要理解的是,术语“中心”、“纵向”、“横向”、“长度”、“宽度”、“厚度”、“上”、“下”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”、“顺时针”、“逆时针”、“轴向”、“径向”、“周向”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本发明的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本发明中,除非另有明确的规定和限定,术语“安装”、“相连”、“连接”、 “固定”等术语应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或成一体;可以是机械连接,也可以是电连接或彼此可通讯;可以是直接相连,也可以通过中间媒介间接相连,可以是两个元件内部的连通或两个元件的相互作用关系,除非另有明确的限定。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
在本发明中,除非另有明确的规定和限定,第一特征在第二特征“上”或 “下”可以是第一和第二特征直接接触,或第一和第二特征通过中间媒介间接接触。而且,第一特征在第二特征“之上”、“上方”和“上面”可是第一特征在第二特征正上方或斜上方,或仅仅表示第一特征水平高度高于第二特征。第一特征在第二特征 “之下”、“下方”和“下面”可以是第一特征在第二特征正下方或斜下方,或仅仅表示第一特征水平高度小于第二特征。
Claims (1)
1.一种非标准地址转标准地址的方法,其特征在于,包括以下步骤:
S1、构建标准地址库,所述标准地址库包括全量地址库、行政区划库、语义词库和地名库;
S2、获取非标准地址文本,非标准地址文本与语义词库比对提取冗余词;
S3、去除冗余词的非标准地址文本与行政区划库比对提取区划词;
S4、去除区划词的非标准地址文本与地名库比对提取地名词;
S5、去除地名词的非标准地址文本与语义词库比对提取语义关联词,并对提取的语义关联词进行关联匹配;
S6、去除语义关联词的非标准地址文本与语义词库比对提取辅助词;
S7、对获取的区划词、地名词和辅助词进行权重排序;
S8、根据权重排序结果与全量地址库进行比对获取标准化地址;
其中,全量地址库为包括所有标准地址要素的数据库;辅助词为辅助识别地名词的信息辅助词;语义关联词用于对区划词和地名词进行关联识别;
所述语义词库包括辅助词库、冗余词库和关联词库;
所述S6中的辅助词包括幢栋辅助词和街区辅助词;
所述S7权重排序中,地名词的权重排序级别最高;
所述S8中根据权重排序结果与全量地址库进行比对获取标准化地址的步骤为:
S81a、使用地名词与全量地址库进行比对筛选,获取含有地名词的标准化地址数据;
S82a、使用区划词与含有地名词的标准化地址数据进行比对筛选,获取含有地名词和区划词的标准化地址数据;
S83a、使用幢栋辅助词与含有地名词和区划词的标准化地址数据进行比对筛选,获取含有地名词、区划词和幢栋辅助词的标准化地址数据。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311522955.9A CN117251554B (zh) | 2023-11-16 | 2023-11-16 | 一种非标准地址转标准地址的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311522955.9A CN117251554B (zh) | 2023-11-16 | 2023-11-16 | 一种非标准地址转标准地址的方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117251554A CN117251554A (zh) | 2023-12-19 |
CN117251554B true CN117251554B (zh) | 2024-02-20 |
Family
ID=89131677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311522955.9A Active CN117251554B (zh) | 2023-11-16 | 2023-11-16 | 一种非标准地址转标准地址的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117251554B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090012644A (ko) * | 2007-07-31 | 2009-02-04 | 주식회사 비즈모델라인 | 정보처리 방법과 이를 위한 기록매체 |
CN103605752A (zh) * | 2013-11-21 | 2014-02-26 | 武大吉奥信息技术有限公司 | 一种基于语义识别的地址匹配方法 |
CN109359200A (zh) * | 2018-10-11 | 2019-02-19 | 北京国信达数据技术有限公司 | 地名地址数据智能解析*** |
CN111159973A (zh) * | 2019-12-13 | 2020-05-15 | 中关村科技软件股份有限公司 | 一种中文地址的行政区划补齐及标准化方法 |
CN111291277A (zh) * | 2020-01-14 | 2020-06-16 | 浙江邦盛科技有限公司 | 一种基于语义识别和高级语言搜索的地址标准化方法 |
CN111695355A (zh) * | 2020-05-26 | 2020-09-22 | 平安银行股份有限公司 | 地址文本识别方法、装置、介质、电子设备 |
CN112084773A (zh) * | 2020-08-21 | 2020-12-15 | 国网湖北省电力有限公司电力科学研究院 | 一种基于词库双向最大匹配法的电网停电地址匹配方法 |
CN115809315A (zh) * | 2022-11-24 | 2023-03-17 | 中科星图智慧科技安徽有限公司 | 一种地名地址标准化匹配算法 |
WO2023091434A1 (en) * | 2021-11-19 | 2023-05-25 | SafeGraph, Inc. | Systems and methods for translating address strings to standardized addresses |
CN116414824A (zh) * | 2021-12-30 | 2023-07-11 | 丰图科技(深圳)有限公司 | 行政区划信息识别和标准化处理的方法、装置及存储介质 |
-
2023
- 2023-11-16 CN CN202311522955.9A patent/CN117251554B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090012644A (ko) * | 2007-07-31 | 2009-02-04 | 주식회사 비즈모델라인 | 정보처리 방법과 이를 위한 기록매체 |
CN103605752A (zh) * | 2013-11-21 | 2014-02-26 | 武大吉奥信息技术有限公司 | 一种基于语义识别的地址匹配方法 |
CN109359200A (zh) * | 2018-10-11 | 2019-02-19 | 北京国信达数据技术有限公司 | 地名地址数据智能解析*** |
CN111159973A (zh) * | 2019-12-13 | 2020-05-15 | 中关村科技软件股份有限公司 | 一种中文地址的行政区划补齐及标准化方法 |
CN111291277A (zh) * | 2020-01-14 | 2020-06-16 | 浙江邦盛科技有限公司 | 一种基于语义识别和高级语言搜索的地址标准化方法 |
CN111695355A (zh) * | 2020-05-26 | 2020-09-22 | 平安银行股份有限公司 | 地址文本识别方法、装置、介质、电子设备 |
CN112084773A (zh) * | 2020-08-21 | 2020-12-15 | 国网湖北省电力有限公司电力科学研究院 | 一种基于词库双向最大匹配法的电网停电地址匹配方法 |
WO2023091434A1 (en) * | 2021-11-19 | 2023-05-25 | SafeGraph, Inc. | Systems and methods for translating address strings to standardized addresses |
CN116414824A (zh) * | 2021-12-30 | 2023-07-11 | 丰图科技(深圳)有限公司 | 行政区划信息识别和标准化处理的方法、装置及存储介质 |
CN115809315A (zh) * | 2022-11-24 | 2023-03-17 | 中科星图智慧科技安徽有限公司 | 一种地名地址标准化匹配算法 |
Non-Patent Citations (2)
Title |
---|
中文地址匹配***的设计与优化;张文豪;信息科技;全文 * |
基于分布式架构的时空大数据管理***设计与实现;王黎升;自然资源信息化;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117251554A (zh) | 2023-12-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103440312B (zh) | 一种通信地址查询邮政编码的***及终端 | |
WO2016165538A1 (zh) | 一种地址数据的管理方法和装置 | |
CN108369582B (zh) | 一种地址纠错方法及终端 | |
CN106383836A (zh) | 将可操作属性归于描述个人身份的数据 | |
CN113535959B (zh) | 面向基层治理的事件自动分拨方法 | |
CN105786800A (zh) | 一种警用标准地址获取方法及*** | |
CN112528664B (zh) | 基于多任务联合学习与地址层级结构知识的地址匹配方法 | |
CN112364114A (zh) | 地址标准化方法、装置、计算机设备和存储介质 | |
CN112364113A (zh) | 一种地址纠错方法及*** | |
CN107608981B (zh) | 基于正则表达式的字符匹配方法及*** | |
CN115168345B (zh) | 数据库分级分类方法、***、装置及存储介质 | |
CN111782892B (zh) | 基于前缀树的相似字符识别方法、设备、装置和存储介质 | |
CN106959961A (zh) | 一种地址识别方法及装置 | |
CN116414824A (zh) | 行政区划信息识别和标准化处理的方法、装置及存储介质 | |
CN103020038A (zh) | 一种网络舆情地域相关度的计算方法 | |
CN109165331A (zh) | 一种英文地名的索引建立方法及其查询方法和装置 | |
CN115562679A (zh) | 一种基于Java语言的自动生成代码的方法及服务器 | |
CN117251554B (zh) | 一种非标准地址转标准地址的方法 | |
CN116414823A (zh) | 一种基于分词模型的地址定位方法和装置 | |
CN113761137B (zh) | 一种提取地址信息的方法及装置 | |
CN111460054A (zh) | 地址数据处理方法及装置、设备和存储介质 | |
CN117494711A (zh) | 一种基于语义的用电地址相似度匹配的方法 | |
KR20110024571A (ko) | 지역 정보 서비스 제공 시스템 및 그 방법 | |
CN112417812B (zh) | 地址标准化方法、***及电子设备 | |
CN115935086A (zh) | 地址信息识别方法、信息推送方法以及信息展示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |