KR100911762B1 - System and method for standardizing address - Google Patents

System and method for standardizing address Download PDF

Info

Publication number
KR100911762B1
KR100911762B1 KR1020080059198A KR20080059198A KR100911762B1 KR 100911762 B1 KR100911762 B1 KR 100911762B1 KR 1020080059198 A KR1020080059198 A KR 1020080059198A KR 20080059198 A KR20080059198 A KR 20080059198A KR 100911762 B1 KR100911762 B1 KR 100911762B1
Authority
KR
South Korea
Prior art keywords
code
address
unit
standardization
building
Prior art date
Application number
KR1020080059198A
Other languages
Korean (ko)
Inventor
김은석
Original Assignee
(주)지디에스케이
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by (주)지디에스케이 filed Critical (주)지디에스케이
Priority to KR1020080059198A priority Critical patent/KR100911762B1/en
Application granted granted Critical
Publication of KR100911762B1 publication Critical patent/KR100911762B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Document Processing Apparatus (AREA)

Abstract

An address standardization system and a method thereof for preventing the description of address data are provided to grasp the other address system corresponding to about one address system easily. A parsing unit(102) produces a unit address corresponding to the range of each regional division standards according to the range of the regional division standards. A database unit(105) includes a reference storing a standardization code and a unit code. An EC code generation area gives the EC code to each unit code. A sequential standardization unit(104) successively adds a unit code of the low address to the unit code of an upper address. The sequential standardization unit determines the error according to the absence of a unit code. The normalizing code in which the priority corresponds to the most high EC code is selected and the final code is replaced.

Description

주소표준화 시스템 및 방법{System and method for standardizing address}System and method for standardizing address

본 발명은 주소표준화를 위한 시스템 및 방법에 관한 것으로서, 더욱 상세히는 실제 입력되는 주소 데이터와 법적으로 혹은 행정적으로 규정된 주소와의 기재 차이를 보상하여 각기 상이한 주소 체계를 모두 커버할 수 있도록 하며, 상기 주소 데이터의 잘못된 기재를 방지할 뿐만 아니라 상기 주소 데이터로부터 획득될 수 있는 각종 부수 데이터들을 제공하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for address standardization, and more particularly, to compensate for a difference between an address data actually input and a legally or administratively defined address so as to cover all different address systems. The present invention relates to a system and method for preventing mis-entry of the address data as well as providing various subsidiary data that can be obtained from the address data.

일반적으로 주소체계를 일원화하기 위하여 지역을 편의상 적당하게 분할하여 공식 문서상에 사용되는 법정동을 일반적인 주소로서 사용하고 있지만, 지방자치체계의 발전과 인구 유동성의 증가로 인해 일정 구역에서 유입 또는 유출되는 인구 규모에 따라 행정 업무의 편의성을 증대시키기 위하여 구역을 다시 세분화하여 행정동으로서 관리되고 있다.In general, for the purpose of unifying the address system, the district is used as a common address by dividing the area appropriately for convenience and using the official document as a general address. In order to increase the convenience of administrative work, the district is further subdivided and managed as an administrative building.

즉, 특정 법정동의 인구 증가에 따라 관리 체계의 세분화가 요구될 경우 상기 법정동을 복수의 행정동으로 나누어 관리하며, 반대로 특정 법정동의 인구 감소나 법정동의 너비 정도에 대비하여 인구 규모가 상대적으로 적을 경우 복수의 법정 동을 하나의 행정동으로 통합하여 관리되기도 한다.In other words, if segmentation of the management system is required in accordance with the increase in the population of a specific legal dong, the administrative dong is divided into a plurality of administrative dongs, and conversely, when the population size is relatively small in comparison to the decrease in population or the width of the legal dong, It is also managed by consolidating the statutory dong into one administrative dong.

더불어, 규정된 지역명에서 벗어나 특정 지역군에서 관습적으로 사용되는 지명이거나, 일반적인 상위 주소에 해당하는 읍·면·리에 비해 특정 유명 건물의 명칭이나 상공업의 발전과 더불어 공단과 같은 하위주소가 각인되어 상위주소를 대체하여 통상적으로 사용되는 지명인 상용동도 주소체계의 일부분을 구성하고 있다.In addition, it is a place name that is customarily used in a specific local group, apart from the prescribed area name, or a sub-address such as the industrial complex with the name of a specific famous building or the development of industrial and industrial industry, in comparison to the towns and villages that are general upper addresses. It replaces the upper address and forms part of the commercial Dongdo address system, which is a commonly used place name.

이와 같이, 법규정, 사회환경의 변화, 지역 특색에 따른 주소 명칭의 다변화에 따라 고객을 관리하는 기업이나 행정업무를 처리하는 관청이 업무를 처리하는 과정에서 상기 기업이나 관청에서 기설정된 기준과 실제 사용되는 주소의 차이로 인하여 정상적으로 고객이나 주민 정보를 수집하지 못하거나 상이한 주소 기재에 따른 업무 혼란을 가중시키는 문제점이 나타나고 있다.In this way, according to laws, changes in the social environment, and diversification of address names according to local characteristics, offices that manage customers or offices handling administrative affairs may set standards and actual standards set by the companies or offices in the course of their work. Due to the difference in the address used, there is a problem of failing to collect customer or resident information normally or increasing business confusion caused by different address descriptions.

이를 해결하기 위하여, 최근 다변화된 주소를 일원화하기 위한 시스템을 마련하여 이를 해결하고자 하나, 상기 법정동, 행정동 또는 상용동 중 어느 하나의 주소 명칭 기준으로 나머지 주소를 매칭시키는 작업 과정이 복잡하여 효율적인 프로세서를 마련하기가 상당히 곤란하고, 일부 주소를 누락하거나 오기를 그대로 방치하여 업무 혼란성을 더욱 증대시키는 문제가 있었다.In order to solve this problem, a system for unifying recently diversified addresses has been proposed and solved. However, an efficient processor is required because the process of matching the remaining addresses based on any one of the above-mentioned statutory building, administrative building, or commercial building is complicated. Difficult to prepare, there was a problem of increasing some of the business confusion by missing some addresses or leaving them as they are.

더불어, 지역에 따라 상기 법정동, 행정동 또는 상용동을 사용하는 비중이 상이하여 어느 하나의 주소 명칭 기준에 따라 설정된 시스템이 특정 지역에서만 높은 효율성을 나타내므로 효용 가치가 상대적으로 떨어지며, 상기 주소 명칭 기준을 교체할 경우 이를 기준으로 설정된 부수적인 작업 플로우와 데이터들을 전부 새로운 기준에 대응하는 프로세스로 교체하여야 하므로 비용부담이 증대되는 문제점이 야기된다.In addition, since the ratio of using the statutory building, administrative building, or commercial building differs depending on the region, the utility value is relatively low because the system set up according to any one of the address naming standards exhibits high efficiency only in a specific region. In case of replacement, the additional work flow and data set based on this need to be replaced by a process corresponding to the new standard, which causes a problem of increased cost burden.

이외에도, 상기 시스템에 도출한 결과를 검증하기 위한 부가 작업이 없어 도출된 데이터에 대한 신뢰성이 떨어지며, 특정 작업에 대하여 단순히 데이터를 보존 및 관리하는 것에 그쳐 상기 데이터를 활용하여 부수적인 통계조사나 다른 업무 프로세서와 연계하여 응용하는 데에는 한계가 있었다.In addition, there is no additional work for verifying the results derived from the system, so the reliability of the derived data is low, and only the preservation and management of the data for a specific task is used, and the additional statistical research or other tasks are utilized. There was a limit to the application in conjunction with the processor.

따라서, 본 발명은 입력되는 주소데이터를 근거로 각각의 다양한 주소 체계에 대응하는 주소 데이터로 변환하여 수집한 후 이를 근거로 상기 주소 체계 중 어느 것을 기준으로 검색하더라도 원하는 데이터 및 일관된 결과를 도출하여 신뢰성을 높일 수 있도록 하는데 목적이 있다.Therefore, the present invention converts and collects address data corresponding to each of various address systems based on the input address data, and then, based on this, retrieves the desired data and consistent results based on any of the address systems based on this. The purpose is to increase the.

또한, 본 발명은 입력되는 주소데이터를 기설정된 데이터베이스를 기준으로 매칭 및 변환하여 수집할 경우 복수의 비교 설정 기준들을 마련하여 입력되는 주소데이터가 일부 누락되거나 주소의 어느 일부분이 나머지와 연관성이 없는 경우에도 표준화할 수 있도록 하여 신뢰성을 높이는데 그 목적이 있다.In addition, the present invention provides a plurality of comparison setting criteria when collecting and converting the input address data based on a predetermined database when the input address data is partially missing or any part of the address is not associated with the rest Its purpose is to increase reliability by enabling standardization.

또한, 본 발명은 수집된 데이터의 오류에 의해 도출되는 데이터의 신뢰성 정도를 판단할 수 있는 기준을 마련하여, 신뢰성이 낮은 데이터에 관해서는 반복 오류수정 과정을 거치거나 수작업을 통해 데이터를 정정할 수 있도록 하는 기회를 제공하는데 그 목적이 있다.In addition, the present invention provides a criterion for determining the degree of reliability of the data derived by the error of the collected data, it is possible to correct the data through the repetitive error correction process or by manual for the low reliability data Its purpose is to provide an opportunity to do so.

더하여, 본 발명은 수집된 데이터를 근거로 차후 입력되는 주소데이터에 대응되는 추가정보를 제공하여 다양한 분야에 활용할 수 있도록 하는데 그 목적이 있다.In addition, it is an object of the present invention to provide additional information corresponding to address data which is input later based on the collected data to be utilized in various fields.

상기한 목적을 달성하기 위한 본 발명에 따른 주소표준화 시스템은 사용자로부터 입력받은 주소데이터를 최상위주소부터 지역구분 기준의 범위에 따라 순차적으로 파싱하여 각 지역구분 기준의 범위에 해당하는 단위주소를 생성하는 파싱부와, 지역구분 기준의 범위에 따라 각 단위주소에 매칭되는 단위코드와 상기 단위코드의 단위주소가 속한 상위주소에 대한 표준화코드가 매칭되어 저장된 레퍼런스를 구비한 DB부와, 상기 지역구분 기준 및 표준화코드와의 일치정도에 따라 각 단위코드에 우선순위에 대한 코드인 EC코드를 부여하는 EC코드 생성부와, 상기 파싱부로부터 순차적으로 제공되는 상기 단위주소마다 상기 레퍼런스와 매칭하여 상위주소의 단위코드에 하위주소의 단위코드를 순차적으로 부가하여 최종코드를 생성하며, 상기 단위주소에 매칭되는 단위코드의 부재 또는 불일치에 따라 오류여부를 판단하여 오류 발생시 상기 레퍼런스에 상기 EC 코드 생성부가 상기 오류 발생 이후에 제공되는 지역구분 기준 범위의 상기 단위주소와 매칭되는 상기 단위코드에 부여한 EC 코드 중에서 우선순위가 가장 높은 EC 코드에 대응하는 상기 표준화코드를 선택하여 상기 최종코드를 대체하는 순차표준화부로 구성될 수 있다.
이때, 상기 주소표준화 시스템은 상기 주소데이터를 정제하여 상기 파싱부에 정제된 주소데이터를 전달하는 문자열 정제부가 더 구성될 수 있다. 또한, 상기 지역구분 기준은 법정동, 행정동 또는 상용동인 것을 특징으로 할 수 있다.
한편, 상기 단위주소는 광역시, 시군구, 읍면동, 리, 번지, 건물명, 건물동 또는 건물호 중 적어도 하나를 포함할 수 있다. 더하여, 상기 주소데이터가 건물명을 포함하는 경우 건물명을 건물키워드와 키워드 위치를 근거로 정제하는 건물명정제부를 더 포함할 수 있다.
또한, 상기 오류발생은 상기 단위주소와 매칭되는 상기 표준화코드가 없거나 상기 주소데이터에 포함된 상기 지역구분 기준의 범위 중 일부가 누락되어 상기 범위의 단위주소를 건너뛰는 경우를 포함하는 것을 특징으로 할 수 있다.
더하여, 상기 순차표준화부는 오류발생시 상기 오류발생 이후에 매칭되는 단위코드와 상기 오류발생 이전까지 생성된 최종코드를 상기 EC 코드 생성부에 제공할 수 있으며, 상기 EC 코드 생성부는 오류 발생에 따라 제공된 상기 단위코드와 최종코드를 근거로 상기 단위코드를 포함하는 적어도 하나 이상의 레퍼런스에 상기 최종코드와의 일치정도에 따라 상기 EC 코드를 부여하는 것을 특징으로 할 수 있다.
또한, 상기 주소표준화 시스템은 상기 순차표준화부를 모니터링하여 각 단위주소마다 상기 오류발생을 체크하며, 오류가 발생된 단위주소마다 대응하는 결과코드를 생성하여 취합하는 결과코드 생성부를 더 포함할 수 있으며, 상기 결과코드 생성부는 매칭되는 상기 단위코드의 존재여부, 우선순위가 높은 EC 코드를 선택함에 따라 수정 및 추가되는 상기 단위주소의 지역구분 기준의 범위에 대하여 서로 다른 결과코드를 부여하여 각 단위주소의 오류종류를 구분하는 것을 특징으로 할 수 있다.
한편, 상기한 목적을 달성하기 위한 본 발명에 따른 주소표준화 방법은 지역구분 기준에 따라 사용자로부터 입력된 주소데이터를 정제하여 표준화된 주소를 생성하는 주소표준화 시스템의 주소표준화 방법에 있어서, 사용자로부터 입력받은 주소데이터를 최상위주소부터 지역구분 기준의 범위에 따라 순차적으로 파싱하여 각 지역구분 기준의 범위에 해당하는 단위주소를 생성하는 제 1단계와, 지역구분 기준의 범위에 따라 각 단위주소에 매칭되는 단위코드와 상기 단위코드의 단위주소가 속한 상위주소에 대한 표준화코드가 매칭되어 저장된 레퍼런스를 호출하는 제2단계와, 순차적으로 제공되는 상기 단위주소를 상기 레퍼런스와 매칭하는 제3단계와, 상기 제3단계를 통해 매칭된 상위주소의 단위코드에 이후 상기 제 1 내지 제 3단계를 반복하여 매칭되는 하위주소의 단위코드를 순차적으로 부가하여 최종코드를 생성하는 제4단계와, 상기 제4단계에서 각 단위주소에 대한 상기 최종코드 생성마다 상기 단위주소에 매칭되는 단위코드의 부재 또는 상기 최종코드와 표준화코드의 불일치를 판단하여 오류 발생시 상기 오류 발생 이후에 제공되는 지역구분 기준 범위의 상기 단위주소와 매칭되는 적어도 하나 이상의 단위코드에 상기 지역구분 기준 및 상기 최종코드와 표준화코드와의 일치정도에 따라 우선순위에 대한 코드인 EC코드를 부여하고, 우선순위가 가장 높은 EC 코드가 부여된 단위코드에 대응하는 상기 표준화코드를 선택하여 상기 제4단계의 최종코드를 상기 표준화코드로 대체하는 제5단계로 이루어질 수 있다.
이때, 상기 지역구분 기준은 법정동, 행정동 또는 상용동 중 어느 하나일 수 있으며, 상기 단위주소는 광역시, 시군구, 읍면동, 리, 번지 또는 건물명, 건물동, 건물호 중 어느 하나일 수 있다.
또한, 상기 제3단계에서 상기 단위주소가 건물명일 경우 상기 단위코드는 기설정된 건물명의 키워드 위치와 건물키워드로부터 획득한 건물분류코드인 것을 특징으로 할 수 있다.
더하여, 상기 제3단계는 매칭되는 단위코드가 없을 경우 오류발생을 나타내는 결과코드를 생성할 수 있으며, 상기 결과코드는 단위주소의 존재여부, 우선순위가 높은 EC 코드에 해당하는 상기 표준화코드를 선택함에 따른 상기 최종코드의 수정 및 추가에 대하여 서로 다른 결과코드가 생성되어 각 단위주소의 오류종류를 구분하는 것을 특징으로 할 수 있다.
또한, 상기 주소표준화 방법은 상기 제4단계의 상기 최종코드를 근거로 상기 레퍼런스를 스캔하여 매칭되는 인증주소를 출력하는 제6단계를 더 포함할 수 있다.
더하여, 상기 주소데이터는 우편번호를 더 포함하며, 상기 레퍼런스는 우편번호에 대한 단위코드를 포함하는 것을 특징으로 할 수 있다.
이외에도, 상기 주소표준화 방법은 상기 주소데이터가 전화번호일 경우 상기 단위주소는 전화번호의 지역번호, 국번 또는 가입자번호 중 어느 하나이며, 상기 단위주소를 기설정된 길이로 보상하여 제4단계의 상기 최종코드에 부가함으로써 가구화 ID를 생성하는 제7단계를 더 포함할 수 있다.
The address standardization system according to the present invention for achieving the above object is to sequentially parse the address data input from the user according to the range of the region classification criteria from the highest address to generate a unit address corresponding to each region classification criteria. A DB unit including a parsing unit, a reference stored by matching a unit code matching each unit address according to a range of a regional classification standard and a standardized code for a higher address to which the unit address of the unit code belongs, and the local classification standard; And an EC code generation unit for giving each unit code an EC code, which is a priority code, according to the degree of matching with the standardization code, and matching the reference to each unit address sequentially provided from the parsing unit. The final code is generated by sequentially adding the unit code of the lower address to the unit code. EC code assigned to the unit code matched with the unit address of the region classification reference range provided after the error is determined by the EC code generation unit to determine whether an error according to the absence or inconsistency of the matching unit code. It may be configured with a sequential standardization unit to select the standardization code corresponding to the EC code of the highest priority among the above to replace the final code.
In this case, the address standardization system may further include a string refiner configured to purify the address data and deliver the refined address data to the parser. In addition, the regional classification criteria may be characterized in that the court dong, administrative dong or commercial dong.
On the other hand, the unit address may include at least one of metropolitan city, Sigun-gu, Eupmyeon-dong, Lee, address, building name, building dong or building number. In addition, when the address data includes a building name, the building name refining unit may further include refining the building name based on the building keyword and the keyword location.
In addition, the occurrence of the error may include a case in which the standardized code matching the unit address does not exist or a part of the range of the region classification criteria included in the address data is missing and the unit address of the range is skipped. Can be.
In addition, the sequential standardization unit may provide the EC code generation unit with a unit code matched after the error occurrence and a final code generated before the error occurrence when the error occurs, and the EC code generation unit provided according to the error occurrence. The EC code may be assigned to at least one reference including the unit code based on the unit code and the final code according to the degree of correspondence with the final code.
The address standardization system may further include a result code generation unit for monitoring the sequential standardization unit to check the occurrence of the error for each unit address, and generating and collecting a result code for each unit address in which the error occurs. The result code generating unit assigns different result codes to the range of the region classification criteria of the unit address to be modified and added according to whether the unit code to be matched and the EC code having a higher priority are selected. It may be characterized by distinguishing the error type.
On the other hand, the address standardization method according to the present invention for achieving the above object in the address standardization method of the address standardization system to generate a standardized address by purifying the address data input from the user according to the regional classification criteria, input from the user The first step of parsing the received address data sequentially from the top address according to the range of the regional classification criteria, and generating unit addresses corresponding to the range of each regional classification criteria, and matching each unit address according to the range of the regional classification criteria. A second step of calling a stored reference by matching a standard code of a unit code and a higher address to which the unit address of the unit code belongs; a third step of matching the unit address provided sequentially with the reference; After repeating the first to third steps to the unit code of the higher address matched in step 3 A fourth step of generating a final code by sequentially adding a unit code of a lower address, and the absence of the unit code matching the unit address for each generation of the final code for each unit address in the fourth step; Determination of inconsistency between the code and the standardized code, and when an error occurs, at least one or more unit codes that match the unit address of the regional classification standard range provided after the error occurs, and the degree of matching between the regional classification standard and the final code and the standardized code. And assigning the EC code which is a code for priority, and selecting the standardization code corresponding to the unit code to which the EC code having the highest priority is assigned and replacing the final code of the fourth step with the standardization code. It can be done in five steps.
At this time, the regional classification criteria may be any one of legal dong, administrative dong or commercial dong, and the unit address may be any one of metropolitan city, Sigun-gu, Eupmyeon-dong, Lee, address or building name, building dong, building number.
In the third step, if the unit address is a building name, the unit code may be a building classification code obtained from a keyword location and a building keyword of a predetermined building name.
In addition, the third step may generate a result code indicating an error occurrence when there is no matching unit code, the result code selects the standardization code corresponding to the presence of a unit address, EC code of high priority As a result, different result codes may be generated for modification and addition of the final code to distinguish the types of errors in each unit address.
The address standardization method may further include a sixth step of scanning the reference based on the final code of the fourth step and outputting a matching authentication address.
In addition, the address data may further include a postal code, and the reference may include a unit code for the postal code.
In addition, in the address standardization method, when the address data is a phone number, the unit address may be any one of an area code, a station number, or a subscriber number of a phone number, and the unit address may be compensated to a predetermined length for the final step of the fourth step. The method may further include a seventh step of generating a household ID by adding the code.

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

삭제delete

본 발명은 법적 혹은 행정적으로 사용되는 주소체계를 모두 커버하도록 하여, 어느 하나의 주소체계에 대해 대응되는 다른 주소체계를 용이하게 파악하도록 하여 주소사용의 혼란을 해결하는 효과가 있다.The present invention has the effect of addressing the confusion of address use by covering all address systems used legally or administratively, and easily identifying other address systems corresponding to one address system.

또한, 본 발명은 상용적으로 사용되는 주소에 대하여 공적인 주소체계에 대응하는 주소를 생성하거나, 공적인 주소체계에 일치하는 주소가 없을 경우 상용적인 주소에 가장 근접한 공적인 주소를 출력하여 주소사용의 혼동을 방지할 수 있 다.In addition, the present invention generates an address corresponding to a public address system for a commercially used address, or outputs a public address closest to a commercial address when there is no address that matches the public address system, thereby confusion of address use. This can be prevented.

이외에도, 본 발명은 입력되는 데이터의 중복 표기 또는 일부 누락 주소를 자동으로 정정하여 이를 근거로 각각의 주소 체계에 대응되는 정확하게 표준화된 주소데이터를 제공하는 효과가 있다.In addition, the present invention has an effect of automatically correcting duplicate notation or partial missing address of the input data and providing accurate standardized address data corresponding to each address system based on this.

더불어, 본 발명은 생성된 최종코드를 수집하여 표준화코드를 기준으로 주소데이터를 검색할 경우 연관된 최종코드를 일목요연하게 추출할 수 있을 뿐 아니라, 상기 최종코드에 대응되는 주소와 상기 최종코드에 연관되는 부가정보를 동시에 획득할 수 있는 편이성을 제공하여 행정 및 회원 데이터베이스 구성에 용이하게 적용할 수 있는 효과가 있다.In addition, the present invention can not only extract the associated final code at a glance when searching the address data based on the standardized code by collecting the generated final code, it is associated with the address and the final code corresponding to the final code By providing the convenience of acquiring additional information at the same time, there is an effect that can be easily applied to the administrative and member database configuration.

또한, 본 발명은 주소표준화 과정에서 발생하는 표준화 결과코드를 통해 최종코드의 정확도 및 생성된 결과값의 종류를 용이하게 인식할 수 있을 뿐 아니라 오류정정 기회를 제공받을 수도 있어 제공되는 부가정보에 대한 신뢰성을 높일 수 있다.In addition, the present invention can not only easily recognize the accuracy of the final code and the type of the generated result through the standardized result code generated during the address standardization process, but may also be provided with an error correction opportunity. It can increase the reliability.

상기한 바와 같은 본 발명의 실시예들을 첨부된 도면들을 통해 상세히 설명하면 다음과 같다. Embodiments of the present invention as described above will be described in detail with reference to the accompanying drawings.

도 1은 본 발명에 따른 주소표준화 시스템의 구성을 도시한 블록도로서, 외부로부터 입력된 주소데이터를 순차적으로 파싱(parsing)하는 파싱부(102)와, 법정동, 행정동 및 상용동에 대응하는 표준화주소 정보가 기록된 적어도 하나 이상의 레퍼런스 테이블을 포함하는 DB부(105)와, 상기 파싱부(102)의 주소 파싱 플로우를 제어하고, 상기 파싱부(102)에서 제공되는 파싱된 주소데이터를 근거로 상기 레퍼런스를 스캔하여 상기 주소데이터에 대응하는 표준화주소 정보를 생성하는 순차표준화부(104)로 구성될 수 있다.1 is a block diagram illustrating a configuration of an address standardization system according to the present invention, and includes a parsing unit 102 for parsing address data input from the outside, and standardization corresponding to legal, administrative, and commercial buildings. A DB unit 105 including at least one reference table in which address information is recorded, an address parsing flow of the parser 102, and based on the parsed address data provided by the parser 102. It may be configured as a sequential standardization unit 104 to scan the reference to generate standardized address information corresponding to the address data.

이때, 상기 주소데이터를 정제하여 상기 파싱부(102)에 정제된 주소데이터를 전달하는 문자열 정제부(101)가 더 구성될 수 있다. 상기 문자열 정제부(101)는 2byte 문자를 1byte 문자로 변경하거나 소문자를 대문자로 변경하여 파싱부(102)의 주소 분석이 용이하게 이루어질 수 있도록 하며, 상기 주소데이터의 공백문자나 특수문자(일례로 non-ascii 문자)를 제거하여 주소 분석시 오류 발생을 최소화하도록 한다. 또한, 상기 주소데이터의 유효성 검증(4byte 이상, 원본주소의 시작문자가 한글문자 여부 검증)을 통해 오류 데이터의 입력을 사전에 차단하여 프로세스 부하를 방지하도록 할 수 있다.In this case, a string refiner 101 may be further configured to transfer the refined address data to the parser 102 by refining the address data. The string refining unit 101 may easily perform the address analysis of the parsing unit 102 by changing a 2-byte character into a 1-byte character or changing a lowercase letter to an uppercase letter, and may include a space character or a special character of the address data (for example, Eliminate non-ascii characters) to minimize errors during address resolution. In addition, it is possible to prevent the process load by blocking the input of the error data in advance through the validation of the address data (4 bytes or more, verify whether the start character of the original address is Hangul characters).

한편, 상기 파싱부(102)는 상기 주소데이터를 '광역시', '시군구', '읍면동', '리'와 같은 단위주소를 포함하는 상위주소와 '번지' 또는 '건물명'과 같은 단위주소를 포함하는 하위주소로 분류하여 단위주소의 범위에 따라 순차적으로 파싱하며, 상기 순차표준화부(104)는 상위주소와 하위주소에 각각 적합한 분류방식을 적용하여 정확한 주소표준화 데이터를 제공하도록 할 수 있다.On the other hand, the parsing unit 102 includes the upper address including the unit address such as 'gwangsi', 'si-gun-gu', 'eup-myeon-dong', 'ri' and the unit address such as 'address' or 'building name'. It is classified into a lower address to be included and parsed sequentially according to a range of unit addresses, and the sequential standardization unit 104 may provide accurate address standardization data by applying a classification method suitable for a higher address and a lower address, respectively.

또한, 상기 파싱부(102)는 기설정된 정규표현식에 따라 상기 주소데이터를 단위주소로 파싱하게 되며, 상기 정규표현식은 유닉스 기반으로 주소데이터의 문자 분석을 통해 상기 단위주소의 순서를 용이하게 정제할 수 있도록 패턴화되어 있다. 이러한 정규표현식의 사용의 실시예는 이하에서 상세히 설명하도록 한다.In addition, the parsing unit 102 parses the address data into a unit address according to a preset regular expression, and the regular expression can be easily refined through the character analysis of the address data based on Unix. It is patterned to help. Embodiments of the use of such regular expressions will be described in detail below.

한편, 상기 순차표준화부(104)는 상기 파싱부(102)가 파싱하여 단위주소를 전달하면, 상기 DB부(105)로부터 상기 단위주소에 대응하는 법정동 또는 행정동 코드가 기록된 상기 레퍼런스 테이블을 호출하고, 상기 단위주소를 기준으로 상기 레퍼런스 테이블을 스캔하여 대응하는 법정동 또는 행정동 코드를 획득하고 이를 표준화코드로서 버퍼부(103)에 저장할 수 있다.On the other hand, when the parsing unit 102 parses and delivers the unit address, the sequential standardization unit 104 calls the reference table in which the legal or administrative code corresponding to the unit address is recorded from the DB unit 105. The reference table may be scanned based on the unit address to obtain a corresponding legal or administrative code and stored in the buffer unit 103 as a standard code.

이때, 상기 파싱부(102)는 원본 주소데이터를 단위주소로 파싱한 후 상기 단위주소를 제외한 나머지 주소데이터를 버퍼부(103)에 저장하도록 할 수 있다. 또한, 상기 순차표준화부(104)는 상기 단위주소를 통해 코드를 획득한 후 나머지 주소데이타를 파싱하여 상기 단위주소보다 하위인 단위주소를 코드화하기 위해, 주소검색 카운트를 1씩 증가시켜 하위 단위주소에 대응하는 모드로 순차적으로 변경할 수 있으며, 상기 DB부(105)로부터 상기 하위 단위주소에 대응되는 레퍼런스 테이블을 호출할 수 있다. 물론, 하위 단위주소의 코드 획득과정에서 발생하는 오류에 의해 표준화작업이 실패할 경우 상기 주소검색 카운트를 리셋하도록 하여 초기화시킬 수 있음은 자명하다.In this case, the parsing unit 102 may parse the original address data into a unit address and store the remaining address data except the unit address in the buffer unit 103. In addition, the sequential standardization unit 104 acquires a code through the unit address, and then parses the remaining address data to code a unit address lower than the unit address. The reference table corresponding to the lower unit address may be called from the DB unit 105. Of course, if the standardization operation fails due to an error occurring in the code acquisition process of the lower unit address, it is obvious that the address search count may be reset to reset.

또한, 상기 순차표준화부(104)는 하위 단위주소를 순차적으로 비교할때마다 상기 버퍼부(103)에 저장된 표준화코드를 기준으로 스캔하여 대응되는 데이터 범위를 확보한 후 상기 범위 중에서 하위 단위주소에 대응되는 문자를 검색하여 표준화코드를 생성시킬 수 있기 때문에, 검색속도의 향상과 더불어 검색효율성을 보장할 수 있다.In addition, the sequential standardization unit 104 scans the lower unit addresses sequentially based on the standardization code stored in the buffer unit 103 to secure a corresponding data range, and then corresponds to the lower unit addresses among the ranges. Since it is possible to generate a standardized code by searching the characters that can be, it is possible to ensure the search efficiency and the search efficiency.

더하여, 상기 순차표준화부(104)는 하위 단위주소의 표준화코드 획득시 분류와 검증 기준이 설정된 설정부(106)와 연결되어 상기 설정부(106)에 설정된 기준코드를 근거로 표준화코드를 생성하거나 표준화코드에 상기 기준코드를 부가하여 제공함으로써, 정확하고 검증된 데이터를 제공하도록 할 수 있다.In addition, the sequential standardization unit 104 is connected to the setting unit 106 in which classification and verification criteria are set when acquiring the standardization code of the lower unit address, and generates a standardization code based on the reference code set in the setting unit 106. By providing the standard code to the standard code, it is possible to provide accurate and verified data.

이때, 상기 설정부(106)는 건물의 종류와 명칭에 따라 분류되며 대응되는 코드가 설정된 건물명 정제부(107)와, 단위주소의 일부 누락이나 오기에 따라 발생되는 오류를 보상하기 위하여 상기 원본 주소데이터에 가장 근접한 표준화코드를 선택하기 위한 기준이 되는 EC코드를 생성하는 EC코드 생성부(108)와, 단위주소의 일부 누락이나 오기 발생부분의 존재여부에 대한 결과코드를 제공하는 결과코드 생성부(109)로 구성되어, 표준화코드 생성시 발생하는 오류를 최대한 보상하여 신뢰성을 높이도록 한다.In this case, the setting unit 106 is classified according to the type and name of the building and the building name refiner 107 with a corresponding code set therein, and the original address to compensate for an error caused by a missing or coming part of the unit address. EC code generation unit 108 for generating an EC code which is a standard for selecting a standardization code closest to the data, and a result code generation unit for providing a result code for the presence or absence of a part of a unit address or an occurrence of an error. 109, to compensate for errors occurring during the generation of standardized codes to maximize reliability.

도 2는 본 발명에 따른 주소표준화 시스템의 상위주소 표준화에 대한 실시예를 도시한 순서도로서, 우선 외부로부터 주소데이터가 입력되면 상기한 바와 같이 주소정제화를 거친 후 단위주소를 구분하기 용이한 형태로 정제된다. 이후, 상위주소와 하위주소를 구분하고, 우선 상위주소를 표준화코드로서 생성하기 위한 작업을 실행하게 되는데, 상위주소 내에서도 주소의 범위에 따라 상위에서 하위로 순차적으로 스캔 및 표준화 작업이 이루어지게 된다.FIG. 2 is a flowchart illustrating an embodiment of higher address standardization of the address standardization system according to the present invention. First, when address data is input from the outside, the unit address is easily distinguished after address refinement as described above. Purified. Subsequently, the upper and lower addresses are distinguished, and a task of generating the upper address as a standardization code is first executed. The upper and lower addresses are sequentially scanned and standardized according to the range of addresses.

이를 도시된 순서에 따라 차례대로 설명하면, 상기 주소데이터에 입력되는 주소체계에 대응하는 상기 순차표준화부의 모드를 설정할 수 있는데, 상기 주소체계는 법정동, 행정동 및 상용동에 대한 것일 수 있으며, 주소데이터의 입력과 동시 에 설정되는 모드에 따라 상기 DB부에서 호출되는 레퍼런스가 달라진다.When this is described in order in the illustrated order, it is possible to set the mode of the sequential standardization unit corresponding to the address system input to the address data, wherein the address system may be for statutory building, administrative building and commercial building, and the address data The reference called by the DB unit varies according to the mode set at the same time as the input of.

이때, 상기 DB부는 상기 주소체계에 각각 대응하는 표준화코드가 기록된 적어도 하나 이상의 레퍼런스를 보유할 수 있다. 또한, 상기 레퍼런스는 하나의 주소체계에 대응하는 나머지 주소체계의 대응 코드를 보유할 수 있다. 일례로, 주소체계가 법정동에 대한 레퍼런스일 경우 법정동에 대하여 스캔한 후 획득되는 코드와 대응되는 행정동 코드를 보유하고 있다. 따라서, 각기 다른 주소체계의 레퍼런스 사이에는 상호 대응되는 코드를 보유하고 있어 연관관계를 가지게 되며, 하나의 레퍼런스로부터 모든 주소체계에 대한 표준화코드를 획득할 수 있다. 또한, 상기 주소체계에 따라 각기 다른 코드를 부여하여 상기 주소체계의 구분을 용이하게 하는 것은 자명하다.In this case, the DB unit may hold at least one reference in which a standardization code corresponding to each of the address systems is recorded. In addition, the reference may hold a corresponding code of the remaining address systems corresponding to one address system. For example, if the address system is a reference to a court dong, it has an administrative dong code corresponding to the code obtained after scanning the court dong. Therefore, each code has a corresponding code between the references of different address systems, and thus has an association relationship, and a standardized code for all the address systems can be obtained from a single reference. In addition, it is apparent that different codes are assigned according to the address system to facilitate the classification of the address system.

이후, 상기 파싱부가 구분된 상기 상위주소 내에서 최상위 주소를 인식하여 파싱하고 나머지 주소데이터는 일시적으로 상기 버퍼부에 저장하여 다음 범위의 주소에 대한 작업에 대하여 레디(Ready)상태로 대기하도록 할 수 있으며, 파싱된 상기 최상위 주소는 단위주소로서 상기 순차표준화부에 제공되며, 상기 순차표준화부는 상기 단위주소에 대응하는 주소체계의 레퍼런스를 상기 DB부로부터 호출하여 비교할 수 있게 된다.Thereafter, the parsing unit recognizes and parses the highest address within the separated upper address, and temporarily stores the remaining address data in the buffer unit to wait in a ready state for a job of a next range of addresses. The parsed top-level address is provided to the sequential standardization unit as a unit address, and the sequential standardization unit can call a reference of an address system corresponding to the unit address from the DB unit and compare the same.

이때, 상기 순차표준화부는 상기 레퍼런스를 스캔하여 상기 단위주소와의 일치여부를 확인하고, 상기 단위주소를 상기 레퍼런스에 기록된 대응코드로 코드화하여 표준화코드를 생성한다. 또한, 상기 표준화코드는 일시적으로 버퍼부에 저장되어, 이후에 들어오는 단위주소의 스캔범위를 결정하기 위한 기준이 된다. 즉, 상기 표준화코드의 범위 내에서 이후 들어오는 단위주소를 검색할 수 있게 되며, 상기 순차표준화부는 상기 표준화코드에 이후 들어오는 단위주소의 코드를 부가하여 상기 표준화코드의 자릿수를 순차적으로 증가시킨다.At this time, the sequential standardization unit scans the reference to confirm whether the unit address matches and generates a standardization code by encoding the unit address with a corresponding code recorded in the reference. In addition, the standardization code is temporarily stored in the buffer unit, and serves as a reference for determining a scan range of a subsequent unit address. That is, it is possible to search for subsequent unit addresses within the range of the standardization code, and the sequential standardization unit sequentially adds the code of the unit address which is subsequently received to the standardization code to sequentially increase the number of digits of the standardization code.

또한, 상기 순차표준화부는 주소검색 카운트를 증가하여, 하위 범위(일례로, 시군구 → 읍면동)의 주소를 검색하기 위한 모드로 변경하게 되며, 상기 파싱부는 상기 나머지 주소데이터 중에서 최상위 주소를 파싱하여 상기한 바와 같은 과정을 반복하여, 최종적으로 '리'에 대응하는 나머지 주소데이터가 소진되면 상기 상위주소의 완전한 표준화코드를 획득할 수 있게 된다.In addition, the sequential standardization unit increases the address search count to change to a mode for searching an address of a lower range (for example, Sigun-gu → Eup-myeon-dong), and the parsing unit parses the highest address among the remaining address data to perform By repeating the process as described above, when the remaining address data corresponding to 'Lee' is finally exhausted, a complete standardization code of the upper address can be obtained.

도 3은 본 발명에 따른 주소표준화 시스템의 하위주소 파싱에 대한 실시예를 도시한 순서도로서, 하위 주소는 상위 주소와 달리 일정한 체계가 마련되지 않아 일반주택과 공동건물 등의 명칭을 중시하여 구분하여 파싱하는 과정이 중요시된다. 따라서, 이를 용이하게 구분하여 파싱하기 위한 실시예를 이하에서 설명하도록 한다.Figure 3 is a flow chart illustrating an embodiment of the lower address parsing of the address standardization system according to the present invention. The process of parsing is important. Therefore, an embodiment for easily classifying and parsing this will be described below.

상기 파싱부는 상기 상위주소를 제외한 최종적인 나머지 주소데이터는 하위주소로 분류하고 이를 파싱하여 상기 순차표준화부에 제공하도록 하는데, 이때 입력되는 주소데이터의 오기로 인하여 상기 하위주소에 상기 상위주소의 내용이 일부 포함되어 최초 원본 데이터의 입력에서 주소의 중복표현이 발생할 수 있다.The parsing unit classifies the last remaining address data except the upper address into lower addresses and parses them to provide them to the sequential standardization unit. In this case, the contents of the upper address are added to the lower address due to the misinterpretation of the input address data. In some cases, duplicate representations of addresses may occur in the input of the original source data.

따라서, 상기 파싱부는 하위주소만을 추출하기 위하여 상기 상위주소의 중복표현을 제거하도록 할 수 있는데, 이는 앞서 설명한 정규표현식을 통해 제거할 수 있다.Accordingly, the parser may remove duplicate expressions of the upper address in order to extract only the lower address, which may be removed through the regular expression described above.

상기 정규표현식은 유닉스 기반에서 제공되는 알고리즘이며, 문자에 해당되는 부분과, 앞의 해당되는 부분을 반복하는 부분과, 문자에 해당되지 않고 위치나 결합을 나타내는 부분을 용이하게 분별하여 문자를 제거하거나 추출하기 용이한 표현방식이다.The regular expression is an algorithm provided by Unix, and easily distinguishes between a part corresponding to a character, a part repeating the previous corresponding part, and a part indicating a position or a combination without being a character, or removing a character. It is easy to extract.

따라서, 상기 중복표현을 제거하기 위하여 상기 정규표현식을 이용한 표현식의 일례는 다음과 같다.Accordingly, an example of an expression using the regular expression to remove the duplicate expression is as follows.

만일 상위주소를 제외한 하위주소 데이터가 '서울 성동구 구의 3동 548 현대아파트'와 같이 표현되어 있다면, 상기 상위주소에 대응하는 '서울 성동구 구의 3동'이 포함되어 있는 것으로서 이를 제거하여 불필요한 작업을 방지하여야 하는데, 다음과 같은 정규표현식으로 제거될 수 있다.If the lower address data except the upper address is expressed as '3, 548 Hyundai Apartment in dong, Seongdong-gu, Seoul,' the '3 dong of Seongdong-gu, Seoul' corresponding to the upper address is included and removed to prevent unnecessary work. It can be removed with the following regular expression:

^(서울|경기)?([%c-%c]{0,8}(시|군))?([%c-%c]{2,8}구)?(([%c-%c]{2,10}?[0-9]{1,2}(동|가|가동|리)|([%c-%c]{2,10}(읍|면)?))^ (Seoul | Gyeonggi)? ([% C-% c] {0,8} (city | count))? ([% C-% c] {2,8})? (([% C-% c] {2,10}? [0-9] {1,2} (dong | ga | gadongri) | ([% c-% c] {2,10} (town | myeon)?))

상기 수학식 1은 실제 파싱부에 설정된 알고리즘을 최대한 간단히 샘플화한 것으로서, 이를 상기 수학식 1의 표현을 순서대로 간단히 설명하면, 상기 하위주소의 문자열의 처음에 '서울'과 '경기'를 포함하는 부분이 있는지 확인하고, 문자자릿수가 0부터 8자리까지인 '시'나 '군'을 포함하는 문자열을 확인하고, 문자자릿수가 2부터 8자리까지인 '구'를 포함하는 문자열을 확인하며, 2부터 10자리까지의 문 자와 1부터 2자리까지의 숫자를 포함하는 '동', '가', '가동' 또는 '리'를 포함하는 문자열을 검색하며, 2부터 10자리까지의 '읍'이나 '면'을 검색하여 일치되는 문자열을 제거하게 된다.Equation 1 is a sample of the algorithm set in the actual parsing unit as simply as possible. When the description of Equation 1 is briefly explained in order, the equation includes 'Seoul' and 'Gyeonggi' at the beginning. Checks for strings containing "hours" or "counts" with zero to eight digits, checks for strings containing "spheres" with two to eight digits, and , Searches for strings containing 'dong', 'ga', 'live' or 'ri' containing 2 to 10 digits and numbers 1 to 2 digits, Search for 'eup' or 'myeon' to remove the matching string.

따라서, 상기 파싱부는 이와 같은 정규표현식을 이용하여 단위주소의 파싱이나 중복주소의 제거를 용이하게 할 수 있다.Accordingly, the parser may facilitate parsing of unit addresses or removal of duplicate addresses by using the regular expression.

이후, 상기 파싱부는 상기 정규표현식을 통해 문자열을 분석하고, 건물이 포함되어 있는지 여부를 판단한다. 만일 상기 하위주소에 건물과 같은 공동주택이 포함되어 있다면 건물 파싱 정규표현식을 이용하여 파싱하고, 번지로 표현되는 일반주택에 대해서는 번지 파싱 정규표현식을 이용하여 파싱하도록 한다.Thereafter, the parser analyzes a string through the regular expression and determines whether a building is included. If the sub-address includes a common house such as a building, parsing is performed using a building parsing regular expression, and parsing is performed using a parsing regular expression for a general house represented by a street address.

상기한 바와 같은 과정을 거쳐 파싱된 하위주소는 상위주소의 파싱 과정과 마찬가지로 상기 하위주소의 최상위 단위주소부터 상기 순차표준화부에 전달되는데, 상기 파싱된 하위주소에 공동주택이 포함되는 경우 공동주택의 건물표현 방식이 다양하여 건물명 정제과정이 요구된다.The lower address parsed through the process as described above is transmitted to the sequential standardization unit from the highest unit address of the lower address, as in the parsing process of the upper address. Building representation is diverse and requires refining of building names.

따라서, 상기 순차표준화부는 전달받은 하위주소가 공동주택일 경우 건물명을 정제하는 과정을 선행하여 이후 실행되는 코드화 과정이 용이하게 이루어지도록 한다.Therefore, when the received sub-address is a multi-family house, the sequential standardization unit facilitates the encoding process to be executed after the process of refining the building name.

이를 상세히 설명하면, 상기 순차표준화부는 파싱된 하위주소에 포함된 건물명에 대하여 공백과 불필요한 구두점(쉼표, 마침표, 따옴표 등)을 제거하고, 지하, 지층, B를 분리하여 위치구분을 용이하도록 하며, 아파트, 빌딩, 오피스텔, 맨션 등의 건물 키워드를 통일하여 구분이 용이하도록 할 수 있다. 또한, 도 4에 도시된 바와 마찬가지로 상기와 같이 정제된 건물명에 대하여 도 1에 도시된 건물명 정제부가 보유하는 건물분류코드를 기준으로 상기 순차표준화부는 건물명과 건물명의 키워드 위치를 분별하여 건물분류코드를 생성하고, 상기 건물분류코드를 파싱된 하위주소와 더불어 레퍼런스 스캔시 기준근거로서 이용할 수 있다.In detail, the sequential standardization unit removes spaces and unnecessary punctuation (commas, periods, quotes, etc.) for the building name included in the parsed subaddress, and separates the basement, the strata, and the B to facilitate location separation. Building keywords such as apartments, buildings, officetels, and mansions can be unified to facilitate differentiation. In addition, as shown in FIG. 4, the sequential standardization unit classifies the building name and the keyword name of the building name based on the building classification code held by the building name refiner shown in FIG. The building classification code can be used as a reference basis along with the parsed lower address.

도 5는 본 발명에 따른 주소표준화 시스템의 하위주소 중 공동주택에 대한 코드화의 실시예를 나타낸 순서도로서, 상기 순차표준화부는 상기 버퍼부에 저장된 상위주소의 최종 표준화코드와 상기 파싱부가 전달하는 파싱된 하위주소를 근거로 상기 DB부에서 상기 파싱된 하위주소에 대응되는 레퍼런스를 호출하여 파싱된 하위주소에 대응하는 코드를 검색하고, 상기 표준화코드에 파싱된 하위주소에 대응하는 코드를 부가하여 더욱 세분화된 표준화코드를 획득하게 된다.5 is a flowchart illustrating an embodiment of encoding a multi-family house among lower addresses of the address standardization system according to the present invention, wherein the sequential standardization unit is parsed to deliver the final standardization code of the upper address stored in the buffer unit and the parsing unit; On the basis of the lower address, the DB unit calls a reference corresponding to the parsed lower address to search for a code corresponding to the parsed lower address, and further refines the code by adding a code corresponding to the parsed lower address. The standardized code is obtained.

이를 상세히 설명하면, 상기 순차표준화부는 파싱된 하위주소를 상위주소에 대한 상기 표준화코드의 범위내에서 대응되는 상기 DB부의 공동주택 레퍼런스를 검색하여 상기 표준화코드 범위내에서 하위주소의 문자나 숫자를 검색하여 관련 코드를 획득할 수 있다. 이때, 상기 표준화코드가 상용동에 대한 코드일 경우 상용동의 관습적인 표현에서 비롯되는 하위주소와 상위주소의 불일치 문제를 해결하기 위하여, '행정동'과 '리' 단위의 오류를 보상하도록 할 수 있다.In detail, the sequential standardization unit searches the apartment house reference of the DB unit corresponding to the parsed lower address within the range of the standardization code for the upper address to search for a letter or number of the lower address within the range of the standardization code. To obtain the relevant code. In this case, when the standardized code is a code for a commercial building, in order to solve the problem of inconsistency between the lower address and the upper address resulting from the customary expression of the commercial building, the error of 'administrative motion' and 'ri' unit may be compensated. .

즉, 상기 순차표준화부는 상기 레퍼런스에 상위주소와 하위주소의 일치정도에 따라 우선순위가 부여된 EC코드를 포함하는 EC코드 테이블을 호출하여 파싱된 하위주소와 레퍼런스 사이의 일치여부를 판단하고, 일치정도에 따라 상기 EC코드를 부여하여 레퍼런스에 일치정도에 따른 우선순위를 표시할 수 있다. 이후, 상기 순 차표준화부는 최우선순위에 있는 EC코드에 대응되는 주소를 선택하여 가장 연관성 있는 주소를 획득하고, 이를 근거로 '동' 이나 '리' 단위에 대한 코드를 추가하거나 변경함으로써 상위주소와 하위주소의 차이로 인한 오류를 보상하도록 할 수 있다. 일례로, 상위주소의 '동'이나 '리' 단위와 하위주소의 '건물명', '번지' 단위가 생략되거나 일치되지 않는 경우 레퍼런스에 표시된 주소들 중 표준화코드 범위내에서 가장 많이 일치되는 값에 최우선순위 EC코드를 부여하거나, 하위주소와 완전히 일치되는 상위주소에 대응하는 표준화코드들 중 입력된 표준화코드와 가장 차이가 적은 정도에 따라 최우선순위 EC코드를 부여하여, 상기 최우선순위 EC코드에 대응되는 표준화코드를 선택하여 표준화된 주소를 획득할 수 있다.That is, the sequential standardization unit calls an EC code table including EC codes given priority according to the degree of matching of the upper address and the lower address to the reference, and determines whether there is a match between the parsed lower address and the reference. According to the degree, the EC code may be assigned to indicate the priority according to the degree of agreement on the reference. Thereafter, the sequential standardization unit selects an address corresponding to the EC code having the highest priority to obtain the most relevant address, and based on this, adds or changes the code for the unit of 'east' or 'ri', and thus the higher address and the higher address. Errors due to differences in subaddresses can be compensated for. For example, if the 'dong' or 'ri' unit of the upper address and the 'building name' and 'address' unit of the lower address are omitted or do not match, the address among the addresses indicated in the reference is the most matched value within the standard code range. Corresponding to the highest priority EC code by assigning the highest priority EC code or by assigning the highest priority EC code according to the degree of difference that is smallest from the input standardization code among the standardization codes corresponding to the upper address that matches the lower address completely. A standardized address can be selected to obtain a standardized address.

한편, 상술한 EC코드 테이블을 하위주소 사이에 발생하는 불일치의 경우에 대해서도 일치정도에 따라 우선순위를 분별하여 적용할 수 있으며, 일례로 하위주소 중 공동주택에 대한 경우를 예로 들어 상기 EC 코드 테이블에 대해 상세히 설명하기로 한다.On the other hand, the above-described EC code table can be applied to the case of inconsistency between sub-addresses according to the degree of matching, and the priority can be applied. This will be described in detail.

도 6은 상기 EC코드 테이블의 하나인 공동주택 EC코드 테이블로서, 하위주소가 공동주택일 경우 호출하여 우선순위를 부여할 수 있다. 상기 공동주택 EC코드 테이블에는 파싱된 상기 하위주소를 근거로 레퍼런스 스캔시 파싱된 하위주소('주번지', '부번지', '건물명', '건물동')에 불일치되는 부분의 정도에 따라 우선순위가 기설정되어 있다. 일치정도는 숫자(1>2>3)로서 표시될 수 있으며, 상위주소의 주소체계가 법정동인지 행정동인지에 따라 문자(A, B)로서 구별하고 있다.FIG. 6 is an EC code table of one of the EC code tables. When the lower address is an apartment, it can be called and given priority. According to the degree of inconsistency of the sub-addresses ('main address', 'sub address', 'building name', 'building building') that are parsed in the reference scan based on the sub address parsed in the multi-unit housing EC code table. Priority is preset. The degree of agreement can be expressed as a number (1> 2> 3), and is distinguished as a letter (A, B) depending on whether the address system of the upper address is legal or administrative.

이와같은 공동주택 EC코드 테이블을 이용하여, 도 7에 도시된 바와 같이 상 기 순차표준화부는 상기 공동주택 EC코드 테이블을 표준화코드 및 파싱된 상기 하위주소를 근거로 레퍼런스를 스캔시 적용하여 연관성 있는 주소에 대하여 EC코드(A1, A3, A5)를 부여하고 부여된 주소 중에서 최우선 순위 EC코드(A1)에 대응하는 주소를 선택하도록 할 수 있다. 이를 통해, 흔히 발생하는 공동주택주소와 주번지나 부번지와의 불일치를 정정한 주소에 대한 표준화코드를 획득하여 표준화된 주소데이터를 획득할 수 있다.Using such an apartment house EC code table, as shown in FIG. 7, the sequential standardization unit applies the apartment house EC code table when scanning a reference based on the standardized code and the parsed lower address, and thus an associated address. EC codes A1, A3, and A5 are assigned to each other, and an address corresponding to the highest priority EC code A1 can be selected from the assigned addresses. Through this, it is possible to obtain standardized address data by acquiring a standardization code for an address that corrects a mismatch between a common housing address and a main address or a minor address.

일반주택 또한 도 5와 같은 과정을 거칠 수 있으며 일반주택의 하위주소가 주번지와 부번지로서 구성되기 때문에 따로 공동주택코드를 부여하는 과정을 제외할 수 있으며, 이로 인해 공동주택주소 코드화와 달리 일반주택은 상기 표준화코드를 이용하여 하위주소와 상위주소의 불일치 또는 '주번지'와 '부번지'의 불일치에 대해서만 상기 EC코드를 부여하고 가장 연관 정도가 높은 주소를 선택하여 오기를 정정하도록 할 수 있다.The general housing can also go through the same process as in FIG. 5, and since the lower address of the general housing is composed of a main address and a sub-address, it is possible to exclude a process of assigning a separate housing code. The housing can assign the EC code only to the mismatch between the lower address and the upper address or the mismatch between the 'main address' and the 'sub address' using the standardization code, and select the most relevant address to correct the coming. have.

한편, 본 발명은 상기한 바와 오기나 불일치에 의하여 표준화 과정에서 발생하는 오류를 각 단위주소의 코드변환 과정마다 오류발생 여부와 해당 오류종류를 기설정된 코드로 기록하여 결과코드를 생성함으로써, 표준화 과정이 종료된 후 상기 결과코드를 근거로 표준화코드의 정확성 정도를 판단할 수 있을 뿐 아니라 오류 종류를 구분하여 용이하게 정정할 수 있도록 한다.On the other hand, the present invention generates the result code by recording the error occurring in the standardization process due to the error or mismatch as described above and the result type by recording the error occurrence and the corresponding error type for each unit code conversion process as a predetermined code, After this is completed, not only the accuracy of the standardized code can be determined based on the result code, but also the type of error can be easily corrected.

상기한 내용을 도 8을 통해 좀 더 상세히 설명하면, 상술한 표준화코드와 하위주소의 단위주소를 이용하여 상위주소로부터 하위주소로 순차적으로 대응되는 레퍼런스를 스캔하여 일치되는 데이터가 없을 경우 상기 EC코드 테이블을 이용해 가 장 연관 정도가 높은 주소로서 정정하여 표시하도록 할 수 있음은 상술한 바와 같고, 이와 같이 정정된 주소의 구분을 위하여 상기 순차표준화부는 정정된 단위주소와 정정 종류에 대하여 각각 다른 기설정된 결과코드로 기록하고 있는 도 9에 명시된 결과코드테이블을 상기 결과코드 생성부로부터 호출하여 비교함으로써 해당 오류내용에 대응하는 결과코드를 생성하게 된다.The above description will be described in more detail with reference to FIG. 8, by using the above-described standardized code and the unit address of the lower address, the corresponding reference is sequentially scanned from the upper address to the lower address, and there is no matching data. As described above, the table can be corrected and displayed as an address having the highest degree of association using the table. In order to distinguish the corrected address, the sequential standardization unit is different from the corrected unit address and the type of the correction. The result code table specified in FIG. 9, which is recorded as a result code, is called from the result code generator and compared to generate a result code corresponding to the corresponding error content.

즉, 상위주소와 하위주소의 불일치('동'이나 '리' 단위의 오류)나 하위주소 사이의 불일치(예로 들면, 공동주택의 경우 '건물명', '건물동', '건물호' 사이의 불일치, 일반주택의 경우 '주번지'와 '부번지' 사이의 불일치)로 인한 단위주소의 존재여부, 수정 및 추가에 대하여 서로 다른 결과코드를 부여하여 각 단위주소의 오류정정 내용을 구분할 수도 있다.That is, there is a mismatch between the upper address and the lower address (an error in 'dong' or 'ri' units) or a mismatch between the lower address (e.g., 'building name', 'building dong', 'building number' in case of apartment houses). It is possible to distinguish error correction contents of each unit address by assigning different result codes for the existence, modification and addition of unit address due to inconsistency, inconsistency between 'main address' and 'minor address' in case of general housing. .

이에 따라, 최종 생성된 표준화코드와 더불어 결과코드를 참고하여 상기 최종 생성된 표준화코드의 정확도를 판단할 수 있으며, 오류가 발생하였다면 어디서 발생하였는지, 정정된 사항은 무엇인지를 용이하게 판단할 수 있도록 하여 정확한 주소를 재입력하도록 하거나 상기 최종 생성된 표준화코드의 정확성 정도를 분별할 수 있도록 할 수 있다.Accordingly, the accuracy of the final generated standardized code can be determined by referring to the result code along with the final generated standardized code, and if an error occurs, it is easy to determine where the error occurred and what is corrected. It is possible to re-enter the correct address or to discern the accuracy of the last generated standardized code.

한편, 상술한 주소표준화 과정은 단지 주소에 그치지 않고 우편번호나 전화번호에 응용하여 적용할 수도 있다.On the other hand, the above-described standard addressing process may be applied to the postal code or telephone number instead of just the address.

도 10을 참고하여 상세히 설명하면, 상기 순차표준화부는 공동주택, 사서함, 빌딩, 기타건물, 지번, 대표동과 같이 주소 종류에 따라 최종 생성된 상기 표준화코드 및 공동주택코드와 파싱된 주소데이터를 근거로 상기 DB부로부터 공동주택코 드와 표준화코드에 대응하여 설정된 우편번호코드를 보유한 우편번호 레퍼런스를 호출하여 스캔함으로써 우편번호 및 일련번호를 획득할 수 있다. 또한, 상술한 EC 결과코드를 이용하여 최종 생성 데이터와 상기 우편번호 레퍼런스에 기록된 데이터와의 일치정도를 표시하여 최우선순위에 있는 우편번호 데이터를 제공하도록 할 수 있다.Referring to FIG. 10, the sequential standardization unit is based on the standardized code and apartment code and parsed address data finally generated according to the type of address, such as a multi-family house, a mailbox, a building, other buildings, a house number, and a representative building. The zip code and serial number can be obtained by calling and scanning a zip code reference having a zip code set corresponding to the multi-family code and the standardization code from the DB. In addition, by using the EC result code described above, the degree of correspondence between the final generated data and the data recorded in the zip code reference can be displayed to provide zip code data having the highest priority.

더불어, 최종 생성된 상기 우편번호 데이터를 근거로 역으로 공식적으로 법정동이나 행정동으로 인정된 인증주소를 출력하여 참고데이터를 생성하도록 할 수도 있다. 즉, 상기 우편번호 레퍼런스는 상기 우편번호 데이터에 대응되는 주소가 명시되어 있으며, 상기 순차표준화부가 최우선순위로 선택한 상기 우편번호 데이터에 대응되는 인증주소를 상기 파싱된 주소데이터와 더불어 출력함으로써 공식적인 주소데이터를 제공할 수도 있다.In addition, it is also possible to generate reference data by outputting an authentication address officially recognized as a legal or administrative building on the basis of the zip code data generated last. That is, the postal code reference specifies an address corresponding to the postal code data, and outputs an authentication address corresponding to the postal code data selected by the sequential standardization unit as the highest priority along with the parsed address data to form official address data. May be provided.

또한, 상기 파싱부는 전화번호에 대하여 파싱을 실행할 수 있으며, 입력된 전화번호의 유효성을 검증하기 위하여 전화번호의 자리수, DDD를 기준으로 상기 정규표현식을 이용하여 파싱할 수 있다. 이후, 파싱된 전화번호는 지역번호, 국번 및 가입자 전화번호로 분리되어 파싱된 주소데이터로서 상기 순차표준화부에 전달될 수 있다.The parsing unit may parse the phone number and parse the phone number using the regular expression based on the number of digits of the phone number and the DDD to verify the validity of the input phone number. Thereafter, the parsed telephone number may be divided into an area code, a station number, and a subscriber's telephone number, and transmitted to the sequential standardization unit as parsed address data.

상기한 내용을 바탕으로 본 발명은 최종적인 가구화 ID를 생성할 수 있는데, 이를 도 11을 참고하여 상세히 설명하면, 상기 표준화코드와 파싱된 주소데이터를 제공받은 상기 순차표준화부는 최종 생성된 표준화코드와 파싱된 주소데이터를 분별하여 각 단위주소마다 규정된 고정길이를 만족하는지 검증하고, 상기 고정길이 미만인 주소에 대해서는 고정길이만큼 왼쪽을 '0'으로 채워 일관된 형식을 가지도록 한다. 만일, 고정길이를 벗어나거나 주소표준화 과정에서 오류 처리된 데이터에 한해서는 예외처리하여 배제하도록 한다.Based on the above, the present invention can generate a final furniture ID, which will be described in detail with reference to FIG. 11. The sequential standardization unit provided with the standardized code and the parsed address data is the final generated standardized code. And parsing the address data to verify that the fixed length is satisfied for each unit address, and for an address less than the fixed length, the left side is filled with '0' by the fixed length to have a consistent format. If the data exceeds the fixed length or error processed during the address standardization process, the exception is excluded.

이후, 도 12에 명시된 것처럼, 상기 표준화코드와 고정길이를 순차적으로 배열하여 최종적인 가구화 ID를 생성시킬 수 있다. 이때, 상기 파싱된 데이터에 공동주택 포함 여부를 분별하여, 공동주택이 포함된 주소데이터에 대해서는 공동주택에 8자리를 할당하며, 공동주택이 포함되지 않은 집단가구나 일반주택에 대해서는 공동주택에 대응하는 8자리를 번지에 추가할당하여 자리수를 채우도록 할 수도 있다.Thereafter, as illustrated in FIG. 12, the finalized furniture ID may be generated by sequentially arranging the standardization code and the fixed length. In this case, the parsed data is classified as to whether or not to include a multi-family housing, and assigns 8 digits to the multi-family housing for the address data including the multi-family housing, and corresponds to the multi-family housing for the multi-family housing or general housing that does not include the multi-family housing. You can also add 8 digits to your address so that you can fill in the digits.

이를 통해, 최종적인 코드로서 생성된 가구화 ID를 개인이나 가구에 할당하여 각종 통계조사 및 효과적인 회원관리를 할 수 있다.Through this, by assigning the furniture ID generated as the final code to the individual or household, it is possible to perform various statistical surveys and effective membership management.

도 1은 본 발명에 따른 주소표준화 시스템의 구성을 도시한 블록도.1 is a block diagram showing the configuration of an address standardization system according to the present invention;

도 2는 본 발명에 따른 주소표준화 시스템의 상위주소 표준화에 대한 실시예를 도시한 순서도.Figure 2 is a flow chart illustrating an embodiment for higher address standardization of the address standardization system according to the present invention.

도 3은 본 발명에 따른 주소표준화 시스템의 하위주소 파싱에 대한 실시예를 도시한 순서도.3 is a flow diagram illustrating an embodiment of sub-address parsing of an address standardization system in accordance with the present invention.

도 4는 본 발명에 따른 건물명정제의 실시예를 나타낸 도면.4 is a view showing an embodiment of a building name tablet according to the present invention.

도 5는 본 발명에 따른 하위주소 중 공동주택에 대한 코드화의 실시예를 나타낸 순서도.Figure 5 is a flow chart showing an embodiment of the coding for the apartment house of the lower address in accordance with the present invention.

도 6은 본 발명에 따른 공동주택 EC코드 테이블을 나타낸 도면.Figure 6 is a view showing a multi-unit EC code table according to the present invention.

도 7은 본 발명에 따른 공동주택 EC코드 테이블의 적용에 대한 실시예를 나타낸 도면.7 is a view showing an embodiment of the application of the apartment code EC code table according to the present invention.

도 8은 본 발명에 따른 결과코드 생성의 실시예를 나타낸 순서도.8 is a flowchart showing an embodiment of result code generation according to the present invention.

도 9는 본 발명에 따른 결과코드 테이블을 나타낸 도면.9 is a view showing a result code table according to the present invention.

도 10은 본 발명에 따른 우편번호를 이용한 인증주소 생성에 대한 실시예를 나타낸 순서도.10 is a flowchart illustrating an embodiment for generating an authentication address using a postal code according to the present invention.

도 11은 본 발명에 따른 전화번호를 이용한 가구화 ID 생성에 대한 실시예를 나타낸 순서도.11 is a flow chart showing an embodiment for generating a household ID using a telephone number according to the present invention.

도 12는 본 발명에 따른 가구화 ID 생성 과정을 나타낸 도면.12 is a view showing a furniture ID generation process according to the present invention.

***도면의 주요 부분에 대한 부호의 설명****** Description of the symbols for the main parts of the drawings ***

101: 문자열 정제부 102: 파싱부101: string refiner 102: parser

103: 버퍼부 104: 순차표준화부103: buffer section 104: sequential standardization section

105: DB부 106: 설정부105: DB unit 106: setting unit

107: 건물명 정제부 108: EC코드 생성부107: building name purification unit 108: EC code generation unit

109: 결과코드 생성부109: result code generation unit

Claims (25)

사용자로부터 입력받은 주소데이터를 최상위주소부터 지역구분 기준의 범위에 따라 순차적으로 파싱하여 각 지역구분 기준의 범위에 해당하는 단위주소를 생성하는 파싱부와;A parsing unit for parsing the address data input from the user sequentially from the highest address according to the range of the regional classification standard to generate a unit address corresponding to the range of each regional classification standard; 지역구분 기준의 범위에 따라 각 단위주소에 매칭되는 단위코드와 상기 단위코드의 단위주소가 속한 상위주소에 대한 표준화코드가 매칭되어 저장된 레퍼런스를 구비한 DB부와;A DB unit having a reference stored by matching a unit code matching each unit address and a standardization code for a higher address to which the unit address of the unit code belongs according to a range of regional classification criteria; 상기 지역구분 기준 및 표준화코드와의 일치정도에 따라 각 단위코드에 우선순위에 대한 코드인 EC코드를 부여하는 EC코드 생성부와;An EC code generation unit for giving each unit code an EC code, which is a code of priority, according to the degree of correspondence with the regional classification standard and the standardization code; 상기 파싱부로부터 순차적으로 제공되는 상기 단위주소마다 상기 레퍼런스와 매칭하여 상위주소의 단위코드에 하위주소의 단위코드를 순차적으로 부가하여 최종코드를 생성하며, 상기 단위주소에 매칭되는 단위코드의 부재 또는 불일치에 따라 오류여부를 판단하여 오류 발생시 상기 레퍼런스에 상기 EC 코드 생성부가 상기 오류 발생 이후에 제공되는 지역구분 기준 범위의 상기 단위주소와 매칭되는 상기 단위코드에 부여한 EC 코드 중에서 우선순위가 가장 높은 EC 코드에 대응하는 상기 표준화코드를 선택하여 상기 최종코드를 대체하는 순차표준화부The final code is generated by sequentially adding a unit code of a lower address to a unit code of an upper address by matching the reference with each unit address sequentially provided from the parsing unit, or absence of a unit code matching the unit address, or The EC having the highest priority among the EC codes assigned to the unit code matching the unit address of the region classification reference range provided after the error by the EC code generator is determined to determine whether an error is caused according to the mismatch. A sequential standardization unit for selecting the standardized code corresponding to the code and replacing the final code 로 구성되는 주소표준화 시스템.Address standardization system. 청구항 1에 있어서,The method according to claim 1, 상기 주소데이터를 정제하여 상기 파싱부에 정제된 주소데이터를 전달하는 문자열 정제부가 더 구성되는 주소표준화 시스템.And a string refiner configured to purify the address data and deliver the refined address data to the parser. 청구항 1에 있어서,The method according to claim 1, 상기 지역구분 기준은 법정동, 행정동 또는 상용동인 것을 특징으로 하는 주소표준화 시스템.The regional classification standard is a statutory building, administrative building or commercial building. 청구항 1에 있어서,The method according to claim 1, 상기 단위주소는 광역시, 시군구, 읍면동, 리, 번지, 건물명, 건물동 또는 건물호 중 적어도 하나를 포함하는 것을 특징으로 하는 주소표준화 시스템.The unit address is an address standardization system comprising at least one of metropolitan city, sigun-gu, eup-myeon-dong, li, address, building name, building dong, or building number. 삭제delete 청구항 4에 있어서,The method according to claim 4, 상기 주소데이터가 건물명을 포함하는 경우 건물명을 건물키워드와 키워드 위치를 근거로 정제하는 건물명정제부를 더 포함하는 주소표준화 시스템.And a building name refining unit for refining a building name based on a building keyword and a keyword location when the address data includes a building name. 삭제delete 청구항 1에 있어서,The method according to claim 1, 상기 오류발생은 상기 단위주소와 매칭되는 상기 표준화코드가 없거나 상기 주소데이터에 포함된 상기 지역구분 기준의 범위 중 일부가 누락되어 상기 범위의 단위주소를 건너뛰는 경우를 포함하는 것을 특징으로 하는 주소표준화 시스템.The occurrence of an error may include a case in which the standardization code corresponding to the unit address is missing or a part of the range of the region classification criteria included in the address data is missing and the unit address of the range is skipped. system. 청구항 1에 있어서,The method according to claim 1, 상기 순차표준화부는 오류발생시 상기 오류발생 이후에 매칭되는 단위코드와 상기 오류발생 이전까지 생성된 최종코드를 상기 EC 코드 생성부에 제공하는 것을 특징으로 하는 주소표준화 시스템.And the sequential standardization unit provides the EC code generation unit with a unit code matched after the error occurrence and a final code generated before the error occurrence when an error occurs. 청구항 8에 있어서,The method according to claim 8, 상기 EC 코드 생성부는 오류 발생에 따라 제공된 상기 단위코드와 최종코드를 근거로 상기 단위코드를 포함하는 적어도 하나 이상의 레퍼런스에 상기 최종코드와의 일치정도에 따라 상기 EC 코드를 부여하는 것을 특징으로 하는 주소표준화 시스템.Wherein the EC code generating unit assigns the EC code to at least one reference including the unit code based on the unit code and the final code provided according to the occurrence of the error according to the degree of correspondence with the final code. Standardization system. 청구항 1에 있어서,The method according to claim 1, 상기 순차표준화부를 모니터링하여 각 단위주소마다 상기 오류발생을 체크하며, 오류가 발생된 단위주소마다 대응하는 결과코드를 생성하여 취합하는 결과코드 생성부를 더 포함하는 주소표준화 시스템.And a result code generation unit for monitoring the sequential standardization unit to check occurrence of the error for each unit address, and generating and collecting a result code corresponding to each unit address where an error occurs. 청구항 11에 있어서,The method according to claim 11, 상기 결과코드 생성부는 매칭되는 상기 단위코드의 존재여부, 우선순위가 높은 EC 코드를 선택함에 따라 수정 및 추가되는 상기 단위주소의 지역구분 기준의 범위에 대하여 서로 다른 결과코드를 부여하여 각 단위주소의 오류종류를 구분하는 것을 특징으로 하는 주소표준화 시스템.The result code generating unit assigns different result codes to the range of the region classification criteria of the unit address to be modified and added according to whether the unit code to be matched and the EC code having a higher priority are selected. Address standardization system characterized by distinguishing the type of error. 지역구분 기준에 따라 사용자로부터 입력된 주소데이터를 정제하여 표준화된 주소를 생성하는 주소표준화 시스템의 주소표준화 방법에 있어서,In the address standardization method of the address standardization system to generate a standardized address by purifying the address data input from the user according to the regional classification criteria, 사용자로부터 입력받은 주소데이터를 최상위주소부터 지역구분 기준의 범위에 따라 순차적으로 파싱하여 각 지역구분 기준의 범위에 해당하는 단위주소를 생성하는 제 1단계와;A first step of parsing the address data received from the user from the highest address sequentially according to the range of the regional classification standard to generate a unit address corresponding to the range of each regional classification standard; 지역구분 기준의 범위에 따라 각 단위주소에 매칭되는 단위코드와 상기 단위코드의 단위주소가 속한 상위주소에 대한 표준화코드가 매칭되어 저장된 레퍼런스를 호출하는 제2단계와;A second step of calling a stored reference by matching a unit code matching each unit address according to a range of local classification criteria and a standardization code for a higher address to which the unit address of the unit code belongs; 순차적으로 제공되는 상기 단위주소를 상기 레퍼런스의 단위코드와 매칭하는 제3단계와;A third step of matching the unit addresses sequentially provided with unit codes of the reference; 상기 제3단계를 통해 매칭된 상위주소의 단위코드에 이후 상기 제 1 내지 제 3단계를 반복하여 매칭되는 하위주소의 단위코드를 순차적으로 부가하여 최종코드를 생성하는 제4단계와;A fourth step of generating a final code by sequentially adding the unit codes of the matching lower addresses to the unit codes of the higher addresses matched through the third step, by repeating the first to third steps thereafter; 상기 제4단계에서 각 단위주소에 대한 상기 최종코드 생성마다 상기 단위주소에 매칭되는 단위코드의 부재 또는 상기 최종코드와 표준화코드의 불일치를 판단하여 오류 발생시 상기 오류 발생 이후에 제공되는 지역구분 기준 범위의 상기 단위주소와 매칭되는 적어도 하나 이상의 단위코드에 상기 지역구분 기준 및 상기 최종코드와 표준화코드와의 일치정도에 따라 우선순위에 대한 코드인 EC코드를 부여하고, 우선순위가 가장 높은 EC 코드가 부여된 단위코드에 대응하는 상기 표준화코드를 선택하여 상기 제4단계의 최종코드를 상기 표준화코드로 대체하는 제5단계In the fourth step, the region classification reference range provided after the occurrence of an error when the occurrence of an error is determined by determining the absence of a unit code matching the unit address or the inconsistency of the standard code with each generation of the final code for each unit address. The EC code, which is a code for priority, is assigned to at least one or more unit codes matching the unit address of the code according to the regional classification criteria and the degree of matching between the final code and the standard code. A fifth step of selecting the standardization code corresponding to the assigned unit code and replacing the final code of the fourth step with the standardization code 로 이루어지는 주소표준화 방법.Address standardization method. 청구항 13에 있어서,The method according to claim 13, 상기 지역구분 기준은 법정동, 행정동 또는 상용동 중 어느 하나인 것을 특징으로 하는 주소표준화 방법.The regional classification standard is one of statutory dong, administrative dong or commercial dong. 청구항 13에 있어서,The method according to claim 13, 상기 단위주소는 광역시, 시군구, 읍면동, 리, 번지, 건물명, 건물동, 건물호 중 어느 하나인 것을 특징으로 하는 주소표준화 방법.The unit address is any one of metropolitan city, Sigun-gu, Eup-myeon-dong, Lee, address, building name, building dong, building number. 삭제delete 청구항 15에 있어서,The method according to claim 15, 상기 제3단계에서 상기 단위주소가 건물명일 경우 상기 단위코드는 기설정된 건물명의 키워드 위치와 건물키워드로부터 획득한 건물분류코드인 것을 특징으로 하는 주소표준화 방법.And in the third step, when the unit address is a building name, the unit code is a building classification code obtained from a keyword location and a building keyword of a predetermined building name. 삭제delete 삭제delete 삭제delete 청구항 13에 있어서,The method according to claim 13, 상기 제3단계는 매칭되는 단위코드가 없을 경우 오류발생을 나타내는 결과코드를 생성하는 것을 특징으로 하는 주소표준화 방법.And the third step generates a result code indicating an error occurrence when there is no matching unit code. 청구항 21에 있어서,The method according to claim 21, 상기 결과코드는 단위주소의 존재여부, 우선순위가 높은 EC 코드에 해당하는 상기 표준화코드를 선택함에 따른 상기 최종코드의 수정 및 추가에 대하여 서로 다른 결과코드가 생성되어 각 단위주소의 오류종류를 구분하는 것을 특징으로 하는 주소표준화 방법.In the result code, different result codes are generated for the modification and addition of the final code by selecting the standard code corresponding to the presence or absence of a unit address and a high priority EC code to distinguish an error type of each unit address. Address standardization method characterized in that. 청구항 13에 있어서,The method according to claim 13, 제4단계의 상기 최종코드를 근거로 상기 레퍼런스를 스캔하여 매칭되는 인증주소를 출력하는 제6단계를 더 포함하는 주소표준화 방법.And a sixth step of outputting a matching authentication address by scanning the reference based on the final code of the fourth step. 청구항 23에 있어서,The method according to claim 23, 상기 주소데이터는 우편번호를 더 포함하며, 상기 레퍼런스는 우편번호에 대한 단위코드를 포함하는 것을 특징으로 하는 주소표준화 방법.The address data further includes a postal code, and the reference comprises a unit code for a postal code. 청구항 13에 있어서,The method according to claim 13, 상기 주소데이터가 전화번호일 경우 상기 단위주소는 전화번호의 지역번호, 국번 또는 가입자번호 중 어느 하나이며, 상기 단위주소를 기설정된 길이로 보상하여 제4단계의 상기 최종코드에 부가함으로써 가구화 ID를 생성하는 제7단계를 더 포함하는 주소표준화 방법.When the address data is a telephone number, the unit address is any one of an area code, a station number, or a subscriber number of a telephone number. Address standardization method further comprising the step of generating a.
KR1020080059198A 2008-06-23 2008-06-23 System and method for standardizing address KR100911762B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020080059198A KR100911762B1 (en) 2008-06-23 2008-06-23 System and method for standardizing address

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020080059198A KR100911762B1 (en) 2008-06-23 2008-06-23 System and method for standardizing address

Publications (1)

Publication Number Publication Date
KR100911762B1 true KR100911762B1 (en) 2009-08-11

Family

ID=41209706

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020080059198A KR100911762B1 (en) 2008-06-23 2008-06-23 System and method for standardizing address

Country Status (1)

Country Link
KR (1) KR100911762B1 (en)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101132150B1 (en) * 2010-10-12 2012-07-11 (주)수지원넷소프트 Address processing for formalizing addresses
US8984006B2 (en) 2011-11-08 2015-03-17 Google Inc. Systems and methods for identifying hierarchical relationships
US9665847B2 (en) 2009-12-22 2017-05-30 Philip Morris Usa Inc. Method and apparatus for storage of data for manufactured items
KR101768015B1 (en) * 2016-11-07 2017-08-22 대한민국 Address information visualization system
US10579889B2 (en) 2015-08-25 2020-03-03 Inexto Sa Verification with error tolerance for secure product identifiers
US10587403B2 (en) 2015-08-13 2020-03-10 Inexto Sa Enhanced obfuscation or randomization for secure product identification and verification
US10594494B2 (en) 2015-08-25 2020-03-17 Inexto Sa Multiple authorization modules for secure production and verification
US10607181B2 (en) 2012-12-17 2020-03-31 Inexto Sa Method and apparatus for storage of data for tracking manufactured items
KR20200053138A (en) 2018-11-08 2020-05-18 한국감정원 Method, system and computer program for automatching adresses between building ledger and energy measuring instrument
US10680826B2 (en) 2015-01-31 2020-06-09 Inexto Sa Secure product identification and verification
WO2021009594A1 (en) * 2019-07-15 2021-01-21 Coupang Corp. Computerized systems and methods for address correction
US10984370B2 (en) 2015-01-28 2021-04-20 Inexto Sa Method and apparatus for unit and container identification and tracking
CN112749560A (en) * 2019-10-30 2021-05-04 阿里巴巴集团控股有限公司 Address text processing method, device and equipment and computer storage medium
WO2021153965A1 (en) * 2020-01-28 2021-08-05 이강록 Method for implementing on/offline franchise stores by using unified domain
CN113704574A (en) * 2021-08-27 2021-11-26 北京市律典通科技有限公司 Address standardization method and device
WO2023191260A1 (en) * 2022-03-28 2023-10-05 쿠팡 주식회사 Method for providing address information and device therefor

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010083549A (en) * 2000-02-16 2001-09-01 이강록 Site address simplify method
KR20030039352A (en) * 2003-04-08 2003-05-17 (주)이스턴테크놀러지 A system for providing a agency service of address-adjustment and the method
KR100415173B1 (en) * 2001-02-16 2004-01-14 주식회사 인포네트 Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data
KR20070059802A (en) * 2005-12-07 2007-06-12 한국전자통신연구원 Postal address unity management system and method

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010083549A (en) * 2000-02-16 2001-09-01 이강록 Site address simplify method
KR100415173B1 (en) * 2001-02-16 2004-01-14 주식회사 인포네트 Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data
KR20030039352A (en) * 2003-04-08 2003-05-17 (주)이스턴테크놀러지 A system for providing a agency service of address-adjustment and the method
KR20070059802A (en) * 2005-12-07 2007-06-12 한국전자통신연구원 Postal address unity management system and method

Cited By (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9665847B2 (en) 2009-12-22 2017-05-30 Philip Morris Usa Inc. Method and apparatus for storage of data for manufactured items
US11797512B2 (en) 2009-12-22 2023-10-24 Philip Morris Usa Inc. Method and apparatus for storage of data for manufactured items
US10019606B2 (en) 2009-12-22 2018-07-10 Philip Morris Usa Inc. Method and apparatus for storage of data for manufactured items
US10083197B2 (en) 2009-12-22 2018-09-25 Philip Morris Usa Inc. Method and apparatus for storage of data for manufactured items
US10380095B2 (en) 2009-12-22 2019-08-13 Philip Morris Usa Inc. Method and apparatus for storage of data for manufactured items
KR101132150B1 (en) * 2010-10-12 2012-07-11 (주)수지원넷소프트 Address processing for formalizing addresses
US8984006B2 (en) 2011-11-08 2015-03-17 Google Inc. Systems and methods for identifying hierarchical relationships
US10607181B2 (en) 2012-12-17 2020-03-31 Inexto Sa Method and apparatus for storage of data for tracking manufactured items
US10984370B2 (en) 2015-01-28 2021-04-20 Inexto Sa Method and apparatus for unit and container identification and tracking
US10680826B2 (en) 2015-01-31 2020-06-09 Inexto Sa Secure product identification and verification
US10587403B2 (en) 2015-08-13 2020-03-10 Inexto Sa Enhanced obfuscation or randomization for secure product identification and verification
US10594494B2 (en) 2015-08-25 2020-03-17 Inexto Sa Multiple authorization modules for secure production and verification
US10579889B2 (en) 2015-08-25 2020-03-03 Inexto Sa Verification with error tolerance for secure product identifiers
KR101768015B1 (en) * 2016-11-07 2017-08-22 대한민국 Address information visualization system
KR20200053138A (en) 2018-11-08 2020-05-18 한국감정원 Method, system and computer program for automatching adresses between building ledger and energy measuring instrument
KR102185813B1 (en) * 2018-11-08 2020-12-02 한국감정원 Method, system and computer program for automatching adresses between building ledger and energy measuring instrument
WO2021009594A1 (en) * 2019-07-15 2021-01-21 Coupang Corp. Computerized systems and methods for address correction
US11328249B2 (en) 2019-07-15 2022-05-10 Coupang Corp. Computerized systems and methods for address correction
CN112749560A (en) * 2019-10-30 2021-05-04 阿里巴巴集团控股有限公司 Address text processing method, device and equipment and computer storage medium
WO2021153965A1 (en) * 2020-01-28 2021-08-05 이강록 Method for implementing on/offline franchise stores by using unified domain
CN113704574A (en) * 2021-08-27 2021-11-26 北京市律典通科技有限公司 Address standardization method and device
CN113704574B (en) * 2021-08-27 2024-02-09 北京市律典通科技有限公司 Address standardization method and device
WO2023191260A1 (en) * 2022-03-28 2023-10-05 쿠팡 주식회사 Method for providing address information and device therefor

Similar Documents

Publication Publication Date Title
KR100911762B1 (en) System and method for standardizing address
US8249744B2 (en) Mail routing system including a data block analyzer
US5734568A (en) Data processing system for merger of sorting information and redundancy information to provide contextual predictive keying for postal addresses
US20020193992A1 (en) Voice-enabled directory look-up
CA2330222A1 (en) Method and means for classifying data packets
JP2007535741A (en) Two-step data validation and mapping for database access
CA2750609A1 (en) Methods and systems for matching records and normalizing names
KR101132150B1 (en) Address processing for formalizing addresses
CN107634765B (en) A kind of Internet of Things coding method and system
US20190303384A1 (en) Method and system for consolidating data retrieved from different sources
IL225820A (en) Real-time single-sweep detection of key words and content analysis
US20090287742A1 (en) Method and system for run time directories for address services on a mail processing system
KR100987761B1 (en) Data Cleansing System and Method for Developing Integrated Database, and Recording Medium Therefor
Wilkinson et al. The information content of trees and their matrix representations
JP2010066841A (en) Help desk support system
KR100921217B1 (en) System and method for estimating income
JP2015176241A (en) Database management device and address recognition device
JP2011159256A (en) Method and program for reading visiting card
CN115309705A (en) Data integration classification system and method for automatically identifying basic data elements of urban information model platform
CN115185986A (en) Method and device for matching provincial and urban area address information, computer equipment and storage medium
KR20010063882A (en) System and its Method for creating delivery information of mail
CN113934736A (en) Enterprise identification method, device and storage medium
KR100415173B1 (en) Method for a automatic standardization of a client information by comparison and analysis of change data using refirement control system of data
JP5603863B2 (en) Code collection technology for mobile devices
JPS60233782A (en) Address reader

Legal Events

Date Code Title Description
A201 Request for examination
A302 Request for accelerated examination
E902 Notification of reason for refusal
E90F Notification of reason for final refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120731

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130731

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20140725

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20150804

Year of fee payment: 7

FPAY Annual fee payment

Payment date: 20170525

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20180625

Year of fee payment: 10

FPAY Annual fee payment

Payment date: 20190731

Year of fee payment: 11