KR102676525B1 - Method for retreiving information related to policy using public data and apparauts thereof - Google Patents

Method for retreiving information related to policy using public data and apparauts thereof Download PDF

Info

Publication number
KR102676525B1
KR102676525B1 KR1020230132175A KR20230132175A KR102676525B1 KR 102676525 B1 KR102676525 B1 KR 102676525B1 KR 1020230132175 A KR1020230132175 A KR 1020230132175A KR 20230132175 A KR20230132175 A KR 20230132175A KR 102676525 B1 KR102676525 B1 KR 102676525B1
Authority
KR
South Korea
Prior art keywords
data
search
policy
information
category
Prior art date
Application number
KR1020230132175A
Other languages
Korean (ko)
Inventor
안종범
Original Assignee
정책평가연구원(주)
Filing date
Publication date
Application filed by 정책평가연구원(주) filed Critical 정책평가연구원(주)
Application granted granted Critical
Publication of KR102676525B1 publication Critical patent/KR102676525B1/en

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/358Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/31Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/3332Query translation
    • G06F16/3334Selection or weighting of terms from queries, including natural language queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/338Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/34Browsing; Visualisation therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Abstract

본 발명은 공공 데이터를 이용하여 정책에 관련된 정보 검색 서비스를 제공하기 위한 것으로, 서버의 동작 방법은, 상기 서버에 접속한 클라이언트 장치로부터 검색어를 수신하는 단계, 상기 검색어에 관련되는 정책 정보 건들을 검색하는 단계, 상기 정책 정보 건들에 대한 정보를 제공하는 단계, 상기 클라이언트 장치의 사용자의 정책정보 군집화 기능의 선택에 따라, 계층적으로 분류된 주제들을 표시하는 화면을 제공하는 단계, 상기 화면에서 주제가 선택되면, 선택된 주제로 초기화된 초기 화면을 제공하는 단계, 및 상기 초기 화면에 표시된 키워드들 중 하나의 키워드가 선택되면, 선택된 키워드에 관련된 카테고리 별 검색 건들의 목록을 제공하는 단계를 포함할 수 있다.The present invention is intended to provide a policy-related information search service using public data. The operating method of the server includes receiving a search term from a client device connected to the server, and searching for policy information related to the search term. providing information on the policy information matters; providing a screen displaying hierarchically classified topics according to selection of a policy information clustering function by a user of the client device; selecting a topic from the screen When one of the keywords displayed on the initial screen is selected, providing an initial screen initialized to the selected topic may include providing a list of search results by category related to the selected keyword.

Description

공공 데이터를 이용하여 정책에 관련된 정보의 검색을 제공하는 방법 및 그 장치{METHOD FOR RETREIVING INFORMATION RELATED TO POLICY USING PUBLIC DATA AND APPARAUTS THEREOF}Method and device for providing retrieval of policy-related information using public data {METHOD FOR RETREIVING INFORMATION RELATED TO POLICY USING PUBLIC DATA AND APPARAUTS THEREOF}

본 발명은 정보 검색 서비스를 제공하기 위한 것으로, 보다 구체적으로 공공 데이터를 이용하여 정책에 관련된 정보 검색 서비스를 제공하기 위한 방법 및 그 장치에 관한 것이다.The present invention is directed to providing an information retrieval service, and more specifically, to a method and device for providing a policy-related information retrieval service using public data.

국가 운영을 위한 정책 정보들의 홍수 시대에 우리나라의 공공 기관 데이터 시장 생태계는 정부와 국회 등 공공 주도로 형성되어 있다. 그러나, 이러한 공공부문의 각 기관 중심으로 일방적인 공급자 중심 정보 제공이 이루어지고 있는 등 정보 제공 플랫폼 및 데이터가 분절적이며, 연계가 부족함으로 인해, 공공 정보 간 유사 및 중복 등이 심각한 상황이다. 나아가, 중앙부처, 공공기관, 지자체 등 정책 관계자(stakeholder)에 있어서, 주기적으로 담당자가 변경되므로, 정책 수립 배경, 과정 등 연혁에 대한 업무 인수인계 및 추적이 쉽지 아니하다. 또한, 국회의 경우는 4년 마다 선거로 인한 의원 교체로 입법 연혁에 대한 지원이 쉽지 아니하다. 따라서, 일반 국민, 기업 등 정책 정보를 필요로 하는 수요자들은 각종 정책 정보를 어디서, 어떻게 찾아야 하는지에 대한 문제를 해결하기 어렵고, 원하는 정책 정보를 적시에 찾을 수 없는 상황이다.In an age of flood of policy information for national operations, Korea's public institution data market ecosystem is formed by the public, including the government and the National Assembly. However, information provision platforms and data are fragmented, with each public sector institution providing unilateral, provider-centered information, and due to lack of connection, similarities and overlaps among public information are serious. Furthermore, for policy stakeholders such as central ministries, public institutions, and local governments, the person in charge changes periodically, so it is not easy to hand over and track the history of policy establishment background and process. Additionally, in the case of the National Assembly, support for legislative history is not easy due to changes in members due to elections every four years. Therefore, it is difficult for consumers who need policy information, such as the general public and companies, to solve the problem of where and how to find various policy information, and are unable to find the desired policy information in a timely manner.

본 발명은 쉽고 빠르게 정책 정보에 접근할 수 있는 검색 서비스를 제공하기 위한 방법 및 그 장치를 제공한다.The present invention provides a method and device for providing a search service that allows easy and quick access to policy information.

본 발명은 여러 공공 데이터 생산자들로부터의 정책 정보들을 효과적으로 수집하기 위한 방법 및 그 장치를 제공한다.The present invention provides a method and device for effectively collecting policy information from various public data producers.

본 발명은 검색 서비스의 검색 결과의 정확도를 높이기 위한 방법 및 그 장치를 제공한다.The present invention provides a method and device for increasing the accuracy of search results of a search service.

본 발명은 한번의 검색으로 많은 공공 데이터 정책 정보를 제공하기 위한 방법 및 그 장치를 제공한다.The present invention provides a method and apparatus for providing a large amount of public data policy information through a single search.

본 발명은 다양한 출처들로부터 수집된 다양한 정책 정보를 효과적으로 활용하기 위한 방법 및 그 장치를 제공한다.The present invention provides a method and device for effectively utilizing various policy information collected from various sources.

본 발명은 다양한 정책 정보를 내용에 따라 분류 및 제공하기 위한 방법 및 그 장치를 제공한다.The present invention provides a method and device for classifying and providing various policy information according to content.

본 발명은 다양한 정책 정보를 군집화된 형태로 제공하기 위한 방법 및 그 장치를 제공한다.The present invention provides a method and device for providing various policy information in a clustered form.

본 발명의 실시 예에 따르면, 정책에 관련된 정보 검색 서비스를 제공하기 위한 서버의 동작 방법은, 상기 서버에 접속한 클라이언트 장치로부터 검색어를 수신하는 단계, 상기 검색어에 관련되는 정책 정보 건들을 검색하는 단계, 상기 정책 정보 건들에 대한 정보를 제공하는 단계, 상기 클라이언트 장치의 사용자의 정책정보 군집화 기능의 선택에 따라, 계층적으로 분류된 주제들을 표시하는 화면을 제공하는 단계, 상기 화면에서 주제가 선택되면, 선택된 주제로 초기화된 초기 화면을 제공하는 단계, 및 상기 초기 화면에 표시된 키워드들 중 하나의 키워드가 선택되면, 선택된 키워드에 관련된 카테고리 별 검색 건들의 목록을 제공하는 단계를 포함할 수 있다.According to an embodiment of the present invention, a method of operating a server for providing a policy-related information search service includes the steps of receiving a search term from a client device connected to the server, and searching for policy information related to the search term. , providing information about the policy information cases, providing a screen displaying hierarchically classified topics according to the selection of the policy information clustering function by the user of the client device, when a topic is selected on the screen, It may include providing an initial screen initialized with a selected topic, and when one keyword among keywords displayed on the initial screen is selected, providing a list of search cases by category related to the selected keyword.

본 발명의 실시 예에 따른 기술은 검색 서비스를 통해 쉽고 빠르게 정책 정보에 접근할 수 있게 할 수 있다.The technology according to an embodiment of the present invention can enable quick and easy access to policy information through a search service.

도 1은 본 발명의 실시 예에 따른 검색 서비스를 제공하는 시스템을 도시한다.
도 2는 본 발명의 실시 예에 따른 검색 서비스를 위한 장치의 기능적 구조를 도시한다.
도 3은 본 발명의 실시 예에 따른 검색 서비스의 개요를 도시한다.
도 4는 본 발명의 실시 예에 따른 검색 서비스에서 군집화를 위한 인공지능 모델의 예를 도시한다.
도 5는 본 발명의 실시 예에 따른 클라이언트 장치 및 서버의 기능적 구조를 도시한다.
도 6은 본 발명의 실시 예에 따른 검색 서비스를 위한 데이터 수집 및 색인화 절차의 예를 도시한다.
도 7은 본 발명의 실시 예에 따른 검색 서비스에서 검색어 입력에 따른 정책 정보 제공 절차의 예를 도시한다.
도 8은 본 발명의 실시 예에 따른 검색 서비스에서 초기 화면의 예를 도시한다.
도 9는 본 발명의 실시 예에 따른 검색 서비스에서 검색어 입력에 따른 검색 결과 화면의 예를 도시한다.
도 10은 본 발명의 실시 예에 따른 검색 서비스에서 검색어 입력에 따른 정책 정보 제공 절차의 다른 예를 도시한다.
도 11은 본 발명의 실시 예에 따른 검색 서비스에서 카테고리 별 초기 화면의 예를 도시한다.
도 12는 발명의 실시 예에 따른 검색 서비스에서 정책정보 군집화 기능 수행 절차의 예를 도시한다.
도 13a 및 도 13b는 본 발명의 실시 예에 따른 검색 서비스에서 정책정보 군집화 기능의 초기 화면의 예를 도시한다.
도 14는 본 발명의 실시 예에 따른 검색 서비스에서 정책정보 군집화 기능의 상세 화면의 예를 도시한다.
도 15는 본 발명의 실시 예에 따른 검색 서비스에서 정책 정보가 제공되는 다양한 경로들을 도시한다.
1 shows a system providing a search service according to an embodiment of the present invention.
Figure 2 shows the functional structure of a device for a search service according to an embodiment of the present invention.
Figure 3 shows an outline of a search service according to an embodiment of the present invention.
Figure 4 shows an example of an artificial intelligence model for clustering in a search service according to an embodiment of the present invention.
Figure 5 shows the functional structures of a client device and a server according to an embodiment of the present invention.
Figure 6 shows an example of a data collection and indexing procedure for a search service according to an embodiment of the present invention.
Figure 7 shows an example of a policy information provision procedure according to a search word input in a search service according to an embodiment of the present invention.
Figure 8 shows an example of an initial screen in a search service according to an embodiment of the present invention.
Figure 9 shows an example of a search result screen according to input of a search word in a search service according to an embodiment of the present invention.
Figure 10 shows another example of a policy information provision procedure according to a search word input in a search service according to an embodiment of the present invention.
Figure 11 shows an example of an initial screen for each category in a search service according to an embodiment of the present invention.
Figure 12 shows an example of a procedure for performing the policy information clustering function in a search service according to an embodiment of the invention.
Figures 13a and 13b show an example of an initial screen of the policy information clustering function in a search service according to an embodiment of the present invention.
Figure 14 shows an example of a detailed screen of the policy information clustering function in a search service according to an embodiment of the present invention.
Figure 15 shows various paths through which policy information is provided in a search service according to an embodiment of the present invention.

이하 본 발명의 바람직한 실시 예를 첨부된 도면의 참조와 함께 상세히 설명한다. 그리고, 본 발명을 설명함에 있어서, 관련된 공지기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단된 경우, 그 상세한 설명은 생략한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the attached drawings. Also, when describing the present invention, if it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the gist of the present invention, the detailed description will be omitted.

이하 본 발명은 공공 데이터를 이용하여 정책에 관련된 정보 검색 서비스를 제공하기 위한 기술을 제안한다. 구체적으로, 본 발명은 정책 정보를 제공하는 웹기반 검색 서비스에 관한 것으로, 입법-행정-사법부 및 산하 기관, 공공 기관에서 운영하는 웹사이트 혹은 공공 데이터 포털 등에서 제공되는 텍스트, 첨부파일, API(application programming interface) 등을 수집하는 기술로서, 검색 결과를 제공함에 있어서 정책/제도 별로 자료를 분류하고, 추천 검색 결과를 제공하는 서비스에 관련된 것이다.Hereinafter, the present invention proposes a technology for providing policy-related information search services using public data. Specifically, the present invention relates to a web-based search service that provides policy information, and includes text, attachments, and API (application) provided from websites or public data portals operated by the legislative-executive-judiciary and subordinate agencies, public institutions, etc. It is a technology that collects information (programming interface), etc., and is related to a service that classifies data by policy/system and provides recommended search results when providing search results.

이하 설명에서, 본 발명의 실시 예들에 따른 정보 검색 서비스의 다양한 측면들이 설명될 것이다. 여기서, 사용자에게 제공되는 화면에 대한 설명에 있어서, 어떠한 영역에 어떠한 항목이 포함되거나 표시된다는 것은, 정보 검색 서비스에 관련된 장치들, 예를 들어, 서버 및 클라이언트 장치가 해당 영역에 해당 항목을 구성하는 텍스트, 그래픽, 이미지를 표시하도록 필요한 동작을 수행하는 것으로 이해될 수 있다. 예를 들어, 어떠한 영역에 어떠한 항목을 표시하기 위해, 서버는 영역을 지시하는 정보 및 항목에 대한 컨텐츠 데이터를 송신할 수 있고, 클라이언트 장치는 서버로부터 수신되는 정보 및/또는 데이터에 기반하여 해당 영역에 해당 항목을 표시할 수 있다.In the following description, various aspects of the information retrieval service according to embodiments of the present invention will be described. Here, in the description of the screen provided to the user, the inclusion or display of an item in an area means that devices related to the information retrieval service, for example, servers and client devices, configure the item in the area. It can be understood as performing the necessary operations to display text, graphics, and images. For example, to display an item in an area, a server may transmit information indicating the area and content data for the item, and the client device may select the area based on the information and/or data received from the server. The corresponding item can be displayed in .

도 1은 본 발명의 실시 예에 따른 검색 서비스를 제공하는 시스템을 도시한다.1 shows a system providing a search service according to an embodiment of the present invention.

도 1을 참고하면, 클라이언트 장치(110) 및 서버(120)는 통신망에 접속한다. 통신망을 통해, 클라이언트 장치(110) 및 서버(120)는 상호 통신을 수행할 수 있다. Referring to FIG. 1, the client device 110 and the server 120 connect to a communication network. Through a communication network, the client device 110 and the server 120 may communicate with each other.

클라이언트 장치(110)는 검색 서비스를 이용하는 사용자에 의해 사용되는 장치이며, 스마트 폰, 랩탑(laptop) PC(personal computer), 데스크탑 PC, 타블렛 PC 등 다양한 형태를 가질 수 있다. 클라이언트 장치(110)는 통신 망을 통해 서버(120)에 접속하고, 검색 서비스를 이용할 수 있다. 검색 서비스는 클라이언트 장치(110)에 설치된 전용 어플리케이션 또는 웹 페이지를 통해 제공될 수 있다.The client device 110 is a device used by a user using a search service, and may have various forms such as a smart phone, laptop personal computer (PC), desktop PC, or tablet PC. The client device 110 can connect to the server 120 through a communication network and use a search service. The search service may be provided through a dedicated application or web page installed on the client device 110.

서버(120)는 전용 어플리케이션 또는 웹 페이지를 통해 클라이언트 장치(110)에게 검색 서비스를 제공할 수 있다. 또한, 서버(120)는 검색 서비스를 통해 제공되는 정책 정보를 미리 또는 실시간으로 수집할 수 있다. 이를 위해, 서버(120)는 입법/행정/사법부, 그 산하 기관 및/또는 공공 기관에 관련된 웹 사이트 또는 포털을 제공하는 서버들(미도시)에 접속하고, 데이터를 요청 및 수신할 수 있다. 또한, 서버(120)는 수집된 데이터를 일정한 기준에 따라 분류하고, 저장할 수 있다.The server 120 may provide a search service to the client device 110 through a dedicated application or web page. Additionally, the server 120 may collect policy information provided through a search service in advance or in real time. To this end, the server 120 may connect to servers (not shown) that provide websites or portals related to the legislative/executive/judicial departments, their affiliated agencies, and/or public agencies, and request and receive data. Additionally, the server 120 can classify and store the collected data according to certain standards.

도 2는 본 발명의 실시 예에 따른 검색 서비스를 위한 장치의 기능적 구조를 도시한다.Figure 2 shows the functional structure of a device for a search service according to an embodiment of the present invention.

도 2를 참고하면, 클라이언트 장치(110)는 입출력부(210), 통신부(220), 저장부(230), 제어부(240)를 포함한다.Referring to FIG. 2, the client device 110 includes an input/output unit 210, a communication unit 220, a storage unit 230, and a control unit 240.

입출력부(210)는 정보 또는 데이터를 외부로 출력하는 출력 수단 및 외부로부터의 입력을 감지하는 입력 수단을 포함한다. 여기서, 출력 수단은 적어도 하나의 형태의 출력을 지원할 수 있으며, 예를 들어, 문자, 그래픽 등으로 구성되는 디지털 화면을 출력할 수 있다. 이를 위해, 출력 수단은 LED(light emitting diode), LCD(liquid crystal display) 등으로 구현될 수 있다. 입력 수단은 다양한 형태의 입력을 감지할 수 있으며, 예를 들어, 터치패드, 키 버튼, 센서, 카메라 중 적어도 하나로 구현될 수 있다. 입출력부(210)는 입력 수단 및 출력 수단이 결합된 터치스크린을 포함할 수 있다. 경우에 따라, 입출력부(210)는 물리적으로 분리된 2 이상의 하드웨어 모듈들의 집합으로 해석될 수 있다.The input/output unit 210 includes an output means for outputting information or data to the outside and an input means for detecting input from the outside. Here, the output means may support at least one form of output, for example, may output a digital screen composed of text, graphics, etc. For this purpose, the output means may be implemented as an LED (light emitting diode), LCD (liquid crystal display), etc. The input means can detect various types of input and, for example, can be implemented as at least one of a touch pad, key button, sensor, and camera. The input/output unit 210 may include a touch screen in which an input means and an output means are combined. In some cases, the input/output unit 210 may be interpreted as a set of two or more physically separated hardware modules.

통신부(220)는 외부 통신망에 접속하고, 데이터/신호/정보를 송신 및 수신하기 위한 기능을 수행한다. 예를 들어, 통신부(220)는 인터넷 망, 무선 통신망, 모바일 통신망, 유선 통신망 등에 접속하는 기능을 수행할 수 있다. 이를 위해, 통신부(220)는 신호의 변복조, 증폭, 필터링 등의 기능을 수행한다. 통신부(220)는 무선 랜 통신(예: 와이파이), 셀룰러 통신(예: LTE, 5G), 이더넷 등의 통신 기술을 지원할 수 있다.The communication unit 220 connects to an external communication network and performs a function to transmit and receive data/signals/information. For example, the communication unit 220 may perform a function of connecting to an Internet network, a wireless communication network, a mobile communication network, a wired communication network, etc. For this purpose, the communication unit 220 performs functions such as modulation/demodulation, amplification, and filtering of signals. The communication unit 220 may support communication technologies such as wireless LAN communication (e.g., Wi-Fi), cellular communication (e.g., LTE, 5G), and Ethernet.

저장부(230)는 클라이언트 장치(110)의 동작을 위해 필요한 데이터, 프로그램, 마이크로 코드, 어플리케이션 등을 저장한다. 저장부(230)는 일시적 또는 비일시적 저장 매체로 구현될 수 있다. 또한, 저장부(230)는 장치에 고정되어 있거나, 또는 분리 가능한 형태로 구현될 수 있다. The storage unit 230 stores data, programs, microcode, applications, etc. necessary for the operation of the client device 110. The storage unit 230 may be implemented as a temporary or non-transitory storage medium. Additionally, the storage unit 230 may be fixed to the device or may be implemented in a detachable form.

제어부(240)는 장치의 전반적인 동작을 제어한다. 제어부(240)는 프로세서, 마이크로 프로세서 중 적어도 하나를 포함할 수 있다. 제어부(240)는 입출력부(210)를 통해 사용자에게 시각적으로 정보를 표현하거나, 사용자의 입력을 감지할 수 있다. 제어부(240)는 저장부(230)에 저장된 프로그램을 실행하고, 통신부(220)를 통해 외부 장치와 데이터를 송신 또는 수신할 수 있다. 특히, 본 발명의 다양한 실시 예들에 따라, 제어부(240)는 클라이언트 장치(110)가 후술하는 다양한 실시 예들에 따라 동작하도록 제어한다.The control unit 240 controls the overall operation of the device. The control unit 240 may include at least one of a processor and a microprocessor. The control unit 240 can visually express information to the user or detect the user's input through the input/output unit 210. The control unit 240 can execute a program stored in the storage unit 230 and transmit or receive data to and from an external device through the communication unit 220. In particular, according to various embodiments of the present invention, the control unit 240 controls the client device 110 to operate according to various embodiments described later.

장치의 종류에 따라, 본 발명의 일 실시 예에 따른 장치는 도 2에 예시된 구성요소들 외 다른 구성요소들을 더 포함할 수 있다. 예를 들어, 장치는 다음과 같은 구성요소들 중 적어도 하나를 더 포함할 수 있다.Depending on the type of device, the device according to an embodiment of the present invention may further include components other than those illustrated in FIG. 2. For example, the device may further include at least one of the following components.

장치는 카메라부를 더 포함할 수 있다. 카메라부는 사진 촬영, 비디오 기록 등의 기능을 수행할 수 있다. 카메라부는 이미지 센서, 렌즈 등을 포함할 수 있다. 이미지 센서로서, CCD(charged coupled device), CMOS(complementary metal-oxide semiconductor) 중 적어도 하나가 사용될 수 있다. 예를 들어, 카메라부는 렌즈를 통해 입력되는 빛을 상기 이미지 센서로 인식하고, 상기 이미지 센서에서 인식된 이미지를 디지털 데이터화한다.The device may further include a camera unit. The camera unit can perform functions such as taking photos and recording videos. The camera unit may include an image sensor, a lens, etc. As an image sensor, at least one of a charged coupled device (CCD) and a complementary metal-oxide semiconductor (CMOS) may be used. For example, the camera unit recognizes light input through a lens using the image sensor, and converts the image recognized by the image sensor into digital data.

장치는 오디오부를 더 포함할 수 있다. 오디오부는 스피커 및 상기 마이크를 포함하며, 오디오의 입력과 출력을 수행한다. 오디오부는 탈부착 가능한 이어폰(ear phone), 헤드폰(head phone) 또는 헤드셋(head set)을 포함하거나, 이어폰, 헤드폰, 헤드셋 등을 연결하기 위한 단자를 포함할 수 있다.The device may further include an audio unit. The audio unit includes a speaker and the microphone, and performs audio input and output. The audio unit may include a detachable earphone, head phone, or headset, or may include a terminal for connecting earphones, headphones, or a headset.

장치는 센서부를 더 포함할 수 있다. 센서부는 외부의 물리적 현상을 검출한다. 센서부는 가속도 센서, 자이로(gyro) 센서, 광(optical) 센서, 지자기 센서, 중력 센서(G-sensor), 온도 센서, 생체 센서, 위치 센서 중 적어도 하나를 포함할 수 있다. 센서부는 움직임, 빛, 기울기, 방위 등을 감지하고, 감지 결과를 나타내는 전기적 신호를 생성할 수 있다.The device may further include a sensor unit. The sensor unit detects external physical phenomena. The sensor unit may include at least one of an acceleration sensor, a gyro sensor, an optical sensor, a geomagnetic sensor, a gravity sensor (G-sensor), a temperature sensor, a biometric sensor, and a position sensor. The sensor unit can detect movement, light, tilt, orientation, etc., and generate an electrical signal representing the detection result.

도 3은 본 발명의 실시 예에 따른 검색 서비스의 개요를 도시한다.Figure 3 shows an outline of a search service according to an embodiment of the present invention.

도 3을 참고하면, 검색 서비스는 공공 데이터 수집(301), 수집 데이터 색인(302), 정책 관련 키워드 추출(303), 정책/제도 정의(304), 정책/제도 별 키워드 정의(305), 키워드 매핑(306), 키워드 별 자료 군집화(307), 일반-연계 검색결과 제공(308) 등의 기능들을 포함한다.Referring to Figure 3, the search service includes public data collection (301), collected data index (302), policy-related keyword extraction (303), policy/system definition (304), policy/system-specific keyword definition (305), keyword It includes functions such as mapping (306), data clustering by keyword (307), and providing general-linked search results (308).

공공 데이터 수집(301)은 공공에 공개된 정책 관련 데이터를 수집하는 기능이다. 예를 들어, 서버(120)는 API, RPA(robotic process automation) 또는 크롤링(Crawling)를 이용하여 데이터를 수집할 수 있다. 다양한 실시 예들에 따라, 서버(120)는 다양한 소스(source)들에서 데이터를 수집할 수 있다. 예를 들어, 국회(예: 열린국회정보, 의안정보시스템, 국회회의록, 국정감사정보 등), 정부(예: 공공데이터포털 API, 정책브리핑 등), 국가법령정보센터, 규제정보포털, 정책연구관리시스템 등에서 수집되는 데이터는 API 또는 웹 상에 텍스트 형태로 존재하는 데이터, API 또는 웹 상에서 접근 가능한 첨부 파일에 포함된 데이터를 포함할 수 있다. 또한, 로그인을 필요로 하는 사이트의 경우, 서버(120)는 프로그래밍된 코드 등을 이용하여 로그인을 수행한 후, 데이터를 요청 및 획득할 수 있다.Public data collection (301) is a function that collects policy-related data disclosed to the public. For example, the server 120 may collect data using API, robotic process automation (RPA), or crawling. According to various embodiments, the server 120 may collect data from various sources. For example, the National Assembly (e.g. open National Assembly information, bill information system, National Assembly minutes, government audit information, etc.), government (e.g. public data portal API, policy briefing, etc.), National Legislation Information Center, regulatory information portal, policy research Data collected from management systems, etc. may include data that exists in text form on the API or the web, or data contained in attached files accessible on the API or the web. Additionally, in the case of a site that requires login, the server 120 may log in using a programmed code and then request and obtain data.

수집 데이터 색인(302)은 수집된 데이터에 대한 색인화 작업을 수행하는 기능이다. 이를 위해, 서버(120)는 수집된 데이터를 출처별로 분류하고 검색이 가능한 구조, 예를 들어, 파싱(parsing) 등을 통해 텍스트 데이터로 변환한 후, 변환된 구조에 기반하여 적어도 하나의 인덱스를 부가할 수 있다. 이를 통해, 수집된 데이터는 일정 단위로 분할됨으로써 복수의 검색어 토큰들로 변환되고, 검색어 토큰들 중 적어도 일부에 인덱스가 부가될 수 있다. 나아가, 데이터에 대한 키워드도 획득될 수 있다. 일 실시 예에 따라, 데이터의 구조 변경 및 인덱스 부가는 훈련된 인공지능 모델 또는 기계학습 모델에 기반하여 수행될 수 있다. The collected data index 302 is a function that performs an indexing operation on the collected data. To this end, the server 120 classifies the collected data by source, converts it into text data through a searchable structure, for example, parsing, etc., and then creates at least one index based on the converted structure. It can be added. Through this, the collected data may be divided into certain units and converted into a plurality of search word tokens, and an index may be added to at least some of the search word tokens. Furthermore, keywords for data can also be obtained. According to one embodiment, changing the structure of data and adding indexes may be performed based on a trained artificial intelligence model or machine learning model.

정책 관련 키워드 추출(303)은 색인화 작업의 결과에서 정책 관련 키워드를 추출하는 기능이다. 이를 위해, 서버(120)는 특정한 단어가 문서 내에 얼마나 자주 등장하는지를 판단할 수 있다. 또한, 서버(120)는 여러 문서에 등장한 단어의 가중치를 낮추는 동작을 수행할 수 있다. 즉, 서버(120)는 유사도 알고리즘으로서, TF(Term Frequency) 알고리즘 및/또는 IDF(Inverse Document Frequency) 알고리즘을 이용할 수 있다. 결과적으로, 서버(120)는 수집된 데이터에서 임계치 이상 등장하는 단어로서, 정책에 관련된 단어들을 정책 관련 키워드로서 추출할 수 있다. 여기서, 정책 관련 키워드는 수집 데이터 색인(302)에 의해 부가된 인덱스들의 적어도 일부일 수 있다. 이를 통해, 불필요한 표현 또는 단어가 제거되고, 정책의 내용을 표현하는 적어도 하나의 키워드가 추출될 수 있다.Policy-related keyword extraction (303) is a function that extracts policy-related keywords from the results of the indexing operation. To this end, the server 120 can determine how often a specific word appears in the document. Additionally, the server 120 may perform an operation to lower the weight of words that appear in multiple documents. That is, the server 120 may use a Term Frequency (TF) algorithm and/or an Inverse Document Frequency (IDF) algorithm as a similarity algorithm. As a result, the server 120 can extract policy-related keywords, which are words that appear above a threshold in the collected data, as policy-related keywords. Here, the policy-related keyword may be at least some of the indexes added by the collected data index 302. Through this, unnecessary expressions or words can be removed, and at least one keyword expressing the content of the policy can be extracted.

정책/제도 정의(304)는 본 발명의 실시 예들에 따라 검색 가능한 데이터와 연관되는 정책/제도를 특정하는 기능이다. 정책/제도 정의(304)는 현재 발의된 법률, 추진 중인 사업 등에 기반하여 수행될 수 있다. 이를 위해, 서버(120)는 현재 발의된 법률, 추진 중인 사업 등에 관련된 데이터를 수집하고, 수집된 데이터로부터 정책/제도 항목들을 결정할 수 있다. 일 실시 예에 따라, 수집된 데이터로부터의 정책/제도 항목들은 훈련된 인공지능 모델 또는 기계학습 모델에 기반하여 결정될 수 있다. 다른 실시 예에 따라, 수집된 데이터로부터의 정책/제도 항목들은 관리자에 의해 판단 및 입력될 수 있다. Policy/system definition 304 is a function that specifies a policy/system associated with searchable data according to embodiments of the present invention. Policy/system definition (304) can be performed based on currently proposed laws, ongoing projects, etc. To this end, the server 120 can collect data related to currently proposed laws, projects being promoted, etc., and determine policy/system items from the collected data. According to one embodiment, policy/institutional items from collected data may be determined based on a trained artificial intelligence model or machine learning model. According to another embodiment, policy/system items from collected data may be judged and entered by an administrator.

정책/제도 별 키워드 정의(305)는 정책/제도 정의(304) 기능에 의해 결정된 정책/제도 항목들 각각을 위한 적어도 하나의 키워드를 결정하는 기능이다. 여기서, 키워드는 해당 정책/제도를 대표하는 표현으로서, 검색의 용이성을 위해 임계치 이하의 단어로 구성되도록 결정될 수 있다. 예를 들어, 정책/제도 별 키워드는 정책/제도 항목을 결정하기 위해 사용된 데이터로부터 추출될 수 있는데, 일정 빈도 이상 등장한 단어로서, 일반적인 문장의 구성요소가 아닌 단어들 중에서 선택될 수 있다. 다른 예로, 정책/제도 별 키워드는 관리자에 의해 직접 선택 및 정의될 수 있다.The keyword definition for each policy/system 305 is a function that determines at least one keyword for each of the policy/system items determined by the policy/system definition 304 function. Here, the keyword is an expression representing the policy/system, and may be determined to consist of words below a threshold for ease of search. For example, policy/system-specific keywords can be extracted from data used to determine policy/system items. They are words that appear more than a certain frequency and can be selected from words that are not components of general sentences. As another example, keywords for each policy/system can be directly selected and defined by the administrator.

키워드 매핑(306)은 수집된 데이터의 키워드들 및 정책/제도 항목의 키워드들을 이용하여, 수집된 데이터 및 정책/제도 간 연관 관계를 파악하는 기능이다. 이에 따라, 키워드를 중심으로 수집된 데이터 및 정책/제도 항목이 정렬될 수 있으며, 수집된 데이터가 어느 정책/제도 항목에 관련된 것인지가 파악될 수 있다. 구체적으로, 서버(120)는 수집된 데이터의 키워드를 정책/제도 항목의 키워드들의 집합에서 검색하거나, 반대로 정책/제도 항목의 키워드를 수집된 데이터의 키워드들의 집합에서 검색함으로써, 일치되는 키워드를 확인할 수 있다. 이때, 키워드의 일치는 완전히 문언 상 동일한 것은 물론, 의미상 동일한 것도 포함하는 것으로 취급될 수 있다. 의미적 비교를 위해, 언어 모델 기반의 훈련된 인공지능 모델 또는 기계학습 모델이 사용될 수 있다.Keyword mapping 306 is a function that identifies the relationship between collected data and policies/systems by using keywords of collected data and keywords of policy/system items. Accordingly, the collected data and policy/system items can be sorted around keywords, and it can be determined which policy/system item the collected data is related to. Specifically, the server 120 searches the keywords of the collected data in a set of keywords of policy/system items, or conversely searches the keywords of the policy/system items in the set of keywords of the collected data to identify matching keywords. You can. At this time, the match of keywords can be treated as including not only textual identical, but also semantic identical. For semantic comparison, a trained artificial intelligence model or machine learning model based on a language model can be used.

키워드 별 자료 군집화(307)는 키워드를 기준으로 데이터를 분류하는 기능이다. 이를 통해, 군집 별 데이터 세트가 얻어진다. 분류의 기준은 시간적 기준, 장소적 기준, 내용적 기준 중 적어도 하나일 수 있으며, 내용적 기준은 산업 별, 주관 주체 별 등 다양하게 정의될 수 있다. 예를 들어, 분류의 기준은 출처, 분야, 과제 등이 될 수 있다. 이에 따라, 서버(120)는 카테고리화된 정책/제도 항목들 및 이에 대한 데이터를 확보할 수 있다. 군집화의 결과는 검색 서비스를 제공하는 웹 페이지를 구성하기 위해 사용될 수 있다. 군집화를 진행하기 위해 비정형 데이터를 분류하는 텍스트 마이닝 인공지능 모델이 활용될 수 있다. 해당 모델은 비정형 데이터를 기반으로, 테스트 데이터를 통해 추출한 특징값을 기준으로 최초 분류 모델을 생성하며, 전체 보유 데이터 및 신규 수집되는 데이터를 기반으로 학습을 지속 수행하며 모델을 개선한다.Data clustering by keyword (307) is a function that classifies data based on keywords. Through this, a data set for each cluster is obtained. The standard for classification may be at least one of a time standard, a location standard, and a content standard, and the content standard may be defined in various ways, such as by industry or subject. For example, the criteria for classification may be source, field, task, etc. Accordingly, the server 120 can secure categorized policy/system items and data related thereto. The results of clustering can be used to construct web pages that provide search services. To proceed with clustering, a text mining artificial intelligence model that classifies unstructured data can be used. The model creates an initial classification model based on unstructured data and feature values extracted through test data, and continues to learn and improve the model based on all retained data and newly collected data.

일반-연계 검색결과 제공(308)은 사용자의 요청에 따른 검색 결과를 제공하는 기능이다. 서버(120)는 사용자로부터 입력되는 검색어를 확인하고, 검색어에 기반하여 정책 관련 데이터를 검색한 후, 검색된 정책 관련 데이터를 제공할 수 있다. 이때, 서버(120)는 앞서 설명된 다양한 기능들을 통해 확보된 키워드들을 이용하여 데이터를 검색할 수 있다. 서버(120)는 우선적으로 사전에 수집된 데이터에서 검색어에 대응하는 정책 관련 데이터를 검색하며, 충분한 검색 결과가 도출되지 아니하면 실시간으로 외부에서 데이터를 더 수집 및 검색할 수 있다. 여기서, 충분한 검색 결과가 도출되지 아니함은 검색 건수가 임계치 미만으로 확인됨으로써 또는 사용자로부터의 불충분하다는 취지의 피드백을 수신함으로써 판단될 수 있다. 또한, 서버(120)는 다양한 자료를 함께 제공하 수 있는데, 예를 들어, 공신력 있는 근거 자료(예: 연구자료, 용역보고서, 내부보고서 등)가 검색 결과의 일부로서 제공될 수 있다.Providing general-linked search results (308) is a function that provides search results according to the user's request. The server 120 may check the search term input from the user, search for policy-related data based on the search term, and then provide the retrieved policy-related data. At this time, the server 120 can search data using keywords secured through various functions described above. The server 120 first searches for policy-related data corresponding to the search term from data collected in advance, and if sufficient search results are not obtained, additional data can be collected and searched from outside in real time. Here, the fact that sufficient search results are not derived can be determined by confirming that the number of searches is less than the threshold or by receiving feedback from the user indicating that the search results are insufficient. Additionally, the server 120 may provide various data. For example, credible evidence (e.g., research data, service reports, internal reports, etc.) may be provided as part of the search results.

도 3을 참고하여 설명한 검색 서비스의 개요에서, 수집 데이터 색인(302), 정책 관련 키워드 추출(303), 정책/제도 정의(304), 키워드 매핑(306), 키워드 별 자료 군집화(307), 키워드 별 자료 군집화(307) 중 적어도 하나는 인공지능 모델을 이용하여 수행될 수 있다. 본 발명의 일 실시예에 따라, 수집된 정책 데이터와 같은 비정형 데이터를 분류하는 텍스트 마이닝 인공지능 모델은 도 4와 같이 학습될 수 있다. 도 4는 본 발명의 실시 예에 따른 검색 서비스에서 군집화를 위한 인공지능 모델의 예를 도시한다.In the overview of the search service explained with reference to Figure 3, collected data index (302), policy-related keyword extraction (303), policy/system definition (304), keyword mapping (306), data clustering by keyword (307), keyword At least one of the star data clustering 307 may be performed using an artificial intelligence model. According to an embodiment of the present invention, a text mining artificial intelligence model that classifies unstructured data such as collected policy data can be learned as shown in FIG. 4. Figure 4 shows an example of an artificial intelligence model for clustering in a search service according to an embodiment of the present invention.

도 4를 참고하면, 모델(402)은 입력 데이터로서 비정형 정책 데이터를 수신하고, 출력 데이터로서 입력 데이터에 대응하는 군집 판단 결과(예: 군집 별 확률)를 제공한다. 이를 위해, 모델(402)은 훈련(410)을 거쳐 학습된 후, 분류(420)를 수행함으로써 군집화 결과를 제공한다. 훈련(410)은 학습 데이터를 이용하여 모델(402)을 학습시키는 과정으로, 예를 들어, SVM(support vector machine), 트리분석 등의 학습 알고리즘에 기반할 수 있다. 구체적으로, 훈련(410)은 레이블링(labeling)된 학습 데이터를 이용하여 역-전파 동작에 의해 가중치들을 업데이트하는 동작을 포함할 수 있다. 즉, 학습 데이터는 레이블(label)을 포함하며, 레이블은 별도의 절차를 통해 부여되거나, 수집된 데이터로부터 추출되거나, 데이터 수집 과정에서 획득될 수 있다. 예를 들어, 군집화가 국정과제 별로 이루어지는 경우, 데이터의 출처에서 관련된 국정과제를 명시하고 있으면, 해당 국정과제의 정보가 추출되어 레이블로서 사용될 수 있다.Referring to FIG. 4, the model 402 receives unstructured policy data as input data and provides a cluster determination result (e.g., probability for each cluster) corresponding to the input data as output data. To this end, the model 402 is learned through training 410 and then performs classification 420 to provide clustering results. Training 410 is a process of learning the model 402 using learning data. For example, it may be based on a learning algorithm such as SVM (support vector machine) or tree analysis. Specifically, training 410 may include updating weights by a back-propagation operation using labeled training data. That is, the learning data includes a label, and the label may be assigned through a separate procedure, extracted from collected data, or acquired during the data collection process. For example, when clustering is done by national task, if the source of the data specifies a related national task, information on the relevant national task can be extracted and used as a label.

훈련(401)을 위한 학습 데이터는 전처리 동작(411), 토큰화 동작(412), 특징 값 추출 동작(413)에 의해 생성된다. 전처리 동작(411)은 문서 분류를 위한 중요한 특징 값들을 추출하기 이전에, 오류를 수정하거나 불필요한 데이터를 제거하는 동작이다. 오류는 문서의 문법적 오류, 데이터의 모순 등을 포함할 수 있다. 오류는 사전에 정의된 규칙에 따라 수정될 수 있다. 불필요한 데이터는 정책 관련 데이터에서 일반적으로 사용되는 형식이나 표현에 기반하여 선별될 수 있다. 본 발명의 일 실시예에 따라, 장치(예: 서버(120))는 출처 별로 불필요한 데이터를 정의한 데이터 테이블(예: 불필요 데이터 사전)을 구비하고 있으며, 데이터의 출처에 따라, 대응하는 데이터 테이블에 정의된 불필요한 데이터의 유형들을 순차적으로 탐색하고, 탐색된 불필요한 데이터를 제거할 수 있다. 불필요한 데이터는 텍스트는 물론, 도형, 컬러 등의 요소들로 정의될 수 있다. 토큰화 동작(412)은 문서 내 문장들에서 형태소 분석 등에 기반하여 단어를 추출하는 동작이다. 특징 값 추출 동작(413)은 문서 분류에 상관 없이 공통적으로 사용되는 특징을 제거하고, 분류에 영향을 미치는 적어도 하나의 특징 값을 추출하는 동작이다. 특징 값 추출 동작(413)에 의해, TF-IDF(term frequency-inverse document frequency), 정보 이득(information gain), 상호 의존 정보(mutual information), 차이 시퀀스(chi sequence), 지니(gini) 인덱스 등이 결정 및 이용될 수 있다. 경우에 따라, 특징 값 추출 동작(413)은 모델(402) 내부에서 구현될 수 있다.Learning data for training 401 is generated by a preprocessing operation 411, a tokenization operation 412, and a feature value extraction operation 413. The preprocessing operation 411 is an operation to correct errors or remove unnecessary data before extracting important feature values for document classification. Errors may include grammatical errors in the document, contradictions in data, etc. Errors can be corrected according to predefined rules. Unnecessary data can be selected based on formats or expressions commonly used in policy-related data. According to an embodiment of the present invention, a device (e.g., server 120) is provided with a data table (e.g., unnecessary data dictionary) that defines unnecessary data for each source, and according to the source of data, the corresponding data table is provided. You can sequentially search for defined types of unnecessary data and remove the searched unnecessary data. Unnecessary data can be defined as elements such as text, shapes, and colors. The tokenization operation 412 is an operation to extract words based on morphological analysis, etc. from sentences in a document. The feature value extraction operation 413 is an operation to remove commonly used features regardless of document classification and extract at least one feature value that affects classification. By the feature value extraction operation 413, term frequency-inverse document frequency (TF-IDF), information gain, mutual information, chi sequence, gini index, etc. This decision can be made and used. In some cases, the feature value extraction operation 413 may be implemented within the model 402.

훈련(401) 과정에서, 군집화 결과는 물론, 출력된 군집들에 대한 키워드들이 함께 결정될 수 있다. 입력되는 비정형 데이터가 전치리, 토큰화, 특징 값 추출 등을 거치는 동안, 복수의 토큰들, 즉, 단어들이 생성되고, 토큰들 중 적어도 일부가 키워드로서 사용될 수 있다. 즉, 토큰들은 키워드의 후보들이 되며, 특징 값에 기반하여 토큰들 중 적어도 일부가 해당 군집에 대한 키워드로서 결정될 수 있다. 예를 들어, 서버(120)는 동일한 군집에 속한 비정형 데이터에서 추출된 토큰들을 의미를 기반으로 동일/유사한 의미를 가진 토큰들을 그룹핑함으로써 복수의 그룹들을 생성한다. 동일/유사한 의미를 판단하기 위해, 토큰들의 임베딩 벡터들 간 거리가 이용될 수 있다. 그리고, 서버(120)는 각 그룹에 속한 적어도 하나의 토큰이 해당 군집에 속한 비정형 데이터 중 어느 정도의 비율로 존재하는지 확인함으로써, 그룹 별로 발견 비율을 결정하고, 발견 비율이 임계치 이상인 그룹의 대표 표현을 해당 군집의 키워드로 결정할 수 있다. 여기서, 대표 표현은 그룹에 속한 토큰들에 기반하여 결정되는데, 토큰들 중 가장 빈도가 높은 토큰이 그대로 사용되거나 또는 토큰들을 운영자에게 제시한 후, 운영자로부터 대표 표현을 입력받을 수 있다. 이를 통해, 해당 군집을 위한 적어도 하나의 키워드가 결정될 수 있다.In the training 401 process, keywords for the output clusters as well as the clustering results can be determined together. While input unstructured data undergoes preprocessing, tokenization, feature value extraction, etc., a plurality of tokens, that is, words, are generated, and at least some of the tokens may be used as keywords. That is, tokens become candidates for keywords, and at least some of the tokens can be determined as keywords for the corresponding cluster based on feature values. For example, the server 120 creates a plurality of groups by grouping tokens with the same/similar meaning based on the meaning of tokens extracted from unstructured data belonging to the same group. To determine the same/similar meaning, the distance between the embedding vectors of the tokens can be used. In addition, the server 120 determines the discovery rate for each group by checking the proportion of at least one token belonging to each group among the unstructured data belonging to the corresponding cluster, and represents a representative representation of the group whose discovery rate is greater than the threshold. can be determined as a keyword for the corresponding cluster. Here, the representative expression is determined based on the tokens belonging to the group, and the most frequent token among the tokens can be used as is, or the tokens can be presented to the operator and then the representative expression can be input from the operator. Through this, at least one keyword for the corresponding cluster can be determined.

분류(420)는 훈련(410)에 의해 학습된 모델(402)의 추론 동작이다. 분류(420)는 훈련 시와 동일한 형식의 입력 데이터로부터, 출력 데이터인 군집화 결과를 생성하는 과정이다. 따라서, 분류(420)를 위한 입력 데이터는, 훈련(410)의 경우와 유사하게, 전처리 동작(421), 토큰화 동작(422), 특징 값 추출 동작(423)에 의해 생성된다. 전처리 동작(421), 토큰화 동작(422), 특징 값 추출 동작(423)은 전술한 전처리 동작(411), 토큰화 동작(412), 특징 값 추출 동작(413)과 유사하다.Classification 420 is an inference operation of the model 402 learned by training 410. Classification 420 is a process of generating clustering results, which are output data, from input data of the same format as during training. Accordingly, input data for classification 420 is generated by a preprocessing operation 421, a tokenization operation 422, and a feature value extraction operation 423, similar to the case of training 410. The preprocessing operation 421, tokenization operation 422, and feature value extraction operation 423 are similar to the preprocessing operation 411, tokenization operation 412, and feature value extraction operation 413 described above.

도 5는 본 발명의 실시 예에 따른 클라이언트 장치 및 서버의 기능적 구조를 도시한다. 도 5를 참고하면, 클라이언트 장치(110)는 요청 생성부(511), 메시지 처리부(512), 화면 처리부(513), UI(user interface) 처리부(514)를 포함하고, 서버(120)는 데이터 수집부(521), DB(database) 생성부(522), 메시지 처리부(523), 데이터 생성부(524), 데이터베이스(525)를 포함한다.Figure 5 shows the functional structures of a client device and a server according to an embodiment of the present invention. Referring to FIG. 5, the client device 110 includes a request generation unit 511, a message processing unit 512, a screen processing unit 513, and a user interface (UI) processing unit 514, and the server 120 provides data processing. It includes a collection unit 521, a database (DB) creation unit 522, a message processing unit 523, a data creation unit 524, and a database 525.

요청 생성부(511)는 UI 처리부(514)에 의해 검출되는 사용자의 입력을 해석함으로서 사용자에게 필요한 요청 사항을 확인한다. 그리고, 요청 생성부(511)는 확인된 사항을 메시지 처리부(512)에게 전달한다. 메시지 처리부(512)는 요청 생성부(511)로부터 제공되는 요청 사항에 대응하는 메시지를 생성하고, 서버(120)에게 전달한다. 화면 처리부(513)는 서버(120)로부터 제공되는 데이터를 해석함으로써 사용자를 위해 표시할 다양한 화면을 구성하고, 화면 내에 표시되는 정보를 제어한다. UI 처리부(514)는 사용자와 상호작용하기 위한 인터페이스를 출력하고, 사용자로부터 입력되는 지시, 명령을 확인한다. 즉, UI 처리부(514)는 요청 생성부(511) 및 화면 처리부(513)의 동작을 위한 인터페이스를 구성 및 출력하고, 인터페이스를 통해 확인되는 사용자의 입력을 대응하는 기능 블록에 제공한다.The request generation unit 511 analyzes the user's input detected by the UI processing unit 514 to confirm the request required by the user. Then, the request generation unit 511 delivers the confirmed details to the message processing unit 512. The message processing unit 512 generates a message corresponding to the request provided from the request generating unit 511 and delivers it to the server 120. The screen processing unit 513 interprets data provided from the server 120 to configure various screens to be displayed for the user and controls information displayed within the screen. The UI processing unit 514 outputs an interface for interacting with the user and confirms instructions and commands input from the user. That is, the UI processing unit 514 configures and outputs an interface for the operation of the request generating unit 511 and the screen processing unit 513, and provides the user's input confirmed through the interface to the corresponding function block.

데이터 수집부(521)는 공공에 공개된 정책 관련 데이터를 수집한다. 이를 위해, 데이터 수집부(521)는 외부 장치들에 접속하고, 데이터를 요청 및 수신할 수 있다. 데이터 수집부(521)는 API 또는 크롤링(crawling)을 이용하여 데이터를 수집할 수 있다. DB 생성부(522)는 수집된 데이터에 기반하여 정책 정보 제공을 위한 데이터베이스를 생성한다. 구체적으로, DB 생성부(522)는 데이터 색인화, 키워드 추출, 키워드 매핑, 자료 군집화 등을 수행할 수 있다. 메시지 처리부(523)는 클라이언트 장치(110)로부터 수신되는 메시지를 해석한다. 메시지는 특정 정보의 요청을 포함할 수 있고, 메시지 처리부(523)는 요청 사항을 확인 후, 필요한 동작을 수행할 수 있다. 예를 들어, 특정 데이터 및/또는 정보가 요청되면, 메시지 처리부(523)는 요청 사항을 데이터 생성부(524)로 전달한다. 데이터 생성부(524)는 클라이언트 장치(110)로부터의 요청 사항에 따라 요청된 정보 및/또는 데이터를 확인 및 패킷화한 후, 클라이언트 장치(110)에게 송신한다. 데이터베이스(525)는 DB 생성부(522)에 의해 생성되고, 데이터 생성부(524)에 의해 활용되는 데이터를 저장하는 공간이다. 즉, 데이터베이스(525)는 데이터를 저장하고, 해당 기능 모듈들의 요청에 응하여 저장된 데이터를 제공한다.The data collection unit 521 collects policy-related data disclosed to the public. To this end, the data collection unit 521 can connect to external devices and request and receive data. The data collection unit 521 may collect data using API or crawling. The DB creation unit 522 creates a database to provide policy information based on the collected data. Specifically, the DB creation unit 522 can perform data indexing, keyword extraction, keyword mapping, and data clustering. The message processing unit 523 interprets the message received from the client device 110. The message may include a request for specific information, and the message processing unit 523 may perform the necessary operation after confirming the request. For example, when specific data and/or information is requested, the message processing unit 523 transmits the request to the data generating unit 524. The data generator 524 confirms and packetizes the requested information and/or data according to the request from the client device 110 and then transmits it to the client device 110. The database 525 is a space that is created by the DB creation unit 522 and stores data used by the data creation unit 524. That is, the database 525 stores data and provides the stored data in response to requests from corresponding function modules.

도 6은 본 발명의 실시 예에 따른 검색 서비스를 위한 데이터 수집 및 색인화 절차의 예를 도시한다. 도 6은 서버(120)의 동작들을 예시한다.Figure 6 shows an example of a data collection and indexing procedure for a search service according to an embodiment of the present invention. 6 illustrates the operations of server 120.

도 6을 참고하면, 601 단계에서, 서버(120)는 공공 데이터 관련 사이트를 확인하고, 접속한다. 일 실시 예에 따라, 서버(120)는 공공 데이터 관련 사이트들의 목록을 보유하고 있으며, 목록 내의 사이트들을 순차적으로 접속할 수 있다. 이 경우, 서버(120)는 현 시점에서 접속하고자 하는 사이트를 순서에 따라 선택할 수 있다. 다른 실시 예에 따라, 서버(120)는 검색 엔진을 이용하여 스스로 공공 데이터 관련 사이트를 탐색할 수 있다. 서버(120)는 파악하고 있는 공공 데이터 관련 사이트들 외 다른 공공 데이터 관련 사이트를 접근 가능한 검색 엔진을 통해, 지정된 키워드를 이용하여 탐색할 수 있다. 여기서, 지정된 키워드는 미리 정의될 수 있다.Referring to FIG. 6, in step 601, the server 120 checks and connects to a public data-related site. According to one embodiment, the server 120 maintains a list of public data-related sites, and can sequentially access the sites in the list. In this case, the server 120 can select the site to be accessed at the current time in order. According to another embodiment, the server 120 may independently search public data-related sites using a search engine. The server 120 can search public data-related sites other than the known public data-related sites through an accessible search engine using designated keywords. Here, the designated keyword may be defined in advance.

602 단계에서, 서버(120)는 웹 페이지 상의 정보를 수집한다. 즉, 서버(120)는 접속된 웹 페이지에 대한 크롤링(crawling) 또는 스크래이핑(scraping)을 수행한다. 이를 통해, 서버(120)는 웹 페이지 및 해당 웹 페이지에서 하이퍼링크로 연결되는 다른 적어도 하나의 웹 페이지에 기록된 데이터들을 수집할 수 있다.In step 602, the server 120 collects information on the web page. That is, the server 120 performs crawling or scraping on connected web pages. Through this, the server 120 can collect data recorded in the web page and at least one other web page connected to the web page by a hyperlink.

603 단계에서, 서버(120)는 첨부 파일을 다운로드 및 분석한다. 접속한 공공 데이터 관련 사이트에서, 웹 페이지 상에 텍스트나 이미지로 작성된 데이터 외에, 첨부 파일의 형태로 존재하는 데이터도 존재할 수 있다. 따라서, 서버(120)는 첨부 파일을 다운로드하고, 첨부 파일에 포함된 데이터를 추출할 수 있다. 이 과정에서, 필요에 따라, 서버(120)는 파싱(parsing), OCR(optical character recognition) 등의 동작을 수행할 수 있다.In step 603, the server 120 downloads and analyzes the attached file. In the accessed public data-related site, in addition to data written as text or images on a web page, there may also be data that exists in the form of an attached file. Accordingly, the server 120 can download the attached file and extract data included in the attached file. In this process, if necessary, the server 120 may perform operations such as parsing and optical character recognition (OCR).

604 단계에서, 서버(120)는 색인화를 수행한다. 서버(120)는 웹 페이지 및 첨부 파일에서 수집된 데이터를 검색이 가능한 구조로 변환한 후, 변환된 구조에 기반하여 적어도 하나의 인덱스를 부가할 수 있다. 나아가, 서버(120)은 데이터에 대한 키워드를 획득할 수 있다. 일 실시 예에 따라, 서버(120)는 훈련된 인공지능 모델 또는 기계학습 모델을 이용하여 데이터의 구조 변경 및 인덱스 부가를 수행할 수 있다. 이때, 도 6에 도시되지 아니하였으나, 색인화가 완료되면, 서버(120)는 수집된 데이터를 삭제하고, 링크(예: URL(uniform resource locator))로 대체할 수 있다. 이를 통해, 데이터의 직접 저장에 의한 저장 공간의 낭비가 방지될 수 있다.In step 604, the server 120 performs indexing. The server 120 may convert data collected from web pages and attached files into a searchable structure and then add at least one index based on the converted structure. Furthermore, the server 120 can obtain keywords for data. According to one embodiment, the server 120 may change the structure of data and add an index using a trained artificial intelligence model or machine learning model. At this time, although not shown in FIG. 6, when indexing is completed, the server 120 may delete the collected data and replace it with a link (eg, URL (uniform resource locator)). Through this, waste of storage space due to direct storage of data can be prevented.

도 6을 참고하여 설명한 실시 예에서, 서버(120)는 검색 엔진을 이용하여 공공 데이터 관련 사이트를 탐색할 수 있다. 이 경우, 구체적으로, 서버(120)는 지정된 키워드를 통해 검색된 사이트가 기존에 공공 데이터 관련 사이트로서 파악 또는 관리 중인 사이트가 아닌 새로운 사이트를 확인할 수 있을 것이다. 이때, 지정된 키워드만으로 검색된 결과가 유효한 공공 데이터를 제공할 수 있는 사이트인지, 다시 말해, 검색된 사이트에서 데이터를 수집할지 여부의 판단이 더 필요할 수 있다. 이를 위해, 일 실시 예에 따라, 서버(120)는 검색 서비스의 관리자의 장치에게 검색된 사이트에서 데이터를 수집할지 여부를 문의하는 메시지를 송신하고, 관리자로부터의 승인 또는 확인에 응하여 데이터를 수집할 수 있다.In the embodiment described with reference to FIG. 6 , the server 120 may search public data-related sites using a search engine. In this case, specifically, the server 120 will be able to confirm that the site searched through the specified keyword is a new site that is not a site that is currently identified or managed as a public data-related site. At this time, it may be necessary to further determine whether the search result with only the specified keyword is a site that can provide valid public data, or in other words, whether to collect data from the searched site. To this end, according to one embodiment, the server 120 may send a message to the device of the manager of the search service to inquire whether to collect data from the searched site, and collect data in response to approval or confirmation from the manager. there is.

도 7은 본 발명의 실시 예에 따른 검색 서비스에서 검색어 입력에 따른 정책 정보 제공 절차의 예를 도시한다. 도 7은 초기 화면에서 검색어를 입력하는 경우의 절차로서, 서버(120)의 동작들을 예시한다.Figure 7 shows an example of a policy information provision procedure according to a search word input in a search service according to an embodiment of the present invention. FIG. 7 is a procedure for entering a search word on the initial screen and illustrates the operations of the server 120.

도 7을 참고하면, 701 단계에서, 서버(120)는 초기 화면을 제공한다. 초기 메뉴는 본 발명의 실시 예들에 따른 검색 서비스를 위한 사이트의 첫 화면, 즉, 홈 화면으로서, 메인 메뉴, 검색 바, 공지 창, 적어도 하나의 서브 메뉴 등을 포함할 수 있다. 초기 화면은 HTTP 프로토콜에 기반하여 제공될 수 있다.Referring to FIG. 7, in step 701, the server 120 provides an initial screen. The initial menu is the first screen of the site for the search service according to embodiments of the present invention, that is, the home screen, and may include a main menu, a search bar, a notification window, and at least one submenu. The initial screen may be provided based on the HTTP protocol.

예를 들어, 메인 메뉴는 '국회', '정부', '공공기관', '언론', '통계'의 메인 항목들을 포함할 수 있고, 메인 항목들 중 적어도 일부는 하위 메뉴를 더 포함할 수 있다. 본 설명에서, 하위 메뉴에 포함되는 항목들은 카테고리로 지칭될 수 있다. 메인 메뉴는 텍스트 형식의 제1 타입 메인 메뉴 및 그래픽 형식의 제2 타입 메인 메뉴 등 2가지 형식으로 제공될 수 있고, 이를 통해 사용자에게 보다 편리한 인터페이스를 제공할 수 있다. 제1 타입 메인 메뉴는 화면의 고정된 위치(예: 상단)의 영역(이하 '고정 영역')에 배치되며, 텍스트만으로 구성되기 때문에 상대적으로 좁은 크기의 영역을 점유한다. 일 실시 예에 따라, 제1 타입 메인 메뉴를 포함하는 고정 영역은, 사용자가 검색을 진행하거나, 하위 화면에 진입하여도 계속 유지될 수 있다. 이로 인해, 정책 정보를 검색하는 도중에도, 사용자는 편리하게 메인 메뉴 항목을 선택 및 이동할 수 있다. 제2 타입 메인 메뉴의 경우, 각 메인 항목을 표현하는 아이콘, 각 메인 항목에 대한 간단한 설명 문구가 함께 표시됨으로써, 사용자의 편의를 도모할 수 있다.For example, the main menu may include main items such as 'National Assembly', 'Government', 'Public Institution', 'Media', and 'Statistics', and at least some of the main items may further include submenus. there is. In this description, items included in a submenu may be referred to as a category. The main menu can be provided in two formats, a first-type main menu in text format and a second-type main menu in graphic format, and through this, a more convenient interface can be provided to the user. The first type main menu is placed in an area (hereinafter referred to as 'fixed area') at a fixed location (e.g., at the top) of the screen, and because it consists only of text, it occupies a relatively small area. According to one embodiment, the fixed area including the first type main menu may be maintained even if the user performs a search or enters a sub-screen. Because of this, the user can conveniently select and move main menu items even while searching for policy information. In the case of the second type main menu, icons representing each main item and a simple explanatory text for each main item are displayed together, thereby improving user convenience.

검색 창은 검색어를 입력하는 영역 및 검색 명령을 입력하는 버튼을 포함한다. 검색 창은 초기 화면의 고정된 위치에 배치된다. 따라서, 초기 메뉴를 벗어나면 검색 창은 보여지지 아니할 것이다. 이 경우, 사용자의 불편함이 존재할 수 있으므로, 초기 화면을 벗어난 경우, 화면에 검색 창 불러오기 버튼이 추가될 수 있다. 예를 들어, 검색 창 불러오기 버튼은 고정 영역에 포함될 수 있다. 따라서, 검색 창 불러오기 버튼은 사용자가 검색을 진행하거나, 하위 화면에 진입하여도 계속 유지될 수 있다. 일 실시 예에 따라, 검색 창 불러오기 버튼은 초기 화면에서 표시되지 아니하고, 초기 화면을 벗어난 상황에서 표시될 수 있다. 나아가, 검색 창 불러오기 버튼은 초기 화면에서 표시되는 특정 버튼을 대체하여 표시될 수 있다. 이 경우, 고정 영역의 공간이 보다 효율적으로 사용될 수 있다.The search window includes an area for entering search words and a button for entering a search command. The search window is placed at a fixed location on the initial screen. Therefore, if you leave the initial menu, the search window will not be displayed. In this case, since there may be inconvenience to the user, when the initial screen is left, a button to call a search window may be added to the screen. For example, a button to bring up a search bar can be included in the fixed area. Accordingly, the search window loading button can be maintained even if the user proceeds with the search or enters the sub-screen. According to one embodiment, the search window loading button may not be displayed on the initial screen, but may be displayed outside the initial screen. Furthermore, the search window call button may be displayed in place of a specific button displayed on the initial screen. In this case, the space of the fixed area can be used more efficiently.

일 실시 예에 따라, 초기 화면은 도 8과 같이 구성될 수 있다. 도 8은 본 발명의 실시 예에 따른 검색 서비스에서 초기 화면의 예를 도시한다. 도 8을 참고하면, 초기 화면은 고정 영역(802) 및 가변 영역(804)을 포함하며, 고정 영역(802) 내에 제1 타입 메인 메뉴(810)가 배치되고, 가변 영역(804) 내에 검색 창(820), 제2 타입 메인 메유(830), 공지 창(840), 서브 메뉴(850)가 배치될 수 있다. 다양한 실시 예들에 따라, 고정 영역(802)은 제1 타입 메인 메뉴(810) 외 다른 항목들을 더 포함할 수 있는데, 예를 들어, 홈 버튼, 로그인 버튼 등을 더 포함할 수 있다. 제2 타입 메인 메뉴(830)는 복수의 메인 항목들(832-1 내지 832-N)을 포함하며, 메인 항목들(832-1 내지 832-N) 각각은 메인 항목의 이름, 간단한 설명, 아이콘 등을 포함할 수 있다. 공지 창(840)은 정보 검색 서비스에 관련된 소식, 서비스에 관련된 온라인/오프라인 행사 소식 등을 공지하기 위해 사용되는 영역이다. 서브 메뉴(850)는 기타 서비스 이용에 관련된 페이지들의 메뉴를 표시하는 영역으로, 각 페이지들로의 링크들을 포함한다.According to one embodiment, the initial screen may be configured as shown in FIG. 8. Figure 8 shows an example of an initial screen in a search service according to an embodiment of the present invention. Referring to FIG. 8, the initial screen includes a fixed area 802 and a variable area 804, and a first type main menu 810 is placed in the fixed area 802 and a search window in the variable area 804. 820, a second type main menu 830, a notice window 840, and a sub menu 850 may be arranged. According to various embodiments, the fixed area 802 may further include items other than the first type main menu 810, for example, a home button, a login button, etc. The second type main menu 830 includes a plurality of main items 832-1 to 832-N, and each of the main items 832-1 to 832-N includes the name of the main item, a brief description, and an icon. It may include etc. The notice window 840 is an area used to announce news related to the information search service, news of online/offline events related to the service, etc. The submenu 850 is an area that displays menus of pages related to the use of other services, and includes links to each page.

검색 창 불러오기 버튼이 사용자에 의해 선택되면, 현재의 화면에 검색 창을 포함하는 팝업 창이 오버랩될 수 있다. 이때, 현재의 화면에 포함되는 요소들은 불활성되며, 불활성을 표현하기 위해 흐려지거나(blurring), 회색 음영이 추가되는 등 시각적인 효과가 부가될 수 있다. 팝업 창을 통해 검색어가 입력될 수 있으나, 팝업 창의 바깥 영역이 선택(예: 클릭 또는 터치)되면, 검색 창을 포함하는 팝업 창이 제거되고, 다시 현재의 화면이 활성화될 수 있다.When the search window loading button is selected by the user, a pop-up window including the search window may overlap the current screen. At this time, elements included in the current screen are inactive, and visual effects such as blurring or gray shading may be added to express inactivity. A search term may be entered through a pop-up window, but if an area outside the pop-up window is selected (e.g., clicked or touched), the pop-up window including the search window may be removed and the current screen may be activated again.

702 단계에서, 서버(120)는 검색어의 입력에 따른 검색 결과를 제공한다. 즉, 사용자가 메인 메뉴의 항목을 선택하지 아니하고, 검색 창을 통해 검색어를 입력하면, 서버(120)는 검색어에 대한 통합 검색의 결과를 제공할 수 있다. 통합 검색의 결과는 복수의 검색 건들을 포함하며, 복수의 검색 건들은 복수의 카테고리들로 분류될 수 있다. 예를 들어, 복수의 카테고리들은 국회 의안정보, 국회 회의록, 국회 보고서/발간물, 정부 보도자료, 정부 정책뉴스, 정부 연구자료, 언론, 공공기관, 통계 중 적어도 하나를 포함할 수 있다. 즉, 통합 검색에 포함되는 카테고리는 메인 메뉴의 메인 항목들과 일치하거나, 메인 항목들의 세부 분류를 포함할 수 있다. 이때, 카테고리 별 검색 결과는 카테고리 명칭, 검색 건 수, 개별 검색 건의 제목, 발생 날짜, 내용 미리보기, 관련 키워드 중 적어도 하나를 포함할 수 있다.In step 702, the server 120 provides search results according to the input of the search term. That is, if the user enters a search term through the search window without selecting an item from the main menu, the server 120 may provide results of an integrated search for the search term. The results of the integrated search include a plurality of search cases, and the plurality of search cases may be classified into a plurality of categories. For example, the plurality of categories may include at least one of National Assembly bill information, National Assembly minutes, National Assembly reports/publications, government press releases, government policy news, government research materials, media, public institutions, and statistics. That is, the categories included in the integrated search may match the main items of the main menu or include detailed classifications of the main items. At this time, the search results for each category may include at least one of the category name, number of searches, title of individual search, occurrence date, content preview, and related keywords.

일 실시 예에 따라, 검색 결과를 보여주는 화면(예: 검색 결과 화면)은 도 9과 같이 구성될 수 있다. 도 9는 본 발명의 실시 예에 따른 검색 서비스에서 검색어 입력에 따른 검색 결과 화면의 예를 도시한다. 도 9를 참고하면, 검색 결과 화면은 가변 영역(804)에서의 화면 구성요소들을 변환함으로써 구성된다. 검색 결화 화면은 검색 창(820)을 포함하며, 초기 화면과 달리, 안내 문구(950), 카테고리 별 검색 건수(960), 카테고리 별 검색 결과(970)를 포함한다.According to one embodiment, a screen showing search results (eg, search results screen) may be configured as shown in FIG. 9 . Figure 9 shows an example of a search result screen according to input of a search word in a search service according to an embodiment of the present invention. Referring to FIG. 9, the search result screen is constructed by converting screen elements in the variable area 804. The search conclusion screen includes a search window 820 and, unlike the initial screen, includes a guidance text 950, the number of searches by category (960), and search results by category (970).

안내 문구(950)는 전체 검색 결과에 대한 정보를 표시한다. 다양한 정보가 안내 문구(950)를 통해 제공될 수 있다. 예를 들어, 안내 문구(950)를 통해, 사용자에 의해 입력된 검색 키워드 및 전체 검색 건 수가 표시될 수 있다. 카테고리 별 검색 건 수(960)는 카테고리 구분 없는 전체 검색 건수 및 카테고리 별 검색 건수를 표시한다. 구체적으로, 카테고리 별 검색 건 수(960)는 전체 버튼(962) 및 카테고리 별 버튼들(964-1 내지 964-M)을 포함하며, 전체 버튼(962) 및 카테고리 별 버튼들(964-1 내지 964-M) 각각은 해당 카테고리의 명칭 및 해당 카테고리에 속하는 검색 건수를 표시한다. 그리고, 전체 버튼(962) 및 카테고리 별 버튼들(964-1 내지 964-M) 중 하나가 활성화되며, 활성 상태인 버튼은 시각적으로 구분되도록 표시(예: 지정된 색상으로 채워짐)될 수 있다. The guidance text 950 displays information about the entire search result. Various information may be provided through the guidance text 950. For example, the search keyword entered by the user and the total number of searches may be displayed through the guidance phrase 950. The number of searches by category (960) displays the total number of searches without category distinction and the number of searches by category. Specifically, the number of searches per category (960) includes the all button 962 and buttons for each category (964-1 to 964-M), and the all button 962 and buttons for each category (964-1 to 964-M). 964-M) Each displays the name of the corresponding category and the number of searches belonging to that category. Then, one of the overall button 962 and the category-specific buttons 964-1 to 964-M is activated, and the activated button may be displayed (e.g., filled with a designated color) to visually distinguish it.

카테고리 별 검색 결과(970)는 카테고리 별 검색 결과를 표시하기 위한 영역이다. 전체 버튼(962) 및 카테고리 별 버튼들(964-1 내지 964-M) 중 하나가 활성화면, 해당 활성화된 버튼에 대응하는 카테고리의 검색 결과가 카테고리 별 검색 결과(970)에 표시된다. 도 9의 예에서, M개의 카테고리들 모두의 검색 결과가 보여지는 상황이 예시되는데, 이는 전체 버튼(962)이 활성화된 경우의 예이다. 전체 버튼(962)이 아닌 카테고리 별 버튼들(964-1 내지 964-M) 중 하나가 활성화되면, 하나의 카테고리에 대한 검색 결과만이 카테고리 별 검색 결과(970)에 표시될 수 있다. 카테고리 별 검색 결과(970)는 각 카테고리에 속한 검색 결과들(972-1 내지 972-M) 중 적어도 하나를 포함한다. 대표적으로, m번째 카테고리의 검색 결과(972-m)은 카테고리 제목(974), 페이지 이동(975), 화면 이동(976), 검색 건 별 요약 정보 영역들(978-1, 978-2 등)을 포함한다.The search results by category 970 is an area for displaying search results by category. If one of the all button 962 and the category buttons 964-1 to 964-M is activated, the search result of the category corresponding to the activated button is displayed in the category search result 970. In the example of FIG. 9 , a situation in which search results of all M categories are shown is illustrated, which is an example when the All button 962 is activated. If one of the category-specific buttons 964-1 to 964-M rather than the all button 962 is activated, only the search results for one category may be displayed in the category-specific search results 970. The search results by category 970 include at least one of the search results 972-1 to 972-M belonging to each category. Typically, the search results of the mth category (972-m) include the category title (974), page movement (975), screen movement (976), and summary information areas for each search case (978-1, 978-2, etc.) Includes.

카테고리 제목(974)에서, 카테고리의 명칭(예: 국회 의안정보), 검색 건수(예: 5건)가 표시된다. 페이지 이동(975)은, 검색 건 별 요약 정보 항목들(978-1, 978-2 등)이 여러 페이지들로 이루어진 경우, 페이지들 간 이동을 위한 버튼들(예: 앞으로 이동 버튼, 뒤로 이동 버튼)을 포함하며, 현재 페이지 및 전체 페이지 개수(예: 1/3)가 함께 표시될 수 있다. 화면 이동(976)은 해당 카테고리 내에서 실행된 검색 결과 화면으로 이동하기 위해 사용되는 버튼을 포함한다. 여기서, 해당 카테고리 내에서 실행된 검색 결과 화면은 메인 메뉴에서 해당 카테고리를 선택 후, 검색어로 검색할 때 제공되는 화면을 의미한다. 검색 건 별 요약 정보 영역들(978-1, 978-2 등) 각각은 검색 건의 제목, 생성일, 식별 번호, 내용 요약, 관련 키워드 중 적어도 하나를 포함한다. 또한, 검색 건 별 요약 정보 영역들(978-1, 978-2 등) 각각은 해당 검색 건의 세부 정보를 표시하기 위한 버튼을 포함하며, 일 실시 예에 따라, 검색 건의 제목을 포함하는 영역이 버튼으로서 사용될 수 있다.In the category title 974, the name of the category (e.g., National Assembly bill information) and the number of searches (e.g., 5) are displayed. Page movement 975, when summary information items (978-1, 978-2, etc.) for each search consists of multiple pages, buttons for moving between pages (e.g., forward button, back button) ), and the current page and the total number of pages (e.g., 1/3) may be displayed together. Screen movement 976 includes a button used to move to the search results screen performed within the corresponding category. Here, the search results screen executed within the corresponding category refers to the screen provided when the corresponding category is selected from the main menu and searched with a search term. Each of the summary information areas (978-1, 978-2, etc.) for each search includes at least one of the title of the search, creation date, identification number, content summary, and related keywords. In addition, each of the summary information areas for each search (978-1, 978-2, etc.) includes a button to display detailed information of the search, and according to one embodiment, the area containing the title of the search is a button. It can be used as.

703 단계에서, 서버(120)는 검색 건의 선택에 따른 세부 정보를 제공한다. 즉, 사용자에 의해 특정 검색 건이 선택되면, 서버(120)는 해당 검색 건에 대한 세부 정보를 제공한다. 예를 들어, 검색 건의 세부 정보는 화면의 측면으로부터 팝업되는 영역에 표시될 수 있다. 즉, 일 실시 예에 따라, 세부 정보 화면은 화면의 일 측면에서 타 측면으로 이동하는 애니메이션의 형식으로 생성될 수 있다. 단, 세부 정보 화면의 생성 방식은 카테고리에 따라 다를 수 있다. 즉, 일부 카테고리에 속하는 세부 정보 화면은 새 창으로 열리는 방식으로 생성될 수 있다.In step 703, the server 120 provides detailed information according to the selection of search items. That is, when a specific search item is selected by the user, the server 120 provides detailed information about the search item. For example, detailed information on search items may be displayed in an area that pops up from the side of the screen. That is, according to one embodiment, the detailed information screen may be created in the form of an animation that moves from one side of the screen to the other side. However, the creation method of the detailed information screen may vary depending on the category. In other words, detailed information screens belonging to some categories can be created in a way that opens in a new window.

이때, 세부 정보는 해당 카테고리에 따라 다른 항목 구성들로 표시될 수 있다. 공통적으로, 세부 정보는 검색 건의 명칭, 서지 사항, 수집된 데이터, 출처에 대한 링크 중 적어도 하나를 포함할 수 있다. 추가적으로, 국회 의안정보 카테고리의 경우, 세부 정보는 의안원문 파일, 관련 위원회 검토보고서, 해당 의안의 진행상황(예: 접수, 임기만료폐기, 위원회 심사, 체계자구 심사, 본회의 심의, 정부 이송, 공표 중 어느 단계에 속하는지), 관련 언론 기사, 유사 의안 중 적어도 하나를 더 포함할 수 있다. 국회 회의록 카테고리의 경우, 국회 회의록 카테고리의 경우, 세부 정보는 미리 보기, 회의록 파일 중 적어도 하나를 더 포함할 수 있다. 국회 보고서/발간물 카테고리의 경우, 세부 정보는 주요 내용, 미리 보기, 원문 파일, 원문 링크 중 적어도 하나를 더 포함할 수 있다. 정부 보도자료 카테고리의 경우, 세부 정보는 주요 내용, 미리 보기, 원문 링크 중 적어도 하나를 더 포함할 수 있다. 정부 정책뉴스 카테고리의 경우, 원문 링크를 더 포함할 수 있다. 정부 연구자료 카테고리의 경우, 세부 정보는 주요 내용, 미리 보기, 보고서 파일, 원문 링크 중 적어도 하나를 더 포함할 수 있다. 언론 카테고리의 경우, 세부 정보는 기사 링크를 더 포함할 수 있다. 통계 카테고리의 경우, 세부 정보는 통계 지표에 대한 설명, 지표에 대한 해석, 활용의 유의사항, 작성/갱신일 중 적어도 하나를 더 포함할 수 있다.At this time, detailed information may be displayed in different item configurations depending on the corresponding category. In common, the detailed information may include at least one of the search query name, bibliographic information, collected data, and a link to the source. Additionally, in the case of the National Assembly bill information category, detailed information includes bill text files, related committee review reports, and the progress of the bill (e.g., receipt, expiration of term, committee review, system structure review, plenary session deliberation, transfer to government, public announcement) At least one of the following may be included: (what stage it belongs to), related media articles, or similar bills. In the case of the National Assembly minutes category, the detailed information may further include at least one of a preview and a minutes file. For the National Assembly report/publication category, detailed information may further include at least one of the following: main content, preview, original file, and original text link. For the government press release category, detailed information may further include at least one of the following: main content, preview, or link to the original text. In the case of the government policy news category, additional links to the original text can be included. For the government research data category, detailed information may further include at least one of the following: main content, preview, report file, and link to the original text. For press categories, detailed information may further include links to articles. In the case of a statistical category, detailed information may further include at least one of a description of the statistical indicator, interpretation of the indicator, precautions for use, and creation/update date.

전술한 바와 같이, 사용자의 선택에 응하여 각 카테고리에 대한 세부 정보가 제공될 수 있다. 이때, 국회 의안정보 카테고리의 경우, 유사 의안이 세부 정보의 일부로서 제공될 수 있다. 여기서, 유사 의안은 정의된 알고리즘에 의해 선택 및 제공되는데, 예를 들어, 알고리즘은 의안에 관련된 법령(예: 법률의 명칭, 조, 항 중 적어도 하나)의 동일 여부 또는 관련성 여부에 기반하여 유사 의안을 결정하도록 설계될 수 있다. 관련된 법령은 의안을 설명하는 자료 내에 명시되어 있을 수 있으므로, 수집된 의안 데이터로부터 추출될 수 있다. 일 실시예에 따라, 장치(예: 서버(120))는 법령 정보를 수집하고, 각 법령을 조항 별로 데이터베이스화한 후, 법령의 조항 별로 진행된 서로 관련된 의안들의 맵핑 관계를 파악할 수 있다.As described above, detailed information for each category may be provided in response to the user's selection. At this time, in the case of the National Assembly bill information category, similar bills may be provided as part of the detailed information. Here, similar bills are selected and provided by a defined algorithm. For example, the algorithm selects and provides similar bills based on whether the laws related to the bill (e.g., at least one of the name, article, or clause of the law) are identical or related. can be designed to determine. Relevant laws may be specified in data describing the bill and thus can be extracted from the collected bill data. According to one embodiment, a device (e.g., server 120) may collect law information, create a database for each law by clause, and then determine the mapping relationship between related bills advanced for each clause of the law.

도 10은 본 발명의 실시 예에 따른 검색 서비스에서 검색어 입력에 따른 정책 정보 제공 절차의 다른 예를 도시한다. 도 10은 카테고리를 선택 후 검색어를 입력하는 경우의 절차로서, 서버(120)의 동작들을 예시한다.Figure 10 shows another example of a policy information provision procedure according to a search word input in a search service according to an embodiment of the present invention. FIG. 10 illustrates the operations of the server 120 as a procedure for entering a search term after selecting a category.

도 10을 참고하면, 1001 단계에서, 서버(120)는 초기 화면을 제공한다. 초기 메뉴는 본 발명의 실시 예들에 따른 검색 서비스를 위한 사이트의 첫 화면, 즉, 홈 화면으로서, 메인 메뉴, 검색 바, 공지 창, 적어도 하나의 서브 메뉴 등을 포함할 수 있다. 초기 화면은 HTTP 프로토콜에 기반하여 제공될 수 있다. 예를 들어, 초기 화면의 구성은 앞서 도 7 및 도 8을 참고하여 설명한 바와 같다.Referring to FIG. 10, in step 1001, the server 120 provides an initial screen. The initial menu is the first screen of the site for the search service according to embodiments of the present invention, that is, the home screen, and may include a main menu, a search bar, a notification window, and at least one submenu. The initial screen may be provided based on the HTTP protocol. For example, the configuration of the initial screen is the same as previously described with reference to FIGS. 7 and 8.

1002 단계에서, 서버(120)는 선택된 카테고리의 초기 화면을 제공한다. 즉, 클라이언트 장치(110)로부터 사용자에 의해 선택된 카테고리에 대한 정보가 수신되면, 서버(120)는 수신된 정보에 의해 지시되는 카테고리를 위한 초기 화면을 제공한다. 이때 제공되는 초기 화면은, 이하 설명에서, '하위 초기 화면', '카테고리 별 초기 화면' 등으로 지칭될 수 있다. 여기서, 카테고리들은, 메인 메뉴에 포함되는 메인 항목 또는 메인 항목의 하위 항목들로서, 검색 가능한 정보의 종류 또는 출처를 구분하도록 정의될 수 있다. In step 1002, the server 120 provides an initial screen of the selected category. That is, when information about the category selected by the user is received from the client device 110, the server 120 provides an initial screen for the category indicated by the received information. The initial screen provided at this time may be referred to as a 'lower initial screen', 'initial screen by category', etc. in the following description. Here, categories are main items included in the main menu or sub-items of the main item, and may be defined to distinguish types or sources of searchable information.

클라이언트 장치(110)에서, 카테고리의 선택은 제1 타입 메인 메뉴(810) 또는 제2 타입 메인 메뉴(830)을 이용하여 이루어질 수 있다. 하위 메뉴를 포함하지 아니하는 메인 항목의 경우, 해당 메인 항목 자체가 하나의 카테고리로서 정의된다. 따라서, 사용자에 의해 제1 타입 메인 메뉴(810) 중 하나가 선택되면, 하위 메뉴를 포함하지 아니하는 메인 항목이라면, 선택된 메인 항목이 선택된 카테고리로서 검출된다. 반면, 사용자에 의해 하위 메뉴를 포함하는 메인 항목이 선택되면, 선택된 메인 항목에 속한 하위 메뉴로서 카테고리들이 표시되고, 사용자에 의해 표시된 카테고리들 중 하나가 클릭 또는 터치되면, 선택된 카테고리가 검출된다. 이에 따라, 클라이언트 장치(110)는 선택된 카테고리에 대한 초기 화면을 요청하는 메시지를 서버(120)에게 송신한다.At the client device 110, selection of a category may be made using the first type main menu 810 or the second type main menu 830. In the case of a main item that does not include a submenu, the main item itself is defined as a category. Accordingly, when one of the first type main menus 810 is selected by the user, if it is a main item that does not include a submenu, the selected main item is detected as the selected category. On the other hand, when a main item including a submenu is selected by the user, categories are displayed as submenus belonging to the selected main item, and when one of the categories displayed by the user is clicked or touched, the selected category is detected. Accordingly, the client device 110 transmits a message requesting an initial screen for the selected category to the server 120.

일 실시 예에 따라, 카테고리 별 초기 화면은 도 11과 같이 구성될 수 있다. 도 11은 본 발명의 실시 예에 따른 검색 서비스에서 카테고리 별 초기 화면의 예를 도시한다. 도 11을 참고하면, 카테고리 별 초기 화면은 카테고리 명칭(1110), 검색 창(1120), 검색 옵션(1130), 수집된 건 목록(1140)을 포함한다. 카테고리 명칭(1110)은 선택된 카테고리의 명칭을 표시하는 영역으로, 메인 항목에 속한 하위 메뉴인 카테고리의 경우, 메인 항목 및 하위 메뉴의 명칭이 모두 표시될 수 있다. 검색 창(1120)은 해당 카테고리 내에서의 검색을 위한 검색어를 입력하는 영역으로, 검색어를 입력하는 영역 및 검색 명령을 입력하는 버튼을 포함한다. According to one embodiment, the initial screen for each category may be configured as shown in FIG. 11. Figure 11 shows an example of an initial screen for each category in a search service according to an embodiment of the present invention. Referring to FIG. 11, the initial screen for each category includes a category name (1110), a search window (1120), a search option (1130), and a list of collected items (1140). The category name 1110 is an area that displays the name of the selected category. In the case of a category that is a submenu belonging to the main item, the names of both the main item and the submenu may be displayed. The search window 1120 is an area for entering a search word for a search within the corresponding category, and includes an area for entering a search word and a button for entering a search command.

검색 옵션(1130)은 검색에 관련된 옵션, 예를 들어, 필터링 조건을 입력하는 적어도 하나의 영역으로서, 카테고리에 따라 제외될 수 있다. 예를 들어, 검색 옵션(1130)에 포함되는 적어도 하나의 영역은, 검색 필드(예: 전체, 내용, 제목, 의안명, 내용, 의안번호, 첨부파일, 보고서/발간물명, 보도자료명 중 적어도 하나), 국회 대수, 제안 종류(예: 위원장, 의원, 정부 중 적어도 하나), 연도, 위원회(예: 과학기술정보방송통신위원회, 교육위원회, 국방위원회 등 중 적어도 하나), 부처명(예: 거시경제분석과, 거시경제분석팀, 경제분석실, 개인정보보호위원회 등 중 적어도 하나), 발행기관(예: 4차산업혁명위원회, KDI국제정책대학원 등 중 적어도 하나), 관련 기관(예: 건강보험심사평가원, 게임물관리위원회 등 중 적어도 하나), 공개여부(예: 공개, 부분공개, 비공개 중 적어도 하나), 통계기관(예: e-나라지표 등) 중 적어도 하나에 관련된 조건을 입력하기 위해 사용될 수 있다. 나열된 조건들은 카테고리에 따라 선택적으로 적용되도록 설게될 수 있으며, 조건들의 내용은 체크 박스를 이용한 선택, 텍스트 입력 등의 형식으로 입력될 수 있다.The search option 1130 is at least one area for entering search-related options, for example, filtering conditions, and may be excluded depending on the category. For example, at least one area included in the search option 1130 is a search field (e.g., at least one of all, content, title, bill name, content, bill number, attached file, report/publication name, and press release name) ), number of National Assembly members, type of proposal (e.g., at least one of chairperson, member, government), year, committee (e.g., at least one of Science and ICT Committee, Education Committee, National Defense Committee, etc.), name of ministry (e.g., macroeconomics) At least one of the Analysis Department, Macroeconomic Analysis Team, Economic Analysis Office, Personal Information Protection Committee, etc.), issuing agency (e.g., at least one of the Fourth Industrial Revolution Committee, KDI School of International Policy, etc.), related organization (e.g., health insurance review) It can be used to enter conditions related to at least one of (at least one of the Evaluation Institute, Game Management Committee, etc.), disclosure (e.g., at least one of disclosure, partial disclosure, and non-disclosure), and statistical agency (e.g., e-National Index, etc.). there is. The listed conditions can be designed to be selectively applied depending on the category, and the contents of the conditions can be entered in the form of selection using a check box or text input.

수집된 건 목록(1140)은 해당 카테고리에 속하는 정책 정보 건들(1142-1 내지 1042-L)에 대한 정보를 표시하는 영역이다. 일 실시 예에 따라, 수집된 건 목록(1140)에서, 정책 정보 건들(1142-1 내지 1042-L)은 수집된 날짜의 내림차순으로 나열될 수 있다. 정책 정보 건들(1142-1 내지 1042-L) 각각에 포함되는 정보는 카테고리에 따라 달라질 수 있다. 정책 정보 건들(1142-1 내지 1042-L) 각각은 해당 건의 요약 정보, 출처, 제목, 날짜, 관련 부처/기관 중 적어도 하나를 포함하며, 해당 건의 세부 정보 화면으로의 이동을 위한 링크를 포함할 수 있다.The collected case list 1140 is an area that displays information about policy information cases 1142-1 to 1042-L belonging to the corresponding category. According to one embodiment, in the collected case list 1140, policy information cases 1142-1 to 1042-L may be listed in descending order of the date they were collected. Information included in each policy information case (1142-1 to 1042-L) may vary depending on the category. Each policy information case (1142-1 to 1042-L) will contain at least one of the following: summary information for the case, source, title, date, relevant department/agency, and may include a link to move to the case's detailed information screen. You can.

1003 단계에서, 서버(120)는 검색어의 입력에 따른 검색 결과를 제공한다. 클라이언트 장치(110)로부터 사용자가 검색 창(1120)에 입력한 검색어에 대한 정보가 수신되면, 서버(112)는 검색어에 대한 카테고리 내의 검색 결과를 제공할 수 있다. 이에 따라, 도 11과 같은 카테고리 별 초기 화면에서, 수집된 건 목록(1140)이 검색 건 목록으로 교체된다. 즉, 서버(112)는 초기 화면에서 수집된 건 목록(1140)을 검색 건 목록으로 대체된 화면을 제공한다. 검색 건 목록 내에 포함되는 적어도 하나의 정책 정보 건은 해당 건의 요약 정보, 출처, 제목, 날짜, 관련 부처/기관 중 적어도 하나를 포함하며, 해당 건의 세부 정보 화면으로의 이동을 위한 링크를 포함할 수 있다. In step 1003, the server 120 provides search results according to the input of a search term. When information about the search term entered by the user in the search window 1120 is received from the client device 110, the server 112 may provide search results within a category for the search term. Accordingly, in the initial screen for each category as shown in FIG. 11, the list of collected items 1140 is replaced with a list of search items. That is, the server 112 provides a screen in which the list of items 1140 collected in the initial screen is replaced with a list of search items. At least one policy information case included in the search case list includes at least one of the case's summary information, source, title, date, and related ministry/agency, and may include a link to move to the case's detailed information screen. there is.

1004 단계에서, 서버(120)는 검색 건의 선택에 따른 세부 정보를 제공한다. 클라이언트 장치(110)로부터 사용자에 의해 선택된 정책 정보 건에 대한 정보가 수신되면, 서버(120)는 해당 검색 건에 대한 세부 정보를 제공한다. 예를 들어, 검색 건의 세부 정보는 화면의 측면으로부터 팝업되는 영역에 표시될 수 있다. 즉, 일 실시 예에 따라, 세부 정보 화면은 화면의 일 측면에서 타 측면으로 이동하는 애니메이션의 형식으로 생성될 수 있다. 단, 세부 정보 화면의 생성 방식은 카테고리에 따라 다를 수 잇다. 즉, 일부 카테고리에 속하는 세부 정보 화면은 새 창으로 열리는 방식으로 생성될 수 있다. 이때, 세부 정보는 해당 카테고리에 따라 다른 항목 구성들로 표시될 수 있다. 예를 들어, 세부 정보에 대한 구성은 앞서 도 7을 참고하여 설명한 바와 같다.In step 1004, the server 120 provides detailed information according to the search item selection. When information on the policy information item selected by the user is received from the client device 110, the server 120 provides detailed information on the corresponding search item. For example, detailed information on search items may be displayed in an area that pops up from the side of the screen. That is, according to one embodiment, the detailed information screen may be created in the form of an animation that moves from one side of the screen to the other side. However, the method of creating the detailed information screen may vary depending on the category. In other words, detailed information screens belonging to some categories can be created in a way that opens in a new window. At this time, detailed information may be displayed in different item configurations depending on the corresponding category. For example, the configuration of detailed information is the same as previously described with reference to FIG. 7.

전술한 바와 같이, 본 발명의 다양한 실시 예들에 따른 정보 검색 서비스는 지정된 카테고리들에 따라 정책 정보를 검색 및 열람하는 서비스를 제공할 수 있다. 카테고리들은 메인 메뉴에 정의된 메인 항목들 또는 메인 항목들의 하위 메뉴의 항목들로 이루어질 수 있다. 따라서, 정책 정보의 검색 및 제공은 메인 항목의 구조에 적어도 부분적으로 종속될 것이다. 일 실시 예에 따라, 메인 항목들은 정보의 출처 내지 관련 주체에 따라 정의될 수 있으며, 구체적으로, '국회', '정부', '공공기관', '언론', '통계'를 포함할 수 있다. As described above, the information search service according to various embodiments of the present invention can provide a service for searching and viewing policy information according to designated categories. Categories may consist of main items defined in the main menu or items of submenus of the main items. Accordingly, the retrieval and provision of policy information will depend at least in part on the structure of the main item. According to one embodiment, main items may be defined according to the source of information or related entity, and may specifically include 'National Assembly', 'Government', 'Public Institution', 'Media', and 'Statistics'. .

이에 더하여, 본 발명의 다양한 실시 예들에 따른 정보 검색 서비스는 설계된 카테고리 외 다른 분류에 따라 정책 정보를 제공하는 기능을 제공할 수 있다. 본 설명에서, 해당 서비스는 '정책정보 군집화 분석(Cluster analysis)' 기능, 정책정보 군집화 메뉴 등으로 지칭될 수 있다. 정책정보 군집화 기능은 도 3 및 도 4를 참고하여 설명한 군집화의 결과에 기반하여 분류 및 가공된 형식으로 정책 정보를 제공하는 기능이다. 정책정보 군집화 기능에 대하여 살펴보면 다음과 같다.In addition, the information search service according to various embodiments of the present invention can provide a function of providing policy information according to classifications other than the designed category. In this description, the service may be referred to as the 'policy information cluster analysis' function, policy information clustering menu, etc. The policy information clustering function is a function that provides policy information in a classified and processed format based on the results of clustering described with reference to FIGS. 3 and 4. The policy information clustering function is as follows.

도 12는 발명의 실시 예에 따른 검색 서비스에서 정책정보 군집화 기능 수행 절차의 예를 도시한다. 도 12는 군집화의 결과에 따라 분류 및 가공된 형식으로 정책 정보를 제공하는 기능으로서, 서버(120)의 동작들을 예시한다.Figure 12 shows an example of a procedure for performing the policy information clustering function in a search service according to an embodiment of the invention. FIG. 12 illustrates the operations of the server 120 as a function of providing policy information in a classified and processed format according to the results of clustering.

도 12를 참고하면, 1201 단계에서, 서버(120)는 정책정보 군집화 기능의 선택을 확인한다. 사용자는 클라이언트 장치(110)에 표시된 화면에서 정책정보 군집화 항목을 클릭 또는 터치함으로써 정책정보 군집화 기능을 요구할 수 있고, 클라이언트 장치(110)는 사용자에 의해 정책정보 군집화 기능이 요청됨을 알리는 메시지를 서버(120)에게 송신할 수 있다. 이에 따라, 서버(120)는 정책정보 군집화 기능이 요구되었음을 확인할 수 있다. 예를 들어, 정책정보 군집화 항목은 초기 화면의 서브 메뉴(850)에 포함될 수 있다.Referring to FIG. 12, in step 1201, the server 120 confirms the selection of the policy information clustering function. The user may request the policy information clustering function by clicking or touching the policy information clustering item on the screen displayed on the client device 110, and the client device 110 sends a message to the server ( 120). Accordingly, the server 120 can confirm that the policy information clustering function has been requested. For example, the policy information clustering item may be included in the submenu 850 of the initial screen.

1202 단계에서, 서버(120)는 정책정보 군집화 초기 화면을 제공한다. 정책정보 군집화 초기 화면은 가변 영역(804)에 표시될 수 있다. 정책정보 군집화 초기 화면은 선택 가능한 주제들을 포함한다. 일 실시 예에 따라, 선택 가능한 주제들은 계층적으로 구조화될 수 있다. 예를 들어, 정책정보 군집화 초기 화면에서, 복수의 상위 주제들과 각 상위 주제에 속하는 하위 주제들이 그래픽 형태로 표현될 수 있다. In step 1202, the server 120 provides an initial screen for policy information clustering. The policy information clustering initial screen may be displayed in the variable area 804. The initial screen for policy information clustering includes selectable topics. According to one embodiment, selectable topics may be structured hierarchically. For example, in the initial screen for policy information clustering, a plurality of high-level topics and sub-topics belonging to each high-level topic may be expressed in graphic form.

일 실시 예에 따라, 정책정보 군집화의 초기 화면은 도 13a 및 도 13b와 같이 구성될 수 있다. 도 13a 및 도 13b는 본 발명의 실시 예에 따른 검색 서비스에서 정책정보 군집화 기능의 초기 화면의 예를 도시한다. 도 13a를 참고하면, 6개의 상위 주제들이 서로 다른 색상으로 채워진 도형들(1211 내지 1216)로 표현된다. 그리고, 상위 주제들을 표현하는 도형들(1211 내지 1216) 각각에 하위 주제를 표현하는 도형들이 해당 상위 주체를 표현하는 색상과 다른 색상으로 채워진 상태로 포함된다. 예를 들어, 상위 주제들로서, '정치행정', '지방시대', '경제', '외교안보', '사회', '미래'가 정의될 수 있고, '정치행정'의 하위 주제들로서 '상식과 공정 원칙 정립', '대통령 및 정부 소통 강화', '국민 기준 부동산 정책'이 정의될 수 있으며, 주제에 따른 분류기준 정의는 관리자의 판단 및 입력에 의해 변경될 수 있다.According to one embodiment, the initial screen for policy information clustering may be configured as shown in FIGS. 13A and 13B. Figures 13a and 13b show an example of an initial screen of the policy information clustering function in a search service according to an embodiment of the present invention. Referring to FIG. 13A, six top topics are expressed as shapes 1211 to 1216 filled with different colors. In addition, in each of the shapes 1211 to 1216 representing higher-level topics, shapes representing lower-level topics are included and filled with a color different from the color representing the corresponding higher-level subject. For example, as upper-level topics, 'political administration', 'local era', 'economy', 'diplomacy and security', 'society', and 'future' can be defined, and as lower-level topics of 'political administration', 'common sense' can be defined. and 'Establishment of fair principles', 'Strengthening presidential and government communication', and 'Real estate policy based on citizens' can be defined, and the definition of classification criteria according to topic can be changed by the administrator's judgment and input.

사용자가 클라이언트 장치(110)를 통해 어느 하나의 상위 주체의 도형, 예를 들어, 제1 상위 도형(1211)의 내부에 커서를 위치시키면, 제1 상위 도형(1211)에 강조의 시각 효과가 부여되고, 나머지 상위 도형들(1212 내지 1216)에 불활성의 시각 효과가 부여된다. 구체적인 예로, 도 13b를 참고하면, 제1 상위 도형(1211)의 테두리가 생성됨으로써, 커서가 위치한 제1 상위 도형(1211)이 보다 시각적으로 눈에 띄이게 된다. 또한, 나머지 상위 도형들(1212 내지 1216) 내부의 하위 주제 도형들에 채워진 색상 및 표시된 하위 주제의 텍스트들이 해당 상위 주제 도형의 색상과 유사해짐으로써, 나머지 상위 도형들(1212 내지 1216)이 상대적으로 눈에 띄이지 아니하게 된다. 이를 통해, 선택 과정 중에 있는 주제에 대한 사용자의 인식력이 개선될 수 있다. 추가적으로, 도 13b에 도시되지 아니하였으나, 사용자가 커서를 하위 도형의 내부에 위치시키면, 해당 하위 도형의 하위 주제에 대한 설명문이 팝업창을 통해 표시될 수 있다. 예를 들어, 설명문은, 상위 주제 명칭, 하위 주제 명칭을 포함할 수 있다.When the user positions the cursor inside a shape of a top entity, for example, the first top shape 1211, through the client device 110, a visual effect of emphasis is given to the first top shape 1211. And an inactive visual effect is given to the remaining upper figures 1212 to 1216. As a specific example, referring to FIG. 13b, the border of the first upper figure 1211 is created, so that the first upper figure 1211 where the cursor is located becomes more visually noticeable. In addition, the colors filled in the sub-topic shapes within the remaining upper-level shapes (1212 to 1216) and the text of the displayed sub-topic become similar to the color of the corresponding upper-topic shape, so that the remaining upper-level shapes (1212 to 1216) are relatively It becomes invisible. Through this, the user's perception of the topic during the selection process can be improved. Additionally, although not shown in FIG. 13B, when the user positions the cursor inside a sub-figure, an explanation of the sub-topic of the sub-figure may be displayed through a pop-up window. For example, the description may include a parent topic name and a child topic name.

1203 단계에서, 서버(120)는 주제 선택에 따른 상세 화면을 제공한다. 사용자는 초기 화면에서 하위 주제를 선택할 수 있고, 클라이언트 장치(110)는 선택된 하위 주제에 대한 정보를 알리는 메시지를 송신할 수 있다. 메시지를 통해 사용자에 의해 선택된 하위 주제를 확인하면, 서버(120)는 선택된 하위 주제에 대한 상세 화면을 생성 및 제공한다. 일 실시 예에 따라, 상세 화면은 팝업 창을 통해 표시될 수 있다. 상세 화면은 주제에 관련된 분류 정보, 관련 키워드들, 관련 정책 정보 목록을 포함할 수 있다. 여기서, 정책 정보 목록은 메인 메뉴에 의해 정의되는 카테고리 별로 표시될 수 있다. In step 1203, the server 120 provides a detailed screen according to the topic selection. The user can select a sub-topic on the initial screen, and the client device 110 can transmit a message informing information about the selected sub-topic. When the sub-topic selected by the user is confirmed through the message, the server 120 creates and provides a detailed screen for the selected sub-topic. According to one embodiment, the detailed screen may be displayed through a pop-up window. The detailed screen may include a list of classification information related to the topic, related keywords, and related policy information. Here, the policy information list may be displayed by category defined by the main menu.

일 실시 예에 따라, 정책정보 군집화의 하위 주제를 위한 상세 화면은 도 14와 같이 구성될 수 있다. 도 14는 본 발명의 실시 예에 따른 검색 서비스에서 정책정보 군집화 기능의 상세 화면의 예를 도시한다. 도 14를 참고하면, 상세 화면(1302)는 상위 구분(1310), 소분류(1320), 소분류 대응 키워드(1330), 카테고리 별 정책 정보 목록(1340)을 포함할 수 있다. 상위 구분(1310)은 대분류 및 중분류를 선택하기 위한 인터페이스 항목들을 포함한다. 여기서, 대분류는 분과로, 중분류는 원칙으로 지칭될 수 있다. 대분류 및 중분류는 초기 화면에서 선택된 상위 주제 및 하위 주제에 대응한다. 따라서, 상세 화면(1302)의 초기화 시, 앞서 선택된 상위 주제가 대분류로서, 앞서 선택된 하위 주제가 중분류로서 표시된다. 사용자는 상위 구분(1310)에 포함된 인터페이스 항목을 이용하여 상위 주제 및 하위 주제를 변경할 수 있다.According to one embodiment, a detailed screen for the sub-topic of policy information clustering may be configured as shown in FIG. 14. Figure 14 shows an example of a detailed screen of the policy information clustering function in a search service according to an embodiment of the present invention. Referring to FIG. 14 , the detailed screen 1302 may include a top category 1310, a subcategory 1320, a keyword corresponding to the subcategory 1330, and a policy information list for each category 1340. The upper division 1310 includes interface items for selecting major categories and middle categories. Here, the major classification may be referred to as a division, and the intermediate classification may be referred to as a principle. Major and middle categories correspond to the upper and lower topics selected on the initial screen. Accordingly, when the details screen 1302 is initialized, the previously selected upper topic is displayed as a major category, and the previously selected lower topic is displayed as a middle category. The user can change the upper topic and lower topic using the interface items included in the upper division 1310.

소분류는 지정된 대분류 및 중분류에 관련된 적어도 하나의 국정 과제의 목록을 표시하는 영역이다. 목록은 텍스트로 구성되는 표 형태, 그래프 형태, 분포도 형태 등 다양하게 표현될 수 있다. 사용자는 목록 내에서 어느 하나의 국정 과제를 선택할 수 있고, 선택된 국정 과제에 따라 소분류 대응 키워드(1330), 카테고리 별 정책 정보 목록(1340) 내의 컨텐츠가 달라진다. 상세 화면(1302)의 초기화 시, 목록 중 첫번째 국정 과제가 선택된다. 소분류 대응 키워드(1330)는 선택된 국정 과제에 관련된 적어도 하나의 정책 키워드를 표시하는 영역이고, 카테고리 별 정책 정보 목록(1340)은 소분류 대응 키워드(1330)에 표시된 키워드들 중 선택된 키워드에 관련된 정책 정보 건들에 대한 검색 결과를 표시하는 영역이다. A subcategory is an area that displays a list of at least one national task related to a designated major or medium category. Lists can be expressed in various ways, such as in the form of a text table, graph, or distribution chart. The user can select any one government task from the list, and the contents of the subcategory corresponding keywords 1330 and the policy information list 1340 for each category change depending on the selected government task. When initializing the details screen 1302, the first national task from the list is selected. The subcategory corresponding keyword 1330 is an area that displays at least one policy keyword related to the selected national task, and the category-specific policy information list 1340 contains policy information related to the selected keyword among the keywords displayed in the subcategory corresponding keyword 1330. This is an area that displays search results for.

1204 단계에서, 서버(120)는 분류 및 키워드 선택에 따른 정책 정보를 제공한다. 소분류 대응 키워드(1330)는 적어도 하나의 키워드를 포함하며, 적어도 하나의 키워드 중 하나가 사용자에 의해 선택될 수 있다. 소분류 대응 키워드(1330)에서, 선택된 키워드는 나머지 적어도 하나의 키워드와 시각적으로 다르게 표시(예: 색상 차이 등)될 수 있다. 하나의 키워드가 선택되면, 서버(120)는 카테고리 별 정책 정보 목록(1340)을 통해 선택된 키워드에 관련된 정책 정보 건들에 대한 검색 결과, 즉, 정책 정보들의 검색 건들의 목록을 제공한다. 이때, 카테고리 별 정책 정보 목록(1340)을 통해 표시되는 검색 건들은 앞서 도 7 및 도 10을 참고하여 설명된 절차에 따라 제공되는 검색 결과에 비해 다소 간소화된 상태로 표시될 수 있다. 여기서, 간소화된 상태는 표시되는 정보의 항목이 더 적은 것으로 이해될 수 있다. In step 1204, the server 120 provides policy information according to classification and keyword selection. The subcategory corresponding keyword 1330 includes at least one keyword, and one of the at least one keyword may be selected by the user. In the subcategory corresponding keyword 1330, the selected keyword may be displayed visually differently (e.g., color difference, etc.) from at least one remaining keyword. When one keyword is selected, the server 120 provides search results for policy information cases related to the selected keyword, that is, a list of policy information search cases, through the policy information list 1340 for each category. At this time, search items displayed through the policy information list 1340 for each category may be displayed in a somewhat simplified state compared to the search results provided according to the procedure previously described with reference to FIGS. 7 and 10. Here, the simplified state can be understood as fewer items of information being displayed.

나아가, 일 실시 예에 따라, 검색 건들은 해당 정책 정보의 세부 정보 화면으로의 이동을 위한 링크를 포함할 수 있다. 링크의 선택에 따라, 서버(120)는 해당 정책 정보의 세부 정보 화면을 제공할 수 있고, 사용자는 해당 정책 정보의 세부 정보를 열람할 수 있다.Furthermore, according to one embodiment, search items may include a link for moving to a detailed information screen of the corresponding policy information. Depending on the selection of the link, the server 120 can provide a detailed information screen of the corresponding policy information, and the user can view the detailed information of the corresponding policy information.

전술한 바와 같이, 정책 정보가 제공될 수 있다. 하나의 정책 정보라 하더라도, 다양한 경로를 통해 제공되는 것이 가능하다. 이를 통해, 사용자는 다각도로 정책 정보에 접근할 수 있으며, 보다 효과적으로 정책 정보를 검색 및 활용할 수 있을 것이다. 다양한 실시 예들에 따른 정책 정보의 세부 정보가 제공되는 경로들을 정리하면 이하 도 15와 같다.As described above, policy information may be provided. Even if it is a single policy information, it is possible to be provided through various channels. Through this, users will be able to access policy information from various angles and search and utilize policy information more effectively. The paths through which detailed policy information is provided according to various embodiments are summarized as shown in FIG. 15 below.

도 15는 본 발명의 실시 예에 따른 검색 서비스에서 정책 정보가 제공되는 다양한 경로들을 도시한다. 도 15를 참고하면, 정책 정보가 제공되는 경로들은 통합 검색(1502), 카테고리 별 분류(1504), 정책정보 군집화 기능(1506)으로 구분된다. 통합 검색(1502)에서, 검색어의 입력에 의해, 통합 검색 결과(1512)가 제공된다. 카테고리 별 분류(1504)에서, 카테고리(예: 출처) 별 정책정보가 제공된다. 추가적으로, 카테고리 별 분류(1504)에서, 검색어의 입력에 의해, 카테고리 내의 검색 결과(1522)가 제공될 수 있다. 이때, 통합 검색 결과(1512)에서, 특정 카테고리가 선택되면, 카테고리 내의 검색 결과(1522)가 제공될 수 있다. 정책정보 군집화 기능(1506)에서, 주제 선택에 의해, 군집 내에서의 관련 키워드에 대한 검색 결과(1516)가 제공된다. 즉, 정책정보 군집화 기능(1506)의 경우, 사용자가 검색어를 직접 입력하는 절차는 없고, 분류를 선택한 후, 주어진 키워드 중 하나를 선택하는 절차에 의해 검색 결과가 제공된다. 또한, 정책정보 군집화 기능(1506)은 해당 군집에 속한 정책정보를 제공하므로, 키워드 검색을 한 경우보다 더 적은 양으로서, 해당 군집에 특화된 결과를 제공할 수 있다. 이후, 통합 검색 결과(1512), 카테고리 내의 검색 결과(1522) 또는 관련 키워드에 대한 검색 결과(1516)에서 어느 하나의 검색 건이 선택되면, 선택된 검색 건에 대응하는 정책 정보의 세부 정보(1522)가 제공된다.Figure 15 shows various paths through which policy information is provided in a search service according to an embodiment of the present invention. Referring to FIG. 15, the paths through which policy information is provided are divided into integrated search (1502), classification by category (1504), and policy information clustering function (1506). In integrated search 1502, integrated search results 1512 are provided by entering a search term. In classification by category 1504, policy information by category (e.g. source) is provided. Additionally, in the classification by category 1504, search results 1522 within the category may be provided by entering a search term. At this time, when a specific category is selected in the integrated search results 1512, search results 1522 within the category may be provided. In the policy information clustering function 1506, by selecting a topic, search results 1516 for related keywords within the cluster are provided. That is, in the case of the policy information clustering function 1506, there is no procedure for the user to directly enter a search term, and search results are provided through a procedure of selecting a classification and then selecting one of the given keywords. In addition, the policy information clustering function 1506 provides policy information belonging to the corresponding cluster, so it can provide results specialized for the corresponding cluster in a smaller amount than when searching by keyword. Thereafter, when one search is selected from the integrated search results 1512, search results within a category 1522, or search results for related keywords 1516, detailed information 1522 of policy information corresponding to the selected search is displayed. provided.

정잭정보 군집화 기능(1506)에 대한 일 예가 앞서 도 12 내지 도 14를 참고하여 설명되었다. 특히, 도 13a 및 도 13b는 해당 군집이 국정과제인 경우의 예를 보여준다. 하지만, 군집은 다양하게 정의될 수 있으며, 예를 들어, 국정과제 외에도, '20**년 총선', '** 사업', '부동산 정책', '국정 감사' 등과 같은 사회적 이슈가 개별 군집으로서 정의될 수 있다. 이 경우, 각 군집은, 도 13a 내지 도 13b의 예와 유사하게, 하위 분류들을 포함할 수 있고, 각 군집에 대하여, 도 13a 및 도 13b와 같은 그래픽 인터페이스 기반의 초기 화면이 제공될 수 있다. 즉, 군집 별 초기 화면이 제공되며, 초기 화면들에 대응하는 군집들을 항목들로 포함하는 상위 메뉴도 제공될 수 있다.An example of the static information clustering function 1506 was previously described with reference to FIGS. 12 to 14. In particular, Figures 13a and 13b show an example where the cluster is a national task. However, clusters can be defined in various ways, and for example, in addition to national tasks, social issues such as '20** general election', '** business', 'real estate policy', and 'government audit' are classified as individual clusters. can be defined. In this case, each cluster may include sub-categories, similar to the examples of FIGS. 13A and 13B, and for each cluster, an initial screen based on a graphical interface such as those of FIGS. 13A and 13B may be provided. That is, an initial screen for each cluster is provided, and a top menu including clusters corresponding to the initial screens as items may also be provided.

군집은 사전에 오프라인에서 정의될 수 있는데, 예를 들어, 전문가 의견에 기반하여 결정될 수 있다. 나아가, 군집의 결정과 함께, 군집에 대한 키워드들도 결정될 수 있다. 구체적으로, 전문가 집단에 의해, 정책 아젠다(예: 국정감사)가 선정되고, 정책 아젠다에 관련된 이슈를 표현하는 키워드들(예: 부동산 정책)이 선정되고, 워드에 대한 관련된 전문가 검토 결과/의견이 수집될 수 있다. 나아가, 일 실시 예에 따라, 서버는 전술한 일련의 과정에서 발생되는 데이터/정보를 전문가 컬럼이라는 명칭으로, 사용자들에게 제공할 수 있다. 또한, 서버는 전술한 바와 같이 전문가 위원회에서 선정된 키워드와 관련한 연계 검색 결과를 제공할 수 있다.Clusters can be defined offline in advance, for example, determined based on expert opinion. Furthermore, along with determining the cluster, keywords for the cluster may also be determined. Specifically, a policy agenda (e.g., government audit) is selected by a group of experts, keywords that express issues related to the policy agenda (e.g., real estate policy) are selected, and related expert review results/opinions on Word are selected. can be collected. Furthermore, according to one embodiment, the server may provide data/information generated in the above-described series of processes to users under the name of an expert column. Additionally, the server may provide linked search results related to keywords selected by the expert committee as described above.

전술한 본 발명의 다양한 실시 예들에 따른 방법은 하드웨어인 컴퓨터가 결합되어 실행되기 위해 컴퓨터 프로그램 또는 모바일 어플리케이션으로 구현되어 매체에 저장될 수 있다. 또는, 본 발명의 실시 예들과 관련하여 설명된 방법 또는 알고리즘의 단계들은 하드웨어로 직접 구현되거나, 하드웨어에 의해 실행되는 소프트웨어 모듈로 구현되거나, 또는 이들의 결합에 의해 구현될 수 있다. 소프트웨어 모듈은 RAM(Random Access Memory), ROM(Read Only Memory), EPROM(Erasable Programmable ROM), EEPROM(Electrically Erasable Programmable ROM), 플래시 메모리(Flash Memory), 하드 디스크, 착탈형 디스크, CD-ROM, 또는 본 발명이 속하는 기술 분야에서 잘 알려진 임의의 형태의 컴퓨터 판독가능 기록매체에 상주할 수도 있다. 또한, 알고리즘은 설치 파일 형태로 제작되어 온라인 다운로드 형태로 제공되며, 이를 위해 온라인 소프트웨어 마켓을 통해 접속 가능한 서버에 저장될 수 있다.The methods according to various embodiments of the present invention described above may be implemented as a computer program or mobile application and stored in a medium in order to be executed by combining a hardware computer. Alternatively, the steps of the method or algorithm described in relation to the embodiments of the present invention may be implemented directly in hardware, implemented as a software module executed by hardware, or a combination thereof. The software module may be RAM (Random Access Memory), ROM (Read Only Memory), EPROM (Erasable Programmable ROM), EEPROM (Electrically Erasable Programmable ROM), Flash Memory, hard disk, removable disk, CD-ROM, or It may reside on any type of computer-readable recording medium well known in the art to which the present invention pertains. Additionally, the algorithm is produced in the form of an installation file and provided as an online download, and for this purpose, it can be stored on a server accessible through an online software market.

한편 본 발명의 상세한 설명에서는 구체적인 실시 예에 관해 설명하였으나, 본 발명의 범위에서 벗어나지 않는 한도 내에서 여러 가지 변형이 가능함은 물론이다. 그러므로 본 발명의 범위는 설명된 실시 예에 국한되어 정해져서는 아니 되며 후술하는 특허청구의 범위뿐만 아니라 이 특허청구의 범위와 균등한 것들에 의해 정해져야 한다.Meanwhile, in the detailed description of the present invention, specific embodiments have been described, but of course, various modifications are possible without departing from the scope of the present invention. Therefore, the scope of the present invention should not be limited to the described embodiments, but should be determined not only by the scope of the patent claims described later, but also by the scope of this patent claim and equivalents.

Claims (5)

정책에 관련된 정보 검색 서비스를 제공하기 위한 서버의 동작 방법에 있어서,
상기 정책에 관련된 정보 검색 서비스를 제공하기 위한 데이터를 수집하고, 검색 가능하도록 처리하는 단계;
상기 서버에 접속한 클라이언트 장치에게 제1 인터페이스를 이용하여 제1 방식으로 정책 정보를 제공하는 단계;
상기 클라이언트 장치에게 제2 인터페이스를 이용하여 제2 방식으로 정책 정보를 제공하는 단계를 포함하며,
상기 제1 방식으로 정책 정보를 제공하는 단계는,
서비스 초기 화면에서 상기 클라이언트 장치의 사용자의 제1 검색어 입력에 따라, 상기 클라이언트 장치로부터 상기 제1 검색어를 수신하는 단계;
상기 검색어에 관련되는 제1 정책 정보 건들을 검색하는 단계; 및
상기 제1 정책 정보 건들의 제1 목록을, 서로 다른 출처들로 구성되는 복수의 카테고리 별로, 카테고리 별 명칭 및 검색된 정책 정보 건들의 개수와 함께 제공하는 단계를 포함하고,
상기 제2 방식으로 정책 정보를 제공하는 단계는,
상기 서비스 초기 화면에서 상기 클라이언트 장치의 사용자의 카테고리 선택에 응하여, 선택된 카테고리의 초기 화면으로서, 선택된 카테고리의 명칭, 검색어 입력을 위한 검색 창, 상기 선택된 카테고리에 기반한 검색 조건의 입력을 위한 검색 옵션 메뉴를 포함하는 카테고리 전용 초기 화면을 제공하는 단계;
상기 카테고리 전용 초기 화면에서 상기 클라이언트 장치의 사용자의 제2 검색어 입력에 따라, 상기 클라이언트 장치로부터 상기 제2 검색어 및 검색 조건 정보를 수신하는 단계;
상기 선택된 카테고리에 속하는 정책 정보 건들 중 상기 검색어에 관련되는 제2 정책 정보 건들을 상기 검색 조건에 기반하여 검색하는 단계; 및
상기 제2 정책 정보 건들의 제2 목록을 제공하는 단계를 포함하고,
상기 정책에 관련된 정보 검색 서비스를 제공하기 위한 데이터를 수집하고, 검색 가능하도록 처리하는 단계는,
저장된 목록에 포함되는 공공 데이터 관련 사이트의 웹 페이지들 중 제1 웹 페이지에 포함된 제1 데이터를 API(application programming interface), RPA(robotic process automation), 크롤링(crawling) 또는 스크래이핑(scraping)을 통해 획득하는 단계;
상기 웹 페이지들 중 제2 웹 페이지에서 다운로드 가능한 적어도 하나의 첨부 파일을 수신하는 단계;
상기 적어도 하나의 첨부 파일에 포함되는 제2 데이터를 OCR(optical character recognition) 동작을 이용하여 획득하는 단계;
지정된 검색 키워드를 이용하여 검색 엔진을 통해 검색된 제3 웹 페이지를 확인하는 단계;
상기 제3 웹 페이지에서의 데이터 수집 여부를 문의하는 메시지를 관리자 장치에게 송신하는 단계;
상기 관리자 장치로부터의 승인이 확인되면, 상기 제3 웹 페이지에서 제3 데이터를 획득하는 단계;
상기 제1 데이터, 상기 제2 데이터 및 제3 데이터에 대한 파싱(parsing) 및 검색어 추출을 수행함으로써 복수의 검색어 토큰들을 획득하는 단계;
상기 복수의 검색어 토큰들 중 일부 단어들을 상기 제1 데이터를 위한 제1 인덱스 집합으로, 상기 제2 데이터를 위한 제2 인덱스 집합으로, 상기 제3 데이터를 위한 제3 인덱스 집합으로서 선택하는 단계;
상기 제1 인덱스 집합, 상기 제2 인덱스 집합, 상기 제3 인덱스 집합 각각에 포함되는 인덱스들 중 임계치 이상 등장하는 단어를 정책 관련 키워드로 선택하는 단계;
기 정의된 정책 키워드들 중 상기 정책 관련 키워드와 동일한 의미를 가지는 정책 키워드를 확인함으로써, 상기 제1 데이터, 상기 제2 데이터, 상기 제3 데이터 각각에 관련된 정책을 판단하는 단계;
상기 정책 관련 키워드를 이용하여, 군집화 기능을 제공하기 위해, 상기 제1 데이터, 상기 제2 데이터 및 상기 제3 데이터를 포함하는 데이터들을 군집화하는 단계;
상기 제1 인덱스 집합을 상기 제1 웹 페이지의 링크와 연계하고, 상기 제2 인덱스 집합을 상기 첨부 파일의 링크와 연계하고, 상기 제3 인덱스 집합을 상기 제3 웹 페이지의 링크와 연계하는 단계;
상기 제1 데이터, 상기 제2 데이터 및 상기 제3 데이터를 삭제하는 단계를 포함하는 방법.
In a method of operating a server to provide a policy-related information retrieval service,
Collecting data to provide an information search service related to the policy and processing it to be searchable;
providing policy information to a client device connected to the server in a first manner using a first interface;
Providing policy information to the client device in a second manner using a second interface,
The step of providing policy information in the first manner includes:
Receiving the first search word from the client device according to a first search word input by the user of the client device on the service initial screen;
searching for first policy information items related to the search term; and
Providing a first list of the first policy information cases by a plurality of categories composed of different sources, together with a name for each category and the number of retrieved policy information cases,
The step of providing policy information in the second method is,
In response to the selection of a category by the user of the client device on the service initial screen, an initial screen of the selected category is displayed, including the name of the selected category, a search window for entering a search term, and a search option menu for entering search conditions based on the selected category. providing an initial screen dedicated to the containing category;
receiving the second search word and search condition information from the client device according to a second search word input by the user of the client device on the category-specific initial screen;
searching for second policy information cases related to the search term among policy information cases belonging to the selected category based on the search conditions; and
providing a second list of said second policy information matters;
The step of collecting data to provide information retrieval services related to the policy and processing it to make it searchable,
Among the web pages of public data-related sites included in the stored list, the first data included in the first web page is processed using API (application programming interface), RPA (robotic process automation), crawling, or scraping. Obtaining through;
Receiving at least one downloadable attachment file from a second web page among the web pages;
Obtaining second data included in the at least one attached file using an optical character recognition (OCR) operation;
Confirming a third web page searched through a search engine using a designated search keyword;
sending a message to an administrator device inquiring about whether to collect data from the third web page;
When approval from the manager device is confirmed, obtaining third data from the third web page;
Obtaining a plurality of search word tokens by performing parsing and search word extraction on the first data, the second data, and the third data;
selecting some words from the plurality of search word tokens as a first index set for the first data, a second index set for the second data, and a third index set for the third data;
selecting words that appear more than a threshold among the indexes included in each of the first index set, the second index set, and the third index set as policy-related keywords;
determining a policy related to each of the first data, the second data, and the third data by identifying a policy keyword that has the same meaning as the policy-related keyword among predefined policy keywords;
Clustering data including the first data, the second data, and the third data using the policy-related keywords to provide a clustering function;
Associating the first index set with a link of the first web page, linking the second index set with a link of the attached file, and linking the third index set with a link of the third web page;
A method comprising deleting the first data, the second data and the third data.
제1항에 있어서,
상기 클라이언트 장치에게 제3 인터페이스를 이용하여 제3 방식으로 정책 정보를 제공하는 단계를 더 포함하며,
상기 제3 방식으로 정책 정보를 제공하는 단계는,
상기 클라이언트 장치의 사용자의 정책정보 군집화 기능의 선택에 응하여, 국정 과제에 기반하여 계층적으로 분류된 주제들을 표시하는 그래픽 기반의 군집화 초기 화면을 제공하는 단계;
상기 군집화 초기 화면에서 주제가 선택되면, 선택된 주제에 대한 상세 화면을 제공하는 단계; 및
상기 상세 화면에 표시된 키워드들 중 하나의 키워드가 선택되면, 선택된 키워드에 관련된 카테고리 별 검색 건들의 목록을 제공하는 단계를 포함하는 방법.
According to paragraph 1,
Further comprising providing policy information to the client device in a third manner using a third interface,
The step of providing policy information in the third method is,
In response to a user's selection of a policy information clustering function of the client device, providing a graphic-based clustering initial screen displaying hierarchically classified topics based on government affairs;
When a topic is selected in the initial clustering screen, providing a detailed screen for the selected topic; and
When one of the keywords displayed on the detailed screen is selected, a method comprising providing a list of search cases by category related to the selected keyword.
제1항에 있어서,
상기 군집화는, 훈련된 텍스트 마이닝 인공지능 모델을 이용하여 수행되며,
상기 텍스트 마이닝 인공지능 모델은, 전처리 동작, 토큰화 동작 및 특징 값 추출 동작에 의해 생성되고, 해당 군집으로 레이블링된(labeled) 학습 데이터를 이용하여 훈련되며,
상기 전처리 동작은, 원본 데이터 내의 문서의 문법적 오류 정정, 데이터의 모순 정정, 불필요한 데이터 제거를 포함하고,
상기 불필요한 데이터 제거는, 원본 데이터의 출처 별로 미리 정의된 불필요한 데이터를 정의한 데이터 테이블에 기반하여 수행되고,
상기 토큰화 동작은, 상기 원본 데이터에서 복수의 단어들을 추출하며,
상기 복수의 단어들은, 각 단어의 임베팅 벡터들 간 거리에 기반하여 복수의 그룹들로 그룹핑되고,
복수의 그룹들 각각에 속한 단어들이 해당 군집에 속한 원본 데이터들 중 어느 정보의 비율로 발견되는지 확인함으로써 그룹 별 발견 비율이 결정되고,
임계치 이상의 발견 비율을 가지는 적어도 하나의 그룹의 적어도 하나의 대표 단어가, 해당 군집의 키워드로서 결정되고,
상기 대표 단어는, 해당 그룹에 속한 단어들 중 가장 빈도가 높은 단어 또는 운영자에 의해 선택된 단어를 포함하는 방법.
According to paragraph 1,
The clustering is performed using a trained text mining artificial intelligence model,
The text mining artificial intelligence model is generated by a preprocessing operation, tokenization operation, and feature value extraction operation, and is trained using learning data labeled with the corresponding cluster,
The preprocessing operation includes correcting grammatical errors in documents in the original data, correcting contradictions in data, and removing unnecessary data,
The unnecessary data removal is performed based on a data table defining unnecessary data predefined for each source of the original data,
The tokenization operation extracts a plurality of words from the original data,
The plurality of words are grouped into a plurality of groups based on the distance between the embedding vectors of each word,
The discovery rate for each group is determined by checking what proportion of information words belonging to each of the plurality of groups are found among the original data belonging to the corresponding cluster,
At least one representative word of at least one group having a discovery rate greater than or equal to a threshold is determined as a keyword of the corresponding cluster,
The representative word includes the most frequent word among words belonging to the group or a word selected by an operator.
제1항에 있어서,
상기 제1 방식으로 정책 정보를 제공하는 단계는,
상기 제1 목록을 중 국회 의안 카테고리에 속하는 정책 정보 건이 선택되면, 선택된 정책 정보 건으로서, 대상 의안에 대한 세부 정보를 제공하는 단계를 더 포함하며,
상기 세부 정보는, 상기 대상 의안에 대한 유사 의안들에 대한 정보를 포함하며,
상기 유사 의안들은, 상기 대상 의안에 관련된 법률의 명칭, 조항에 기반하여 결정되는 의안들 간 맵핑 관계에 기반하여 선택되는 방법.
According to paragraph 1,
The step of providing policy information in the first manner includes:
When a policy information item belonging to the National Assembly bill category is selected from the first list, it further includes providing detailed information on the target bill as a selected policy information item,
The detailed information includes information about similar bills to the target bill,
A method in which the similar bills are selected based on a mapping relationship between bills determined based on the name and provisions of the law related to the target bill.
제1항에 있어서,
상기 제1 방식으로 정책 정보를 제공하는 단계는,
상기 제1 정책 정보 건들의 제1 목록을 카테고리 별 하위 목록들로 분류하는 단계;
카테고리 선택이 전체인 경우, 상기 카테고리 별 하위 목록들을 순차적으로 세로로 나열한 검색 결과를 제공하는 단계를 포함하며,
상기 하위 목록들 각각은, 카테고리 제목, 해당되는 정책 정보 건의 요약 정보를 포함하는 방법.
According to paragraph 1,
The step of providing policy information in the first manner includes:
Classifying the first list of first policy information cases into sub-lists by category;
When the category selection is All, providing a search result in which sub-lists for each category are sequentially and vertically arranged,
Each of the sub-lists includes a category title and summary information of the corresponding policy information proposal.
KR1020230132175A 2023-10-05 Method for retreiving information related to policy using public data and apparauts thereof KR102676525B1 (en)

Publications (1)

Publication Number Publication Date
KR102676525B1 true KR102676525B1 (en) 2024-06-20

Family

ID=

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102398757B1 (en) * 2021-08-18 2022-05-16 홍태균 Method and apparatus for providing platform services to provide customized policy information by collecting and classifying public big data information

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102398757B1 (en) * 2021-08-18 2022-05-16 홍태균 Method and apparatus for providing platform services to provide customized policy information by collecting and classifying public big data information

Similar Documents

Publication Publication Date Title
JP7187545B2 (en) Determining Cross-Document Rhetorical Connections Based on Parsing and Identifying Named Entities
Boididou et al. Verifying information with multimedia content on twitter: a comparative study of automated approaches
US7953687B2 (en) Knowledge discovery system with user interactive analysis view for analyzing and generating relationships
US20180232265A1 (en) System and method for detecting, collecting, analyzing, and communicating event-related information
US20210117417A1 (en) Real-time content analysis and ranking
US8583592B2 (en) System and methods of searching data sources
US9069853B2 (en) System and method of goal-oriented searching
US8176440B2 (en) System and method of presenting search results
US20150033077A1 (en) Leveraging user-to-tool interactions to automatically analyze defects in it services delivery
US20080243784A1 (en) System and methods of query refinement
WO2014144869A1 (en) System and method for providing a semi-automated research tool
WO2014210184A2 (en) Real-time and adaptive data mining
US20130346401A1 (en) Topical affinity badges in information retrieval
KR101984937B1 (en) 3 dimensions digital timeline output system of traditional culture
WO2014084140A1 (en) Document management system, document management method, and document management program
Sufi Identifying the drivers of negative news with sentiment, entity and regression analysis
WO2020036725A1 (en) A hypergraph-based method for segmenting and clustering customer observables for vehicles
US11567975B1 (en) System and method for user interactive contextual model classification based on metadata
US20150193529A1 (en) Opinion analyzing system and method
US20210240702A1 (en) Systems and methods for data insight generation and display
US11403557B2 (en) System and method for scalable, interactive, collaborative topic identification and tracking
CN110147482A (en) Method and apparatus for obtaining burst hot spot theme
KR102676525B1 (en) Method for retreiving information related to policy using public data and apparauts thereof
WO2023205204A1 (en) Classification process systems and methods
US11068121B2 (en) System and method for visual exploration of subnetwork patterns in two-mode networks