KR102047233B1 - Metadata search system by using dual load balancing and database management method by using dual load balancing - Google Patents

Metadata search system by using dual load balancing and database management method by using dual load balancing Download PDF

Info

Publication number
KR102047233B1
KR102047233B1 KR1020180126190A KR20180126190A KR102047233B1 KR 102047233 B1 KR102047233 B1 KR 102047233B1 KR 1020180126190 A KR1020180126190 A KR 1020180126190A KR 20180126190 A KR20180126190 A KR 20180126190A KR 102047233 B1 KR102047233 B1 KR 102047233B1
Authority
KR
South Korea
Prior art keywords
database
server
storage
metadata
score
Prior art date
Application number
KR1020180126190A
Other languages
Korean (ko)
Inventor
정태윤
박판종
김태형
Original Assignee
강릉원주대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 강릉원주대학교산학협력단 filed Critical 강릉원주대학교산학협력단
Priority to KR1020180126190A priority Critical patent/KR102047233B1/en
Application granted granted Critical
Publication of KR102047233B1 publication Critical patent/KR102047233B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/907Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/505Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the load

Abstract

The present invention relates to a metadata search system. The metadata search system is composed of clustering of a storage database for data storage and clustering of a search database for a search to improve performance and stability of a database. Through primary load balancing, a search task and a storage task are separated, and the separated work can be stored in an optimal database server through secondary load balancing based on a score calculated in accordance with previously collected information on database servers.

Description

이중 부하 분산을 이용한 메타데이터 검색 시스템 및 이중 부하 분산을 통한 데이터베이스 관리 방법{Metadata search system by using dual load balancing and database management method by using dual load balancing}Metadata search system by using dual load balancing and database management method by using dual load balancing}

본 발명은 메타데이터 검색 시스템에 관한 것으로서, 더욱 구체적으로는 저장용 데이터베이스와 검색용 데이터베이스의 연동을 통해 이중 부하 분산을 구현하여 성능을 향상시킨 것을 특징으로 하는 메타데이터 검색 시스템 및 상기 메타데이터 검색 시스템에서의 상기 이중 부하 분산을 통한 데이터베이스 관리 방법에 관한 것이다. The present invention relates to a metadata retrieval system. More specifically, the metadata retrieval system and the metadata retrieval system are characterized by improving performance by implementing dual load balancing through interworking of a storage database and a retrieval database. It relates to a database management method through the dual load balancing in the.

클라우딩 컴퓨팅 환경에 있어서 분산 데이터 파일들의 효율적인 관리를 위하여, 분산 데이터 파일들에 대한 메타데이터를 관리할 필요가 있다. 분산 데이터 파일들의 메타데이터는 일반적으로 다양한 형식들을 갖고 있다. In order to efficiently manage distributed data files in a cloud computing environment, it is necessary to manage metadata for distributed data files. The metadata of distributed data files generally has various formats.

이와 같이, 메타데이터들은 그 형식이 다양하기 때문에, 기존의 정형화된 Schema를 갖는 데이터베이스에 저장하기가 용이하지 않으며, 오히려 비정형 데이터 저장에 특화된 데이터베이스를 사용하는 것이 요구되고 있는 실정이다. 하지만, 일반적으로 비정형 데이터 저장에 특화된 데이터베이스들은 검색 성능이 우수하지 못하다는 문제점을 갖고 있다. As such, since metadata has various formats, it is not easy to store metadata in a database having an existing standardized schema, but rather, it is required to use a database specialized for storing unstructured data. However, in general, databases specialized for storing unstructured data have a problem in that search performance is not good.

하지만, 메타데이터 검색 시스템은 메타데이터들에 대한 우수한 데이터 저장 성능 뿐만 아니라 신속한 검색 속도도 요구되는 바, 이러한 요구를 모두 충족시킬 수 있는 검색 시스템의 개발이 필요한 실정이다. However, the metadata retrieval system requires fast retrieval speed as well as excellent data storage performance for metadata, and thus, a development of a retrieval system capable of satisfying all of these requirements is required.

한국공개특허공보 제 10-2010-0037401호Korean Patent Publication No. 10-2010-0037401

전술한 문제점을 해결하기 위한 본 발명의 목적은, 클라우드 컴퓨팅용 분산 데이터 파일들에 대한 메타데이터들을 안정적으로 저장시키면서 저장 속도 및 검색 성능을 향상시키기 위하여, 저장용 데이터베이스와 검색용 데이터베이스의 연동을 이용한 이중 부하 분산을 통하여 데이터베이스를 관리할 수 있는 메타데이터 검색 시스템을 제공하는 것이다. An object of the present invention for solving the above problems is to use the interworking of the storage database and the search database in order to improve the storage speed and search performance while stably storing metadata for distributed data files for cloud computing. It is to provide a metadata retrieval system that can manage a database through dual load balancing.

전술한 기술적 과제를 달성하기 위한 본 발명의 제1 특징에 따른 메타데이터 검색 시스템은, 데이터베이스 관리 서버, 저장용 데이터베이스와 검색용 데이터베이스를 구비하는 메타데이터 검색 시스템에 관한 것으로서, 상기 저장용 데이터베이스는 클러스터링된 복수 개의 저장용 데이터베이스 서버들로 구성되고, 상기 검색용 데이터베이스는 클러스터링된 복수개의 검색용 데이터베이스 서버들로 구성되고, A metadata retrieval system according to a first aspect of the present invention for achieving the above technical problem relates to a metadata retrieval system having a database management server, a storage database and a search database, wherein the storage database is clustered. It is composed of a plurality of storage database servers, the search database is composed of a plurality of clustered search database servers,

상기 데이터베이스 관리 서버는, 메타데이터에 대한 일감이 입력되면 명령어 파싱(parsing)하여 검색 업무 또는 저장 업무로 1차 분리하는 1차 부하 밸런싱 모듈; 및 저장 업무로 1차 분리된 일감을 저장하기 위하여, 상기 저장용 데이터베이스 서버들에 대한 사용 상태를 수치화하고, 상기 수치화된 점수를 이용하여 저장용 데이터베이스 서버를 선택하고, 선택된 저장용 데이터베이스 서버에 상기 저장 업무로 1차 분리된 일감을 저장하는 2차 부하 밸런싱 모듈;을 구비하여, 메타데이터의 검색 및 저장 속도를 향상시킨다. The database management server may include: a first load balancing module configured to first divide a command into a search task or a storage task by parsing a command when a task for metadata is input; And quantifying a state of use of the storage database servers to store the first separated work as a storage task, selecting a storage database server using the digitized score, and storing the selected storage database server in the selected storage database server. Secondary load balancing module for storing the first separated work as a storage task; to improve the speed of searching and storing the metadata.

전술한 제1 특징에 따른 메타데이터 검색 시스템에 있어서, 상기 2차 부하 밸런싱 모듈은, 상기 저장용 데이터베이스 서버들에 대하여, 서버의 자원 사용량을 기반으로 한 서버 시스템 점수 및 서버의 네트워크 사용률을 기반으로 한 네트워크 사용 점수를 계산하고, 서버 시스템 점수와 네트워크 사용 점수를 합한 점수가 가장 낮은 저장용 데이터베이스 서버를 선택하는 것이 바람직하다. In the metadata retrieval system according to the first aspect described above, the secondary load balancing module is configured for the storage database servers based on a server system score based on server resource usage and a server network utilization rate. It is desirable to calculate a network usage score and to select a storage database server with the lowest score of the server system score and the network usage score.

전술한 제1 특징에 따른 메타데이터 검색 시스템에 있어서, 상기 서버 시스템 점수는 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률을 이용하여 계산하되, 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률의 비중을 서로 달리하여 계산하는 것이 바람직하며, 상기 서버의 CPU 사용률은, CPU 사용량의 총합 및 CPU 코어 개수를 이용하여 계산하는 것이 바람직하다. In the metadata retrieval system according to the first aspect described above, the server system score is calculated using the CPU utilization rate, the memory utilization rate and the disk I / O utilization rate of the server, but the CPU utilization rate, the memory utilization rate and the disk I / O rate of the server are calculated. It is preferable to calculate the specific gravity of the utilization rate different from each other, and it is preferable to calculate the CPU utilization rate of the server using the total CPU usage and the number of CPU cores.

전술한 제1 특징에 따른 메타데이터 검색 시스템에 있어서, 상기 2차 부하 밸런싱 모듈은, 상기 서버 시스템 점수와 네트워크 사용 점수를 합한 점수가 사전 설정된 범위를 초과하는 경우에는 서버 선택에서 제외시키는 것이 바람직하다. In the metadata retrieval system according to the first aspect, the secondary load balancing module preferably excludes the server selection when the sum of the server system score and the network usage score exceeds a preset range. .

전술한 제1 특징에 따른 상기 메타데이터 검색 시스템에 있어서, 상기 데이터베이스 관리 서버는 저장용 데이터베이스와 검색용 데이터베이스를 실시간으로 동기화시키는 동기화 모듈을 더 구비하여, 검색용 데이터베이스의 데이터 유실을 방지하는 것이 바람직하다. In the metadata retrieval system according to the first aspect described above, the database management server further includes a synchronization module for synchronizing a storage database and a retrieval database in real time, thereby preventing data loss of the retrieval database. Do.

본 발명의 제2 특징에 따른 데이터베이스 관리 방법은, 데이터베이스 관리 서버, 클러스터링된 복수 개의 저장용 데이터베이스 서버들로 구성된 저장용 데이터베이스, 및 클러스터링된 복수 개의 검색용 데이터베이스 서버들로 구성된 검색용 데이터베이스를 구비하는 메타데이터 검색 시스템에서의 데이터베이스 관리 서버에 의한 데이터베이스 관리 방법에 관한 것으로서, (a) 메타데이터에 대한 일감이 입력되면 명령어 파싱(parsing)하여 검색 업무 또는 저장 업무로 1차 분리하는 1차 부하 밸런싱 단계; (b) 저장 업무로 1차 분리된 일감을 저장하기 위하여, 상기 저장용 데이터베이스 서버들에 대한 사용 상태를 수치화하고, 상기 수치화된 점수를 이용하여 저장용 데이터베이스 서버를 선택하고, 선택된 저장용 데이터베이스 서버에 상기 저장 업무로 1차 분리된 일감을 저장하는 2차 부하 밸런싱 단계;를 구비하여, 메타데이터의 검색 및 저장 속도를 향상시킨다. A database management method according to a second aspect of the present invention includes a database management server, a storage database composed of a plurality of clustered storage database servers, and a search database composed of a plurality of clustered search database servers. A method for managing a database by a database management server in a metadata retrieval system, the method comprising: (a) a primary load balancing step of first parsing a command into a retrieval job or a storage job when a task for metadata is input; ; (b) in order to store the primary separated work as a storage task, the usage state for the storage database servers is quantified, the storage database server is selected using the digitized score, and the selected storage database server And a second load balancing step of storing the first separated work in the storage task. In this case, the speed of searching and storing the metadata is improved.

전술한 제2 특징에 따른 데이터베이스 관리 방법에 있어서, 상기 (b) 단계는, 상기 저장용 데이터베이스 서버들에 대하여, 서버의 자원 사용량을 기반으로 한 서버 시스템 점수 및 서버의 네트워크 사용률을 기반으로 한 네트워크 사용 점수를 계산하고, 서버 시스템 점수와 네트워크 사용 점수를 합한 점수가 가장 낮은 저장용 데이터베이스 서버를 선택하는 것이 바람직하다. In the database management method according to the second aspect described above, the step (b) includes, for the storage database servers, a server system score based on server resource usage and a network based on server network utilization. It is desirable to calculate a usage score and to select a storage database server with the lowest score of the sum of the server system score and the network usage score.

전술한 제2 특징에 따른 데이터베이스 관리 방법에 있어서, 상기 서버 시스템 점수는 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률을 이용하여 계산하되, 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률의 비중을 서로 달리하여 계산하는 것이 바람직하다. In the method for managing a database according to the second aspect described above, the server system score is calculated using a CPU utilization rate, a memory utilization rate and a disk I / O utilization rate of the server, but the CPU utilization rate, the memory utilization rate and the disk I / O utilization rate of the server are calculated. It is desirable to calculate the specific gravity of different from each other.

본 발명에 따른 메타데이터 검색 시스템은 데이터 저장에 특화된 저장용 데이터베이스와 검색 엔진 기능을 갖는 검색용 데이터베이스를 구비하여 데이터 이중화를 구현함으로써, 데이터 저장 속도 및 검색 속도를 모두 향상시킬 수 있게 된다. 이러한 특징에 의해, 본 발명에 따른 시스템은 대규모 클라우드 시스템에서의 파일의 메타데이터에 대한 검색의 효율을 극대화시킬 수 있게 된다. 특히, 종래의 시스템에서는 데이터베이스가 기본 쿼리(Query)로 검색했던 것과는 달리, 본 발명에 따른 시스템은 전문 검색용 데이터베이스를 사용함으로써 빠르고 정확한 검색이 가능해진다. The metadata retrieval system according to the present invention has data storage specialized for data storage and a search database having a search engine function to implement data redundancy, thereby improving both data storage speed and retrieval speed. By this feature, the system according to the present invention can maximize the efficiency of the search for the metadata of the file in a large-scale cloud system. In particular, in the conventional system, unlike a database search using a basic query, the system according to the present invention enables a fast and accurate search by using a database for full-text search.

또한, 본 발명에 따른 시스템은 데이터 이중화가 구현됨으로써, 별도의 백업서버를 구성할 필요가 없게 된다. In addition, the system according to the present invention is implemented by data duplication, it is not necessary to configure a separate backup server.

또한, 본 발명에 따른 시스템은 2차 부하 밸런싱을 통해 메타데이터의 저장의 속도를 향상시킬 수 있을 뿐만 아니라, 저장용 데이터베이스와 검색용 데이터베이스의 실시간 동기화를 통해 저장 데이터들에 대한 안정성을 향상시킬 수 있게 된다. In addition, the system according to the present invention can not only improve the speed of storing the metadata through the secondary load balancing, but also improve the stability of the stored data through real-time synchronization of the storage database and the retrieval database. Will be.

도 1은 본 발명의 바람직한 실시예에 따른 메타데이터 검색 시스템을 개략적으로 도시한 블록도이다. 1 is a block diagram schematically illustrating a metadata retrieval system according to a preferred embodiment of the present invention.

본 발명에 따른 메타데이터 검색 시스템은 데이터베이스의 성능 및 안정성 향상을 위해 데이터 저장을 위한 저장용 데이터베이스의 클러스터링과 검색을 위한 검색용 데이터베이스의 클러스터링으로 구성되며, 1차 부하 밸런싱을 통해 검색과 저장 업무를 분리하고, 분리된 일감은 데이터베이스 서버들에 대하여 사전 수집된 정보에 따라 계산된 점수를 기반으로 한 2차 부하 밸런싱을 통해 최적의 데이터베이스 서버에 저장할 수 있도록 하는 것을 특징으로 한다. Metadata retrieval system according to the present invention is composed of the clustering of the storage database for the data storage and the clustering of the search database for the search to improve the performance and stability of the database, and performs the search and storage tasks through the first load balancing Separating and separating work can be stored in an optimal database server through secondary load balancing based on scores calculated based on pre-collected information about the database servers.

이하, 첨부된 도면을 참조하여 본 발명의 바람직한 실시예에 따른 메타데이터 검색 시스템의 구조 및 동작에 대하여 구체적으로 설명한다. Hereinafter, with reference to the accompanying drawings will be described in detail the structure and operation of the metadata retrieval system according to a preferred embodiment of the present invention.

도 1은 본 발명의 바람직한 실시예에 따른 메타데이터 검색 시스템을 개략적으로 도시한 블록도이다. 1 is a block diagram schematically illustrating a metadata retrieval system according to a preferred embodiment of the present invention.

도 1을 참조하면, 본 발명의 바람직한 실시예에 따른 메타데이터 검색 시스템(1)은 데이터베이스 관리 서버(10), 저장용 데이터베이스(20) 및 검색용 데이터베이스(30)를 구비한다. 전술한 구성을 갖는 메타데이터 검색 시스템(1)은 메타데이터의 검색 및 저장 속도를 향상시킬 수 있게 된다. Referring to FIG. 1, a metadata search system 1 according to a preferred embodiment of the present invention includes a database management server 10, a storage database 20, and a search database 30. The metadata retrieval system 1 having the above-described configuration can improve the retrieval and storage speed of metadata.

일반적으로 저장용 데이터베이스는 안정적인 저장 성능을 제공하나 별도의 검색 엔진 지원이 불가하여 신속한 메타데이터 검색에 어려움이 있다. 이에 따라, 본 발명에 따른 시스템은 메타데이터의 효율적인 검색 및 사용을 위하여 검색 엔진 기능을 갖는 검색용 데이터베이스를 구비하게 된다. 이러한 구조를 통해, 본 발명에 따른 시스템은, 메타데이터의 쓰기와 읽기 기능에 대한 부하 분산을 통해 서버의 가용성 및 응답 시간을 최적화시킬 수 있게 된다. In general, the storage database provides stable storage performance, but it is difficult to search metadata quickly because it cannot support a separate search engine. Accordingly, the system according to the present invention has a search database having a search engine function for efficient search and use of metadata. Through this structure, the system according to the present invention can optimize the availability and response time of the server through load balancing for the writing and reading functions of metadata.

상기 저장용 데이터베이스(20)는 클러스터링된 복수 개의 저장용 데이터베이스 서버들(200, 210, 220)로 구성되고, 상기 검색용 데이터베이스(30)는 검색 엔진(32) 및 클러스터링된 복수개의 검색용 데이터베이스 서버들(300, 310, 320)로 구성된다. The storage database 20 is composed of a plurality of clustered storage database servers 200, 210, and 220, and the search database 30 is a search engine 32 and a plurality of clustered search database servers. Fields 300, 310, and 320.

특히, 클라우드 컴퓨팅용 분산 데이터 파일의 효율적인 관리를 위하여 분산 데이터 파일의 메타데이터를 관리할 필요가 있다. 분산 데이터 파일의 메타데이터는 특성상, 정형화된 구조(Schema)을 갖는 기존의 데이터베이스보다는, 다양한 형식과 그에 따른 다양한 메타데이터가 저장될 수 있는 비정형 데이터 저장에 특화된 데이터베이스를 사용하는 것이 바람직하다. 비정형 데이터 저장에 특화된 데이터베이스로는 NoSQL 데이터베이스 등이 있다. 따라서, 본 발명에 따른 시스템은 저장용 데이터베이스로는 NoSQL 데이터베이스 등과 같은 비정형 데이터 저장에 특화된 데이터베이스를 사용하고, 저장용 데이터베이스의 검색 성능을 보완하기 위하여 검색 엔진 기능을 갖는 검색용 데이터베이스를 연동함으로써, 데이터 이중화화 함께 검색 성능도 향상시킬 수 있게 된다. In particular, for efficient management of distributed data files for cloud computing, it is necessary to manage metadata of distributed data files. It is preferable that the metadata of the distributed data file use a database specialized for storing unstructured data in which various formats and various metadata can be stored, rather than an existing database having a structured structure (Schema). Databases specialized in storing unstructured data include NoSQL databases. Accordingly, the system according to the present invention uses a database specialized for storing unstructured data, such as a NoSQL database, as a storage database, and interlocks a search database having a search engine function to supplement the search performance of the storage database. Along with redundancy, search performance can also be improved.

상기 데이터베이스 관리 서버(10)는 1차 부하 밸런싱 모듈(100), 2차 부하 밸런싱 모듈(110) 및 동기화 모듈(120)을 구비한다.The database management server 10 includes a primary load balancing module 100, a secondary load balancing module 110, and a synchronization module 120.

상기 동기화 모듈(120)은 저장용 데이터베이스와 검색용 데이터베이스를 실시간으로 동기화시키는 모듈로서, 검색용 데이터베이스를 저장용 데이버베이스와 실시간으로 동기화시킴으로써 검색용 데이터베이스의 데이터 유실을 방지하게 된다. The synchronization module 120 is a module for synchronizing the storage database and the search database in real time, thereby preventing data loss of the search database by synchronizing the search database with the storage database in real time.

상기 1차 부하 밸런싱 모듈(100)은 메타데이터의 검색 또는 저장 등과 같은 일감(Work)이 입력되면 명령어 파싱(parsing)하여 해당 일감이 검색 업무 및 저장 업무 중 하나로 1차 분리한다.  The primary load balancing module 100 first parses a task into one of a search task and a storage task by parsing a command when a task such as a search or storage of metadata is input.

상기 2차 부하 밸런싱 모듈(11)은, 저장 업무로 1차 분리된 일감을 저장하기 위한 저장용 데이터베이스 서버를 선택하는 모듈로서, 상기 저장용 데이터베이스 서버들에 대한 사용 상태를 수치화하고, 상기 수치화된 점수를 이용하여 저장용 데이터베이스 서버를 선택하고, 선택된 저장용 데이터베이스 서버에 상기 저장 업무로 1차 분리된 일감을 저장하게 된다. 이와 같이, 본 발명에 따른 시스템은, 1차 분리된 일감을 미리 수집한 각각의 데이터베이스 서버들의 CPU 및 RAM 사용률 등을 바탕으로 2차 부하 밸런싱(Load Balancing)함으로써, 최적의 저장용 데이터베이스에 전달 및 저장시킬 수 있게 된다. The secondary load balancing module 11 is a module for selecting a storage database server for storing a primary separated work as a storage task, and quantifies the use state of the storage database servers, The storage database server is selected using the scores, and the first separated work is stored as the storage task in the selected storage database server. As described above, the system according to the present invention is transferred to an optimal storage database by performing secondary load balancing on the basis of CPU and RAM utilization rates of the respective database servers that have collected the first separated work in advance. You can save it.

상기 2차 부하 밸런싱 모듈은, 클러스터링된 상기 저장용 데이터베이스 서버들에 대하여, 서버의 현재 상태 정보에 따른 자원 사용량을 기반으로 한 서버 시스템 점수 및 서버의 네트워크 사용률을 기반으로 한 네트워크 사용 점수를 계산하고, 서버 시스템 점수와 네트워크 사용 점수를 합한 점수가 가장 낮은 저장용 데이터베이스 서버를 선택하게 된다. The secondary load balancing module calculates, for the clustered storage database servers, a server system score based on resource usage according to the current state information of the server and a network usage score based on the network utilization of the server. In this case, the server database score and the network usage score are selected as the lowest storage database server.

상기 서버 시스템 점수는 서버의 CPU 사용률(A), 메모리 사용률(B) 및 디스크 I/O 사용률(C)을 이용하여 계산하되, 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률의 비중을 서로 달리하여 계산하는 것이 바람직하다. The server system score is calculated using the CPU utilization rate (A), memory utilization rate (B) and disk I / O utilization rate (C) of the server, but the ratios of the CPU utilization rate, the memory utilization rate and the disk I / O utilization rate of the server are different from each other. It is desirable to calculate otherwise.

상기 서버의 CPU 사용량 점수는 CPU 사용률로서, 수학식 1과 같이 표현되며, 여기서, α는 CPU 사용량의 총합(단위 %)이며 β는 CPU 코어 개수이며, 전체적인 안정적인 운영을 위해 CPU의 사용량을 최대 70%로 설정하는 것이 바람직하다. The CPU usage score of the server is a CPU utilization rate, which is expressed as in Equation 1, wherein α is the sum of CPU usage (%), β is the number of CPU cores, and the maximum CPU usage is 70 for overall stable operation. It is preferable to set it to%.

Figure 112018104175113-pat00001
Figure 112018104175113-pat00001

네트워크 사용량을 제외한 서버 시스템 점수는 CPU 사용률(A)의 40%, 메모리 사용률(B)의 40%, 디스크 I/O 사용률(C)의 20%를 반영하여 수학식 2와 같이 계산할 수 있다. The server system score excluding network usage may be calculated as shown in Equation 2 by reflecting 40% of CPU utilization (A), 40% of memory usage (B), and 20% of disk I / O utilization (C).

Figure 112018104175113-pat00002
Figure 112018104175113-pat00002

전술한 수학식들을 토대로 하여 계산된 서버 시스템 점수와 네트워크 사용률을 합한 총점수(K)를 기반으로 하여 데이터베이스 서버의 사용 가능 여부를 판단하게 되며, 상기 총점수(K)가 가장 낮은 점수를 갖는 데이터베이스 서버를 현재 가장 최적화된 데이터베이스 서버로 판단하게 된다. 만약, 0 < K < 50 인 경우 서버의 상태가 가장 우수하며, 50 < K < 150 인 경우 서버의 상태가 양호하며, 150 < K < 200 인 경우 서버의 상태가 나쁜 것을 의미한다. 서버의 상태가 나쁜 것으로 판단된 경우, 서버 선정에서 제외시키는 것이 바람직하다. The availability of the database server is determined based on the total score (K) obtained by adding the server system score and the network utilization calculated based on the above equations, and the database having the lowest score is the total score (K). The server will be determined to be the most optimized database server. If 0 <K <50, the state of the server is the best. If 50 <K <150, the state of the server is good. If 150 <K <200, the state of the server is bad. If it is determined that the state of the server is bad, it is desirable to exclude it from server selection.

이상에서 본 발명에 대하여 그 바람직한 실시예를 중심으로 설명하였으나, 이는 단지 예시일 뿐 본 발명을 한정하는 것이 아니며, 본 발명이 속하는 분야의 통상의 지식을 가진 자라면 본 발명의 본질적인 특성을 벗어나지 않는 범위에서 이상에 예시되지 않은 여러 가지의 변형과 응용이 가능함을 알 수 있을 것이다. 그리고, 이러한 변형과 응용에 관계된 차이점들은 첨부된 청구 범위에서 규정하는 본 발명의 범위에 포함되는 것으로 해석되어야 할 것이다. Although the present invention has been described above with reference to preferred embodiments thereof, this is merely an example and is not intended to limit the present invention, and those skilled in the art do not depart from the essential characteristics of the present invention. It will be appreciated that various modifications and applications which are not illustrated above in the scope are possible. And differences relating to such modifications and applications should be construed as being included in the scope of the invention as defined in the appended claims.

1 : 메타데이터 검색 시스템
10 : 데이터베이스 관리 서버
20 : 저장용 데이터베이스
30 : 검색용 데이터베이스
100 : 1차 부하 밸런싱 모듈
110 : 2차 부하 밸런싱 모듈
120 : 동기화 모듈
1: metadata retrieval system
10: database management server
20: database for storage
30: database for search
100: primary load balancing module
110: secondary load balancing module
120: synchronization module

Claims (10)

데이터베이스 관리 서버, 저장용 데이터베이스와 검색용 데이터베이스를 구비하는 메타데이터 검색 시스템에 있어서,
상기 저장용 데이터베이스는 클러스터링된 복수 개의 저장용 데이터베이스 서버들로 구성되고,
상기 검색용 데이터베이스는 클러스터링된 복수개의 검색용 데이터베이스 서버들로 구성되고,
상기 데이터베이스 관리 서버는,
메타데이터에 대한 일감이 입력되면 명령어 파싱(parsing)하여 검색 업무 또는 저장 업무로 1차 분리하는 1차 부하 밸런싱 모듈; 및
저장 업무로 1차 분리된 일감을 저장하기 위하여, 상기 저장용 데이터베이스 서버들에 대한 사용 상태를 수치화하고, 상기 수치화된 점수를 이용하여 저장용 데이터베이스 서버를 선택하고, 선택된 저장용 데이터베이스 서버에 상기 저장 업무로 1차 분리된 일감을 저장하는 2차 부하 밸런싱 모듈;
을 구비하여, 메타데이터의 검색 및 저장 속도를 향상시키는 것을 특징으로 하는 메타데이터 검색 시스템.
A metadata retrieval system having a database management server, a storage database and a retrieval database,
The storage database is composed of a plurality of clustered storage database servers,
The search database is composed of a plurality of search database servers clustered,
The database management server,
A first load balancing module for parsing an instruction into a search task or a storage task if a task for metadata is input; And
In order to store the first separated work as a storage task, the usage state of the storage database servers is quantified, the storage database server is selected using the digitized score, and the storage is stored in the selected storage database server. A secondary load balancing module for storing work separated from the first work;
Providing, to improve the speed of searching and storing the metadata metadata search system.
제1항에 있어서, 상기 2차 부하 밸런싱 모듈은,
상기 저장용 데이터베이스 서버들에 대하여, 서버의 자원 사용량을 기반으로 한 서버 시스템 점수 및 서버의 네트워크 사용률을 기반으로 한 네트워크 사용 점수를 계산하고,
서버 시스템 점수와 네트워크 사용 점수를 합한 점수가 가장 낮은 저장용 데이터베이스 서버를 선택하는 것을 특징으로 하는 메타데이터 검색 시스템.
The method of claim 1, wherein the secondary load balancing module,
For the storage database servers, calculate the server system score based on the server resource usage and the network usage score based on the network utilization of the server,
A metadata retrieval system characterized by selecting a database server for storage having the lowest sum of server system score and network usage score.
제2항에 있어서, 상기 서버 시스템 점수는 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률을 이용하여 계산하는 것을 특징으로 하는 메타데이터 검색 시스템. 3. The metadata retrieval system of claim 2, wherein the server system score is calculated using a CPU utilization rate, a memory utilization rate and a disk I / O utilization rate of the server. 제3항에 있어서, 상기 서버 시스템 점수를 계산함에 있어서, 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률의 비중을 서로 달리하여 계산하는 것을 특징으로 하는 메타데이터 검색 시스템. 4. The metadata retrieval system of claim 3, wherein in calculating the server system score, different weights of CPU utilization, memory utilization, and disk I / O utilization of the server are calculated. 제3항에 있어서, 상기 서버의 CPU 사용률은, CPU 사용량의 총합 및 CPU 코어 개수를 이용하여 계산하는 것을 특징으로 하는 메타데이터 검색 시스템. 4. The metadata retrieval system according to claim 3, wherein the CPU usage rate of the server is calculated using the total CPU usage and the number of CPU cores. 제2항에 있어서, 상기 2차 부하 밸런싱 모듈은,
상기 서버 시스템 점수와 네트워크 사용 점수를 합한 점수가 사전 설정된 범위를 초과하는 경우에는 서버 선택에서 제외시키는 것을 특징으로 하는 메타데이터 검색 시스템.
The method of claim 2, wherein the secondary load balancing module,
And when the sum of the server system score and the network usage score exceeds the preset range, exclude the server selection.
제1항에 있어서, 상기 데이터베이스 관리 서버는,
저장용 데이터베이스와 검색용 데이터베이스를 실시간으로 동기화시키는 동기화 모듈을 더 구비하여, 검색용 데이터베이스의 데이터 유실을 방지하는 것을 특징으로 하는 메타데이터 검색 시스템.
The method of claim 1, wherein the database management server,
And a synchronization module for synchronizing the storage database and the search database in real time, thereby preventing data loss of the search database.
데이터베이스 관리 서버, 클러스터링된 복수 개의 저장용 데이터베이스 서버들로 구성된 저장용 데이터베이스, 및 클러스터링된 복수 개의 검색용 데이터베이스 서버들로 구성된 검색용 데이터베이스를 구비하는 메타데이터 검색 시스템에서의 데이터베이스 관리 서버에 의한 데이터베이스 관리 방법에 있어서,
(a) 메타데이터에 대한 일감이 입력되면 명령어 파싱(parsing)하여 검색 업무 또는 저장 업무로 1차 분리하는 1차 부하 밸런싱 단계;
(b) 저장 업무로 1차 분리된 일감을 저장하기 위하여, 상기 저장용 데이터베이스 서버들에 대한 사용 상태를 수치화하고, 상기 수치화된 점수를 이용하여 저장용 데이터베이스 서버를 선택하고, 선택된 저장용 데이터베이스 서버에 상기 저장 업무로 1차 분리된 일감을 저장하는 2차 부하 밸런싱 단계;
를 구비하여, 메타데이터의 검색 및 저장 속도를 향상시키는 것을 특징으로 하는 메타데이터 검색 시스템에서의 데이터베이스 관리 방법.
Database management by a database management server in a metadata retrieval system having a database management server, a storage database composed of a plurality of clustered storage database servers, and a search database composed of a plurality of clustered search database servers. In the method,
(a) a first load balancing step of first parsing an instruction into a search task or a storage task if a task for metadata is input;
(b) in order to store the primary separated work as a storage task, the usage state for the storage database servers is quantified, the storage database server is selected using the digitized score, and the selected storage database server A second load balancing step of storing a first separated work in the storage task in the second work;
The method for managing a database in a metadata retrieval system, comprising: improving a retrieval and storage speed of metadata.
제8항에 있어서, 상기 (b) 단계는,
상기 저장용 데이터베이스 서버들에 대하여, 서버의 자원 사용량을 기반으로 한 서버 시스템 점수 및 서버의 네트워크 사용률을 기반으로 한 네트워크 사용 점수를 계산하고,
서버 시스템 점수와 네트워크 사용 점수를 합한 점수가 가장 낮은 저장용 데이터베이스 서버를 선택하는 것을 특징으로 하는 메타데이터 검색 시스템의 데이터베이스 관리 방법.
According to claim 8, wherein step (b),
For the storage database servers, calculate the server system score based on the server resource usage and the network usage score based on the network utilization of the server,
A method for managing a database of a metadata retrieval system, characterized by selecting a storage database server having the lowest sum of a server system score and a network usage score.
제9항에 있어서, 상기 서버 시스템 점수는 서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률을 이용하여 계산하되,
서버의 CPU 사용률, 메모리 사용률 및 디스크 I/O 사용률의 비중을 서로 달리하여 계산하는 것을 특징으로 하는 메타데이터 검색 시스템의 데이터베이스 관리방법.

10. The method of claim 9, wherein the server system score is calculated using CPU utilization, memory utilization and disk I / O utilization of the server,
A method for managing a database of a metadata retrieval system, characterized by calculating different ratios of CPU utilization, memory utilization, and disk I / O utilization of a server.

KR1020180126190A 2018-10-22 2018-10-22 Metadata search system by using dual load balancing and database management method by using dual load balancing KR102047233B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020180126190A KR102047233B1 (en) 2018-10-22 2018-10-22 Metadata search system by using dual load balancing and database management method by using dual load balancing

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180126190A KR102047233B1 (en) 2018-10-22 2018-10-22 Metadata search system by using dual load balancing and database management method by using dual load balancing

Publications (1)

Publication Number Publication Date
KR102047233B1 true KR102047233B1 (en) 2019-11-21

Family

ID=68692133

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180126190A KR102047233B1 (en) 2018-10-22 2018-10-22 Metadata search system by using dual load balancing and database management method by using dual load balancing

Country Status (1)

Country Link
KR (1) KR102047233B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021229292A1 (en) * 2020-05-12 2021-11-18 Coupang Corp. Systems and methods for reducing database query latency

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100037401A (en) 2008-10-01 2010-04-09 엔에이치엔(주) Method and apparatus for managing search database
KR20100048130A (en) * 2008-10-30 2010-05-11 주식회사 케이티 Distributed storage system based on metadata cluster and method thereof
US20140222871A1 (en) * 2011-12-29 2014-08-07 Teradata Us, Inc. Techniques for data assignment from an external distributed file system to a database management system
US20150127625A1 (en) * 2011-04-26 2015-05-07 Brian J. Bulkowski Cluster-node load balancing in a distributed database system
KR101566884B1 (en) * 2014-05-22 2015-11-06 주식회사 아이온커뮤니케이션즈 Distribution store system for managing unstructured data
JP2017507424A (en) * 2014-02-19 2017-03-16 スノーフレーク コンピューティング インク.Snowflake Computing Inc. Data management system and method
KR20180046078A (en) * 2016-10-27 2018-05-08 삼성에스디에스 주식회사 Database rebalancing method

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20100037401A (en) 2008-10-01 2010-04-09 엔에이치엔(주) Method and apparatus for managing search database
KR20100048130A (en) * 2008-10-30 2010-05-11 주식회사 케이티 Distributed storage system based on metadata cluster and method thereof
US20150127625A1 (en) * 2011-04-26 2015-05-07 Brian J. Bulkowski Cluster-node load balancing in a distributed database system
US20140222871A1 (en) * 2011-12-29 2014-08-07 Teradata Us, Inc. Techniques for data assignment from an external distributed file system to a database management system
JP2017507424A (en) * 2014-02-19 2017-03-16 スノーフレーク コンピューティング インク.Snowflake Computing Inc. Data management system and method
KR101566884B1 (en) * 2014-05-22 2015-11-06 주식회사 아이온커뮤니케이션즈 Distribution store system for managing unstructured data
KR20180046078A (en) * 2016-10-27 2018-05-08 삼성에스디에스 주식회사 Database rebalancing method

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021229292A1 (en) * 2020-05-12 2021-11-18 Coupang Corp. Systems and methods for reducing database query latency
KR20210138455A (en) * 2020-05-12 2021-11-19 쿠팡 주식회사 Systems and methods for reducing database query latency
US11210288B2 (en) 2020-05-12 2021-12-28 Coupang Corp. Systems and methods for reducing database query latency
US11681701B2 (en) 2020-05-12 2023-06-20 Coupang Corp. Systems and methods for reducing database query latency

Similar Documents

Publication Publication Date Title
US9514188B2 (en) Integrating map-reduce into a distributed relational database
US9507875B2 (en) Symbolic hyper-graph database
US20170357653A1 (en) Unsupervised method for enriching rdf data sources from denormalized data
JP6281225B2 (en) Information processing device
EP3516539B1 (en) Techniques for in-memory key range searches
US9753960B1 (en) System, method, and computer program for dynamically generating a visual representation of a subset of a graph for display, based on search criteria
US7953727B2 (en) Handling requests for data stored in database tables
US8880463B2 (en) Standardized framework for reporting archived legacy system data
US20170344546A1 (en) Code dispersion hash table-based map-reduce system and method
CN102722553A (en) Distributed type reverse index organization method based on user log analysis
Chen et al. SparkRDF: elastic discreted RDF graph processing engine with distributed memory
US11080207B2 (en) Caching framework for big-data engines in the cloud
US10783127B2 (en) Componentized data storage
CN110232106A (en) A kind of mass data storage and method for quickly retrieving based on MongoDB and Solr
CN116992887A (en) Metadata data catalog processing method, device and processing equipment
KR102047233B1 (en) Metadata search system by using dual load balancing and database management method by using dual load balancing
US20170270149A1 (en) Database systems with re-ordered replicas and methods of accessing and backing up databases
CN109992575B (en) Distributed storage system for big data
CN108121807B (en) Method for realizing multi-dimensional Index structure OBF-Index in Hadoop environment
JP2011216029A (en) Distributed memory database system, database server, data processing method, and program thereof
GB2520993A (en) Indexing presentation slides
CN111309704B (en) Database operation method and database operation system
CN109657060B (en) Safety production accident case pushing method and system
CN105912877A (en) Data processing method of medicine product
US11841857B2 (en) Query efficiency using merged columns

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant