KR20190134115A - 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램 - Google Patents

효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램 Download PDF

Info

Publication number
KR20190134115A
KR20190134115A KR1020180059336A KR20180059336A KR20190134115A KR 20190134115 A KR20190134115 A KR 20190134115A KR 1020180059336 A KR1020180059336 A KR 1020180059336A KR 20180059336 A KR20180059336 A KR 20180059336A KR 20190134115 A KR20190134115 A KR 20190134115A
Authority
KR
South Korea
Prior art keywords
index structure
sub
index
level
value
Prior art date
Application number
KR1020180059336A
Other languages
English (en)
Inventor
이주현
Original Assignee
주식회사 티맥스데이터
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 티맥스데이터 filed Critical 주식회사 티맥스데이터
Priority to KR1020180059336A priority Critical patent/KR20190134115A/ko
Priority to US16/019,694 priority patent/US10860561B2/en
Publication of KR20190134115A publication Critical patent/KR20190134115A/ko
Priority to US17/090,441 priority patent/US11468027B2/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/30Monitoring
    • G06F11/3003Monitoring arrangements specially adapted to the computing system or computing system component being monitored
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2237Vectors, bitmaps or matrices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2228Indexing structures
    • G06F16/2246Trees, e.g. B+trees
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/901Indexing; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 개시내용의 일 실시예에 따라 데이터베이스 관리 시스템(DBMS)에서 수행되는 방법이 제공된다. 상기 방법은 데이터베이스 관리 시스템에서의 모니터링 알고리즘에 따른 모니터링 결과 정보에 기초하여, 데이터 저장 위치를 포인팅하기 위한 데이터베이스 인덱스 구조를 생성하는 단계를 포함할 수 있다. 데이터베이스 인덱스 구조는, 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 적어도 부분적으로 포함하며, 제 2 레벨의 서브 인덱스 구조는 복수의 컬럼들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우에 대응되는 ROWID 값들을 포함하며, 그리고 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화 인덱스 값들을 포함할 수 있다.

Description

효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램 {METHOD AND APPARATUS FOR PROVIDING EFFICIENT INDEXING AND COMPUTER PROGRAM INCLUDED IN COMPUTER READABLE MEDIUM THEREFOR}
본 개시내용은 데이터베이스 인덱싱 기법에 관한 것으로서, 보다 구체적으로 DB 성능을 향상시키기 위한 인덱스 생성 기법에 관한 것이다.
기업의 비즈니스는 폭발적인 데이터의 증가와 다양한 환경 및 플랫폼의 등장으로 빠르게 확장되고 있다. 새로운 비즈니스 환경이 도래함에 따라서, 보다 더 효율적이고 유연한 데이터 서비스와 정보의 처리, 데이터 관리 기능이 필요하게 되었다. 이러한 변화에 맞춰서 기업 비지니스 구현의 기반이되는 고성능, 고가용성 및 확장성의 문제를 해결하기 위한 데이터베이스에 대한 연구가 계속되고 있다.
데이터베이스 관리 시스템(DBMS)에서 데이터들은 데이터 저장소에 저장될 수 있다. 관계형 데이터베이스 관리 시스템(RDBMS)에서는 이러한 데이터 저장소는 테이블로 지칭될 수 있다. 이러한 테이블은 하나 이상의 로우(row)들을 포함하고 하나 이상의 로우들 각각은 하나 이상의 컬럼들을 포함할 수 있다.
데이터베이스가 수많은 양의 데이터를 포함하고 있는 경우, 사용자가 관심있어 하는 데이터를 리트리브하기 위한 쿼리를 수행하는데 있어서 상대적으로 긴 시간이 소요될 수 있다. 데이터베이스가 쿼리에 응답하는데 시간이 많이 소요되는 경우에는 데이터베이스의 성능에 있어서 악영향을 미칠 수 있다. 따라서, 해당 기술 분야에서는 쿼리에 응답하는데 처리되는 시간을 줄이기 위한, 즉, 데이터베이스 관리 시스템의 성능을 증대시키기 위한, 다양한 기법들이 연구되고 있다.
데이터베이스로부터의 데이터 리트리브 속도를 증대시키는데 있어서, 인덱싱 기법이 활용될 수 있다. 이러한 인덱스는 데이터베이스 분야에 있어서 테이블에 대한 동작 속도를 높여주는 데이터 구조를 의미할 수 있다. 인덱스를 사용하는 경우, 데이터 리트리브에 소요되는 시간을 줄여줄 뿐만 아니라 데이터 리트리브에 소모되는 자원의 양 또한 감소시킬 수 있다.
일반적으로 인덱스 구조는 트리 구조로 이루어져 있다. 트리 구조는 그래프의 일종으로 노드(node)와 노드를 가리키는 포인터로 구성되어있다. 여러 노드가 한 노드를 가리킬 수 없지만 한 노드가 여러 노드를 가리킬 수는 있다. 방대한 양의 저장된 자료를 검색해야 하는 경우 자료를 일일히 비교하는 방식은 비효율적이다. 트리 구조를 이용하여 인덱싱을 하여 자료를 정렬된 상태로 보관하면 효율적으로 자료를 검색할 수 있다. 트래버스(traverse)는 인덱스를 탐색하는 일련의 과정을 의미한다. 트래버스는 루트 노드에서 시작하여 탐색 대상의 값과 구분 값을 비교하여 다음 포인터를 찾아나가는 과정으로 진행된다. 트래버스를 통해 탐색 대상의 값에 해당하는 인덱스를 발견하면 트래버스는 종료된다.
인덱스는 크게 B+트리(Balanced Tree) 인덱스 및 비트맵(bitmap) 인덱스로 분류될 수 있다.
B+트리 인덱스는 루트(root) 블록, 브랜치(branch) 블록 및 리프(leaf) 블록으로의 계층형태의 인덱스 기법을 의미할 수 있다. B+트리 인덱스에서, 리프 블록이 데이터 블록의 해당 로우에 접근할 수 있는 ROWID를 가지고 있으며 그리고 브랜치 블록 및 루트 블록은 각 하위 단계에 접근할 수 있는 키값(예컨대, 블록의 주소값)을 가지고 있다.
비트맵 인덱스는 컴퓨터에서 사용하는 최소 단위인 비트를 이용하여 컬럼값을 저장하고 이를 이용하여 ROWID를 자동으로 생성하는 인덱스 기법을 의미할 수 있다.
B+트리 인덱싱 기법 및 비트맵 인덱싱 기법 각각은 그 구조적 특성으로 인하여 장점 및 단점이 존재할 수 있다. 따라서, 방대한 데이터를 처리하는 상황에서 DBMS의 성능을 향상시키기 위한 효율적인 인덱싱 기법에 대한 당업계의 수요가 존재한다.
(1) 미국 등록 특허 US5903888 (2) 미국 등록 특허 US6278992 (3) 일본 특허 공보 JP2004326404
본 개시내용의 목적은, 전술한 당업계에서의 수요를 충족시키기 위해, DBMS에서의 쿼리 처리 시간을 축소시키기 위함이다.
본 개시내용의 목적은, 전술한 당업계에서의 수요를 충족시키기 위하여, DBMS에서 효율적인 인덱싱 기법을 제공하기 위함이다.
본 개시내용의 일 실시예에 따라, 인코딩된 명령들을 포함하는 컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서들에 의해 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 데이터의 검색 성능을 향상시키기 위하여 이하의 동작을 수행하도록 하며, 상기 동작은: 데이터베이스 관리 시스템(DBMS)에서의 모니터링 알고리즘에 따른 모니터링 결과 정보에 기초하여, 데이터 저장 위치를 포인팅(pointing)하기 위한 데이터베이스 인덱스 구조를 생성하는 동작을 포함할 수 있다. 데이터베이스 인덱스 구조는, 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 적어도 부분적으로 포함하며, 제 2 레벨의 서브 인덱스 구조는 복수의 컬럼(column)들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우(row)에 대응되는 ROWID 값들을 포함하며, 그리고 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화(optimized) 인덱스 값들을 포함할 수 있다.
본 개시내용의 일 실시예에 따라, 데이터베이스 관리 시스템(DBMS)에서 수행되는 방법이 제공된다. 상기 방법은, 데이터베이스 관리 시스템에서의 모니터링 알고리즘에 따른 모니터링 결과 정보에 기초하여, 데이터 저장 위치를 포인팅하기 위한 데이터베이스 인덱스 구조를 생성하는 단계를 포함할 수 있다. 데이터베이스 인덱스 구조는, 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 적어도 부분적으로 포함하며, 제 2 레벨의 서브 인덱스 구조는 복수의 컬럼들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우에 대응되는 ROWID 값들을 포함하며, 그리고 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화 인덱스 값들을 포함할 수 있다.
본 개시내용의 일 실시예에 따른 데이터베이스 관리 장치가 개시된다. 상기 데이터베이스 관리 장치는 데이터베이스 관리 시스템(DBMS)에서의 모니터링 알고리즘에 따른 모니터링 결과 정보에 기초하여, 데이터 저장 위치를 포인팅하기 위한 데이터베이스 인덱스 구조를 생성하는 프로세서; 및 상기 생성된 데이터베이스 인덱스 구조를 저장하는 저장부를 포함할 수 있다. 데이터베이스 인덱스 구조는, 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 적어도 부분적으로 포함하며, 제 2 레벨의 서브 인덱스 구조는 복수의 컬럼들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며, 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우에 대응되는 ROWID 값들을 포함하며, 그리고 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화 인덱스 값들을 포함할 수 있다.
본 개시내용의 일 실시예에 따라서 DBMS에서의 쿼리 처리 시간이 축소될 수 있다.
본 개시내용의 일 실시예에 따라서, DBMS에서 효율적인 인덱싱 기법이 제공될 수 있다.
다양한 양상들이 이제 도면들을 참조로 기재되며, 여기서 유사한 참조 번호들은 총괄적으로 유사한 구성요소들을 지칭하는데 이용된다. 이하의 실시예에서, 설명 목적을 위해, 다수의 특정 세부사항들이 하나 이상의 양상들의 총체적 이해를 제공하기 위해 제시된다. 그러나, 그러한 양상(들)이 이러한 특정 세부사항들 없이 실시될 수 있음은 명백할 것이다. 다른 예시들에서, 공지의 구조들 및 장치들이 하나 이상의 양상들의 기재를 용이하게 하기 위해 블록도 형태로 도시된다.
도 1은 본 개시내용의 일 실시예에 따른 데이터베이스 관리 장치 및 클라이언트에 대한 개략도를 도시한다.
도 2는 본 개시내용의 일 실시예에 따른 DBMS에 대한 블록 구성도를 도시한다.
도 3은 본 개시내용의 일 실시예에 따른 데이터베이스 관리 장치의 블록 구성도를 도시한다.
도 4는 본 개시내용의 일 실시예에 따른 데이터베이스 인덱스 구조를 예시적으로 도시한다.
도 5는 본 개시내용의 일 실시예에 따라 파티션 단위로 상이한 데이터베이스 인덱스 구조를 예시적으로 도시한다.
도 6은 본 개시내용의 일 실시예에 따라, 효율적인 인덱싱을 수행하기 위한 순서도를 예시적으로 도시한다.
도 7은 본 개시내용의 일 실시예에 따라, 효율적인 인덱싱을 수행하기 위한 수단, 로직 및 모듈을 예시적으로 도시한다.
도 8은 본 발명의 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
다양한 실시예들 및/또는 양상들이 이제 도면들을 참조하여 개시된다. 하기 설명에서는 설명을 목적으로, 하나 이상의 양상들의 전반적 이해를 돕기 위해 다수의 구체적인 세부사항들이 개시된다. 그러나, 이러한 양상(들)은 이러한 구체적인 세부사항들 없이도 실행될 수 있다는 점 또한 본 발명의 기술 분야에서 통상의 지식을 가진 자에게 인식될 수 있을 것이다. 이후의 기재 및 첨부된 도면들은 하나 이상의 양상들의 특정한 예시적인 양상들을 상세하게 기술한다. 하지만, 이러한 양상들은 예시적인 것이고 다양한 양상들의 원리들에서의 다양한 방법들 중 일부가 이용될 수 있으며, 기술되는 설명들은 그러한 양상들 및 그들의 균등물들을 모두 포함하고자 하는 의도이다.
또한, 다양한 양상들 및 특징들이 다수의 디바이스들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있는 시스템에 의하여 제시될 것이다. 다양한 시스템들이, 추가적인 장치들, 컴포넌트들 및/또는 모듈들 등을 포함할 수 있다는 점 그리고/또는 도면들과 관련하여 논의된 장치들, 컴포넌트들, 모듈들 등 전부를 포함하지 않을 수도 있다는 점 또한 이해되고 인식되어야 한다.
본 명세서에서 사용되는 "실시예", "예", "양상", "예시" 등은 기술되는 임의의 양상 또는 설계가 다른 양상 또는 설계들보다 양호하다거나, 이점이 있는 것으로 해석되지 않을 수도 있다. 아래에서 사용되는 용어들 '컴포넌트', '모듈', '시스템', '인터페이스' 등은 일반적으로 컴퓨터 관련 엔티티(computer-related entity)를 의미하며, 예를 들어, 하드웨어, 하드웨어와 소프트웨어의 조합, 소프트웨어를 의미할 수 있다.
더불어, 용어 "또는"은 배타적 "또는"이 아니라 내포적 "또는"을 의미하는 것으로 의도된다. 즉, 달리 특정되지 않거나 문맥상 명확하지 않은 경우에, "X는 A 또는 B를 이용한다"는 자연적인 내포적 치환 중 하나를 의미하는 것으로 의도된다. 즉, X가 A를 이용하거나; X가 B를 이용하거나; 또는 X가 A 및 B 모두를 이용하는 경우, "X는 A 또는 B를 이용한다"가 이들 경우들 어느 것으로도 적용될 수 있다. 또한, 본 명세서에 사용된 "및/또는"이라는 용어는 열거된 관련 아이템들 중 하나 이상의 아이템의 가능한 모든 조합을 지칭하고 포함하는 것으로 이해되어야 한다.
또한, "포함한다" 및/또는 "포함하는"이라는 용어는, 해당 특징 및/또는 구성요소가 존재함을 의미하지만, 하나 이상의 다른 특징, 구성요소 및/또는 이들의 그룹의 존재 또는 추가를 배제하지 않는 것으로 이해되어야 한다. 또한, 달리 특정되지 않거나 단수 형태를 지시하는 것으로 문맥상 명확하지 않은 경우에, 본 명세서와 청구범위에서 단수는 일반적으로 "하나 또는 그 이상"을 의미하는 것으로 해석되어야 한다.
본 명세서에서 사용되는 용어 "컴포넌트", "모듈", "시스템" 등은 컴퓨터-관련 엔티티, 하드웨어, 펌웨어, 소프트웨어, 소프트웨어 및 하드웨어의 조합, 또는 소프트웨어의 실행을 지칭한다. 예를 들어, 컴포넌트는 프로세서상에서 실행되는 처리과정, 프로세서, 객체, 실행 스레드, 프로그램, 및/또는 컴퓨터일 수 있지만, 이들로 제한되는 것은 아니다. 예를 들어, 컴퓨팅 장치에서 실행되는 애플리케이션 및 컴퓨팅 장치 모두 컴포넌트일 수 있다. 하나 이상의 컴포넌트는 프로세서 및/또는 실행 스레드 내에 상주할 수 있고, 일 컴포넌트는 하나의 컴퓨터 내에 로컬화될 수 있고, 또는 2개 이상의 컴퓨터들 사이에 분배될 수 있다. 또한, 이러한 컴포넌트들은 그 내부에 저장된 다양한 데이터 구조들을 갖는 다양한 컴퓨터 판독가능한 매체로부터 실행할 수 있다. 컴포넌트들은 예를 들어 하나 이상의 데이터 패킷들을 갖는 신호(예를 들면, 로컬 시스템, 분산 시스템에서 다른 컴포넌트와 상호작용하는 하나의 컴포넌트로부터 데이터 및/또는 신호를 통해 다른 시스템과 인터넷과 같은 네트워크를 통한 데이터)에 따라 로컬 및/또는 원격 처리들을 통해 통신할 수 있다.
본 명세서에서의 컴퓨터 판독가능 매체는 컴퓨터 시스템에 의해서 판독될 수 있도록 프로그램 및 데이터가 저장되는 모든 종류의 저장 매체를 포함할 수 있다. 본 발명의 일 양상에 따르면, 이러한 컴퓨터 판독가능 매체는, 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 컴퓨터 판독가능 저장 매체는, ROM(판독 전용 메모리), RAM(랜덤 액세스 메모리), CD(컴팩트 디스크)-ROM, DVD(디지털 비디오 디스크)-ROM, 자기 테이프, 플로피 디스크, 광 데이터 저장장치 등을 포함할 수 있다. 컴퓨터 판독가능 전송 매체는, 캐리어 웨이브(예컨대, 인터넷을 통한 전송)의 형태로 구현되는 것을 포함할 수 있다. 추가적으로, 이러한 매체는 네트워크로 연결된 시스템에 분산되어, 분산 방식으로 컴퓨터가 판독가능한 코드들 및/또는 명령들을 저장할 수도 있다.
본 발명의 실시를 위한 구체적인 내용을 설명하기에 앞서, 본 발명의 기술적 요지와 직접적 관련이 없는 구성에 대해서는 본 발명의 기술적 요지를 흩뜨리지 않는 범위 내에서 생략하였음에 유의하여야 할 것이다. 또한, 본 명세서 및 청구범위에 사용된 용어 또는 단어는 발명자가 자신의 발명을 최선의 방법으로 설명하기 위해 적절한 용어의 개념을 정의할 수 있다는 원칙에 입각하여 본 발명의 기술적 사상에 부합하는 의미와 개념으로 해석되어야 할 것이다.
본 개시내용의 일 실시예에 따른 인덱싱 기술의 기본 개념은 본 출원에서 그 전체가 참조로 통합되는 미국 특허 US9626398호(2017.04.18) 및 US2007-0174309(2007.07.26)호에서 구체적으로 논의된다.
전술한 바와 같이, 인덱스는 B+트리 인덱스 및 비트맵 인덱스로 나누어질 수 있다.
B+트리 인덱스는 루트(root) 블록, 브랜치(branch) 블록 및 리프(leaf) 블록으로의 계층형태의 인덱스 기법을 의미할 수 있다. B+트리 인덱스에서, 리프 블록이 데이터 블록의 해당 로우에 접근할 수 있는 ROWID를 가지고 있으며 그리고 브랜치 블록 및 루트 블록은 각 하위 단계에 접근할 수 있는 키값(예컨대, 블록의 주소값)을 가지고 있다.
B+트리 인덱스에서는 테이블의 컬럼 값과 집합 내에서의 정보의 ROWID를 정렬된 형태로 가지는 구조이기 때문에, 동일한 값에 대해서 물리적 주소가 서로 상이한 경우 동일한 값을 중복하여 가지고 있어야 함에 따라 저장 공간에 낭비가 발생할 수 있다. 즉, B+트리 인덱스는 실제 컬럼 값을 인덱스에서도 보관하고 있어야 한다는 점 때문에, 대용량 데이터를 관리 및 처리하는데에 있어서 단점이 존재할 수 있다. 또한, B+트리 인덱스가 효율적으로 동작하기 위해서는 컬럼값의 분포도(selectivity)가 양호하여야 할 뿐만 아니라, 특정한 조건들에서는 인덱스의 성능을 보장받지 못한다는 단점이 존재할 수 있다. 나아가, B+트리 인덱스는 동일한 테이블에 대한 액세스시에 두 개 이상의 인덱스들을 병렬적으로 사용하는 상황에서 많은 제약사항이 따를 수 있다. 실제 DBMS 업무 환경에서의 사용자의 요구 사항은 매우 다양할 수 있다. 이러한 다양한 형태의 사용자들의 요구사항을 만족시키기 위해서는 테이블의 모든 컬럼의 조합만큼의 B+트리 인덱스를 만들어야 하며, 이러한 경우 테이블의 크기보다 오히려 인덱스의 크기가 더 커지는 기현상을 초래할 수 있다. 분포도가 양호한 2개의 B+트리 인덱스들이 존재하는 경우 2개 이상의 인덱스들을 동시에 사용하는데 하나만 사용되는 등과 같이 2개의 인덱스를 효과적으로 사용하기 위한 제약사항들 또한 존재할 수 있다.
B+트리 인덱스의 문제점들을 해결하기 위한 시도의 일환으로 비트맵 인덱스가 고려될 수 있다. 비트맵 인덱스는 컴퓨터에서 사용하는 최소 단위인 비트를 이용하여 컬럼값을 저장하고 이를 이용하여 ROWID를 자동으로 생성하는 인덱스 기법을 의미할 수 있다. 일반적으로 비트맵 인덱스는, 인덱스를 생성하고자 하는 컬럼의 값들을 찾기 위해 테이블 스캔을 수행한 후 컬럼값, 시작(start) ROWID, 종료(end) ROWID 및 비트맵을 갖는 인덱스 엔트리가 생성되고 나서, 생성된 비트맵들을 B+트리 구조에 삽입되기 용이한 형태(즉, 키값 및 시작 ROWID 순서)로 정렬한 다음에, 정렬된 인덱스 엔트리들이 B+트리 구조로 삽입되는 방식으로 생성될 수 있다. 하지만, 비트맵 인덱스의 경우에도, DML(Data Manipulation Language) 작업시 계속적으로 비트맵 엔트리가 증가하게 되어, 빈번한 DML 작업을 수행하다 보면 비트맵 인덱스의 크기가 테이블의 크기보다 더 커지는 결과를 초래할 수도 있다. 또한, 비트맵 인덱스는 Distinct 값들이 많은 경우에는 그 크기가 비효율적으로 증가될 수도 있다.
본 개시내용의 일 실시예에 따라, 비트맵 인덱스 및 B+트리 인덱스를 효율적인 방식으로 조합하는 기법이 제공될 수 있다. 상기 기법은: 리프 노드에 대한 빈도수에 기초하여 빈도수가 낮은 리프 노드에 대해서는 B+트리 방식으로 표현하고 그리고 빈도수가 높은 리프 노드에 대해서는 B+트리 방식에 비트맵 값을 추가하여 표현하는 것을 포함할 수 있다. 또한, 상기 기법은: Distinct 값이 사전결정된 수를 초과하는 경우 혹은 DML의 발생 횟수가 사전결정된 횟수를 초과하는 파티션에 대해서는 B+트리 방식으로 인덱스를 표현하고 그리고 Distinct 값이 사전결정된 수보다 적거나 DML의 발생이 사전결정된 횟수보다 적은 파티션에 대해서는 B+트리 방식에 비트맵 값을 추가하여 인덱스를 표현하는 기법을 포함할 수 있다.
본 개시내용의 일 실시예에 따라, 인덱스의 크기를 최소화시킬 수 있을 뿐만 아니라 DBMS의 쿼리 처리 성능을 증대시킬 수 있다. 본 개시내용의 일 실시예에 따라서 DBMS에서의 쿼리 처리 시간이 축소될 수 있을 뿐만 아니라 DB 시스템에서의 상환 조건들에 맞는 최적화된 효율적인 인덱싱 기법이 제공될 수 있다.
도 1은 본 개시내용의 일 실시예에 따른 데이터베이스 관리 장치(120) 및 클라이언트(110)에 대한 개략도를 도시한다.
도 1에서 도시되는 바와 같이, 데이터베이스 시스템은 클라이언트(110), 데이터베이스 관리 장치(120)를 포함할 수 있다. 본 명세서에서의 데이터베이스 관리 장치는 데이터베이스 서버와 상호 교환 가능하게 사용될 수 있다.
도 1에서 도시되는 바와 같이, 클라이언트(110)는 네트워크를 통하여 통신하기 위한 매커니즘을 갖는 데이터베이스 시스템에서의 노드(들)를 의미할 수 있다. 예를 들어, 클라이언트(110)는 PC, 랩탑 컴퓨터, 워크스테이션, 단말 및/또는 네트워크 접속성을 갖는 임의의 전자 디바이스를 포함할 수 있다. 또한, 클라이언트(110)는 에이전트(Agent), API(Application Programming Interface) 및 플러그-인(Plug-in) 중 적어도 하나에 의해 구현되는 임의의 서버를 포함할 수도 있다. 예를 들어, 도 1에서의 클라이언트(110)는 데이터베이스 관리 장치(120)를 사용하는 사용자와 관련될 수 있다. 이러한 예시에서, 클라이언트(110)는 데이터베이스 관리 장치(120)로 DML 및 DDL(Data Definition Language) 등을 포함하는 다양한 형태의 쿼리들을 발행할 수 있다.
데이터베이스 관리 장치(120)는, 예를 들어, 마이크로프로세서, 메인프레임 컴퓨터, 디지털 싱글 프로세서, 휴대용 디바이스 및 디바이스 제어기 등과 같은 임의의 타입의 컴퓨터 시스템 또는 컴퓨터 디바이스를 포함할 수 있다. 예를 들어, 본 개시내용의 일 실시예에 따른 데이터베이스 관리 장치(120)는 데이터베이스 서버를 포함할 수 있다. 이러한 데이터베이스 관리 장치(120)는 DBMS(Database Management System)(130) 및 영구 저장 매체(persistent storage)(140)를 포함할 수 있다. 도 1에서는 1개의 데이터베이스 관리 장치를 도시하고 있으나, 이보다 많은 데이터베이스 관리 장치들 또한 본 발명의 범위에 포함될 수 있다는 점이 당해 출원 분야에 있어서 통상의 지식을 가진 자에게 명백할 것이다.
도 1에서는 도시되지 않았지만, 데이터베이스 관리 장치(120)는 버퍼 캐시를 포함하는 하나 이상의 메모리를 포함할 수 있다. 또한, 도 1에서는 도시되지 않았지만, 데이터베이스 관리 장치(120)는 하나 이상의 프로세서를 포함할 수 있다. 따라서, DBMS(130)는 상기 메모리 상에서 상기 프로세서에 의하여 동작될 수 있다.
여기서, 메모리는 동적 램(DRAM, dynamic random access memory), 정적 램(SRAM, static random access memory) 등의 랜덤 액세스 메모리(RAM)와 같은, 프로세서가 직접 접근하는 주된 저장 장치로서 전원이 꺼지면 저장된 정보가 순간적으로 지워지는 휘발성(volatile) 저장 장치를 의미할 수 있지만, 이들로 한정되는 것은 아니다. 이러한 메모리는 프로세서에 의하여 동작 될 수 있다. 메모리는 데이터 값을 포함하는 데이터 테이블(data table) 및/또는 인덱스 테이블을 임시로 저장할 수 있다. 상기 데이터 테이블 및 인덱스 테이블은 데이터 값을 포함할 수 있으며, 본 발명의 일 실시예에서 상기 테이블들의 데이터 값은 메모리로부터 영구 저장 매체에 기록될 수 있다. 추가적인 양상에서, 메모리는 버퍼 캐시를 포함하며, 상기 버퍼 캐시의 데이터 블록에는 데이터가 저장될 수 있다. 상기 데이터는 백그라운드 프로세스에 의하여 영구 저장 매체에 기록될 수 있다.
영구 저장 매체(140)는, 예를 들어 자기(magnetic) 디스크, 광학(optical) 디스크 및 광자기(magneto-optical) 저장 디바이스뿐만 아니라 플래시 메모리 및/또는 배터리-백업 메모리에 기초한 저장 디바이스와 같은, 임의의 데이터를 지속적으로 할 수 있는 비-휘발성(non-volatile) 저장 매체를 의미한다. 이러한 영구 저장 매체(140)는 다양한 통신 수단을 통하여 데이터베이스 관리 장치(120)의 프로세서 및 메모리와 통신할 수 있다. 추가적인 실시예에서, 이러한 영구 저장 매체(140)는 데이터베이스 관리 장치(120) 외부에 위치하여 데이터베이스 관리 장치(120)와 통신 가능할 수도 있다. 본 개시내용의 일 실시예에 따라 영구 저장 매체(140) 및 메모리는 저장부로 통칭될 수도 있다.
DBMS(130)는 데이터베이스 관리 장치(120)에서 필요한 데이터를 검색, 삽입, 수정 및/또는 삭제 그리고 인덱스를 생성하고 인덱스에 액세스하는 것 등과 같은 데이터베이스의 임의의 형태의 동작들을 수행하는 것을 허용하기 위한 프로그램으로서, 전술한 바와 같이, 데이터베이스 관리 장치(120)의 메모리에서 프로세서에 의하여 구현될 수 있다.
클라이언트(110)와 데이터베이스 관리 장치(120) 또는 데이터베이스 관리 장치들은 네트워크(미도시)를 통하여 서로 통신할 수 있다. 본 발명의 일 실시예에 따른 네트워크는 공중전화 교환망(PSTN:Public Switiched Telephone Network), xDSL(x Digital Subscriber Line), RADSL(Rate Adaptive DSL), MDSL(Multi Rate DSL), VDSL(Very High Speed DSL), UADSL(Universal Asymmetric DSL), HDSL(High Bit Rate DSL) 및 근거리 통신망(LAN) 등과 같은 다양한 유선 통신 시스템들을 사용할 수 있다.
또한, 본 명세서에서 제시되는 네트워크는 CDMA(Code Division Multi Access), TDMA(Time Division Multi Access), FDMA(Frequency Division Multi Access), OFDMA(Orthogonal Frequency Division Multi Access), SC-FDMA(Single Carrier-FDMA) 및 다른 시스템들과 같은 다양한 무선 통신 시스템들을 사용할 수 있다. 추가적으로, 네트워크는 데이터베이스 링크(dblink)를 포함할 수 있으며, 이에 따라 복수의 데이터베이스 관리 장치들은 이러한 데이터베이스 링크를 통해 서로 통신하여 다른 데이터베이스 관리 장치로부터의 데이터를 가져올 수 있다. 본 명세서에서 설명된 기술들은 위에서 언급된 네트워크들뿐만 아니라, 다른 네트워크들에서도 사용될 수 있다.
도 2는 본 개시내용의 일 실시예에 따른 DBMS(130)에 대한 블록 구성도를 도시한다.
도 2에서 도시되는 바와 같이, DBMS(130)는 쿼리 수신부(201), 모니터링 수행부(203), 쿼리 처리부(205), 통신부(207) 및 저장부(209)를 포함할 수 있다. 도 2에서 도시되는 컴포넌트들은 예시적인 것이며, 발명의 구현 양상에 따라서 일부 컴포넌트들이 생략될 수 있거나 또는 추가적인 컴포넌트들이 추가될 수도 있다. 상기 DBMS(130)내의 컴포넌트들은 하나 이상의 프로세서에 의해 실행되어 메모리 및/또는 영구 저장 매체(140)에 저장될 수 있다. 전술한 메모리 및 영구 저장 매체(140)는 저장부(209)로 통합될 수도 있다. 이러한 경우, 저장부(209)는 프로세서와 통신하여 데이터 저장/관리를 제어할 수 있다.
쿼리 수신부(201)는 클라이언트(110)로부터 발행된 임의의 형태의 쿼리를 수신을 제어할 수 있다. 쿼리 수신부(201)는 수신된 쿼리에 대한 특정 동작을 수행할 수 있다. 본 개시내용에서의 쿼리는 데이터의 조회, 업데이트, 추가, 변경, 삭제 및 삽입 등을 포함하는 DML(Data Manipulation Language)을 포함할 수 있다. 예를 들어, 이러한 DML은 SELECT, INSERT, UPDATE, DELETE와 관련된 명령어 등을 포함할 수 있다. 또한, 본 개시내용에서의 쿼리는 스키마, 도메인, 테이블, 뷰, 인덱스를 정의하거나 변경 또는 제거할때 사용되는 DDL(Data Definition Language)을 포함할 수 있다. 이러한 DDL은 CREATE, ALTER, DROP, RENAME, TRUNCATE 등의 명령어를 포함할 수 있다. DDL의 일례로, 데이터베이스 인덱스 구조의 생성을 위한 쿼리가 포함될 수 있다.
프로세서가 DBMS(130)를 통하여 쿼리를 파싱(parsing)하고, 변환(transformation)하고, 최적화(optimization)한 후, 해당 쿼리는 최적화된 쿼리 문(statement)의 형태로 실행될 수 있다. 추가적으로, 쿼리 수신부(201)가 쿼리를 수신하는 경우, 이에 대한 복수의 (후보) 수행 알고리즘들이 자동적으로 결정될 수 있거나 또는 클라이언트로부터 수신된 힌트(hint)에 기초하여 이에 대한 복수의 (후보) 수행 알고리즘들이 결정될 수도 있다. 데이터 조회와 관련된 예시로, 인덱스를 통하여 데이터 조회를 수행할지 혹은 전체(full) 테이블 스캔을 통하여 데이터 조회를 수행할지에 관한 수행 알고리즘이 결정될 수 있다.
본 발명의 일 양상에서, 데이터베이스 인덱스 구조의 생성과 관련된 쿼리는 예를 들어, CREATE INDEX, CREATE INDEX WITH DROP_EXISTING, ALTER INDEX REBUILD, ALTER TABLE ADD CONSTRAINT(PRIMARY KEY 또는 UNIQUE), ALTER TABLE DROP CONSTRAINT(PRIMARY KEY 또는 UNIQUE), 및 DROP INDEX MOVE TO 등을 포함할 수 있지만, 이들로 제한되지는 않는다.
모니터링 수행부(203)는 데이터베이스 인덱스 구조를 생성하는데 기초가 될 수 있는 모니터링 동작을 수행할 수 있다. 본 명세서에서의 모니터링 동작은, 인덱스를 빌드하기 위하여, 특정 키 값에 액세스되는 횟수/빈도 정보, 특정 데이터에 액세스되는 횟수/빈도 정보, 특정 파티션에 대한 distinct 값 정보, 특정 파티션에 대한 DML 발생 횟수/빈도 정보, 및 특정 파티션에 포함된 데이터의 마지막 액세스 시점 정보 중 적어도 하나의 정보를 획득하는 과정을 의미할 수 있다. 횟수/빈도 정보는 카운팅 값을 의미할 수 있거나 혹은 시간당 횟수 값을 의미할 수 있다. 시점 정보는 실제 시간 정보를 의미할 수 있거나 혹은 데이터베이스 관리 장치(120)가 자체적으로 관리하는 시간 정보(예컨대, TSN(Tibero Sequence Number))를 의미할 수도 있다.
모니터링 수행부(203)는 모니터링 수행에 따른 모니터링 결과 정보를 생성할 수 있다. 모니터링 수행 결과 정보는, 데이터베이스 인덱스 구조가 포함하는 복수의 서브 인덱스 구조들 특정 서브 인덱스 구조(예컨대, 하위 서브 인덱스 구조)가 제 1 타입의 인덱싱 방식 또는 상기 제 1 타입의 인덱싱 방식과 상이한 제 2 타입의 인덱싱 방식 중 어느 인덱싱 방식을 사용할 것인지에 대한 표시를 포함할 수 있다. 본 개시내용의 일 실시예에서, 특정 타입의 인덱싱 방식은 임의의 인덱싱 방식을 포함할 수 있다. 예를 들어, 제 1 타입의 인덱싱 방식은 비트맵 인덱싱 방식을 포함할 수 있다. 제 2 타입의 인덱싱 방식은 B+트리 인덱싱 방식을 포함할 수 있다. 또한, 이러한 모니터링 결과 정보는 ROWID 단위 및/또는 데이터베이스 테이블이 분할된 형태인 파티션 단위로 어떤 인덱싱 방식을 사용할 것인지를 표시할 수 있다.
전술한 예시들에 따라서, 예를 들어, 모니터링 결과 정보에는 리프 노드의 특정 로우는 B+트리 인덱싱 방식을 사용하고 특정 로우와는 상이한 다른 로우는 비트맵 인덱싱 방식을 사용한다는 표시가 포함될 수 있다. 다른 예시로, 모니터링 결과 정보에는 데이터베이스 테이블의 특정 파티션은 B+트리 인덱싱 방식을 사용하고 상기 특정 파티션과 상이한 다른 파티션은 비트맵 인덱싱 방식을 사용한다는 표시가 포함될 수 있다.
본 개시내용의 일 실시예에 따라서, 모니터링 수행부(203)는 사전결정된 모니터링 알고리즘에 기초하여, 모니터링 동작을 수행할 수 있다. 예를 들어, 제 1 모니터링 알고리즘에 따라서, 모니터링 수행부(203)는 데이터베이스 인덱스 구조가 참조하는 기초(base) 데이터 구조의 컬럼 값에 액세스되는 횟수 정보를 모니터링함으로써, 모니터링 결과 정보를 생성할 수 있다. 이러한 경우, 예를 들어, 모니터링 결과 정보는, 로우 단위로 제 1 타입의 인덱싱 방식 또는 제 2 타입의 인덱싱 방식 중 어느 인덱싱 방식을 사용할 것인지에 대한 표시를 포함할 수 있다. 이러한 경우, 컬럼 값으로 액세스되는 횟수 정보가 사전결정된 액세스 임계 횟수값 보다 큰 경우 상기 모니터링 결과 정보는 비트맵 인덱싱 방식을 사용할 것을 표시하고, 컬럼 값으로 액세스되는 횟수 정보가 사전결정된 액세스 임계 횟수값 이하인 경우 상기 모니터링 결과 정보는 B+트리 인덱싱 방식을 사용할 것을 표시할 수 있다.
본 개시내용의 일 실시예에 따라서, 모니터링 수행부(203)에 의해 생성되는 모니터링 결과 정보는, 데이터베이스 인덱스 구조가 참조하는 기초 데이터 구조의 파티션 특성 정보에 적어도 부분적으로 기초하여 파티션 단위로 생성될 수 있다. 예를 들어, 기초 데이터 구조는 데이터베이스 인덱스 구조가 인덱싱하는 데이터 테이블을 포함할 수 있다. 파티션 특성 정보는, 파티션의 Distinct 값의 크기 정보 및 파티션에 대한 DML 발생 횟수 정보 중 적어도 하나에 기초하여 결정될 수 있다. 예를 들어, 파티션의 상기 Distinct 값의 크기 정보가 사전결정된 크기 임계값보다 작거나 또는 상기 파티션에 대한 DML 발생 횟수 정보가 사전결정된 DML 발생 횟수 임계값 보다 작은 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 비트맵 인덱싱 방식을 사용할 것을 표시하며, 파티션에 대한 상기 DML 발생 횟수 정보가 사전결정된 DML 발생 횟수 임계값 이상인 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 B+트리 인덱싱 방식을 사용할 것을 표시할 수 있다.
본 개시내용의 일 실시예에 따라서, 모니터링 수행부(203)에서 생성하는 모니터링 결과 정보는, 파티션에 포함된 데이터의 마지막 액세스 시점 정보에 적어도 부분적으로 기초하여 결정될 수 있다. 이러한 경우, 파티션에 포함된 데이터의 상기 마지막 액세스 시점 정보가 사전결정된 임계 시점 정보 보다 오래된 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 비트맵 인덱싱 방식을 사용할 것을 표시할 수 있다. 또한, 파티션에 포함된 데이터의 상기 마지막 액세스 시점 정보가 사전결정된 임계 시점 정보 보다 오래되지 않은 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 B+트리 인덱싱 방식을 사용할 것을 표시할 수 있다.
모니터링 수행부(203)의 모니터링 동작에 의하여, 각 로우 단위로 그리고/또는 각 파티션 단위로 상이한 타입의 인덱싱 방식이 적용될 수 있기 때문에, 전체적인 인덱싱 성능이 최적화될 수 있다.
일례로, 기존의 비트맵 인덱스의 경우 distinct 값이 큰 경우에는 비효율적으로 크기가 커질 수 있다. 따라서, 본 개시내용의 일 실시예에 따른 기법에 의하여, 특정한 값들이 전체 데이터의 대부분을 차지하고 그리고 나머지 값들은 개수가 적은 이른바 Long Tail Data에 대해서는 액세스 빈도수가 높은 값들에 대해서는 비트맵 인덱싱을 통하여 해당 자료를 표현하는 Row Piece가 줄어들게 된다. 나아가 본 개시내용의 일 실시예에 따른 기법에 의하여, 빈도수가 낮은 값들에 대해서는 B+트리 인덱싱 방식을 사용함에 따라 불필요한 공간 낭비가 줄어들 수 있다. 즉, 본 개시내용의 일 실시예에 따른 기법에 의하여, 인덱스 구조의 크기를 줄임과 동시에 인덱스 속도가 빨라질 수 있다.
다른 예시로, DML이 자주 발생하는 경우 B+트리 인덱스가 유리하며, Select 쿼리 등에 대해서는 비트맵 인덱스가 유리할 수 있다. 예를 들어, 과거 데이터가 포함된 파티션에는 비트맵 인덱스를 사용하고 업데이트, 삽입 등이 발생하는 현재 데이터가 포함된 파티션에 대해서는 B+트리 인덱스를 사용함으로써, 파티션 특성에 따라 최적화된 인덱싱 방식을 통하여 쿼리 응답 성능이 향상될 수 있다.
본 개시내용의 일 실시예에 따라, 모니터링 수행부(203)에 의해 생성된 모니터링 결과 정보는 저장부(209)로 저장되어 관리될 수 있다. 이러한 경우, 쿼리 처리부(205)는 저장부(209)에 저장된 모니터링 결과 정보를 리트리브(retrieve)하여 모니터링 결과 정보에 따라 데이터베이스 인덱스 구조를 생성할 수 있다.
쿼리 처리부(205)는 해당 쿼리에 대한 임의의 연산(operation)을 수행할 수 있다. 쿼리 처리부(205)는, 쿼리 수신부(201)에 의해 수신된 쿼리에 대한 하나 이상의 수행 알고리즘을 생성할 수 있다. 쿼리 처리부(205)는 쿼리를 실행하기 위한 수행 알고리즘을 결정하고, 결정된 수행 알고리즘에 따라서 쿼리를 처리하기 위한 연산을 수행할 수 있다.
쿼리 처리부(205)는 인덱스 구조 정의/생성에 관한 쿼리를 수신하는 경우, 모니터링 수행부(203)의 모니터링 결과 정보에 기초하여, 데이터베이스 인덱스 구조를 생성할 수 있다. 생성되는 데이터베이스 인덱스 구조는, 복수의 서브 인덱스 구조들을 계층적으로 구비하는 형태가 될 수 있다.
예를 들어, 데이터베이스 인덱스 구조는 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 포함할 수 있다. 이러한 경우, 제 1 레벨의 서브 인덱스 구조는 루트 노드와 대응될 수 있으며 그리고 제 2 레벨의 서브 인덱스 구조는 리프 노드와 대응될 수 있다 또한, 데이터베이스 인덱스 구조는 제 1 레벨의 서브 인덱스 구조, 제 1 레벨의 하위 레벨인 제 2 레벨의 서브 인덱스 구조 및 제 2 레벨의 하위 레벨인 제 3 레벨의 서브 인덱스 구조를 포함할 수 있다. 이러한 경우, 제 1 레벨의 서브 인덱스 구조는 루트 노드와 대응될 수 있으며, 제 2 레벨의 서브 인덱스 구조는 브랜치 노드와 대응될 수 있으며 그리고 제 3 레벨의 서브 인덱스 구조는 리프 노드와 대응될 수 있다.
본 개시내용의 일 실시예에 따라서, 복수의 서브 인덱스 구조들 중 하나 이상의 서브 인덱스 구조(예컨대, 루트 노드 및/또는 브랜치 노드)는 자신의 하위 레벨의 서브 인덱스 구조의 시작 ROWID 값 및 상기 하위 레벨의 서브 인덱스 구조에 접근하기 위한 주소값을 포함할 수 있다. 이에 따라, 상위 노드는 하위 노드(들)을 포인팅할 수 있어서, 인덱스 구조에서의 상위 레벨로부터 하위 레벨로의 대한 트래버스가 이루어질 수 있다. 프로세서는 트래버스 수행시에 각 노드의 조건을 확인하고 상기 조건에 기초하여 연산을 수행할 수 있다. 상기 조건은 탐색 목표의 인덱스 번호가 노드에 포함하는 인덱스 번호의 범위에 포함되는지 여부일 수 있다.
본 개시내용의 일 실시예에 따라서, 복수의 서브 인덱스 구조들 중 하나 이상의 서브 인덱스 구조(예컨대, 리프 노드)는 복수의 컬럼들을 포함할 수 있다. 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며, 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우에 대응되는 ROWID 값들을 포함하며, 그리고 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화(optimized) 인덱스 값들을 포함할 수 있다.
본 개시내용의 일 실시예에 따른 "최적화 인덱스 값"은 어떤 타입의 인덱싱 방식을 사용하는지에 대한 표시를 포함할 수 있다. 예를 들어, 최적화 인덱스 값에 기초하여 해당 컬럼 값이 비트맵 인덱스를 사용하는지 혹은 B+트리 인덱스를 사용하는지 여부가 판단될 수 있다. 예를 들어, B+트리 인덱싱 방식을 사용하는 것으로 결정된 경우 최적화 인덱스 값은 NULL 값을 포함할 수 있다. 또한, 비트맵 인덱싱 방식을 사용하는 것으로 결정된 경우 최적화 인덱스 값은 해당 비트맵 값을 포함할 수 있다. 해당 비트맵 값에 따라, 비트맵 인덱싱이 수행될 수 있다. 즉, 본 개시내용의 일 실시예에 따른 최적화 인덱스 값은, 모니터링 결과 정보가 비트맵 타입의 인덱싱 방식을 사용할 것을 나타내는 경우, 해당 로우에 대하여 비트맵 값을 포함할 것이고, 그리고 모니터링 결과 정보가 B+트리 타입의 인덱싱 방식을 사용할 것을 나타내는 경우, 해당 로우에 대하여 NULL 값을 포함할 것이다.
본 개시내용의 일 실시예에 따른 복수의 컬럼들 중 제 4 컬럼은 종료(end) ROWID 값들을 포함할 수도 있다. 이러한 경우, 상기 종료 ROWID 값들은 상기 모니터링 결과 정보가 B+트리의 인덱싱 방식을 사용할 것을 나타내는 경우, 해당 로우에 대하여 NULL 값을 포함할 수 있다. 종료 ROWID 값은 제 2 컬럼에 포함된 ROWID 값을 시작으로 하는 해당 서브 인덱스 구조의 ROWID 범위를 나타내기 위한 마지막 ROWID 값을 의미할 수 있다. 이러한 경우, 제 3 컬럼에 포함된 비트맵 값은, 제 2 컬럼에 포함된 ROWID 값(즉, 시작 ROWID)을 기준 지점으로 하여 상기 기준 지점과 다른 ROWID 값들의 위치 간의 상대적인 거리를 표시하는 비트(bit) 값을 의미할 수 있다.
통신부(207)는, 다른 데이터베이스 관리 장치 또는 클라이언트(110)와의 통신 기능을 제공할 수 있다. 예를 들어, 통신부(207)는 수신된 쿼리에 대한 처리 결과를 클라이언트(110)로 전송할 것을 결정할 수 있다. 또한, 통신부(207)는 앞서 설명된 임의의 네트워크 및/또는 데이터베이스 링크를 사용하여, 다른 데이터베이스 관리 장치 또는 클라이언트(110)와 통신하는 것을 제어할 수 있다. 또한, 통신부(207)는 클라이언트(110)로부터의 데이터 저장, 조회 및 인덱스 정의/생성/빌드, 조회 요청 등을 수신하는 것을 제어할 수도 있다. 또한, 통신부(207)는 데이터 저장, 조회 및 인덱스 빌드, 조회 요청에 대한 결과 정보를 클라이언트(110) 혹은 내부 컴포넌트들로 전달할 수도 있다.
저장부(209)는 데이터베이스 관리 장치(120)의 테스크 수행과 관련하여 저장되는 임의의 데이터를 저장할 수 있다. 저장부(209)는 DBMS(130) 및/또는 영구저장매체(140)에 포함될 수 있다. 추가적으로, 저장부(209)는 데이터베이스 관리 장치(120) 상에서의 테이블(예컨대, 인덱스 테이블) 등을 생성할 수도 있다. 예를 들어, 이러한 테이블들의 생성은, 제어 모듈(미도시)과 같은 별도의 컴포넌트에 의해 수행될 수도 있다. 또한, 저장부(209)는 데이터의 저장(업데이트 포함)과 관련된 요청을 처리 및 관리할 수 있다. 이러한 저장부(209)는 데이터 및 인덱스 테이블 등을 저장할 것을 결정할 수 있다. 또한, 저장부(209)는 데이터 및/또는 인덱스 테이블에 대한 저장 위치를 결정할 수 있다. 예를 들어, 저장부(209)은 데이터에 대하여 데이터 테이블 상에서의 저장 위치를 결정할 수 있다. 다른 예시로, 저장부(209)는 데이터에 대하여 영구 저장 매체(140) 상의 저장 위치를 결정할 수 있다. 저장부(209)는 생성된 데이터베이스 인덱스 구조를 저장할 수 있다. 본 개시내용의 추가적인 실시예에서, 저장부(209)는 메모리 및/또는 영구 저장 매체(140)를 포함할 수도 있다.
도 3은 본 개시내용의 일 실시예에 따른 데이터베이스 관리 장치의 블록 구성도를 도시한다.
도 3에서 도시되는 바와 같이, 데이터베이스 관리 장치(120)는 프로세서(310) 및 저장부(320)를 포함할 수 있다. 프로세서(310)는 도 2에서 설명된 DBMS(130)에 의해 수행되는 동작들을 제어할 수 있다. 프로세서(310)는 DBMS(130)를 실행하여, 도 2에서 설명된 동작들을 수행할 수 있다. 예를 들어, 프로세서(310)는 모니터링 동작 및 데이터베이스 인덱스 구조(330)의 생성 동작을 수행할 수 있다. 다른 예시로, 프로세서(310)는 생성된 데이터베이스 인덱스 구조(330)를 저장부(320)에 저장할 수 있다. 프로세서(310)의 동작들은 도 2에서 설명된 DBMS(130)의 동작들과 대응되기 때문에, 도 3과 관련된 설명에서는 이에 대한 기재를 생략하기로 한다.
도 3에서 도시되는 저장부(320)는 앞서 기재된 메모리 및/또는 영구 저장 매체와 대응될 수 있다. 저장부(320)는 데이터베이스 인덱스 구조(330)를 저장할 수 있다. 도 2와 관련하여 설명된 바와 같이, 데이터베이스 인덱스 구조(330)는 하나 이상의 서브 인덱스 구조들(340, 350, 360a 및 360b)을 포함할 수 있다. 이러한 서브 인덱스 구조들(340, 350, 360a 및 360b)은 루트 노드(340), 브랜치 노드(350) 및/또는 리프 노드(360a 및 360b)와 대응될 수 있다. 도 3에서 도시되는 저장부(320)에 저장되는 데이터베이스 인덱스 구조(330)는 하나의 루트 노드, 하나의 브랜치 노드 및 두 개의 리프 노드들만을 포함하고 있으나, 이는 설명의 편의를 위한 예시일 뿐, 본 개시내용의 사상을 벗어나지 않는 범위에서 임의의 개수 및 임의의 형태의 노드들이 데이터베이스 인덱스 구조(330)를 형성할 수 있다.
본 개시내용의 일 실시예에 있어서, 루트 노드(340) 및 브랜치 노드(350)는 자신 보다 하위에 있는 하위 레벨의 서브 인덱스 구조의 ROWID 값 및 상기 하위 레벨의 서브 인덱스 구조에 접근하기 위한 주소값을 포함할 수 있다. 예를 들어, 프로세서(310)가 루트 노드(340)로부터 트래버스를 하는 경우, 루트 노드(340)에 포함된 브랜치 노드(350)로의 분기값(즉, 어느 브랜치 노드(350) 방향으로 트래버스를 할지 결정하는 값) 및 브랜치 노드(350)의 주소(DBA: Data Block Address)에 기초하여, 프로세서(310)는 트래버스할 브랜치 노드(350)를 결정할 수 있다. 브랜치 노드(350) 또한 동일한 방식으로 리프 노드(360a, 360b)들 중 트래버스할 리프 노드를 결정할 수 있다.
도 4는 본 개시내용의 일 실시예에 따른 데이터베이스 인덱스 구조를 예시적으로 도시한다.
본 개시내용의 일 실시예에 따라, 비트맵 인덱스 및 B+트리 인덱스를 효율적인 방식으로 조합하는 최적의 인덱싱 기법이 제공될 수 있다. 이러한 인덱싱 기법은: 리프 노드에 대한 빈도수에 기초하여 빈도수가 낮은 리프 노드에 대해서는 B+트리 방식으로 표현하고 그리고 빈도수가 높은 리프 노드에 대해서는 B+트리 방식에 비트맵 값을 추가하여 표현하는 것을 포함할 수 있다. 또한, 상기 인덱싱 기법은: Distinct 값이 사전결정된 수를 초과하는 경우 혹은 DML의 발생 횟수가 사전결정된 횟수를 초과하는 파티션에 대해서는 B+트리 방식으로 인덱스를 표현하고 그리고 Distinct 값이 사전결정된 수보다 적거나 DML의 발생이 사전결정된 횟수보다 적은 파티션에 대해서는 B+트리 방식에 비트맵 값을 추가하여 인덱스를 표현하는 기법을 포함할 수 있다.
도 4에서 도시되는 바와 같이, 각각의 리프 노드(360a 및 360b)는 서브 인덱스 구조(400)를 가질 수 있다. 이러한 리프 노드(360a 및 360b) 각각의 서브 인덱스 구조(400)는 각각 적어도 3개의 컬럼들(410, 420 및 430)을 포함할 수 있다. 제 1 컬럼(410)은 인덱스 키 값들을 포함할 수 있다. 인덱스 키 값은 기본(base) 테이블에서의 컬럼 값, 컬럼 값에 대한 임의의 해시 값, 및/또는 컬럼 값에 대한 임의의 변환 값을 포함할 수 있다. 키 값들은 제 1 컬럼(410) 내에서 고유한 값들을 가질 수 있거나 혹은 중복되는 값들을 가질 수도 있다. 도 4에서 도시되는 바와 같이, 제 1 컬럼(410)은 1, 1, 2, 3, 4, 5 의 키 값들을 가질 수 있다.
제 2 컬럼(420)은, 데이터 블록의 로우에 대응되는 ROWID 값들을 포함할 수 있다. ROWID는 실제 데이터가 저장된 위치와 대응될 수 있다. 이러한 ROWID를 통하여, 실제 데이터가 저장된 위치를 찾아갈 수 있기 때문에, 테이블 전체(full) 스캔에 비하여 효율적인 데이터 검색이 가능해진다. 본 개시내용의 일 실시예에 따르면, 도 4에서는 도시되지 않았지만, 제 4 컬럼이 서브 인덱스 구조(400)에 포함될 수도 있다. 제 4 컬럼은 종료(end) ROWID 값들을 포함할 수 있다. 이러한 경우, 상기 종료 ROWID 값들은 모니터링 결과 정보가 B+트리의 인덱싱 방식을 사용할 것을 나타내는 경우, 해당 로우에 대하여 혹은 해당 키 값에 대하여 NULL 값을 포함할 수 있다. 종료 ROWID 값은 제 2 컬럼(420)에 포함된 ROWID 값을 시작으로 하는 해당 서브 인덱스 구조(400)의 ROWID 범위를 나타내기 위한 마지막 ROWID 값을 의미할 수 있다. 이러한 경우, 제 3 컬럼(430)에 포함된 비트맵 값은, 제 2 컬럼(420)에 포함된 ROWID 값(즉, 시작 ROWID)을 기준 지점으로 하여 기준 지점과 다른 ROWID 값들의 위치 간의 상대적인 거리를 표시하는 비트(bit) 값을 의미할 수 있다.
제 3 컬럼(430)은 전술한 바와 같이, 모니터링 결과 정보에 기초하여 설정되는 최적화(optimized) 인덱스 값들을 포함할 수 있다. 즉, 제 3 컬럼(430)에 포함된 값들은, 모니터링 결과 정보가 특정 로우에 대해서 혹은 특정 키 값에 대하여 B+트리 인덱스를 사용한다고 표시하는 경우, NULL 값을 가질 수 있다. 제 3 컬럼(430)에 포함된 값들은, 모니터링 결과 정보가, 특정 로우에 대해서 혹은 특정 키 값에 대하여, 비트맵 인덱스를 사용한다고 표시하는 경우, 비트맵 값(즉, 비트 값)을 가질 수 있다.
예를 들어, 컬럼 값으로 액세스되는 횟수 정보 혹은 키 값에 대한 액세스 횟수 정보가 사전결정된 액세스 임계 횟수값(예컨대, 분당 1회 혹은 총 100회 등) 보다 큰 경우 비트맵 인덱싱 방식을 사용할 것으로 결정되며, 그리고 컬럼 값으로 액세스되는 횟수 정보 혹은 키 값에 대한 액세스 횟수 정보가 사전결정된 액세스 임계 횟수값 이하인 경우 B+트리 인덱싱 방식을 사용할 것으로 결정될 수 있다.
도 4에서 도시되는 바와 같이, 데이터 액세스의 빈도수가 낮은 키 값인 1, 3, 4에 대해서는 키 값, ROWID 및 NULL 값을 갖는 데이터 구조를 갖게 되며, 데이터의 액세스의 빈도수가 높은 키 값인 2, 5에 대해서는 키 값, ROWID 및 비트맵 값을 갖는 데이터 구조를 가질 수 있다. 도 4에서 도시되는 예시에서는 키 값 단위로 비트맵 인덱스를 사용할지 혹은 B+트리 인덱스를 사용할지가 결정될 수 있는 것으로 도시되었지만, 다른 예시로, ROWID 단위로 비트맵값을 가질지 아니면 NULL 값을 가질지가 모니터링 결과 정보에 의해 설정될 수도 있다.
본 개시내용의 추가적인 실시예에서, 키 값들 혹은 로우 단위로 결정된 결정된 인덱스 구조들과 키 값들 혹은 로우들 간의 맵핑 관계는 메타 데이터로서 메타 테이블에 저장될 수도 있다. 메타 테이블을 형성함에 따라, 인덱스 구조를 생성할때 마다 모니터링 프로세스를 별도로 수행하지 않고, 메타 테이블에 저장된 맵핑 관계를 확인함으로써 보다 효율적인 인덱스 빌드가 이루어질 수 있다.
전술한 바와 같이, 본 개시내용의 일 실시예에 따른 서브 인덱스 구조(예컨대, 리프 노드의 데이터 구조)는 비트맵 인덱스 구조와 B+트리 인덱스 구조를 하나의 인덱스로 사용할 수 있는 글로벌 인덱스를 제공할 수 있다. 즉, 본 개시내용에 따른 인덱싱 방식은, 하나의 인덱스 구조에 대해서, 액세스 빈도수가 높은 데이터에 대해서는 비트맵 인덱스를 사용하고 액세스 빈도수가 낮은 데이터에 대해서는 B+트리 인덱스를 사용하기 때문에, 불필요한 공간을 줄임으로써 인덱스의 크기를 최소화할 수 있을 뿐만 아니라 인덱스의 속도 또한 향상될 수 있다.
도 5는 본 개시내용의 일 실시예에 따라 파티션 단위로 상이한 데이터베이스 인덱스 구조를 예시적으로 도시한다.
도 5에서 도시되는 바와 같이, 파티션 1 내지 10(510a, 520a, 530a, 540a)은 각각 파티션 단위로 상이한 인덱스 구조(510b, 520b, 530b, 540b)를 가질 수 있다. 도 5에서의 예시에 따르면, 파티션 1, 2 및 9(510a, 520a, 530a)는 로컬 인덱스로서 B+트리 인덱스(510b, 520b, 530b)를 가질 수 있다. 파티션 10(540b)은 로컬 인덱스로서 비트맵 인덱스(540b)를 가질 수 있다.
예를 들어, 파티션의 Distinct 값의 크기 정보가 사전결정된 크기 임계값(예컨대, 2, 5, 10, 100 등)보다 작거나 또는 상기 파티션에 대한 DML 발생 횟수 정보가 사전결정된 DML 발생 횟수 임계값(예컨대, 시간당 1회 혹은 총 10회 등) 보다 작은 경우, 상기 파티션에 대해서는 비트맵 인덱싱 방식이 사용될 것으로 결정될 수 있다. 일례로, 사전결정된 크기 임계값은 사용자에 의해 사전에 설정될 수 있다. 다른 예시로, 사전결정된 크기 임계값은 모니터링 수행부(203)에 의한 모니터링 결과 정보에 기초하여 가변적으로 그리고 동적으로 결정될 수 있다. 또한, 특정 파티션에 대한 DML 발생 횟수 정보가 사전결정된 DML 발생 횟수 임계값 이상인 경우, 상기 파티션에 대해서는 B+트리 인덱싱 방식이 사용될 것으로 결정될 수 있다.
또한, 특정 파티션에 포함된 데이터의 마지막 액세스 시점 정보가 사전결정된 임계 시점 정보(예컨대, 24시간, 7일, 30일 등) 보다 오래된 경우, 상기 파티션에 대해서는 비트맵 인덱싱 방식이 사용될 것으로 결정될 수 있다. 또한, 파티션에 포함된 데이터의 마지막 액세스 시점 정보가 사전결정된 임계 시점 정보 보다 오래되지 않은 경우, 상기 파티션에 대해서는 B+트리 인덱싱 방식이 사용될 것으로 결정될 수 있다.
각 파티션이 가지는 서브 인덱스 구조는 도 4와 관련하여 설명된 서브 인덱스 구조(400)와 동일하기 때문에, 도 5에서는 해당 설명을 생략하기로 한다.
본 개시내용의 추가적인 실시예에서, 파티션들(510a, 520a, 530a, 540a)과 파티션 단위로 결정된 인덱스 구조들(510b, 520b, 530b, 540b) 간의 맵핑 관계는 메타 데이터로서 메타 테이블에 저장될 수도 있다. 메타 테이블을 형성함에 따라, 인덱스 구조를 생성할때 마다 모니터링 프로세스를 별도로 수행하지 않고, 메타 테이블에 저장된 맵핑 관계를 확인함으로써 보다 효율적인 인덱스 빌드가 이루어질 수 있다.
본 개시내용의 일 실시예에 따른 파티션 단위의 인덱싱 구분 기법에 의해, 파티션의 특성에 따라 파티션 별로 비트맵 인덱스 구조 또는 B+트리 인덱스 구조를 사용할 수 있는 로컬 인덱스를 제공할 수 있다. 즉, 파티션의 Distinct 값이 적거나 DML이 거의 발생하지 않는 파티션에 대해서는 비트맵 인덱스를 사용하고, DML이 자주 발생하는 파티션에 대해서는 B+트리 인덱스를 사용함에 따라, 효율적인 공간 관리가 가능해지고 그리고 쿼리 성능이 향상될 수 있다.
도 6은 본 개시내용의 일 실시예에 따라, 효율적인 인덱싱을 수행하기 위한 순서도를 예시적으로 도시한다. 도 6에서 도시되는 단계들은 예를 들어, 데이터베이스 관리 장치(120)에 의해 수행될 수 있다. 또한, 도 6에서 도시되는 단계들은 예를 들어, 하나 이상의 프로세서(310)에 의해 수행될 수 있다. 도 6에서 도시되는 단계들은 예시적인 것이며, 추가적인 단계들이 존재하거나 혹은 도시되는 단계들 중 일부가 생략될 수도 있다.
도 6에서 도시되는 바와 같이, 데이터베이스 관리 장치(120)는 사용자로부터 발행된 인덱스 빌드를 요청하는 쿼리를 수신할 수 있다(610). 예를 들어, 인덱스 빌드를 요청하는 쿼리는 생성된 데이터 테이블 구조에 대한 검색을 용이하게 하기 위하여 인덱스 형태의 데이터 구조를 생성하고자 한다는 표시를 포함할 수 있다.
인덱스 빌드를 요청하는 것에 응답하여, 데이터베이스 관리 장치(120)는 사전결정된 모니터링 알고리즘에 기초하여 인덱스 빌드를 위한 모니터링 동작을 수행할 수 있다(630). 모니터링 동작에 의한 결과로서, 모니터링 결과 정보가 생성될 수 있다. 모니터링 동작을 수행하는데 있어서 임의의 방식의 데이터베이스 모니터링 방식이 사용될 수 있다. 본 명세서에서의 모니터링 동작은, 인덱스를 빌드하기 위하여, 특정 키 값에 액세스되는 횟수/빈도 정보, 특정 데이터에 액세스되는 횟수/빈도 정보, 특정 파티션에 대한 distinct 값 정보, 특정 파티션에 대한 DML 발생 횟수/빈도 정보, 및 특정 파티션에 포함된 데이터의 마지막 액세스 시점 정보 중 적어도 하나의 정보를 획득하는 임의의 형태의 과정을 의미할 수 있다. 예를 들어, 횟수/빈도 정보는 카운팅 값을 의미할 수 있거나 혹은 시간당 횟수 값을 의미할 수 있지만, 이들은 예시들에 불과하며 비교가능한 형태의 정보이면 모니터링 결과 정보에 포함될 수 있다.
데이터베이스 관리 장치(120)는 모니터링 동작에 의해 생성된 모니터링 결과 정보에 기초하여 데이터베이스 인덱스 구조 생성할 수 있다(630). 데이터베이스 인덱스 구조는 모니터링 결과 정보가 포함하는 표시에 따라 가변적으로 설정될 수 있다. 또한, 데이터베이스 관리 장치(120)는 생성된 데이터베이스 인덱스 구조와 기초 데이터 테이블을 서로 연결시킬 수 있다. 데이터베이스 인덱스 구조에 대한 구체적인 설명은 도 2 내지 5와 관련하여 사전에 설명되었기 때문에, 도 6에 대한 설명에서는 생략하기로 한다.
데이터베이스 관리 장치(120)는 생성된 데이터베이스 인덱스 구조를 임의의 형태의 저장부에 저장할 수 있다(650). 저장부는 일시적/임시적 저장 매체 및/또는 영구 저장 매체를 포함할 수 있다. 예를 들어, 데이터베이스 관리 장치(120)는 생성된 데이터베이스 인덱스 구조를 버퍼 캐시에 저장할 수 있다. 이러한 경우, 사전결정된 주기로 혹은 사용자 설정에 의해 백그라운드 프로세스에 의해 버퍼 캐시에 저장된 데이터베이스 인덱스 구조가 영구 저장 매체로 기록될 수 있다. 또한, 별도의 저장 서버에 상기 생성된 데이터베이스 인덱스 구조가 저장될 수 있으며, 별도의 저장 서버는 저장된 임의의 형태의 데이터들을 그룹 단위로 모아서 영구 저장 매체에 기록할 수도 있다.
도 7은 본 개시내용의 일 실시예에 따른 다양한 예시적 논리적 블록들, 구성들, 모듈들, 수단들 및 로직들, 및 알고리즘 단계들이 도시된다.
당업자들은 추가적으로 여기서 개시된 실시예들과 관련되어 설명된 다양한 예시적 논리적 블록들, 구성들, 모듈들, 회로들, 수단들, 로직들, 및 알고리즘 단계들이 전자 하드웨어, 컴퓨터 소프트웨어, 또는 양쪽 모두의 조합들로 구현될 수 있음을 인식해야 한다. 하드웨어 및 소프트웨어의 상호교환성을 명백하게 예시하기 위해, 다양한 예시적 컴포넌트들, 블록들, 구성들, 수단들, 로직들, 모듈들, 회로들, 및 단계들은 그들의 기능성 측면에서 일반적으로 위에서 설명되었다. 그러한 기능성이 하드웨어로 또는 소프트웨어로서 구현되는지 여부는 전반적인 시스템에 부과된 특정 어플리케이션(application) 및 설계 제한들에 달려 있다. 숙련된 기술자들은 각각의 특정 어플리케이션들을 위해 다양한 방법들로 설명된 기능성을 구현할 수 있으나, 그러한 구현의 결정들이 본 개시내용의 영역을 벗어나게 하는 것으로 해석되어서는 안된다.
도 7에서 도시되는 수단, 로직, 및 모듈은 각각 도 6에서 설명되는 단계들과 대응될 수 있다.
도 7에서 도시되는 바와 같이, 데이터베이스 관리 장치(120)는, 인덱스 빌드를 요청하는 쿼리를 수신하기 위한 수단(710), 모니터링 알고리즘에 기초하여 인덱스 빌드를 위한 모니터링 동작을 수행하기 위한 수단(730), 모니터링 결과 정보에 기초하여 데이터베이스 인덱스 구조를 생성하기 위한 수단(750) 및 생성된 데이터베이스 인덱스 구조를 저장하기 위한 수단(770)을 포함할 수 있다.
또한, 데이터베이스 관리 장치(120)는, 인덱스 빌드를 요청하는 쿼리를 수신하기 위한 로직(810), 모니터링 알고리즘에 기초하여 인덱스 빌드를 위한 모니터링 동작을 수행하기 위한 로직(830), 모니터링 결과 정보에 기초하여 데이터베이스 인덱스 구조를 생성하기 위한 로직(850) 및 생성된 데이터베이스 인덱스 구조를 저장하기 위한 로직(870)을 포함할 수 있다.
또한, 데이터베이스 관리 장치(120)는, 인덱스 빌드를 요청하는 쿼리를 수신하기 위한 모듈(910), 모니터링 알고리즘에 기초하여 인덱스 빌드를 위한 모니터링 동작을 수행하기 위한 모듈(930), 모니터링 결과 정보에 기초하여 데이터베이스 인덱스 구조를 생성하기 위한 모듈(950) 및 생성된 데이터베이스 인덱스 구조를 저장하기 위한 모듈(970)을 포함할 수 있다.
도 8은 본 개시내용의 실시예들이 구현될 수 있는 예시적인 컴퓨팅 환경에 대한 간략하고 일반적인 개략도를 도시한다.
본 개시내용이 일반적으로 하나 이상의 데이터베이스 관리 장치 상에서 실행될 수 있는 컴퓨터 실행가능 명령어 혹은 로직과 관련하여 전술되었지만, 당업자라면 본 개시내용이 기타 프로그램 모듈들과 결합되어 및/또는 하드웨어와 소프트웨어의 조합으로서 구현될 수 있다는 것을 잘 알 것이다.
일반적으로, 프로그램 모듈은 특정의 태스크를 수행하거나 특정의 추상 데이터 유형을 구현하는 루틴, 프로시져, 프로그램, 컴포넌트, 데이터 구조, 기타 등등을 포함한다. 또한, 당업자라면 본 발명의 방법 및 동작이 단일-프로세서 또는 멀티프로세서 컴퓨터 시스템, 미니컴퓨터, 메인프레임 컴퓨터는 물론 퍼스널 컴퓨터, 핸드헬드 컴퓨팅 장치, 마이크로프로세서-기반 또는 프로그램가능 가전 제품, 기타 등등(이들 각각은 하나 이상의 연관된 장치(예컨대, 데이터베이스 관리 장치(120))와 연결되어 동작할 수 있음)을 비롯한 다른 컴퓨터 시스템 구성으로 실시될 수 있다는 것을 잘 알 것이다.
본 발명의 설명된 실시예들은 또한 어떤 태스크들이 통신 네트워크를 통해 연결되어 있는 원격 처리 장치들에 의해 수행되는 분산 컴퓨팅 환경에서 실시될 수 있다. 분산 컴퓨팅 환경에서, 프로그램 모듈은 로컬 및 원격 메모리 저장 장치 둘다에 위치할 수 있다.
컴퓨터(예컨대, 데이터베이스 관리 장치(120))는 통상적으로 다양한 컴퓨터 판독가능 매체를 포함한다. 컴퓨터에 의해 액세스 가능한 매체는 그 어떤 것이든지 컴퓨터 판독가능 매체가 될 수 있고, 이러한 컴퓨터 판독가능 매체는 휘발성 및 비휘발성 매체, 일시적(transitory) 및 비일시적(non-transitory) 매체, 이동식 및 비-이동식 매체를 포함한다. 제한이 아닌 예로서, 컴퓨터 판독가능 매체는 컴퓨터 판독가능 저장 매체 및 컴퓨터 판독가능 전송 매체를 포함할 수 있다. 컴퓨터 판독가능 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보를 저장하는 임의의 방법 또는 기술로 구현되는 휘발성 및 비휘발성 매체, 일시적 및 비-일시적 매체, 이동식 및 비이동식 매체를 포함한다. 컴퓨터 판독가능 저장 매체는 RAM, ROM, EEPROM, 플래시 메모리 또는 기타 메모리 기술, CD-ROM, DVD(digital video disk) 또는 기타 광 디스크 저장 장치, 자기 카세트, 자기 테이프, 자기 디스크 저장 장치 또는 기타 자기 저장 장치, 또는 컴퓨터에 의해 액세스될 수 있고 원하는 정보를 저장하는 데 사용될 수 있는 임의의 기타 매체를 포함하지만, 이에 한정되지 않는다.
컴퓨터 판독가능 전송 매체는 통상적으로 반송파(carrier wave) 또는 기타 전송 메커니즘(transport mechanism)과 같은 피변조 데이터 신호(modulated data signal)에 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터등을 구현하고 모든 정보 전달 매체를 포함한다. 피변조 데이터 신호라는 용어는 신호 내에 정보를 인코딩하도록 그 신호의 특성들 중 하나 이상을 설정 또는 변경시킨 신호를 의미한다. 제한이 아닌 예로서, 컴퓨터 판독가능 전송 매체는 유선 네트워크 또는 직접 배선 접속(direct-wired connection)과 같은 유선 매체, 그리고 음향, RF, 적외선, 기타 무선 매체와 같은 무선 매체를 포함한다.
컴퓨터(1102)를 포함하는 본 발명의 여러가지 측면들을 구현하는 예시적인 환경(1100)이 나타내어져 있으며, 컴퓨터(1102)는 처리 장치(혹은 프로세서)(1104), 시스템 메모리(1106) 및 시스템 버스(1108)를 포함한다. 시스템 버스(1108)는 시스템 메모리(1106)(이에 한정되지 않음)를 비롯한 시스템 컴포넌트들을 처리 장치(1104)에 연결시킨다. 처리 장치(1104)는 다양한 상용 프로세서들 중 임의의 프로세서일 수 있다. 듀얼 프로세서 및 기타 멀티프로세서 아키텍처도 역시 처리 장치(1104)로서 이용될 수 있다.
시스템 버스(1108)는 메모리 버스, 주변장치 버스, 및 다양한 상용 버스 아키텍처 중 임의의 것을 사용하는 로컬 버스에 추가적으로 상호 연결될 수 있는 몇가지 유형의 버스 구조 중 임의의 것일 수 있다. 시스템 메모리(1106)는 판독 전용 메모리(ROM)(1110) 및 랜덤 액세스 메모리(RAM)(1112)를 포함한다. 기본 입/출력 시스템(BIOS)은 ROM, EPROM, EEPROM 등의 비휘발성 메모리(1110)에 저장되며, 이 BIOS는 시동 중과 같은 때에 컴퓨터(1102) 내의 구성요소들 간에 정보를 전송하는 일을 돕는 기본적인 루틴을 포함한다. RAM(1112)은 또한 데이터를 캐싱하기 위한 정적 RAM 등의 고속 RAM을 포함할 수 있다.
컴퓨터(1102)는 또한 내장형 하드 디스크 드라이브(HDD)(1114)(예를 들어, EIDE, SATA)(이 내장형 하드 디스크 드라이브(1114)는 또한 적당한 섀시(도시 생략) 내에서 외장형 용도로 구성될 수 있음), 자기 플로피 디스크 드라이브(FDD)(1116)(예를 들어, 이동식 디스켓(1118)으로부터 판독을 하거나 그에 기록을 하기 위한 것임), 및 광 디스크 드라이브(1120)(예를 들어, CD-ROM 디스크(1122)를 판독하거나 DVD 등의 기타 고용량 광 매체로부터 판독을 하거나 그에 기록을 하기 위한 것임)를 포함한다. 하드 디스크 드라이브(1114), 자기 디스크 드라이브(1116) 및 광 디스크 드라이브(1120)는 각각 하드 디스크 드라이브 인터페이스(1124), 자기 디스크 드라이브 인터페이스(1126) 및 광 드라이브 인터페이스(1128)에 의해 시스템 버스(1108)에 연결될 수 있다. 외장형 드라이브 구현을 위한 인터페이스(1124)는 USB(Universal Serial Bus) 및 IEEE 1394 인터페이스 기술 중 적어도 하나 또는 그 둘다를 포함한다.
이들 드라이브 및 그와 연관된 컴퓨터 판독가능 매체는 데이터, 데이터 구조, 컴퓨터 실행가능 명령어, 기타 등등의 비휘발성 저장을 제공한다. 컴퓨터(1102)의 경우, 드라이브 및 매체는 임의의 데이터를 적당한 디지털 형식으로 저장하는 것에 대응한다. 상기에서의 컴퓨터 판독가능 매체에 대한 설명이 HDD, 이동식 자기 디스크, 및 CD 또는 DVD 등의 이동식 광학 매체를 언급하고 있지만, 당업자라면 집 드라이브(zip drive), 자기 카세트, 플래쉬 메모리 카드, 카트리지, 기타 등등의 컴퓨터에 의해 판독가능한 다른 유형의 매체도 역시 예시적인 운영 환경에서 사용될 수 있으며 또 임의의 이러한 매체가 본 발명의 방법들을 수행하기 위한 컴퓨터 실행가능 명령어를 포함할 수 있다는 것을 잘 알 것이다.
운영 체제(1130), 하나 이상의 애플리케이션 프로그램(1132), 기타 프로그램 모듈(1134) 및 프로그램 데이터(1136)을 비롯한 다수의 프로그램 모듈이 드라이브 및 RAM(1112)에 저장될 수 있다. 운영 체제, 애플리케이션, 모듈 및/또는 데이터의 전부 또는 그 일부분이 또한 RAM(1112)에 캐싱될 수 있다. 본 발명이 여러가지 상업적으로 이용가능한 운영 체제 또는 운영 체제들의 조합에서 구현될 수 있다는 것을 잘 알 것이다.
사용자는 하나 이상의 유선/무선 입력 장치, 예를 들어, 키보드(1138) 및 마우스(1140) 등의 포인팅 장치를 통해 컴퓨터(1102)에 명령 및 정보를 입력할 수 있다. 기타 입력 장치(도시 생략)로는 마이크, IR 리모콘, 조이스틱, 게임 패드, 스타일러스 펜, 터치 스크린, 기타 등등이 있을 수 있다. 이들 및 기타 입력 장치가 종종 시스템 버스(1108)에 연결되어 있는 입력 장치 인터페이스(1142)를 통해 처리 장치(1104)에 연결되지만, 병렬 포트, IEEE 1394 직렬 포트, 게임 포트, USB 포트, IR 인터페이스, 기타 등등의 기타 인터페이스에 의해 연결될 수 있다.
모니터(1144) 또는 다른 유형의 디스플레이 장치도 역시 비디오 어댑터(1146) 등의 인터페이스를 통해 시스템 버스(1108)에 연결된다. 모니터(1144)에 부가하여, 컴퓨터는 일반적으로 스피커, 프린터, 기타 등등의 기타 주변 출력 장치(도시 생략)를 포함한다.
컴퓨터(1102)는 유선 및/또는 무선 통신을 통한 원격 컴퓨터(들)(1148) 등의 하나 이상의 원격 컴퓨터로의 논리적 연결을 사용하여 네트워크화된 환경에서 동작할 수 있다. 원격 컴퓨터(들)(1148)는 워크스테이션, 서버 컴퓨터, 라우터, 퍼스널 컴퓨터, 휴대용 컴퓨터, 마이크로프로세서-기반 오락 기기, 피어 장치 또는 기타 통상의 네트워크 노드일 수 있으며, 일반적으로 컴퓨터(1102)에 대해 기술된 구성요소들 중 다수 또는 그 전부를 포함하지만, 간략함을 위해, 메모리 저장 장치(1150)만이 도시되어 있다. 도시되어 있는 논리적 연결은 근거리 통신망(LAN)(1152) 및/또는 더 큰 네트워크, 예를 들어, 원거리 통신망(WAN)(1154)에의 유선/무선 연결을 포함한다. 이러한 LAN 및 WAN 네트워킹 환경은 사무실 및 회사에서 일반적인 것이며, 인트라넷 등의 전사적 컴퓨터 네트워크(enterprise-wide computer network)를 용이하게 해주며, 이들 모두는 전세계 컴퓨터 네트워크, 예를 들어, 인터넷에 연결될 수 있다.
LAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 유선 및/또는 무선 통신 네트워크 인터페이스 또는 어댑터(1156)를 통해 로컬 네트워크(1152)에 연결된다. 어댑터(1156)는 LAN(1152)에의 유선 또는 무선 통신을 용이하게 해줄 수 있으며, 이 LAN(1152)은 또한 무선 어댑터(1156)와 통신하기 위해 그에 설치되어 있는 무선 액세스 포인트를 포함하고 있다. WAN 네트워킹 환경에서 사용될 때, 컴퓨터(1102)는 모뎀(1158)을 포함할 수 있거나, WAN(1154) 상의 통신 서버에 연결되거나, 또는 인터넷을 통하는 등, WAN(1154)을 통해 통신을 설정하는 기타 수단을 갖는다. 내장형 또는 외장형 및 유선 또는 무선 장치일 수 있는 모뎀(1158)은 직렬 포트 인터페이스(1142)를 통해 시스템 버스(1108)에 연결된다. 네트워크화된 환경에서, 컴퓨터(1102)에 대해 설명된 프로그램 모듈들 또는 그의 일부분이 원격 메모리/저장 장치(1150)에 저장될 수 있다. 도시된 네트워크 연결이 예시적인 것이며 컴퓨터들 사이에 통신 링크를 설정하는 기타 수단이 사용될 수 있다는 것을 잘 알 것이다.
컴퓨터(1102)는 무선 통신으로 배치되어 동작하는 임의의 무선 장치 또는 개체, 예를 들어, 프린터, 스캐너, 데스크톱 및/또는 휴대용 컴퓨터, PDA(portable data assistant), 통신 위성, 무선 검출가능 태그와 연관된 임의의 장비 또는 장소, 및 전화와 통신을 하는 동작을 한다. 이것은 적어도 Wi-Fi 및 블루투스 무선 기술을 포함한다. 따라서, 통신은 종래의 네트워크에서와 같이 미리 정의된 구조이거나 단순하게 적어도 2개의 장치 사이의 애드혹 통신(ad hoc communication)일 수 있다.
Wi-Fi(Wireless Fidelity)는 유선 없이도 인터넷 등으로의 연결을 가능하게 해준다. Wi-Fi는 이러한 장치, 예를 들어, 컴퓨터가 실내에서 및 실외에서, 즉 기지국의 통화권 내의 아무 곳에서나 데이터를 전송 및 수신할 수 있게 해주는 셀 전화와 같은 무선 기술이다. Wi-Fi 네트워크는 안전하고 신뢰성있으며 고속인 무선 연결을 제공하기 위해 IEEE 802.11(a,b,g, 기타)이라고 하는 무선 기술을 사용한다. 컴퓨터를 서로에, 인터넷에 및 유선 네트워크(IEEE 802.3 또는 이더넷을 사용함)에 연결시키기 위해 Wi-Fi가 사용될 수 있다. Wi-Fi 네트워크는 비인가 2.4 및 5 GHz 무선 대역에서, 예를 들어, 11Mbps(802.11a) 또는 54 Mbps(802.11b) 데이터 레이트로 동작하거나, 양 대역(듀얼 대역)을 포함하는 제품에서 동작할 수 있다.
본 발명의 기술 분야에서 통상의 지식을 가진 자는 여기에 개시된 실시예들과 관련하여 설명된 다양한 예시적인 논리 블록들, 모듈들, 프로세서들, 수단들, 회로들 및 알고리즘 단계들이 전자 하드웨어, (편의를 위해, 여기에서 "소프트웨어"로 지칭되는) 다양한 형태들의 프로그램 또는 설계 코드 또는 이들 모두의 결합에 의해 구현될 수 있다는 것을 이해할 것이다. 하드웨어 및 소프트웨어의 이러한 상호 호환성을 명확하게 설명하기 위해, 다양한 예시적인 컴포넌트들, 블록들, 모듈들, 회로들 및 단계들이 이들의 기능과 관련하여 위에서 일반적으로 설명되었다. 이러한 기능이 하드웨어 또는 소프트웨어로서 구현되는지 여부는 특정한 애플리케이션 및 전체 시스템에 대하여 부과되는 설계 제약들에 따라 좌우된다. 본 발명의 기술 분야에서 통상의 지식을 가진 자는 각각의 특정한 애플리케이션에 대하여 다양한 방식들로 설명된 기능을 구현할 수 있으나, 이러한 구현 결정들은 본 발명의 범위를 벗어나는 것으로 해석되어서는 안 될 것이다.
여기서 제시된 다양한 실시예들은 방법, 장치, 또는 표준 프로그래밍 및/또는 엔지니어링 기술을 사용한 제조 물품(article)으로 구현될 수 있다. 용어 "제조 물품"은 임의의 컴퓨터-판독가능 장치로부터 액세스 가능한 컴퓨터 프로그램, 캐리어, 또는 매체(media)를 포함한다. 예를 들어, 컴퓨터-판독가능 매체는 자기 저장 장치(예를 들면, 하드 디스크, 플로피 디스크, 자기 스트립, 등), 광학 디스크(예를 들면, CD, DVD, 등), 스마트 카드, 및 플래쉬 메모리 장치(예를 들면, EEPROM, 카드, 스틱, 키 드라이브, 등)를 포함하지만, 이들로 제한되는 것은 아니다. 또한, 여기서 제시되는 다양한 저장 매체는 정보를 저장하기 위한 하나 이상의 장치 및/또는 다른 기계-판독가능한 매체를 포함한다. 용어 "기계-판독가능 매체"는 명령(들) 및/또는 데이터를 저장, 보유, 및/또는 전달할 수 있는 무선 채널 및 다양한 다른 매체를 포함하지만, 이들로 제한되는 것은 아니다.
제시된 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조는 예시적인 접근들의 일례임을 이해하도록 한다. 설계 우선순위들에 기반하여, 본 발명의 범위 내에서 프로세스들에 있는 단계들의 특정한 순서 또는 계층 구조가 재배열될 수 있다는 것을 이해하도록 한다. 첨부된 방법 청구항들은 샘플 순서로 다양한 단계들의 엘리먼트들을 제공하지만 제시된 특정한 순서 또는 계층 구조에 한정되는 것을 의미하지는 않는다.

Claims (16)

  1. 인코딩된 명령들을 포함하는 컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램으로서, 상기 컴퓨터 프로그램은 하나 이상의 프로세서들에 의해 실행되는 경우, 상기 하나 이상의 프로세서들로 하여금 데이터의 검색 성능을 향상시키기 위하여 이하의 동작을 수행하도록 하며, 상기 동작은:
    데이터베이스 관리 시스템(DBMS)에서의 모니터링 알고리즘에 따른 모니터링 결과 정보에 기초하여, 데이터 저장 위치를 포인팅(pointing)하기 위한 데이터베이스 인덱스 구조를 생성하는 동작;
    을 포함하며,
    상기 데이터베이스 인덱스 구조는, 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 적어도 부분적으로 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조는 복수의 컬럼(column)들을 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우(row)에 대응되는 ROWID 값들을 포함하며, 그리고
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화(optimized) 인덱스 값들을 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  2. 제 1 항에 있어서,
    상기 제 3 컬럼에 포함되는 최적화 인덱스 값들은,
    상기 제 2 레벨의 서브 인덱스 구조가 제 1 타입의 인덱싱 방식 또는 상기 제 1 타입의 인덱싱 방식과 상이한 제 2 타입의 인덱싱 방식 중 어느 인덱싱 방식을 사용할 것인지에 대한 표시를 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  3. 제 1 항에 있어서,
    상기 모니터링 결과 정보는,
    상기 제 2 레벨의 서브 인덱스 구조가 제 1 타입의 인덱싱 방식 또는 상기 제 1 타입의 인덱싱 방식과 상이한 제 2 타입의 인덱싱 방식 중 어느 인덱싱 방식을 사용할 것인지에 대한 표시를 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  4. 제 3 항에 있어서,
    상기 제 3 컬럼에 포함되는 최적화 인덱스 값은,
    상기 모니터링 결과 정보가 제 1 타입의 인덱싱 방식을 사용할 것을 나타내는 경우, 비트맵 값을 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  5. 제 4 항에 있어서,
    상기 제 3 컬럼에 포함되는 최적화 인덱스 값은,
    상기 모니터링 결과 정보가 제 2 타입의 인덱싱 방식을 사용할 것을 나타내는 경우, NULL 값을 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  6. 제 5 항에 있어서,
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 4 컬럼은 종료(end) ROWID 값들을 포함하며, 상기 종료 ROWID 값은 상기 모니터링 결과 정보가 제 2 타입의 인덱싱 방식을 사용할 것을 나타내는 경우, NULL 값을 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  7. 제 5 항에 있어서,
    상기 비트맵 값은,
    상기 ROWID 값을 기준 지점으로 하여 상기 기준 지점과 상기 제 2 레벨의 서브 인덱스 구조 내에서의 다른 ROWID 값들의 위치 간의 상대적인 거리를 표시하는 비트(bit) 값인,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  8. 제 7 항에 있어서,
    상기 제 1 레벨의 서브 인덱스 구조는 루트(root) 노드 및 브랜치(branch) 노드 중 적어도 하나를 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조는 리프(leaf) 노드를 포함하며, 그리고
    상기 제 1 레벨의 서브 인덱스 구조는, 하위 레벨의 서브 인덱스 구조의 시작 ROWID 값 및 상기 하위 레벨의 서브 인덱스 구조에 접근하기 위한 주소 값을 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  9. 제 8 항에 있어서,
    상기 모니터링 알고리즘에 따른 모니터링 결과 정보는,
    상기 데이터베이스 인덱스 구조가 참조하는 기초(base) 데이터 구조의 컬럼 값에 액세스되는 횟수 정보에 적어도 부분적으로 기초하여 생성되며, 그리고 로우 단위로 또는 키 값 단위로 상기 제 1 타입의 인덱싱 방식 또는 상기 제 2 타입의 인덱싱 방식 중 어느 인덱싱 방식을 사용할 것인지에 대한 표시를 포함하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  10. 제 9 항에 있어서,
    상기 컬럼 값으로 액세스되는 횟수 정보 혹은 상기 키 값에 대한 액세스 횟수 정보가 사전결정된 액세스 임계 횟수값 보다 큰 경우 상기 모니터링 결과 정보는 상기 제 1 타입의 인덱싱 방식을 사용할 것을 표시하고,
    상기 컬럼 값으로 액세스되는 횟수 정보 혹은 상기 키 값에 대한 액세스 횟수 정보가 사전결정된 액세스 임계 횟수값 이하인 경우 상기 모니터링 결과 정보는 상기 제 2 타입의 인덱싱 방식을 사용할 것을 표시하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  11. 제 8 항에 있어서,
    상기 모니터링 알고리즘에 따른 모니터링 결과 정보는,
    상기 데이터베이스 인덱스 구조가 참조하는 기초 데이터 구조의 파티션(partition) 특성 정보에 적어도 부분적으로 기초하여 파티션 단위로 생성되는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  12. 제 11 항에 있어서,
    상기 기초 데이터 구조의 파티션 특성 정보는,
    파티션의 Distinct 값의 크기 정보 및 파티션에 대한 DML(Data Manipulation Language) 발생 횟수 정보 중 적어도 하나에 기초하여 결정되는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  13. 제 12 항에 있어서,
    상기 파티션의 상기 Distinct 값의 크기 정보가 사전결정된 크기 임계값보다 작거나 또는 상기 파티션에 대한 DML 발생 횟수 정보가 사전결정된 DML 발생 횟수 임계값 보다 작은 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 상기 제 1 타입의 인덱싱 방식을 사용할 것을 표시하며, 그리고
    상기 파티션에 대한 상기 DML 발생 횟수 정보가 사전결정된 DML 발생 횟수 임계값 이상인 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 상기 제 2 타입의 인덱싱 방식을 사용할 것을 표시하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  14. 제 11 항에 있어서,
    상기 모니터링 알고리즘에 따른 모니터링 결과 정보는,
    상기 파티션에 포함된 데이터의 마지막 액세스 시점 정보에 적어도 부분적으로 기초하여 결정되며,
    상기 파티션에 포함된 데이터의 상기 마지막 액세스 시점 정보가 사전결정된 임계 시점 정보 보다 오래된 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 상기 제 1 타입의 인덱싱 방식을 사용할 것을 표시하며, 그리고
    상기 파티션에 포함된 데이터의 상기 마지막 액세스 시점 정보가 사전결정된 임계 시점 정보 보다 오래되지 않은 경우, 상기 모니터링 결과 정보는 상기 파티션에 대해서 상기 제 2 타입의 인덱싱 방식을 사용할 것을 표시하는,
    컴퓨터-판독가능 저장 매체에 저장된 컴퓨터 프로그램.
  15. 데이터베이스 관리 시스템(DBMS)에서 수행되는 방법으로서,
    데이터베이스 관리 시스템에서의 모니터링 알고리즘에 따른 모니터링 결과 정보에 기초하여, 데이터 저장 위치를 포인팅하기 위한 데이터베이스 인덱스 구조를 생성하는 단계;
    를 포함하며,
    상기 데이터베이스 인덱스 구조는, 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 적어도 부분적으로 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조는 복수의 컬럼들을 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우에 대응되는 ROWID 값들을 포함하며, 그리고
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화 인덱스 값들을 포함하는,
    방법.
  16. 데이터베이스 관리 장치로서,
    데이터베이스 관리 시스템에서의 모니터링 알고리즘에 따른 모니터링 결과 정보에 기초하여, 데이터 저장 위치를 포인팅하기 위한 데이터베이스 인덱스 구조를 생성하는 프로세서;
    상기 생성된 데이터베이스 인덱스 구조를 저장하는 저장부;
    를 포함하며,
    상기 데이터베이스 인덱스 구조는, 제 1 레벨의 서브 인덱스 구조 및 상기 제 1 레벨 보다 하위 레벨인 제 2 레벨의 서브 인덱스 구조를 적어도 부분적으로 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조는 복수의 컬럼들을 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 1 컬럼은 키 값들을 포함하며,
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 2 컬럼은, 데이터 블록의 로우에 대응되는 ROWID 값들을 포함하며, 그리고
    상기 제 2 레벨의 서브 인덱스 구조의 복수의 컬럼들 중 제 3 컬럼은 상기 모니터링 결과 정보에 기초하여 설정되는 최적화 인덱스 값들을 포함하는,
    데이터베이스 관리 장치.
KR1020180059336A 2018-05-25 2018-05-25 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램 KR20190134115A (ko)

Priority Applications (3)

Application Number Priority Date Filing Date Title
KR1020180059336A KR20190134115A (ko) 2018-05-25 2018-05-25 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램
US16/019,694 US10860561B2 (en) 2018-05-25 2018-06-27 Method and apparatus for providing efficient indexing and computer program included in computer readable medium therefor
US17/090,441 US11468027B2 (en) 2018-05-25 2020-11-05 Method and apparatus for providing efficient indexing and computer program included in computer readable medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180059336A KR20190134115A (ko) 2018-05-25 2018-05-25 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램

Related Child Applications (1)

Application Number Title Priority Date Filing Date
KR1020200030277A Division KR102127785B1 (ko) 2020-03-11 2020-03-11 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램

Publications (1)

Publication Number Publication Date
KR20190134115A true KR20190134115A (ko) 2019-12-04

Family

ID=68615323

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180059336A KR20190134115A (ko) 2018-05-25 2018-05-25 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램

Country Status (2)

Country Link
US (2) US10860561B2 (ko)
KR (1) KR20190134115A (ko)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704248A (zh) * 2021-07-12 2021-11-26 北京邮电大学 一种基于外置索引的区块链查询优化方法
CN114185934A (zh) * 2021-12-15 2022-03-15 广州辰创科技发展有限公司 一种基于天盾数据库列存储的索引及查询方法及***

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11048756B2 (en) * 2019-01-31 2021-06-29 EMC IP Holding Company LLC Inserting datasets into database systems utilizing hierarchical value lists
CN111261227B (zh) * 2020-01-20 2022-06-17 苏州浪潮智能科技有限公司 测序数据存储方法、装置、设备及计算机可读存储介质
CN111310076B (zh) * 2020-02-25 2023-10-03 同盾控股有限公司 地理位置查询方法、装置、介质及电子设备
US11366793B1 (en) 2020-12-21 2022-06-21 Dropbox, Inc. Data model and data service for content management system
US12001574B2 (en) 2020-12-21 2024-06-04 Dropbox, Inc. Evaluating an access control list from permission statements
US20220197883A1 (en) * 2020-12-21 2022-06-23 Dropbox, Inc. Aggregates index
US11645273B2 (en) 2021-05-28 2023-05-09 Ocient Holdings LLC Query execution utilizing probabilistic indexing
CN113722415B (zh) * 2021-11-04 2022-02-11 北京四维图新科技股份有限公司 点云数据的处理方法、装置、电子设备及存储介质
US11573860B1 (en) * 2021-11-22 2023-02-07 Vmware, Inc. Verification of metadata consistency across snapshot copy-on-write (COW) B+tree logical maps
JP2023104400A (ja) * 2022-01-17 2023-07-28 富士通株式会社 データ管理方法およびデータ管理プログラム
CN114547380B (zh) * 2022-01-25 2022-11-15 北京元年科技股份有限公司 数据遍历查询方法、装置、电子设备及可读存储介质
KR20230120347A (ko) * 2022-02-09 2023-08-17 주식회사 티맥스티베로 데이터를 인덱스하기 위한 방법

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903888A (en) 1997-02-28 1999-05-11 Oracle Corporation Method and apparatus for using incompatible types of indexes to process a single query
US6278992B1 (en) 1997-03-19 2001-08-21 John Andrew Curtis Search engine using indexing method for storing and retrieving data
JP2004326404A (ja) 2003-04-24 2004-11-18 Nec Corp インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1211611A1 (en) * 2000-11-29 2002-06-05 Lafayette Software Inc. Methods of encoding and combining integer lists
US6836777B2 (en) * 2001-11-15 2004-12-28 Ncr Corporation System and method for constructing generic analytical database applications
US7457286B2 (en) * 2003-03-31 2008-11-25 Applied Micro Circuits Corporation Accelerating the shortest path problem
US7386563B1 (en) * 2003-12-11 2008-06-10 Unisys Corporation Method for using deferred column retrieval to improve row retrieval and query performance of OLE DB applications
US20050257201A1 (en) * 2004-05-17 2005-11-17 International Business Machines Corporation Optimization of XPath expressions for evaluation upon streaming XML data
US8041742B1 (en) * 2004-12-20 2011-10-18 American Megatrends, Inc. Method, system, and apparatus for providing generic database services within an extensible firmware interface environment
US20070174309A1 (en) 2006-01-18 2007-07-26 Pettovello Primo M Mtreeini: intermediate nodes and indexes
JP4933222B2 (ja) * 2006-11-15 2012-05-16 株式会社日立製作所 インデックス処理方法及び計算機システム
US7840609B2 (en) * 2007-07-31 2010-11-23 Oracle International Corporation Using sibling-count in XML indexes to optimize single-path queries
US7792823B2 (en) * 2008-01-15 2010-09-07 International Business Machines Corporation Maintained symbol table only index
US9626398B2 (en) 2012-05-22 2017-04-18 Hewlett Packard Enterprise Development Lp Tree data structure
US8982129B1 (en) * 2010-04-23 2015-03-17 Crimson Corporation Mapping graph data to a tree structure on a computing device
US9097239B2 (en) * 2010-08-18 2015-08-04 Ebo Group, Inc. Wind turbine torque limiting clutch system
US20130151535A1 (en) * 2011-12-09 2013-06-13 Canon Kabushiki Kaisha Distributed indexing of data
US20140122173A1 (en) * 2012-10-25 2014-05-01 Hewlett-Packard Development Company, L.P. Estimating semi-parametric product demand models
KR101539306B1 (ko) * 2013-10-14 2015-07-24 주식회사 파수닷컴 데이터베이스에서 암호화된 필드에 대한 색인 생성 및 검색 방법
US9460402B2 (en) * 2013-12-27 2016-10-04 International Business Machines Corporation Condensing hierarchical data
US9582566B2 (en) * 2013-12-27 2017-02-28 International Business Machines Corporation Condensing hierarchical data
US10061792B2 (en) * 2013-12-31 2018-08-28 Sybase, Inc. Tiered index management

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5903888A (en) 1997-02-28 1999-05-11 Oracle Corporation Method and apparatus for using incompatible types of indexes to process a single query
US6278992B1 (en) 1997-03-19 2001-08-21 John Andrew Curtis Search engine using indexing method for storing and retrieving data
JP2004326404A (ja) 2003-04-24 2004-11-18 Nec Corp インデックス作成装置、インデックス作成方法、および、インデックス作成プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113704248A (zh) * 2021-07-12 2021-11-26 北京邮电大学 一种基于外置索引的区块链查询优化方法
CN113704248B (zh) * 2021-07-12 2024-01-09 北京邮电大学 一种基于外置索引的区块链查询优化方法
CN114185934A (zh) * 2021-12-15 2022-03-15 广州辰创科技发展有限公司 一种基于天盾数据库列存储的索引及查询方法及***

Also Published As

Publication number Publication date
US20210056087A1 (en) 2021-02-25
US20190362000A1 (en) 2019-11-28
US11468027B2 (en) 2022-10-11
US10860561B2 (en) 2020-12-08

Similar Documents

Publication Publication Date Title
US11468027B2 (en) Method and apparatus for providing efficient indexing and computer program included in computer readable medium therefor
KR102195836B1 (ko) 인덱스 관리 방법
KR101706252B1 (ko) 이기종 데이터베이스들 간의 쿼리 결과를 동기화하기 위한 방법, 서버 및 컴퓨터-판독가능 매체에 저장된 컴퓨터 프로그램
US8868926B2 (en) Cryptographic hash database
US8732139B2 (en) Method and system for dynamically partitioning very large database indices on write-once tables
KR101747265B1 (ko) 쿼리를 실행하기 위한 방법, 장치 및 컴퓨터 판독가능 매체
US11003540B2 (en) Method, server, and computer readable medium for index recovery using index redo log
KR102230245B1 (ko) 피벗 쿼리를 처리하기 위한 컴퓨터 프로그램
KR102127785B1 (ko) 효율적인 인덱싱을 제공하기 위한 방법, 장치 및 컴퓨터-판독가능 매체에 포함된 컴퓨터 프로그램
KR101797483B1 (ko) 데이터베이스 관리 시스템에서 쿼리를 프로세싱하기 위한 기법
KR101751970B1 (ko) 쿼리를 실행하기 위한 방법, 장치 및 컴퓨터 판독가능 매체
KR102057055B1 (ko) 인덱스 관리 방법
KR101747262B1 (ko) 동적인 알고리즘 변경을 통하여 쿼리 처리 시간을 축소시키기 위한 방법, 장치 및 컴퓨터-판독가능 매체
KR101747270B1 (ko) 이기종 데이터베이스들 간의 쿼리 결과를 동기화하기 위한 방법, 서버 및 컴퓨터-판독가능 매체에 저장된 컴퓨터 프로그램
KR20170122151A (ko) 동적인 알고리즘 변경을 통하여 쿼리 처리 시간을 축소시키기 위한 방법, 장치 및 컴퓨터-판독가능 매체
KR20170101835A (ko) 이기종 데이터베이스들 간의 쿼리 결과를 동기화하기 위한 방법, 서버 및 컴퓨터-판독가능 매체에 저장된 컴퓨터 프로그램
KR102233944B1 (ko) 데이터베이스 관리를 위한 컴퓨터 프로그램
KR102214697B1 (ko) 데이터베이스 관리 시스템에서 데이터 저장을 위한 공간 관리를 제공하는 컴퓨터 프로그램
KR20210033880A (ko) 인덱스 리두 로그를 이용한 인덱스 복구를 위한 방법, 서버 및 컴퓨터 판독가능 저장매체
KR20170143470A (ko) 쿼리를 실행하기 위한 방법, 장치 및 컴퓨터 판독가능 매체
KR20200001575A (ko) 인덱스 관리 방법
KR20200136858A (ko) 인덱스 관리 방법
KR20180009730A (ko) 데이터베이스 관리 시스템에서 쿼리를 프로세싱하기 위한 기법
KR20210029174A (ko) 피벗 쿼리를 처리하기 위한 컴퓨터 프로그램
KR20170143437A (ko) 쿼리를 실행하기 위한 방법, 장치 및 컴퓨터 판독가능 매체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
A107 Divisional application of patent