KR20190118913A - 메타데이터 변환 장치 및 방법 - Google Patents

메타데이터 변환 장치 및 방법 Download PDF

Info

Publication number
KR20190118913A
KR20190118913A KR1020180042385A KR20180042385A KR20190118913A KR 20190118913 A KR20190118913 A KR 20190118913A KR 1020180042385 A KR1020180042385 A KR 1020180042385A KR 20180042385 A KR20180042385 A KR 20180042385A KR 20190118913 A KR20190118913 A KR 20190118913A
Authority
KR
South Korea
Prior art keywords
metadata
information
file
database
mapping
Prior art date
Application number
KR1020180042385A
Other languages
English (en)
Inventor
박경현
원희선
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR1020180042385A priority Critical patent/KR20190118913A/ko
Priority to US16/249,985 priority patent/US20190317919A1/en
Publication of KR20190118913A publication Critical patent/KR20190118913A/ko

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/16File or folder operations, e.g. details of user interfaces specifically adapted to file systems
    • G06F16/164File meta data generation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/10File systems; File servers
    • G06F16/14Details of searching files based on file metadata

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Library & Information Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

메타데이터 변환 장치는 적용할 메타데이터의 표준규약모델을 설정하고, 수집 대상이 되는 유통 플랫폼의 메타데이터를 수집한 후, 수집한 상기 메타데이터와 상기 표준규약모델간의 매핑을 수행하며, 매핑된 메타데이터를 메타데이터 교환을 위한 파일 형태로 변환한다.

Description

메타데이터 변환 장치 및 방법{APPARATUS AND METHOD FOR CONVERTING METADATA}
본 발명은 메타데이터 변환 장치 및 방법에 관한 것으로, 특히 데이터 유통 환경에서 메타데이터 상호 교환을 위한 메타데이터 변환 장치 및 방법에 관한 것이다.
최근 인공지능 기술의 발달로 데이터가 점점 더 중요한 자원으로 인식되면서 세계 각국은 공공데이터 기반의 다양한 비즈니스 기회를 창출하기 위한 오픈 데이터 정책을 수립하고 시행하고 있다. 이와 더불어 사회 전분야에 걸친 대용량의 공공데이터를 효과적으로 저장, 관리하고 공유하기 위한 솔루션으로 데이터 유통 플랫폼이 확산, 발전하고 있다.
공공데이터는 공공기관에 의해 생성되고 관리되는 방대한 데이터로 기상, 지리정보로부터 교통, 식품에 이르기까지 사회 전분야에 걸친 방대한 데이터를 일컫는다. 공공데이터를 효과적으로 공유하고 활용하기 위한 소프트웨어로 오픈 데이터 유통 플랫폼이 확산, 발전하고 있는데 대표적인 오픈소스 플랫폼으로 CKAN(Comprehensive Knowledge Archive Network)과 DKAN이 있고 상용 플랫폼으로 소크라타(Socrata)가 있다.
오픈 데이터 플랫폼은 데이터 카탈로그를 통해 데이터를 관리하고 다양한 검색기능을 제공한다. 또한 다른 플랫폼과의 정보교환 및 검색도 데이터 카탈로그를 통해 이루어지기 때문에 오픈 데이터 플랫폼의 활용에 있어서 데이터 카탈로그의 표준화는 가장 중요한 요소중의 하나이다.
데이터 카탈로그 표준기술 중 가장 대표적인 기술로는 웹 상의 데이터를 통합 관리하기 위한 메타데이터 표준인 DCAT(Data Catalog Vocabulary)이 있다. DCAT은 웹상에 존재하는 카탈로그 데이터간에 상호 연동성을 제공하기 위한 W3C 표준으로 웹 상의 다양한 데이터 소스로부터 메타데이터를 읽어 데이터의 접근 및 활용을 가능하게 할 수 있도록 RDF(Resource Description Framework) 포맷으로 정의된다.
DCAT은 유연한 확장성으로 인해 CKAN, DKAN, 소크라타와 같은 많은 오픈 데이터 플랫폼에서 적용하고 있고, 실제 data.gov와 data.gov.uk와 같은 많은 공공데이터 포털에서 데이터 연동을 위해 활용되고 있다. DCAT은 3개의 주 클래스인 카탈로그(Catalog), 데이터셋(DataSet), 분포(Distribution)와 1개의 중요 클래스인 Distribution을 중심으로 구성된다.
오픈 데이터 플랫폼 중의 하나인 CKAN은 CKAN 하베스팅을 통해 CKAN간에 메타데이터를 공유한다. 또한 DCAT 하베스팅을 지원함으로써 CKAN 플랫폼이 아니더라도 DCAT을 지원하는 다른 플랫폼과도 데이터를 공유할 수 있다.
일반적으로 데이터 유통 플랫폼은 CKAN과 같은 기존의 플랫폼을 그대로 활용하기도 하지만 요구사항에 의해 자체 개발하거나 기존 플랫폼을 수정 및 확장 개발하는 경우도 많다. 이럴 경우에는 데이터 플랫폼간에 메타데이터를 상호교환 할 수 없다는 문제점이 발생한다.
본 발명이 해결하려는 과제는 플랫폼 간에 메타데이터 상호교환을 가능하게 하기 위한 메타데이터 변환 장치 및 방법을 제공하는 것이다.
본 발명의 한 실시 예에 따르면, 메타데이터 변환 장치에서 메타데이터를 변환하는 방법이 제공된다. 메타데이터 변환 방법은 적용할 메타데이터의 표준규약모델을 설정하는 단계, 수집 대상이 되는 유통 플랫폼의 메타데이터를 수집하는 단계, 수집한 상기 메타데이터와 상기 표준규약모델간의 매핑을 수행하는 단계, 그리고 매핑된 메타데이터를 메타데이터 교환을 위한 파일 형태로 변환하는 단계를 포함한다.
상기 설정하는 단계는 표준규약으로 DCAT(Data Catalog Vocabulary)을 선택하는 단계를 포함할 수 있다.
상기 매핑을 수행하는 단계는 상기 수집한 메타데이터로부터 스키마 정보를 추출하는 단계, 상기 표준규약모델을 관계형 모델로 변경하는 단계, 그리고 상기 메타데이터의 스키마 정보와 상기 관계형 모델을 대상으로 매핑을 수행하는 단계를 포함할 수 있다.
상기 메타데이터의 스키마 정보와 상기 관계형 모델을 대상으로 매핑을 수행하는 단계는 상기 관계형 모델을 기준으로 해당 필드가 상기 메타데이터의 스키마 정보에 존재하면 매핑하는 단계를 포함할 수 있다.
상기 스키마 정보를 추출하는 단계는 데이터베이스에 직접 접속하는 방법, 상기 데이터베이스에 접근할 수 있는 REST API를 이용하는 방법 및 메타데이터 정보를 저장한 파일에 접근하는 방법 중 적어도 하나를 이용하여 스키마 및 메타데이터 정보를 추출하는 단계를 포함할 수 있다.
상기 변환하는 단계는 엔드포인트(End Point)를 설정하는 단계, 그리고 상기 메타데이터의 파일 포맷을 결정하는 단계를 포함할 수 있다.
상기 메타데이터 변환 방법은 상기 파일 형태로 변환된 메타데이터를 배포하는 단계를 더 포함할 수 있다.
본 발명의 다른 한 실시 예에 따르면, 데이터 유통 플랫폼의 메타데이터를 변환하는 장치가 제공된다. 메타데이터 변환 장치는 수집 대상이 되는 유통 플랫폼의 메타데이터를 수집하고, 수집한 상기 메타데이터와 적용할 메타데이터의 표준규약모델간의 매핑을 수행한 후, 매핑된 메타데이터를 메타데이터 교환을 위한 파일 형태로 변환하는 프로세서, 그리고 상기 파일 형태의 메타데이터를 교환하는 입출력 인터페이스를 포함한다.
상기 표준규약모델은 DCAT(Data Catalog Vocabulary) 모델을 포함할 수 있다.
상기 프로세서는 상기 수집한 메타데이터로부터 스키마 정보를 추출하고, 상기 표준규약모델을 관계형 모델로 변경한 후, 상기 관계형 모델을 기준으로 해당 필드가 존재하면 매핑할 수 있다.
상기 프로세서는 데이터베이스에 직접 접속하는 방법, 상기 데이터베이스에 접근할 수 있는 REST API를 이용하는 방법 및 메타데이터 정보를 저장한 파일에 접근하는 방법 중 적어도 하나를 이용하여 상기 스키마 정보를 추출할 수 있다.
상기 프로세서는 매핑된 메타데이터의 출력 형태를 결정하기 위한 엔드포인트를 결정한 후, 상기 매핑된 메타데이터의 파일 포맷을 결정할 수 있다.
본 발명에 따르면, DCAT 기반 메타데이터 변환 장치를 이용하여 DCAT을 지원하는 다른 데이터 유통 플랫폼들과 데이터를 상호 교환할 수 있다는 이점이 있다.
도 1은 데이터 유통 플랫폼간 메타데이터 수집 방법의 일 예를 나타낸 도면이다.
도 2는 본 발명의 실시 예에 따른 메타데이터 변환 장치에서 메타데이터와 DCAT간의 매핑 방법을 나타낸 도면이다.
도 3은 본 발명의 한 실시 예에 따른 메타데이터 변환 장치에서 메타데이터 스키마 정보를 추출하기 위한 방법을 나타낸 도면이다.
도 4는 본 발명의 다른 실시 예에 따른 메타데이터 변환 장치에서 메타데이터 스키마 정보를 추출하기 위한 방법을 나타낸 도면이다.
도 5는 본 발명의 또 다른 실시 예에 따른 메타데이터 변환 장치에서 메타데이터 스키마 정보를 추출하기 위한 방법을 나타낸 도면이다.
도 6은 본 발명의 실시 예에 따른 데이터 유통 플랫폼의 스키마를 추출하여 DCAT 기반의 RDF 파일을 생성하는 방법을 나타낸 도면이다.
도 7은 본 발명의 실시 예에 따른 메타데이터와 DCAT간의 매핑하는 인터페이스를 나타낸 도면이다.
도 8은 본 발명이 실시 예에 따른 메타데이터 변환 장치에서 RDF 파일을 관리하는 방법을 나타낸 도면이다.
도 9는 본 발명의 실시 예에 따른 메타데이터 변환 장치를 나타낸 도면이다.
아래에서는 첨부한 도면을 참고로 하여 본 발명의 실시 예에 대하여 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자가 용이하게 실시할 수 있도록 상세히 설명한다. 그러나 본 발명은 여러 가지 상이한 형태로 구현될 수 있으며 여기에서 설명하는 실시 예에 한정되지 않는다. 그리고 도면에서 본 발명을 명확하게 설명하기 위해서 설명과 관계없는 부분은 생략하였으며, 명세서 전체를 통하여 유사한 부분에 대해서는 유사한 도면 부호를 붙였다.
명세서 및 청구범위 전체에서, 어떤 부분이 어떤 구성 요소를 "포함"한다고 할 때, 이는 특별히 반대되는 기재가 없는 한 다른 구성요소를 제외하는 것이 아니라 다른 구성 요소를 더 포함할 수 있는 것을 의미한다.
이제 본 발명의 실시 예에 따른 메타데이터 변환 장치 및 방법에 대하여 도면을 참고로 하여 상세하게 설명한다.
도 1은 데이터 유통 플랫폼간 메타데이터 수집 방법의 일 예를 나타낸 도면이다.
도 1에 도시한 바와 같이, CKAN-CKAN과의 메타데이터 수집은 기본적으로 CKAN이 제공하는 데이터 수집 기능을 이용하여 이루어질 수 있다.
CKAN은 메타데이터 국제 표준중의 하나인 DCAT을 지원한다. 따라서 DCAT을 지원하는 다른 플랫폼 예를 들어, 소크라타(Socrata)와 DCAT을 통해 메타데이터를 수집할 수 있다.
하지만 국내의 대표적인 데이터 유통 플랫폼 중의 하나인 데이터스토어(Data store)는 자체 개발한 플랫폼이기 때문에 DCAT을 지원하지 않는다. 따라서 CKAN 플랫폼과 데이터스토어 사이에는 메타데이터 교환이 불가능하다.
따라서 데이터스토어와 CKAN간에 메타데이터 변환 장치를 두어 데이터스토어와 CKAN간 메타데이터 수집을 가능하게 할 수 있다.
도 2는 본 발명의 실시 예에 따른 메타데이터 변환 장치에서 메타데이터와 DCAT간의 매핑 방법을 나타낸 도면이다.
도 2를 참고하면, 메타데이터 변환 장치는 메타데이터를 데이터 교환을 위한 형태로 변환하기 위해서 먼저 적용할 메타데이터 표준을 선택한다. 본 발명의 실시 예에서는 메타데이터 국제표준의 하나인 DCAT을 기준으로 기술한다.
메타데이터 변환 장치는 메타데이터의 표준규약 설정 후 수집 대상이 되는 유통 플랫폼의 메타데이터 정보를 수집한다. 대상 플랫폼의 메타데이터 정보를 수집하기 위해서는 데이터베이스에 직접 로그인하여 접근하는 방법, REST API(Representational State Transfer Application Programming Interface)를 이용하여 접근하는 방법, 메타데이터 정보가 저장된 파일에 접근하는 방법 등을 이용하여 메타데이터 정보를 수집할 수 있다.
메타데이터 변환 장치는 메타데이터 정보를 수집한 후에 메타데이터와 DCAT 모델간의 매핑을 수행한다. 메타데이터 변환 장치는 매핑을 위해 우선 수집한 메타데이터로부터 스키마 정보를 추출하여 사용자에게 제공하고 DCAT 모델을 관계형 모델로 변경하여 사용자에게 제공한다. 기본적으로 DCAT 모델에서 클래스명은 테이블 명으로 클래스 내 필드명은 테이블 내 컬럼명으로 변환된다.
메타데이터 변환 장치는 메타데이터의 스키마 정보와 DCAT의 관계형 데이터 모델을 대상으로 매핑을 수행한다. 이때 DCAT의 관계형 모델을 기준으로 해당 필드가 수집한 스키마 정보에 있는지 확인하고 존재하면 매핑하는 형태로 진행한다.
매핑 작업이 끝나면 플랫폼의 메타데이터 중 일부는 매핑이 되고 일부는 매핑이 되지 않는다. 이때 데이터 수집 대상이 되는 것은 매핑된 메타데이터로 한정된다.
메타데이터 변환 장치는 스키마 매핑 후에 출력형태를 결정하기 위한 엔드포인트(End Point)를 설정한다. 엔드포인트는 카탈로그(Catalog)와 데이터셋(DataSet) 2가지 형태를 지원한다. 데이터셋은 하나의 데이터셋을 기준으로 메타데이터를 기술하는 형태이다. 카탈로그는 다수의 데이터셋 정보를 기술하는 형태이다.
메타데이터 변환 장치는 엔트포인트를 설정한 후에 메타데이터 교환을 위한 파일 형태로 메타데이터를 변환한다. 파일 포맷으로는 JSON(JavaScript Object Notation), RDF(Resource Description Framework) 파일 포맷을 지원한다.
다음, 메타데이터 변환 장치는 변환된 메타데이터를 배포한다. 여기서 배포는 다른 데이터 플랫폼에서 접근 가능한 위치에 저장하고 만약 특정 플랫폼이 선택되어 있다면 해당 플랫폼에 메타데이터 소스 정보를 전달하는 기능을 포함한다.
도 3은 본 발명의 한 실시 예에 따른 메타데이터 변환 장치에서 메타데이터 스키마 정보를 추출하기 위한 방법을 나타낸 도면이다.
도 3을 참고하면, 메타데이터 변환 장치는 메타데이터 정보를 수집한 후 수집한 메타데이터로부터 스키마 정보를 추출하는데, 메타데이터 스키마 정보를 추출하기 위한 방법으로 데이터베이스에 직접 접속하여 스키마 정보를 추출하는 방법을 사용할 수 있다.
메타데이터 변환 장치는 데이터베이스 계정에 접속한 후, 데이터베이스 스키마 정보를 추출한다.
다음, 메타데이터 변환 장치는 테이블 스키마 정보를 생성한다.
이와 같이, 데이터베이스에 직접 접속하여 스키마 정보를 추출하는 방법은 해당 플랫폼의 데이터베이스 관리자에 의해 수행될 수 있다.
도 4는 본 발명의 다른 실시 예에 따른 메타데이터 변환 장치에서 메타데이터 스키마 정보를 추출하기 위한 방법을 나타낸 도면이다.
도 4를 참고하면, 메타데이터 스키마 정보를 추출하기 위한 방법으로 데이터베이스에 접근할 수 있는 REST API를 이용하는 방법이 사용될 수 있다.
메타데이터 변환 장치는 메타데이터 정보를 수집한 후, 수집한 메타데이터로부터 스키마 정보를 추출하기 위해 플랫폼에서 공개하는 데이터베이스 스키마 API를 호출하고, 데이터베이스 스키마 API를 이용하여 데이터베이스에 접근한다.
다음, 메타데이터 변환 장치는 데이터베이스 스키마 정보를 추출하고, 테이블 스키마 정보를 생성한다.
이 방법은 도 3에 도시된 방법이 보안문제로 인해 사용하기 어려울 경우 사용될 수 있다.
도 5는 본 발명의 또 다른 실시 예에 따른 메타데이터 변환 장치에서 메타데이터 스키마 정보를 추출하기 위한 방법을 나타낸 도면이다.
도 5를 참고하면, 메타데이터 스키마 정보를 추출하기 위한 방법으로, 데이터베이스가 아닌 메타데이터 정보를 저장한 파일에 접근하는 방법이 사용될 수 있다.
메타데이터 변환 장치는 메타데이터 정보를 수집한 후, 메타데이터 정보를 저장한 파일에 접근한 후, 메타데이터를 파싱한다.
다음, 메타데이터 변환 장치는 데이터베이스 스키마 정보를 추출하고, 테이블 스키마 정보를 생성한다.
이 방법은 해당 플랫폼이 데이터베이스 스키마를 제공하는 API를 지원하지 못하는 경우 공개 가능한 정보만을 이용하여 파일로 생성하여 스키마 정보를 제공하는 방법이다.
도 6은 본 발명의 실시 예에 따른 데이터 유통 플랫폼의 스키마를 추출하여 DCAT 기반의 RDF 파일을 생성하는 방법을 나타낸 도면이다.
도 6을 참고하면, 메타데이터 변환 장치는 도 3 내지 도 5에서 설명한 방법을 이용하여 스키마 및 메타데이터 정보를 읽어온다.
API를 이용한 방법은 크게 2가지 종류의 API 함수를 가진다. 스키마 정보를 읽어오는 API와 해당 스키마의 메타데이터 정보를 읽어오는 API이다. 따라서 메타데이터 변환 장치는 우선 플랫폼의 스키마 정보를 읽어와 플랫폼의 메타데이터와 DCAT간에 매핑할 수 있도록 한다. 매핑이 끝난 후에는 메타데이터 정보를 읽어오는 API를 통해 메타데이터를 읽어와 매핑된 DCAT 메타데이터 형태로 변환하고 RDF 파일 형태로 데이터를 생성하여 저장한다.
데이터베이스를 이용한 방법은 데이터베이스에 직접 접속하여 데이터베이스 스키마 및 메타데이터 정보를 읽어오는 방식이다. 이러한 경우는 데이터 유통 플랫폼의 데이터베이스 관리자가 수행할 수 있으며 메타데이터 변환 장치에서 아이디와 암호를 입력하여 직접 데이터베이스에 접속할 수 있다.
다음, 파일을 이용하는 방법은 외부에서 데이터 유통 플랫폼의 데이터베이스에 접근하는 것을 허용하지 않을 때 사용할 수 있는 방법이다.
데이터 유통 플랫폼은 자신의 데이터베이스를 공개하지 않고 자신이 공개하고 싶은 정보만을 추출하여 파일로 생성하여 제공한다. 따라서 파일은 공개하고 싶은 데이터베이스 스키마 정보와 메타데이터 정보를 XML 형태로 저장하여 제공한다.
이와 같이, 메타데이터 변환 장치는 API, 데이터베이스 및 파일을 이용한 방법 중 적어도 하나의 방법을 사용하여 스키마 및 메타데이터 정보를 읽어온다. 다음, 메타데이터 변환 장치는 메타데이터와 DCAT간에 매핑하고, 매핑된 DCAT 메타데이터를 RDF 파일 형태로 변환하여 저장한다.
도 7은 본 발명의 실시 예에 따른 메타데이터와 DCAT간의 매핑하는 인터페이스를 나타낸 도면으로, 좌측은 DCAT 클래스와 필드를 보여주고 우측은 데이터 유통 플랫폼의 데이터베이스 스키마와 릴레이션 정보를 보여준다.
도 7을 참고하면, 메타데이터와 DCAT간의 매핑은 모든 DCAT 필드에 매핑되지는 않고 데이터 유통 플랫폼에 해당되는 스키마가 있는 경우에만 이루어진다. 매핑을 하기 위해서는 우선 좌측의 DCAT 패널에서 매핑하고자 하는 DCAT의 클래스와 해당 클래스의 필드를 선택한다. 그리고 우측 패널에서 해당되는 데이터베이스 테이블을 선택한다. 해당되는 테이블이 선택되면 컬럼 패널에 해당 테이블의 컬럼 목록들이 나타나고 이 컬럼들 중 해당 컬럼을 선택한다.
기본적으로 이와 같이 DCAT 클래스와 필드에 매핑되는 데이터베이스의 테이블과 컬럼을 매핑하는데 실제로 데이터베이스의 테이블 내 컬럼 정보는 데이터가 저장되어 있는 경우도 있지만 릴레이션을 통해 아이디 값을 가지고 있거나 코드값을 가지고 있는 경우가 있다. 따라서 이런 경우에는 조인 연산을 통해 해당 값을 검색하여 가져와야 한다. 이러한 기능을 하는 것이 좌측의 릴레이션 패널이다.
만약 2개의 테이블이 릴레이션을 가지고 있고 한 번의 조인 연산을 통해 데이터를 읽을 수 있다면 데이터베이스 패널에는 릴레이션을 갖는 테이블과 매핑되는 컬럼을 설정하고 릴레이션 패널에는 데이터베이스 패널에 해당되는 테이블과 릴레이션을 갖는 컬럼을 매핑한다. 마지막으로 뷰(view) 패널에는 우리가 검색하고자 하는 컬럼을 설정하여 해당 값을 읽어온다.
실제적으로 테이블간의 릴레이션은 1회 이상의 조인연산이 필요할 수도 있기 때문에 사용자 인터페이스에서는 테이블간 릴레이션을 1회 이상 가능하도록 제공할 수 있다.
도 8은 본 발명이 실시 예에 따른 메타데이터 변환 장치에서 RDF 파일을 관리하는 방법을 나타낸 도면이다.
도 8에 도시한 바와 같이, 메타데이터 변환 장치는 생성한 RDF 파일들을 RDF 스토어에 저장하여 관리한다. RDF 파일은 파일을 생성한 사용자의 아이디, RDF 파일명, 생성일, 파일 크기, 접근한 데이터베이스 종류와 같은 정보들과 함께 관리될 수 있다.
메타데이터 변환 장치는 RDF 파일 목록에서 배포를 수행할 수 있다. 여기서 배포란 다른 플랫폼들이 RDF 파일에 접근할 수 있도록 경로를 제공하거나 해당 플랫폼에 RDF 정보를 제공하는 것을 말한다.
따라서 메타데이터 변환 장치는 배포기능을 수행하면 HTTP 프로토콜로 접속이 가능한 위치에 RDF 파일을 저장하고 RDF 파일 정보를 하베스팅을 원하는 플랫폼에 전달할 수 있다.
도 9는 본 발명의 실시 예에 따른 메타데이터 변환 장치를 나타낸 도면이다.
도 9을 참고하면, 메타데이터 변환 장치는 프로세서(910), 메모리(920), 저장 장치(930) 및 입출력(input/output, I/O) 인터페이스(940)를 포함한다.
프로세서(910)는 중앙 처리 유닛(central processing unit, CPU)이나 기타 칩셋, 마이크로프로세서 등으로 구현될 수 있다.
메모리(920)는 동적 랜덤 액세스 메모리(dynamic random access memory, DRAM), 램버스 DRAM(rambus DRAM, RDRAM), 동기식 DRAM(synchronous DRAM, SDRAM), 정적 RAM(static RAM, SRAM) 등의 RAM과 같은 매체로 구현될 수 있다.
저장 장치(930)는 하드 디스크(hard disk), CD-ROM(compact disk read only memory), CD-RW(CD rewritable), DVD-ROM(digital video disk ROM), DVD-RAM, DVD-RW 디스크, 블루레이(blu-ray) 디스크 등의 광학 디스크, 플래시 메모리, 다양한 형태의 RAM과 같은 영구 또는 휘발성 저장 장치로 구현될 수 있다.
I/O 인터페이스(940)는 프로세서(910) 및/또는 메모리(920)가 저장 장치(930)에 접근할 수 있도록 한다. I/O 인터페이스(940)는 파일 형태의 메타데이터를 데이터 유통 플랫폼간 교환하기 위한 인터페이스를 제공한다. 또한 I/O 인터페이스(940)는 사용자와 인터페이스를 제공할 수 있다.
프로세서(910)는 도 1 내지 도 8에서 설명한 메타데이터 변환 기능을 수행할 수 있다. 프로세서(910)는 도 1 내지 도 8에서 설명한 메타데이터 변환 기능을 구현하기 위한 프로그램 명령을 메모리(920)에 로드시켜, 도 1 내지 도 8에서 설명한 동작이 수행되도록 할 수 있다. 그리고 이러한 프로그램 명령은 저장 장치(930)에 저장되어 있을 수 있으며, 또는 네트워크로 연결되어 있는 다른 시스템에 저장되어 있을 수 있다.
이상에서 본 발명의 실시 예에 대하여 상세하게 설명하였지만 본 발명의 권리 범위는 이에 한정되는 것은 아니고 다음의 청구범위에서 정의하고 있는 본 발명의 기본 개념을 이용한 당업자의 여러 변형 및 개량 형태 또한 본 발명의 권리 범위에 속하는 것이다.

Claims (12)

  1. 메타데이터 변환 장치에서 메타데이터를 변환하는 방법으로서,
    적용할 메타데이터의 표준규약모델을 설정하는 단계,
    수집 대상이 되는 유통 플랫폼의 메타데이터를 수집하는 단계,
    수집한 상기 메타데이터와 상기 표준규약모델간의 매핑을 수행하는 단계, 그리고
    매핑된 메타데이터를 메타데이터 교환을 위한 파일 형태로 변환하는 단계
    를 포함하는 메타데이터 변환 방법.
  2. 제1항에서,
    상기 설정하는 단계는 표준규약으로 DCAT(Data Catalog Vocabulary)을 선택하는 단계를 포함하는 메타데이터 변환 방법.
  3. 제2항에서,
    상기 매핑을 수행하는 단계는
    상기 수집한 메타데이터로부터 스키마 정보를 추출하는 단계,
    상기 표준규약모델을 관계형 모델로 변경하는 단계, 그리고
    상기 메타데이터의 스키마 정보와 상기 관계형 모델을 대상으로 매핑을 수행하는 단계를 포함하는 메타데이터 변환 방법.
  4. 제3항에서,
    상기 메타데이터의 스키마 정보와 상기 관계형 모델을 대상으로 매핑을 수행하는 단계는
    상기 관계형 모델을 기준으로 해당 필드가 상기 메타데이터의 스키마 정보에 존재하면 매핑하는 단계를 포함하는 메타데이터 변환 방법.
  5. 제3항에서,
    상기 스키마 정보를 추출하는 단계는 데이터베이스에 직접 접속하는 방법, 상기 데이터베이스에 접근할 수 있는 REST API를 이용하는 방법 및 메타데이터 정보를 저장한 파일에 접근하는 방법 중 적어도 하나를 이용하여 스키마 및 메타데이터 정보를 추출하는 단계를 포함하는 메타데이터 변환 방법.
  6. 제1항에서,
    상기 변환하는 단계는
    엔드포인트(End Point)를 설정하는 단계, 그리고
    상기 메타데이터의 파일 포맷을 결정하는 단계를 포함하는 메타데이터 변환 방법.
  7. 제1항에서,
    상기 파일 형태로 변환된 메타데이터를 배포하는 단계
    를 더 포함하는 메타데이터 변환 방법.
  8. 데이터 유통 플랫폼의 메타데이터를 변환하는 장치로서,
    수집 대상이 되는 유통 플랫폼의 메타데이터를 수집하고, 수집한 상기 메타데이터와 적용할 메타데이터의 표준규약모델간의 매핑을 수행한 후, 매핑된 메타데이터를 메타데이터 교환을 위한 파일 형태로 변환하는 프로세서, 그리고
    상기 파일 형태의 메타데이터를 교환하는 입출력 인터페이스
    를 포함하는 메타데이터 변환 장치.
  9. 제8항에서,
    상기 표준규약모델은 DCAT(Data Catalog Vocabulary) 모델을 포함하는 메타데이터 변환 장치.
  10. 제8항에서,
    상기 프로세서는 상기 수집한 메타데이터로부터 스키마 정보를 추출하고, 상기 표준규약모델을 관계형 모델로 변경한 후, 상기 관계형 모델을 기준으로 해당 필드가 존재하면 매핑하는 메타데이터 변환 장치.
  11. 제10항에서,
    상기 프로세서는 데이터베이스에 직접 접속하는 방법, 상기 데이터베이스에 접근할 수 있는 REST API를 이용하는 방법 및 메타데이터 정보를 저장한 파일에 접근하는 방법 중 적어도 하나를 이용하여 상기 스키마 정보를 추출하는 메타데이터 변환 장치.
  12. 제8항에서,
    상기 프로세서는 매핑된 메타데이터의 출력 형태를 결정하기 위한 엔드포인트를 결정한 후, 상기 매핑된 메타데이터의 파일 포맷을 결정하는 메타데이터 변환 장치.
KR1020180042385A 2018-04-11 2018-04-11 메타데이터 변환 장치 및 방법 KR20190118913A (ko)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180042385A KR20190118913A (ko) 2018-04-11 2018-04-11 메타데이터 변환 장치 및 방법
US16/249,985 US20190317919A1 (en) 2018-04-11 2019-01-17 Apparatus and method for converting metadata

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180042385A KR20190118913A (ko) 2018-04-11 2018-04-11 메타데이터 변환 장치 및 방법

Publications (1)

Publication Number Publication Date
KR20190118913A true KR20190118913A (ko) 2019-10-21

Family

ID=68161825

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180042385A KR20190118913A (ko) 2018-04-11 2018-04-11 메타데이터 변환 장치 및 방법

Country Status (2)

Country Link
US (1) US20190317919A1 (ko)
KR (1) KR20190118913A (ko)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102380518B1 (ko) * 2021-06-22 2022-04-01 한국과학기술정보연구원 이종 데이터 통합 서비스 방법 및 이종 데이터 통합 서비스 시스템
KR20220054992A (ko) 2020-10-26 2022-05-03 주식회사 데이터누리 Dcat 기반 메타데이터 변환 시스템
WO2022092330A1 (ko) * 2020-10-26 2022-05-05 주식회사 데이터누리 Dcat 기반 메타데이터 변환 시스템
KR102563179B1 (ko) * 2023-03-02 2023-08-03 브레인즈컴퍼니 주식회사 Rest api 클라이언트 개발을 위한 가상 rest api 서비스 자동 생성 서버 및 방법

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108133000B (zh) * 2017-12-21 2021-05-04 百度在线网络技术(北京)有限公司 一种元数据存储方法、装置和服务器

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20220054992A (ko) 2020-10-26 2022-05-03 주식회사 데이터누리 Dcat 기반 메타데이터 변환 시스템
WO2022092330A1 (ko) * 2020-10-26 2022-05-05 주식회사 데이터누리 Dcat 기반 메타데이터 변환 시스템
KR102380518B1 (ko) * 2021-06-22 2022-04-01 한국과학기술정보연구원 이종 데이터 통합 서비스 방법 및 이종 데이터 통합 서비스 시스템
KR102563179B1 (ko) * 2023-03-02 2023-08-03 브레인즈컴퍼니 주식회사 Rest api 클라이언트 개발을 위한 가상 rest api 서비스 자동 생성 서버 및 방법

Also Published As

Publication number Publication date
US20190317919A1 (en) 2019-10-17

Similar Documents

Publication Publication Date Title
KR20190118913A (ko) 메타데이터 변환 장치 및 방법
KR102258437B1 (ko) 블록체인 기반 데이터 저장 및 쿼리 방법 및 디바이스
CN102521230B (zh) 用于有条件的数据显示的结果类型
EP3777025A1 (en) Blockchain-based cross-chain data operation method and apparatus
KR101689782B1 (ko) 메타 데이터에 따라 파일 시스템의 파일들을 액세스하는 방법 및 상기 방법을 구현하는 디바이스
JP5152877B2 (ja) 文書ベースシステムにおける文書データ記憶方法およびその装置
CN112182045B (zh) 元数据管理方法、装置、计算机设备及存储介质
CN103455335A (zh) 一种多级分类的Web实现方法
CN112015754A (zh) 数据查询方法、装置与***
Mao et al. NoSQL based 3D city model management system
CN111680030A (zh) 数据融合方法及装置,基于元信息的数据处理方法和装置
Kim et al. Comprehensive Knowledge Archive Network harvester improvement for efficient open‐data collection and management
Lapp et al. Organizing our knowledge of biodiversity
CN111159192B (zh) 基于大数据的数据入库方法、装置、存储介质和处理器
JP2015212961A (ja) ファイルバリアントを作成する方法、システム、及びコンピュータ可読な媒体
US9514099B1 (en) Documentation system
CN106407345B (zh) 一种脏数据更新方法及装置
US11321340B1 (en) Metadata extraction from big data sources
Kupfer et al. Digitization and digital preservation of government information
Makris et al. Federating natural history museums in natural Europe
Zhao et al. Heterogeneous Social Linked Data Integration and Sharing for Public Transportation
Singh NoSQL: A new horizon in big data
Nasr et al. Datahub for AURIN and ANDS Project
Androcec Data portability among providers o platform as a service
Hourclé FRBR applied to scientific data

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E601 Decision to refuse application