KR100491725B1 - A data integration system and method using XQuery for defining the integrated schema - Google Patents

A data integration system and method using XQuery for defining the integrated schema Download PDF

Info

Publication number
KR100491725B1
KR100491725B1 KR20020082900A KR20020082900A KR100491725B1 KR 100491725 B1 KR100491725 B1 KR 100491725B1 KR 20020082900 A KR20020082900 A KR 20020082900A KR 20020082900 A KR20020082900 A KR 20020082900A KR 100491725 B1 KR100491725 B1 KR 100491725B1
Authority
KR
South Korea
Prior art keywords
schema
xquery
clause
integration
integrated
Prior art date
Application number
KR20020082900A
Other languages
Korean (ko)
Other versions
KR20040056298A (en
Inventor
김병섭
이미영
김명준
Original Assignee
한국전자통신연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국전자통신연구원 filed Critical 한국전자통신연구원
Priority to KR20020082900A priority Critical patent/KR100491725B1/en
Publication of KR20040056298A publication Critical patent/KR20040056298A/en
Application granted granted Critical
Publication of KR100491725B1 publication Critical patent/KR100491725B1/en

Links

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)

Abstract

본 발명은 XML 기반 데이터 통합 시스템에서 분산된 이질 데이터 소스를 통합하기 위하여 통합 스키마를 생성 관리하는 시스템 및 방법에 관한 것이다.The present invention relates to a system and method for creating and managing an integrated schema for integrating distributed heterogeneous data sources in an XML-based data integration system.

본 발명이 적용되는 데이터 통합 시스템은 사용자의 통합 질의어를 처리하는 통합 질의 처리기; 지역 스키마 정보를 제공하는 랩퍼; 통합 스키마 정의어를 처리하는 통합 스키마 처리기를 포함한다.A data integration system to which the present invention is applied includes an integrated query processor for processing an integrated query of a user; A wrapper that provides local schema information; Contains an integrated schema handler that handles unified schema definitions.

본 발명은 XML기반 데이터 통합 시스템에서 통합 질의어로 사용되는 XQuery를 확대 적용하여 통합 스키마 정의 및 맵핑 정보를 기술함으로서 통합 스키마 생성을 용이하게 하고, XQuery의 다양한 구문을 활용하여 다양한 형태의 통합 스키마 정의가 가능하며, 통합 스키마 정의와 동시에 맵핑 정보를 표현할 수 있어 별도의 맵핑 정보 정의를 위한 표현 방법이 필요 없다.The present invention facilitates the creation of the integration schema by describing the integration schema definition and mapping information by applying XQuery used as the integration query language in the XML-based data integration system, and using the various syntaxes of XQuery It is possible to express mapping information at the same time as integration schema definition, so there is no need for a separate method for defining mapping information.

Description

엑스퀘리를 사용하여 통합 스키마를 정의하는 데이터 통합 시스템 및 그 방법{A data integration system and method using XQuery for defining the integrated schema} A data integration system and method using XQuery for defining the integrated schema}

본 발명은 XML기반의 데이터 통합 기술에 관한 것으로, 분산된 이질 데이터 소스를 통합하기 위하여 엑스퀘리(XQuery)를 사용하여 통합 스키마를 정의하는 데이터 통합 시스템 및 그 방법에 관한 것이다.The present invention relates to an XML-based data integration technology, and more particularly, to a data integration system and method for defining an integration schema using XQuery to integrate distributed heterogeneous data sources.

최근들어, 인터넷 환경의 발달 및 정보 자원의 중요성이 증가함에 따라 개별적으로 운영되던 많은 시스템들의 정보를 통합하여 새로운 서비스를 제공하고자 하는 요구가 증가하고 있다. 이러한 요구에 대하여 연합 데이터베이스 시스템(Federated Database Systems), 데이터 웨어하우스(Data Warehouses), 미디에이터(Mediators)와 같은 데이터 통합 시스템이 개발되고 있다. Recently, as the development of the Internet environment and the importance of information resources increase, there is an increasing demand to provide new services by integrating the information of many systems operated individually. To meet these needs, data integration systems such as Federated Database Systems, Data Warehouses, and Mediators are being developed.

인터넷 기반의 데이터 통합은 데이터가 통합된다고 하여도 기존에 운영 중인 시스템에 영향을 주지 않아야 하는 자치성과, 인터넷 기반의 정보들은 특성상 변경이 자주 일어나며 이러한 정보가 통합되었을 때 변경 정보에 대한 투명성이 필수적이며, 인터넷 문서 표준인 XML 데이터 모델을 제공하여야 한다. 이러한 이유로 최근 데이터 통합 시스템은 XML 기반의 미디에이터 방식의 데이터 통합 시스템(이하 "XML 기반 데이터 통합 시스템") 개발이 진행되고 있다. Internet-based data integration requires autonomy that data should not affect existing systems even when data is integrated. Internet-based information changes frequently, and transparency of change information is essential when such information is integrated. In addition, the XML data model, an Internet document standard, must be provided. For this reason, the data integration system of the XML-based mediator-based data integration system (hereinafter referred to as "XML-based data integration system") has recently been developed.

XML 기반 데이터 통합 시스템은 공통된 데이터 모델로 XML 모델을 사용하고, DTD나 XML Schema 형태의 통합 스키마를 제공하며, 이기종 데이터들과의 연동을 위하여 랩퍼(Wrapper)를 사용한다. 사용자는 미디에이터가 제공하는 통합 스키마를 대상으로 XML 질의어(예: XQL, XQuery등)를 사용한 통합 질의를 수행하여 원하는 결과를 XML 데이터로 제공받는다. XML-based data integration system uses XML model as common data model, provides integrated schema of DTD or XML Schema type, and uses wrapper for interworking with heterogeneous data. The user executes an integrated query using XML query words (eg XQL, XQuery, etc.) against the integrated schema provided by the mediator and receives the desired result as XML data.

또한, 미디에이터는 통합 대상 데이터에 대한 메타 정보만을 생성 및 관리하므로 대상 데이터를 운영하는 지역 시스템과는 독립적으로 운영되며, 통합 대상 데이터에 대한 변경이 발생하여도 통합 질의 수행 시에 데이터를 참조하므로 최신의 정보를 제공한다. In addition, since the mediator generates and manages only meta-information about the data to be integrated, it operates independently of the local system that operates the data.In addition, the mediator refers to data when performing integration queries even when changes are made to the data. Provide information.

그런데 종래 데이터 통합 시스템의 기술은 통합 스키마 생성을 위한 새로운 언어를 제공하고, 맵핑 정보를 위한 또 다른 새로운 언어를 제공함으로써 사용자는 별도의 특화된 언어들을 사용하여 스키마 생성과 맵핑 정보를 정의함으로써 사용이 어렵고 의미 해석 또한 모호하며, XML 데이터 모델과의 연계가 어려운 문제점이 있었다. However, the technology of the conventional data integration system provides a new language for generating an integrated schema, and provides another new language for mapping information, which makes it difficult for a user to define schema generation and mapping information using separate specialized languages. The semantic interpretation is also ambiguous, and it is difficult to link with the XML data model.

본 발명은 상기 문제점을 해결하기 위하여 제안된 것으로, XML 기반 데이터 통합 시스템에서 통합 스키마 생성 및 맵핑 정보 기술 시에 웹 컨소시엄(W3C)에서 XML 질의어로 표준 작업이 진행 중인 XQuery의 적용 대상을 확장한 XQuery를 사용하여 통합 스키마를 정의하는 데이터 통합 시스템 및 그 방법을 제공하는데 그 목적이 있다.The present invention has been proposed to solve the above problems, XQuery that extends the application of XQuery in the standard work as an XML query in the Web Consortium (W3C) in the integration schema creation and mapping information description in XML-based data integration system Its purpose is to provide a data integration system and method for defining an integration schema using.

즉, 본 발명은 XQuery 정의어를 사용하여 기존 시스템들의 통합 스키마 정의 시 의미상 모호함을 개선하고, XML 데이터 모델에 적합한 스키마 정의 및 맵핑 정보 표현 방법을 제공하는 것이다. 이에 따라, XML 데이터 모델에 익숙한 사용자는 XML 기반 데이터 통합 시스템 운용 시에 XQuery를 사용하여 통합 스키마 생성 및 맵핑 정보 기술을 명확하게 할 수 있으며, 통합 시스템 개발 시에 이미 개발되어 검증된 XQuery 처리 기술을 활용할 수 있다.That is, the present invention improves the semantic ambiguity when defining integrated schema of existing systems using XQuery definition and provides a schema definition and mapping information expression method suitable for XML data model. As a result, users who are familiar with the XML data model can use XQuery to clarify the integration schema creation and mapping information technology when operating the XML-based data integration system. It can be utilized.

상기 목적을 달성하기 위한 XML 기반 데이터 통합 시스템의 내부 구성은 사용자의 질의어(XQuery)를 파싱하고 정당성 검증과 질의 수행을 위한 통합 질의 처리기; 지역 스키마 정보를 제공하고 지역 질의 처리를 수행하는 랩퍼; 및 통합 스키마 정의어(XQuery)를 파싱하고 정당성 검증과 질의 수행을 위한 통합 스키마 처리기;를 포함하는 것을 특징으로 한다.The internal configuration of the XML-based data integration system to achieve the above object comprises an integrated query processor for parsing a user's query (XQuery), validity verification and query execution; A wrapper that provides local schema information and performs local query processing; And an integrated schema processor for parsing an integrated schema definer (XQuery) and validating and executing a query.

또한 상기 통합 스키마 처리기는, 통합 질의 처리기가 입력으로 받는 XQuery와 동일한 구문을 사용함으로 통합 질의 처리기가 포함하는 XQuery 파서를 활용할 수 있으며, XQuery 파서가 생성하는 XQuery 파스 트리를 입력받아 정당성을 검증하기 위한 정당성 검증 모듈과, 검증된 XQuery를 수행하는 구문 수행모듈로 이루어진다.In addition, the unified schema processor can utilize the XQuery parser included in the unified query processor by using the same syntax as the XQuery received by the unified query processor, and receives the XQuery parse tree generated by the XQuery parser to verify validity. It consists of a validity verification module and a syntax execution module that executes verified XQuery.

본 발명의 XQuery를 사용하여 통합 스키마를 정의하는 데이터 통합 방법은 표준 XQuery의 FOR/LET절과 WHERE절, RETURN절을 확장 정의하는 단계; 상기 확장된 FOR/LET절을 사용하여 지역 스키마의 엘리먼트 트리 구조의 특정 엘리먼트에 바인딩하는 단계; 상기 확장된 WHERE절을 사용하여 지역 스키마의 특정 엘리먼트에 조건을 적용시켜 통합 대상 데이터에 제약을 가하는 단계; 및 상기 확장된 RETURN절을 사용하여 통합 스키마 구조를 정의하는 단계를 포함하는 것을 특징으로 한다. 이때 상기 데이터 통합방법은, 상기 확장된 RETURN절의 표현식을 사용하여 지역 스키마와 통합 스키마 간의 맵핑 정보를 정의하는 단계를 더 포함한다. The data integration method of defining an integration schema using the XQuery of the present invention includes the steps of: extending the FOR / LET clause, WHERE clause, and RETURN clause of standard XQuery; Binding to a specific element of an element tree structure of a local schema using the extended FOR / LET clause; Applying a condition to a specific element of a local schema using the extended WHERE clause to apply a restriction to integration target data; And defining an integrated schema structure using the extended RETURN clause. In this case, the data integration method further includes defining mapping information between a local schema and an integrated schema using an expression of the extended RETURN clause.

이하, 본 발명의 바람직한 실시 예를 첨부된 도면을 참조하여 상세하게 설명한다.Hereinafter, exemplary embodiments of the present invention will be described in detail with reference to the accompanying drawings.

도 1은 본 발명이 활용될 수 있는 미디에이터-랩퍼 방식의 XML 기반 데이터 통합 시스템의 구성도이다. 1 is a block diagram of a mediator-rapper XML-based data integration system that can be used in the present invention.

도면을 참조하면, 본 발명에 따른 XML 기반 데이터 통합 시스템(110)은, 랩퍼(114)와 미디에이터(112)를 포함하여 RDBMS(102), OODBMS(104), 파일 시스템(106), 웹 페이지(108) 등과 같은 이질 데이터를 통합하여 고객관리시스템(CRM: Customer Relationship Management, 121), 전자 비지니스(E-Business: Electronic Business, 122), 포탈 서비스(Portal Service; 123)와 같은 응용 서비스를 구축할 수 있게 한다.Referring to the drawings, the XML-based data integration system 110 according to the present invention, including the wrapper 114 and the mediator 112, RDBMS 102, OODBMS 104, file system 106, Web page ( 108) to integrate heterogeneous data to build application services such as Customer Relationship Management (CRM) 121, Electronic Business (E-Business) 122, and Portal Service (123). To be able.

데이터 통합 시스템(110)은 미디에이터(112)와 랩퍼(114)를 포함하고 있으며, 랩퍼(114)는 각종 데이터 소스(100)에 대하여 XML 데이터 모델화해주는 작업을 담당한다. 그리고 미디에이터(112)는 각 랩퍼(114)로부터 제공되는 지역 스키마에 대하여 공통된 스키마와 공통된 질의어를 제공한다. The data integration system 110 includes a mediator 112 and a wrapper 114, and the wrapper 114 is responsible for modeling XML data for various data sources 100. In addition, the mediator 112 provides a common schema and a common query word for the local schema provided from each wrapper 114.

본 발명은 미디에이터(112)에서 통합 스키마 생성 시에 사용될 수 있는 스키마 정의어와, 지역 스키마와 통합 스키마 간의 맵핑 정보를 정의하는 방법에 대한 발명이다. 랩퍼(114)에 의해 제공되는 지역 스키마의 생성 또한 본 발명에서 제시하는 방법을 사용하여 생성될 수 있으며, 처리 결과 또한 XML Schema의 형태로 제공할 수 있다. The present invention relates to a schema definition word that can be used when generating the integrated schema in the mediator 112, and a method for defining mapping information between the local schema and the integrated schema. The generation of the local schema provided by the wrapper 114 may also be generated using the method proposed in the present invention, and the processing result may also be provided in the form of XML Schema.

본 발명에서 제안하는 방법은 통합 스키마 정의어와 맵핑 정보 정의어로 엑스퀘리(W3C XQuery)의 적용 대상을 확장하여 사용한다. 이와 같이 XQuery를 사용함으로서 기존 시스템들이 안고 있었던 정형화되지 않고 시스템 의존적인 문제를 해결할 수 있을 뿐만 아니라, 이미 개발된 XQuery 기술을 활용하여 보다 쉽고 효과적인 시스템 개발이 가능하다. The method proposed in the present invention extends the application target of the W3C XQuery as the integrated schema definition word and the mapping information definition word. By using XQuery, not only can we solve the unstructured and system-dependent problems that existed in existing systems, but also it is possible to develop the system more easily and effectively by utilizing the already developed XQuery technology.

또한, 맵핑 정보가 동시에 표현이 가능하므로 기존 시스템처럼 별도의 맵핑 정보 기술에 대한 정의어를 제공하지 않고 맵핑 정보 제공이 가능하다. In addition, since mapping information can be expressed at the same time, it is possible to provide mapping information without providing a definition word for a separate mapping information technology like the existing system.

다음 표 1은 본 발명에서 제안하는 XQuery를 사용한 통합 스키마 생성 및 맵핑 정보를 위한 W3C XQuery의 확대 적용 도표이다. 즉, 다음 표 1에는 웹 컨소시엄(W3C)의 XQuery와 본 발명에서 제안하는 XQuery의 차이점이 기술되어 있다.Table 1 below is an extended application chart of W3C XQuery for unified schema generation and mapping information using XQuery proposed by the present invention. That is, Table 1 below describes the differences between the XQuery of the Web Consortium (W3C) and the XQuery proposed in the present invention.

구분division 표준 XQueryStandard XQuery 통합스키마 정의 및 맵핑정보를 위한 XQueryXQuery for integration schema definition and mapping information FOR/LETFOR / LET XML문서들을 대상으로 엘리먼트 바인딩Binding Elements to XML Documents XML스키마로 표현되는 지역 스키마의 엘리먼트 트리구조를 대상으로 특정 엘리먼트에 바인딩Binding to specific elements by targeting element tree structure of local schema expressed as XML schema WHEREWHERE 문서 내 데이터에 대한 검색조건Search Criteria for Data in Documents 통합 시 해당 지역 스키마의 데이터에 대한 제약조건Constraints on data in your local schema at consolidation RETURNRETURN 질의 처리 결과에 대한 XML데이터 구조XML data structure for query processing results 생성하고 싶은 통합 스키마 구조The integration schema structure you want to create

상기 표 1과 같이, W3C XQuery를 사용하여 통합 스키마 정의 및 맵핑 정보를 표현하기 위해서 본 발명에서는 다음과 같이 XQuery를 확대 적용한다. 즉, W3C XQuery의 "FOR/LET" 절이 XML 문서를 대상으로 엘리먼트를 바인딩하는 반면, 본 발명에 따른 XQuery의 FOR/LET절은 XML Schema로 표현된 지역 스키마의 엘리먼트 트리 구조를 대상으로 특정 엘리먼트에 바인딩하도록 한다. 또한 W3C XQuery의 "WHERE" 절이 문서 내 데이터 검색 조건을 표현하는 반면 본 발명에서 제안하는 XQuery의 WHERE 절은 통합 대상 데이터인 지역 데이터에 대한 제약 조건을 표현하도록 한다. 그리고 W3C XQuery의 "RETURN" 절이 질의 처리 결과에 대한 XML 데이터 구조를 표현하는 반면, 본 발명에서 제안하는 XQuery의 RETURN 절은 생성하고 싶은 통합 스키마 구조를 표현하도록 한다. As shown in Table 1, in order to express the integration schema definition and mapping information using W3C XQuery, the present invention extends XQuery as follows. That is, while the "FOR / LET" clause of W3C XQuery binds an element to an XML document, the FOR / LET clause of XQuery according to the present invention targets an element tree structure of a local schema expressed in XML Schema. To bind. In addition, the WHERE clause of the W3C XQuery expresses the data search condition in the document, whereas the WHERE clause of the XQuery proposed in the present invention expresses the constraint on the local data which is the integration target data. And while the "RETURN" clause of W3C XQuery represents the XML data structure for the query processing result, the RETURN clause of XQuery proposed in the present invention expresses the integrated schema structure that you want to create.

도 2는 본 발명에서 제안하는 XQuery를 사용한 통합 스키마 생성 및 맵핑 정보 정의를 위한 시스템 내부 구성도이다. FIG. 2 is a diagram illustrating a system internal configuration for defining an integrated schema and mapping information using XQuery proposed by the present invention.

도면을 참조하면, 본 발명에 따른 통합 질의 처리기(210)는 XQuery 질의 처리를 위한 XQuery 파서(211)와 정당성 검증 모듈(212)과, 통합 질의 처리를 위한 XQuery 수행모듈(213)을 포함하고 있고, 통합 스키마 처리기(220)는 XQuery의 스키마 생성을 위한 정당성 검증모듈(222)과, 스키마 생성 및 맵핑 정보 생성을 위한 XQuery 수행모듈(224)로 이루어진다. Referring to the drawings, the integrated query processor 210 according to the present invention includes an XQuery parser 211 and a validity verification module 212 for XQuery query processing, and an XQuery execution module 213 for integrated query processing. The integrated schema processor 220 includes a validity verification module 222 for generating a schema of XQuery and an XQuery execution module 224 for generating schema and generating mapping information.

그리고 지역 질의 변환, 지역 질의 처리 등을 제공하는 랩퍼(230)가 존재한다. 통합 스키마 처리기는 통합 스키마 정의어로서 XQuery를 사용함으로서 XML 기반 데이터 통합 시스템의 통합 질의 처리기(210)에서 사용하는 XQuery 파서(211)를 활용할 수 있다. There is a wrapper 230 that provides local query translation, local query processing, and the like. The integrated schema processor may utilize the XQuery parser 211 used by the integrated query processor 210 of the XML-based data integration system by using XQuery as the integrated schema definition word.

질의 처리기의 XQuery 파서(211)의 결과로 얻은 XQuery 파스 트리(202)는 통합 스키마 처리기(220)의 정당성 검증 모듈(222)을 통하여 통합 스키마 정의 요구에 대한 수행 가능성과 스키마 생성 및 맵핑 정보에 필요한 지역 스키마 정보(230)에 대한 정보 수집이 수행된다. The XQuery parse tree 202 obtained as a result of the XQuery parser 211 of the query processor is required for the feasibility of the integration schema definition request and schema generation and mapping information through the validation module 222 of the integration schema handler 220. Information collection about the local schema information 230 is performed.

정당성 검증 모듈(222)에 의해 정당성 검증이 완료된 XQuery 파스 트리(202)와 수집 정보를 사용하여 통합 스키마 생성을 위한 XQuery 구문 수행이 구문 수행 모듈(224)에서 수행되며, 수행 결과 지역 스키마들로부터 필요한 스키마 정보들을 사용자의 요구에 맞게 수행하여 통합 스키마인 XML Schema 트리(204)와, 지역 스키마와 통합 스키마 간의 관계를 표현하는 맵핑 정보(206)가 생성된다. Using the XQuery parse tree 202 and the collected information, which has been validated by the validity validation module 222, the execution of XQuery syntax for generating an integrated schema is performed in the syntax execution module 224, and the result is required from local schemas. By performing schema information according to a user's needs, an XML Schema tree 204, which is an integrated schema, and mapping information 206 representing a relationship between a local schema and an integrated schema are generated.

결과로 얻은 XML Schema 트리(204)는 사용자의 요구 시에 언제라도 XML Schema 원문으로 추출이 가능하여 XML 기반 통합 시스템이 서비스하고자 하는 스키마를 제공할 수 있으며, 맵핑 정보(206)는 통합 질의 수행 시에 질의 정당성 검증 시와 통합 질의를 분해하여 실제 해당되는 지역 스키마의 질의로 분해 생성 시에 활용된다. 맵핑 정보 또한 XQuery 트리 형태로 표현되어 통합 질의 수행 시에 쉽게 적용될 수 있다. The resulting XML Schema tree 204 can be extracted at any time as the XML Schema text can be provided at the user's request to provide the schema that the XML-based integration system wants to service, and the mapping information 206 can be used to perform the integration query. This is used to verify the validity of the query and to decompose the integrated query into the query of the local schema. Mapping information is also expressed in the form of XQuery tree so that it can be easily applied when executing an integrated query.

다음 표 2 내지 표 7은 본 발명에서 제안하고 있는 스키마 생성 및 맵핑 정보 처리를 설명하기 위한 스키마 예이다. 표 2 내지 표 4는 랩퍼로부터 얻어진 지역 스키마이며, 표 5는 표 2 ~ 표 4를 대상으로 새로운 통합 스키마인 표 6 생성을 위한 XQuery를 사용한 통합 스키마 정의 예이다. Tables 2 to 7 below are schema examples for explaining schema generation and mapping information processing proposed in the present invention. Tables 2 to 4 are local schemas obtained from the wrapper, and Table 5 is an example of a schema definition using XQuery for generating a new integration schema, Table 6, for Tables 2 to 4.

다음 표 2는 본 발명에 따라 전자 서점 서비스가 운영되고 있는 사이트로부터 랩퍼가 제공하는 스키마의 예이다. Table 2 below is an example of a schema provided by a wrapper from a site where an electronic bookstore service is operated according to the present invention.

다음 표 3은 본 발명에 따라 전자책 사이트로부터 얻은 지역 스키마의 예이며, 다음 표 4는 본 발명에 따라 전자 도서관으로부터 얻은 지역 스키마의 모습이다. Table 3 below is an example of a local schema obtained from an e-book site according to the present invention, and Table 4 below is a view of the local schema obtained from an e-library according to the present invention.

이와 같은 세가지의 스키마를 대상으로 책에 대한 다양한 정보 제공 서비스 시스템을 위한 통합 스키마가 다음 표 6과 같으며, 표 6과 같은 스키마 생성을 위한 본 발명에서 제안하는 XQuery를 사용한 정의어가 다음 표 5와 같다. 이때 지역 스키마와 통합 스키마간의 맵핑 정보가 스키마 생성을 위한 XQuery에 동시에 정의되어있으며, 수행 결과 얻을 수 있는 맵핑 정보가 다음 표 7과 같다. 이때 맵핑 정보는 스키마 생성 시 통합 스키마의 엘리먼트 정의에 필요한 XQuery 표현식과 동일하다.The integrated schema for various information providing service systems for books for these three schemas is shown in Table 6, and the definitions using XQuery proposed in the present invention for generating schemas are shown in Table 5 below. same. At this time, mapping information between local schema and unified schema is defined at the same time in XQuery for schema creation. At this time, mapping information is the same as XQuery expression necessary for element definition of integration schema at schema creation.

도 3은 본 발명에 따라 통합 스키마 및 맵핑 정보를 생성하기 위한 처리 흐름도이다. 3 is a process flow for generating integration schema and mapping information in accordance with the present invention.

도면을 참조하면, 통합 스키마 생성을 위한 사용자의 입력으로 XQuery가 입력되면 XQuery 파서(211)를 사용하여 파싱을 수행한다(300). 파싱 후 파싱 수행 결과로 얻는 파스 트리(202)를 기반으로 정당성 검사를 수행하며(310), 필요 시 지역 스키마 정보를 랩퍼(230)로부터 얻는다(311,312). Referring to the drawing, when XQuery is input as a user input for generating an integrated schema, parsing is performed using the XQuery parser 211 (300). After parsing, a validity check is performed based on the parse tree 202 obtained as a result of parsing (310), and if necessary, local schema information is obtained from the wrapper 230 (311, 312).

이어 정당성 검사 수행 결과가 유효하면(320), XQuery를 수행한다(330). XQuery 수행은 파스 트리를 순회하면서 XQuery 표현식을 수행하며(330), 수행 후 얻어지는 결과가 엘리먼트를 포함하면(331), 최종 결과인 통합 스키마 트리(204)에 추가를 하며(332), 동시에 대상 엘리먼트의 생성에 사용된 XQuery 파스 트리를 기반으로 맵핑 정보를 추가한다(333). Subsequently, if the validity test execution result is valid (320), the XQuery is performed (330). XQuery execution performs XQuery expressions while traversing the parse tree (330), and if the result obtained after execution includes an element (331), it adds to the final result, the unified schema tree 204 (332), and simultaneously the target element. The mapping information is added based on the XQuery parse tree used to generate the data (333).

XQuery 파스 트리의 연산 작업을 완료하면 XML Schema 트리 모습의 통합 스키마(340)와 XQuery 파스 트리 형태의 맵핑 정보(350)를 결과로 얻어 저장 장치에 기록한다. 결과로 얻은 통합 스키마(340)와 맵핑 정보(350)는 XML 데이터 모델에 적합하여 XML 기반 데이터 통합 시스템 구현에 쉽게 적용할 수 있다.When the operation of the XQuery parse tree is completed, an integrated schema 340 in the form of an XML Schema tree and mapping information 350 in the form of an XQuery parse tree are obtained as a result and recorded in the storage device. The resulting integration schema 340 and mapping information 350 can be easily adapted to an XML-based data integration system implementation as it fits into the XML data model.

도 4는 도 3에서 XQuery 표현식 수행(330)에 대한 상세 처리 흐름도이다. FIG. 4 is a detailed process flowchart of performing an XQuery expression 330 in FIG. 3.

도면을 참조하면, 입력된 XQuery 파스 트리(202)를 순회하면서 하나의 표현식을 얻는다(400). 얻은 표현식이 FLWR 절인가 확인한다(401). Referring to the drawing, it traverses the input XQuery parse tree 202 and obtains one expression (400). Check that the obtained expression is a FLWR clause (401).

FLWR절이면 FOR/LET절을 얻는다(402). FOR/LET절이 포함하고 있는 변수와 바인딩을 위한 표현식을 얻는다(403). 얻은 표현식이 document() 함수가 포함된 경로식인지를 확인한다(404). If it is a FLWR clause, a FOR / LET clause is obtained (402). Get the expression for the variable and binding contained in the FOR / LET clause (403). Check whether the expression obtained is a path expression including a document () function (404).

확인 결과 조건에 맞는 경로식이면 document() 함수 인자를 해석하여 통합 대상 지역 스키마 정보를 얻고, 경로식을 수행하여 얻은 스키마 정보를 앞서 구한(403) FOR/LET절의 변수에 바인딩하여 기록한다(405,406). If the path expression satisfies the condition, the document () function argument is interpreted to obtain the local schema information to be integrated, and the schema information obtained by the path expression is bound to the variable of the FOR / LET clause (403) obtained above (405,406). ).

다른 FOR/LET절이 존재하는 지 확인한다(407). 존재하면 반복하여(402~407) 바인딩된 변수를 추가한다. Check if another FOR / LET clause exists (407). If present, it is repeated (402 ~ 407) to add the bound variable.

FOR/LET절의 수행이 완료되면 WHERE절이 존재하는 지 확인한다(408). 존재하면 통합 질의 처리 시 지역 데이터 소스 대상의 제약 조건으로 추가하기 위하여 기록한다(409,410). When the execution of the FOR / LET clause is completed, it is checked whether the WHERE clause exists (408). If present, it is recorded to add as a constraint of local data source object during integrated query processing (409, 410).

이어서 RETURN절을 얻고 RETURN절이 포함하고 있는 표현식을 얻는다(411). 얻은 표현식을 수행한다(412). 수행 결과가 통합 스키마 구조를 구성하는 엘리먼트에 대한 정보가 포함되어 있는가를 확인한다(413). Then you get a RETURN clause and get the expression it contains (411). Perform the obtained expression (412). It is checked whether the execution result includes information on elements constituting the integrated schema structure (413).

통합 스키마 생성을 위한 엘리먼트를 포함하고 있다면, 통합 스키마 트리에 추가를 하고(414,415), 엘리먼트를 생성하기 위해서 수행된 관련된 XQuery 표현식 정보를 맵핑 정보에 추가한다(416,417). RETURN절 내 다른 표현식이 존재하는 지 확인한다(418). 존재하면 순회하면서 반복하여(412~418), 통합 스키마 트리(204)와 맵핑 정보(206)를 추가 생성한다.If it contains an element for generating a unified schema, add it to the unified schema tree (414, 415), and add related XQuery expression information performed to generate the element to the mapping information (416, 417). Check if there is another expression in the RETURN clause (418). If present, iterates and repeats (412 to 418) to further generate the integrated schema tree 204 and mapping information 206.

이상에서 설명한 바와 같이, 본 발명은 XML기반 데이터 통합 시스템에서 통합 질의어로 사용되는 XQuery를 확대 적용하여 통합 스키마 정의 및 맵핑 정보를 기술함으로서 통합 스키마 생성을 용이하게 하고, XQuery의 다양한 구문을 활용하여 다양한 형태의 통합 스키마 정의가 가능하며, 통합 스키마 정의와 동시에 맵핑 정보를 표현할 수 있어 별도의 맵핑 정보 정의를 위한 표현 방법이 필요없는 효과가 있다.As described above, the present invention facilitates the creation of the integration schema by describing the integration schema definition and mapping information by applying XQuery used as the integration query language in the XML-based data integration system and utilizing various syntaxes of the XQuery. It is possible to define the integrated schema in the form, and since mapping information can be expressed at the same time as the integration schema definition, there is no effect that a separate expression method for defining mapping information is not required.

이상에서 설명한 것은 본 발명에 따른 XQuery를 사용하여 통합 스키마 생성 및 맵핑 정보를 표현하는 데이터 통합 시스템 및 그 방법을 설명한 하나의 실시 예에 불과한 것으로써, 본 발명은 상기한 실시 예에 한정되지 않고, 이하의 특허 청구의 범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 분야에서 통상의 지식을 가진 자라면 누구든지 다양한 변경 실시가 가능한 범위까지 본 발명의 기술적 사상이 미친다고 할 것이다. What has been described above is just one embodiment of a data integration system and method for expressing unified schema generation and mapping information using XQuery according to the present invention, and the present invention is not limited to the above embodiments, Without departing from the gist of the present invention claimed in the following claims, those skilled in the art to which the present invention pertains to the spirit of the present invention to the extent that various modifications can be made.

도 1은 본 발명이 활용될 수 있는 XML 데이터 통합 시스템의 응용 예를 도시한 도면,1 is a view showing an application example of the XML data integration system that can be utilized the present invention,

도 2는 본 발명에 따라 XQuery 기술을 활용하여 구현한 데이터 통합 시스템의 블록 구성도,2 is a block diagram of a data integration system implemented using XQuery technology according to the present invention;

도 3은 본 발명에 따른 XQuery를 사용한 통합 스키마 생성 및 맵핑 정보에 대한 표현을 수행하기 위한 흐름도,3 is a flow chart for performing the expression for the integrated schema generation and mapping information using XQuery according to the present invention,

도 4는 본 발명에 따른 XQuery 표현식 수행에 따른 스키마 정보 및 맵핑 정보 수행 흐름도이다.4 is a flowchart illustrating schema information and mapping information according to execution of an XQuery expression according to the present invention.

* 도면의 주요 부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings

100;지역 데이터베이스 110;XML기반 데이터 통합 시스템100; regional database 110; XML-based data integration system

112;미디에이터 114,230;랩퍼112; mediator 114, 230; wrapper

121;CRM 122;E-Business121; CRM 122; E-Business

123;포탈 서비스 210;통합 질의 처리기123; portal service 210; integrated query handler

211;XQuery 파서 220;통합 스키마 처리기211; XQuery Parser 220; Integrated Schema Handler

202;XQuery 파스 트리 204;스키마 결과 트리202; XQuery parse tree 204; schema result tree

206;맵핑 정보 트리 206; mapping information tree

Claims (4)

XQuery 파서를 포함하여 XQuery 파스 트리를 생성하는 통합 질의 처리기;An integrated query processor that generates an XQuery parse tree, including an XQuery parser; 지역 스키마 정보를 제공하는 랩퍼; 및A wrapper that provides local schema information; And 상기 XQuery 파서로부터 XQuery 파스 트리를 전달받아 정당성을 검증하고, 상기 랩퍼로부터 지역 스키마 정보를 전달받아 구문을 수행하여 XML 스키마 트리와 맵핑 정보 트리를 생성하는 통합 스키마 처리기;An integrated schema processor for generating an XML schema tree and a mapping information tree by receiving an XQuery parse tree from the XQuery parser and validating the validity, receiving local schema information from the wrapper, and performing a syntax; 를 포함하는 것을 특징으로 하는 확장 XQuery를 사용하여 통합 스키마 생성 및 맵핑 정보를 표현하는 데이터 통합 시스템.Data integration system to express the integration schema generation and mapping information using an extended XQuery, characterized in that it comprises a. 제 1항에 있어서, 상기 통합 스키마 처리기는,The method of claim 1, wherein the integration schema processor, 상기 XQuery 파스 트리를 입력받아 정당성을 검증하기 위한 정당성 검증 모듈과, 검증된 XQuery를 수행하는 구문 수행모듈로 이루어진 것을 특징으로 하는 확장 XQuery를 사용하여 통합 스키마 구조 및 맵핑 정보를 표현하는 데이터 통합 시스템.A data integration system that expresses an integrated schema structure and mapping information using an extended XQuery, comprising a validity verification module for validating validity by receiving the XQuery parse tree and a syntax execution module for performing verified XQuery. 통합 스키마 정의를 위해 확장된 XQuery의 정당성 검증 방법에 있어서,In the method of validating XQuery extended for unified schema definition, 정당성 검증 모듈에서, FOR/LET 절에서 관련된 랩퍼로부터 지역 스키마를 얻어 엘리먼트 구조에 대한 존재 유무를 검증하는 단계;In the validity verification module, obtaining a local schema from a related wrapper in a FOR / LET clause to verify existence of an element structure; WHERE 절에서 정의한 구문을 지역 스키마의 특정 엘리먼트 타입과의 호환성을 검증하는 단계; 및Verifying the syntax defined in the WHERE clause with a specific element type of the local schema; And RETURN 절에서 FOR/LET 절에서 얻은 지역 스키마를 사용하여 엘리먼트 구조에 대한 존재 유무를 검증하는 단계;Verifying the existence of the element structure using the local schema obtained in the FOR / LET clause in the RETURN clause; 를 포함하는 확장 XQuery를 사용하여 통합 스키마 구조 및 맵핑 정보를 표현하는 데이터 통합 방법.Data integration method to express integration schema structure and mapping information using extended XQuery including. 통합 스키마 정의를 위해 표준 XQuery의 FOR/LET 절과 WHERE 절, RETURN 절을 이용한 구문 수행처리 방법에 있어서,In the syntax processing method using FOR / LET clause, WHERE clause, and RETURN clause of standard XQuery for defining a schema, 구문 수행 모듈에서, FOR/LET 절에서 지역 스키마의 엘리먼트 트리 구조에서 관련된 특정 엘리먼트를 저장하는 단계;In the syntax execution module, storing the specific element associated in the element tree structure of the local schema in the FOR / LET clause; WHERE 절에서 통합 대상 데이터 제약을 추출하여 저장하는 단계; 및Extracting and storing the integration target data constraint from the WHERE clause; And RETURN 절에서 통합 스키마 구조 정보를 추출하고, FOR/LET 절에서 얻은 지역 스키마의 엘리먼트를 사용하여 맵핑 정보를 추출하여 저장하는 단계;Extracting the integrated schema structure information from the RETURN clause, and extracting and storing mapping information using the elements of the local schema obtained from the FOR / LET clause; 를 포함하는 확장 XQuery를 사용하여 통합 스키마 구조 및 맵핑 정보를 표현하는 데이터 통합 방법.Data integration method to express integration schema structure and mapping information using extended XQuery including.
KR20020082900A 2002-12-23 2002-12-23 A data integration system and method using XQuery for defining the integrated schema KR100491725B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR20020082900A KR100491725B1 (en) 2002-12-23 2002-12-23 A data integration system and method using XQuery for defining the integrated schema

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR20020082900A KR100491725B1 (en) 2002-12-23 2002-12-23 A data integration system and method using XQuery for defining the integrated schema

Publications (2)

Publication Number Publication Date
KR20040056298A KR20040056298A (en) 2004-06-30
KR100491725B1 true KR100491725B1 (en) 2005-05-27

Family

ID=37348695

Family Applications (1)

Application Number Title Priority Date Filing Date
KR20020082900A KR100491725B1 (en) 2002-12-23 2002-12-23 A data integration system and method using XQuery for defining the integrated schema

Country Status (1)

Country Link
KR (1) KR100491725B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100930108B1 (en) 2006-12-05 2009-12-07 한국전자통신연구원 Schema-based Static Checking System and Method for Query

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100691429B1 (en) * 2004-12-16 2007-03-09 한국전자통신연구원 Biological inforamation integration retrieval systmem and method for integrating biological information
KR100691261B1 (en) * 2005-12-01 2007-03-12 한국전자통신연구원 System and method for supporting xquery update language
KR100900514B1 (en) * 2006-12-04 2009-06-02 한국전자통신연구원 System and method for processing heterogeneous sensor data stream using xml common model
KR100904890B1 (en) * 2006-12-20 2009-06-29 재단법인대구경북과학기술원 MPEG-7 meta-data storage method suitable for the embedded multimedia device
KR100947115B1 (en) * 2007-11-19 2010-03-10 한국전자통신연구원 Method and device for collecting vehicle information

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100930108B1 (en) 2006-12-05 2009-12-07 한국전자통신연구원 Schema-based Static Checking System and Method for Query

Also Published As

Publication number Publication date
KR20040056298A (en) 2004-06-30

Similar Documents

Publication Publication Date Title
Hartig et al. Foundations of an alternative approach to reification in RDF
US7383255B2 (en) Common query runtime system and application programming interface
CN100527127C (en) Query intermediate language method and system
US8387030B2 (en) Service adaptation definition language
US8726229B2 (en) Multi-language support for service adaptation
Dodds et al. Linked data patterns
US20060242563A1 (en) Optimizing XSLT based on input XML document structure description and translating XSLT into equivalent XQuery expressions
US8606806B2 (en) Static typing of xquery expressions in lax validation content
KR100701104B1 (en) Method of generating database schema to provide integrated view of dispersed information and integrating system of information
Goasdoué et al. Growing triples on trees: an XML-RDF hybrid model for annotated documents
US7774700B2 (en) Partial evaluation of XML queries for program analysis
Choi et al. The Xquery formal semantics: A foundation for implementation and optimization
Arenas-Guerrero et al. Boosting knowledge graph generation from tabular data with RML views
Arenas-Guerrero et al. Declarative generation of RDF-star graphs from heterogeneous data
KR100491725B1 (en) A data integration system and method using XQuery for defining the integrated schema
Malki et al. Building Semantic Mashup.
Fernandez et al. Growing xquery
Chang et al. Supporting unified interface to wrapper generator in Integrated Information Retrieval
Colazzo et al. A typed text retrieval query language for XML documents
US10984195B2 (en) Methods and systems for using implied properties to make a controlled-english modelling language more natural
CN1588371A (en) Forming method for package device
Pollack et al. Spring Data MongoDB-Reference Documentation
CN100338609C (en) Maintenance method for package device
Reveliotis et al. Your enterprise on XQuery and XML schema: XML-based data and metadata integration
Lanthaler Third generation web apis

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130424

Year of fee payment: 9

FPAY Annual fee payment

Payment date: 20130730

Year of fee payment: 18