CN101216851A - 一种本体数据(Ontology)管理***和方法 - Google Patents

一种本体数据(Ontology)管理***和方法 Download PDF

Info

Publication number
CN101216851A
CN101216851A CNA2008100560987A CN200810056098A CN101216851A CN 101216851 A CN101216851 A CN 101216851A CN A2008100560987 A CNA2008100560987 A CN A2008100560987A CN 200810056098 A CN200810056098 A CN 200810056098A CN 101216851 A CN101216851 A CN 101216851A
Authority
CN
China
Prior art keywords
module
data
ontology
importing
data management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2008100560987A
Other languages
English (en)
Inventor
孟小峰
陈妍
蒋瑜
欧建波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CNA2008100560987A priority Critical patent/CN101216851A/zh
Publication of CN101216851A publication Critical patent/CN101216851A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种本体数据管理***包括:数据存储模块,用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的存储管理服务;数据管理模块,用于进行三元组形式的本体数据管理,其包括三元组在数据页内的存储组织、访问、以及更新;数据处理模块,用于负责本体数据的导入、查询、以及更新处理;以及用户界面模块,用于负责用户与***的交互。

Description

一种本体数据(Ontology)管理***和方法
技术领域
本发明涉及计算机网络技术领域,尤其是涉及一种本体数据(Ontology)管理方法。
背景技术
万维网是一个巨大的信息资源库,不仅有门类齐全的文本信息,而且有丰富多彩的多媒体信息,无论何时何地,人们都可以很方便地获取自己想要的信息。然而,信息的***使得当今的万维网已经不堪重负,要想从这个巨大的资源库中找到自己想要的信息更是大海捞针。一些网站如yahoo、***等搜索引擎可以提供一些帮助,但是这些还远远不够。很多时候,用户不仅仅想查找一个网页,他们还想让计算机做的更多。例如,用户计划去加勒比海度过一个浪漫的假期,去之前想在Web上预定一个中等价位的意大利旅馆,并且这个旅馆离一个著名的电影院只有五个街区的距离。这些信息可能分别由不同的网站提供,在机器无法识别信息的情况下,所有的事情都需要用户亲自去做。用户需要分别去这些网站获取需要的信息,然后再根据自己的需要选择合适的内容。这种需求是当前流行的搜索引擎无法满足的,于是就出现了很多关于Web信息集成方面的研究工作,但是这方面的工作一般都针对一个特定的应用,无法对应不同的数据类型,因此无法直接应用到基于Web信息的复杂应用上来。
为了使来自不同地方的数据源的信息很容易的集成起来,需要由一个相关领域知识的共同理解。Ontology提供了一个支持共享和重用知识的公共词汇。Ontology通过描述事物以及事物之间的关系来描述现实世界的语义。
Ontology可以作为知识共享和知识发现的工具:一方面它可以作为不同***之间的沟通媒介,另一方面通过已有的Ontology描述可以推知更多的知识。语义网络是Ontology的一个重要应用场景,它使机器能自动识别并处理网络上的信息,从而提高人们使用和管理网络资源的能力。
万维网已经成了人们获取信息的主要来源,随着网络技术的发展,人们在网络上发布自己的信息成了一件越来越简单的事情,但目前的Web依赖于用户的技术,只能被人所理解,机器却无法自动识别,Web只负责提供信息给用户,剩下的事情都需要用户自己去处理,这给用户带了极大的不便。语义网正是在这种环境下应运而生。语义网(Semantic Web)是一个由万维网联盟的蒂姆·伯纳斯-李(Tim Berners-Lee)在1998年提出的一个概念,它的核心是:通过给万维网上的文档(如:HTML)添加能够被计算机所理解的元数据(Meta data),从而使整个互联网成为一个通用的信息交换媒介。语义万维网通过使用标准、置标语言和相关的处理工具来扩展万维网的能力。
万维网上的信息虽然是机器可读的,但却不是机器可理解的,由此导致网上的信息难以被计算机自动处理。解决这个难题的途径就是采用元数据来索引网上的信息,然后使用RDF资源描述框架来描述元数据以及元数据与元数据之间的关系。由W3C提出的RDF[3]和RDFS目前已经成为描述网络资源语义的标准语言。RDF的全称是资源描述框架,用于表示元数据。RDF用三元组(Subject,Property,Object)来表示资源以及资源之间的关系,和以文档或以数据为中心的XML相比,RDF是以知识为中心的方法,是专门为Web,尤其是语义网设计的,而XML是为信息交换提供了统一的语法格式。RDF优于XML的一个方面是RDF图描绘了资源的唯一表示方式,而对同一内容XML却有多种形式。RDF只定义了用于描述资源的框架,但没有定义使用哪些元数据来表述资源的,但允许定义元数据来描述特定的资源。这种定义出来的元数据被称为RDF Schema,简称RDFS。RDFS(RDF Schema)可以被用来表示特定领域内的词汇,与XMLDTD或者XML Schema相比,RDFS并没有对数据有严格的约束,例如,我们可以使用在RDFS中并没有定义的属性或类等等,RDFS中的元数据分为两类:一类是Class,用于描述资源的类型;Class之间可以存在继承关系,通过继承关系可以定义大型的分类目录,详细地分类有助于对资源的精确描述。另一类是Property,用于描述资源的属性以及资源之间的关系。Property本身具有Domain和Range两个属性,Domain用于表示RDF三元关系中的subject所属的类型,Range表示RDF三元关系中object所属的类型。
OrientX是由中国人民大学WAMDM实验室自主研究开发的Native XML数据管理***。现在,OrientX***仍然在完善当中。OrientX以Native方式存储XML数据,保留了XML数据的树状结构。存储子***中还提供了缓冲区管理、物理页面管理、文件读写管理功能,为上层数据管理模块提供高效的存储支持。
OrientX/Ontology***是基于OrientX***扩展得到的******,专门处理Ontology数据的存储和管理;可以看作是OrientX for Ontology的专用版本。传统的数据管理由于缺乏语义支持而受到限制,Ontology提供的语义信息弥补了这个不足。但Ontology数据本身的管理又成为一个新的问题。关系模式与Ontology数据的模式差异过大,不适合Ontology数据管理;希望能够借鉴XML数据管理中的相关技术提供更有效的Ontology数据管理。
发明内容
为了解决上述传统问题,因此本发明的一个目的就是提出了一种本体数据管理***和方法。
在本发明的一个方面中,一种本体数据管理***包括:数据存储模块,用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的存储管理服务;数据管理模块,用于进行三元组形式的本体数据管理,其包括三元组在数据页内的存储组织、访问、以及更新;数据处理模块,用于负责本体数据的导入、查询、以及更新处理;以及用户界面模块,用于负责用户与***的交互。
在这个方面中,数据存储模块包括:存储管理模块用于对逻辑页和缓冲区的管理;数据集管理模块用于对数据集的相关信息的管理;以及文件管理模块用于创建文件和对文件的各种操作。
在这个方面中,数据管理模块包括:类管理模块,用于对类对像进行管理;属性管理模块,用于对各种属性进行管理;相同类管理模块,用于对相同的类对像进行管理;以及不同类管理模块,用于对不同类对像进行管理。
在这个方面中,数据处理模块包括导入模块和查询模块。
在这个方面中,导入模块包括:RDF解析器,用于解析RDF文档;导入推理引擎,用于在导入时对部分的数据进行推理;以及导入执行模块,用于将解析好并完成推理的数据进行存储。
在这个方面中,查询模块包括:SPASQL语言解析器,用于解析SPASQL查询语句;查询推理引擎,用于对数据推理得到隐含的数据;查询执行模块,用于选取满足条件的数据。
在这个方面中,用户界面模块由API和GUI两种接口构成,用户既可以使用API开发上层的应用程序,也可以通过图形界面进行数据管理。
在本发明的另一方面中,提出了一种用在本体数据管理***中的导入方法,该管理***包括数据存储模块、数据管理模块、由导入模块和查询模块构成的数据处理模块、以及用户界面模块,其中该数据处理模块包括类管理模块,属性管理模块、相同类管理模块、以及不同类管理模块,该导入模块包括RDF解析器、导入推理引擎、以及导入执行模块,该查询模块包括SPASQL语言解析器、查询推理引擎、以及查询执行模块,该导入方法包括步骤:用户提交RDF文档;通过RDF解析器进行解析,得到本体的内存模型;导入执行模块从内存模型中提取三元组,传给导入推理引擎进行推理;推理得到的三元组和原始三元组一起,交由数据管理模块进行处理;数据管理模块根据三元组的不同语义选择类管理模块、属性管理模块、相同类管理模块、以及不同类管理模块中的相应子管理模块负责;所述相应子管理模块将三元组组织成数据记录,交给存储管理模块写入逻辑页;以及存储管理模块通过文件管理模块将数据最终写到数据文件中。
在本发明的又一方面中,提出了一种用在本体数据管理***中的查询方法,该管理***包括数据存储模块、数据管理模块、由导入模块和查询模块构成的数据处理模块、以及用户界面模块,其中该数据处理模块包括类管理模块,属性管理模块、相同类管理模块、以及不同类管理模块,该导入模块包括RDF解析器、导入推理引擎、以及导入执行模块,该查询模块包括SPASQL语言解析器、查询推理引擎、以及查询执行模块,该查询方法包括步骤:用户提交SPARQL查询;通过SPARQL解析器对查询语句进行解析;查询引擎模块接收解析后的查询并送至数据管理模块;数据管理模块进行单个三元组的查询,并将中间结果进行处理,得到最终的结果并返回给用户。
附图说明
结合随后的附图,从下面的详细说明中可显而易见的得出本发明的上述及其他目的、特征及优点。在附图中:
图1给出了根据本发明的OrientX/Ontology的***结构图;
图2给出了根据本发明的方法的导入流程图;以及
图3给出了根据本发明的方法的查询流程图。
具体实施方式
首先,参考图1,对根据本发明的OrientX/Ontology的***结构进行详细的说明。图1给出了OrientX/Ontology的***结构图。
如图1所示,该***自底向上可以分为四个部分,其分别是数据存储模块、数据管理模块、数据处理模块、以及用户界面模块。下面简要介绍一下各层的作用。
数据存储模块由存储管理模块、数据集管理模块、以及文件管理模块这三个模块构成,并且该存储层用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的存储管理服务,其中存储管理模块用于对逻辑页和缓冲区的管理;数据集管理模块用于对数据集的相关信息的管理;文件管理模块用于创建文件和对文件的各种操作。
数据管理模块由类管理模块、属性管理模块、相同类管理模块、以及不同类管理模块构成,并且该数据管理模块用于进行三元组形式的本体数据管理,其包括三元组在数据页内的存储组织、访问、以及更新,其中类管理模块用于对类对像进行管理,属性管理模块用于对各种属性进行管理,相同类管理模块用于对相同的类对像进行管理,并且不同类管理模块用于对不同类对像进行管理。这四个不同的管理模块分别对于各自不同的对像定义了各自的存储组织,访问和更新子模块。
数据处理模块由数据导入模块和查询模块构成,并且该数据处理模块负责本体数据的导入、查询、以及更新处理。在导入模块当中,包括RDF解析器、导入推理引擎、以及导入执行模块。其中RDF解析器用于解析RDF文档;导入推理引擎用于在导入时对部分的数据进行推理;导入执行模块用于将解析好并完成推理的数据进行存储。在查询模块当中,包括SPASQL语言解析器、查询推理引擎、以及查询执行模块。其中SPASQL语言解析器用于解析SPASQL查询语句;查询推理引擎用于对数据推理得到隐含的数据;查询执行模块用于选取满足条件的数据。
用户界面模块由API和GUI两种接口构成,负责用户与***的交互。用户既可以使用API开发上层的应用程序,也可以通过图形界面进行数据管理。
***中数据的流动可归为两个处理流程,分别是导入流程和查询流程,下面分别简单介绍一下这两个流程。
图2解释了本发明方法的导入流程的过程:用户提交RDF(资源描述框架)文档,通过RDF解析器进行解析,得到本体的内存模型;导入执行模块从内存模型中提取三元组,传给导入推理引擎进行推理;推理得到的三元组和原始三元组一起,交由数据管理模块进行处理;数据管理模块根据三元组的不同语义选择类管理模块、属性管理模块、相同类管理模块、以及不同类管理模块中的相应子管理模块负责;所述相应子管理模块将三元组组织成数据记录,交给存储管理模块写入逻辑页;存储管理模块通过文件管理模块将数据最终写到数据文件中。
图3解释了本发明方法的查询流程的过程:用户提交SPARQL(RDF上的查询语言)查询,通过SPARQL解析器进行解析,查询引擎模块接收解析后的查询,传递给数据管理模块进行单个三元组的查询,并将中间结果进行处理,得到最终的结果返回给用户。
从以上描述可知,本发明的特征在于设计了一套适合Ontology数据特征的Native的存储方法,查询和推理都是建立在Native的存储基础之上的。Ontology数据可以用图来表示,因此直接用关系来表示必定会带来转换的困难,从而使查询效率受到影响。因此,我们的OrientX/Ontology***Native存储设计方法是:
1、把RDF三元组组织成树的结构。
2、Ontology数据模型是一个有向无环图,对于有多个父亲的结点,我们把此结点拆分开,一个为主结点,另一个为Copy结点。
对于本领域的普通技术人员来说可显而易见的得出其他优点和修改。因此,具有更广方面的本发明并不局限于这里所示出的并且所描述的具体说明及示例性实施例。因此,在不脱离由随后权利要求及其等价体所定义的一般发明构思的精神和范围的情况下,可对其做出各种修改。

Claims (9)

1.一种本体数据管理***,包括:
数据存储模块,用于对磁盘数据页进行组织和管理且向上层提供以逻辑页为单位的存储管理服务;
数据管理模块,用于进行三元组形式的本体数据管理,其包括三元组在数据页内的存储组织、访问、以及更新;
数据处理模块,用于负责本体数据的导入、查询、以及更新处理;
以及
用户界面模块,用于负责用户与***的交互。
2.根据权利要求1的本体数据管理***,其中数据存储模块包括:
存储管理模块用于对逻辑页和缓冲区的管理;
数据集管理模块用于对数据集的相关信息的管理;以及
文件管理模块用于创建文件和对文件的各种操作。
3.根据权利要求1的本体数据管理***,其中数据管理模块包括:
类管理模块,用于对类对像进行管理;
属性管理模块,用于对各种属性进行管理;
相同类管理模块,用于对相同的类对像进行管理;以及
不同类管理模块,用于对不同类对像进行管理。
4.根据权利要求1的本体数据管理***,其中数据处理模块包括导入模块和查询模块。
5.根据权利要求4的本体数据管理***,其中导入模块包括:
RDF解析器,用于解析RDF文档;
导入推理引擎,用于在导入时对部分的数据进行推理;以及
导入执行模块,用于将解析好并完成推理的数据进行存储。
6.根据权利要求4的本体数据管理***,其中查询模块包括:
SPASQL语言解析器,用于解析SPASQL查询语句;
查询推理引擎,用于对数据推理得到隐含的数据;
查询执行模块,用于选取满足条件的数据。
7.根据权利要求1的本体数据管理***,其中用户界面模块由API和GUI两种接口构成,用户既可以使用API开发上层的应用程序,也可以通过图形界面进行数据管理。
8.一种用在本体数据管理***中的导入方法,该管理***包括数据存储模块、数据管理模块、由导入模块和查询模块构成的数据处理模块、以及用户界面模块,其中该数据处理模块包括类管理模块,属性管理模块、相同类管理模块、以及不同类管理模块,该导入模块包括RDF解析器、导入推理引擎、以及导入执行模块,该查询模块包括SPASQL语言解析器、查询推理引擎、以及查询执行模块,该导入方法包括步骤:
用户提交RDF文档;
通过RDF解析器进行解析,得到本体的内存模型;
导入执行模块从内存模型中提取三元组,传给导入推理引擎进行推理;
推理得到的三元组和原始三元组一起,交由数据管理模块进行处理;
数据管理模块根据三元组的不同语义选择类管理模块、属性管理模块、相同类管理模块、以及不同类管理模块中的相应子管理模块负责;
所述相应子管理模块将三元组组织成数据记录,交给存储管理模块写入逻辑页;以及
存储管理模块通过文件管理模块将数据最终写到数据文件中。
9.一种用在本体数据管理***中的查询方法,该管理***包括数据存储模块、数据管理模块、由导入模块和查询模块构成的数据处理模块、以及用户界面模块,其中该数据处理模块包括类管理模块,属性管理模块、相同类管理模块、以及不同类管理模块,该导入模块包括RDF解析器、导入推理引擎、以及导入执行模块,该查询模块包括SPASQL语言解析器、查询推理引擎、以及查询执行模块,该查询方法包括步骤:
用户提交SPARQL查询;
通过SPARQL解析器对查询语句进行解析;
查询引擎模块接收解析后的查询并送至数据管理模块;
数据管理模块进行单个三元组的查询,并将中间结果进行处理,得到最终的结果并返回给用户。
CNA2008100560987A 2008-01-11 2008-01-11 一种本体数据(Ontology)管理***和方法 Pending CN101216851A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2008100560987A CN101216851A (zh) 2008-01-11 2008-01-11 一种本体数据(Ontology)管理***和方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2008100560987A CN101216851A (zh) 2008-01-11 2008-01-11 一种本体数据(Ontology)管理***和方法

Publications (1)

Publication Number Publication Date
CN101216851A true CN101216851A (zh) 2008-07-09

Family

ID=39623283

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2008100560987A Pending CN101216851A (zh) 2008-01-11 2008-01-11 一种本体数据(Ontology)管理***和方法

Country Status (1)

Country Link
CN (1) CN101216851A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102722569A (zh) * 2012-05-31 2012-10-10 浙江理工大学 基于rdf图路径游走的知识发现装置及方法
CN101853251B (zh) * 2009-03-30 2012-11-21 华为技术有限公司 一种保护敏感资源描述框架数据的方法、装置及***
CN102929898A (zh) * 2011-08-12 2013-02-13 微软公司 结构化数据库的语义查询引擎
CN102999563A (zh) * 2012-11-01 2013-03-27 无锡成电科大科技发展有限公司 基于资源描述框架的网络资源语义检索方法及***
CN104205092A (zh) * 2012-03-28 2014-12-10 国际商业机器公司 通过变换复杂三元组建立本体
CN105447156A (zh) * 2015-11-30 2016-03-30 北京航空航天大学 资源描述框架分布式引擎及增量式更新方法
CN105760425A (zh) * 2016-01-17 2016-07-13 曲阜师范大学 一种本体数据存储方法
CN109101550A (zh) * 2018-07-09 2018-12-28 广州极天信息技术股份有限公司 语义网管理***、方法、设备以及存储介质

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853251B (zh) * 2009-03-30 2012-11-21 华为技术有限公司 一种保护敏感资源描述框架数据的方法、装置及***
CN102929898A (zh) * 2011-08-12 2013-02-13 微软公司 结构化数据库的语义查询引擎
CN102929898B (zh) * 2011-08-12 2017-08-15 微软技术许可有限责任公司 结构化数据库的语义查询引擎
CN104205092B (zh) * 2012-03-28 2017-03-01 国际商业机器公司 通过变换复杂三元组建立本体的方法和***
CN104205092A (zh) * 2012-03-28 2014-12-10 国际商业机器公司 通过变换复杂三元组建立本体
CN102722569A (zh) * 2012-05-31 2012-10-10 浙江理工大学 基于rdf图路径游走的知识发现装置及方法
CN102722569B (zh) * 2012-05-31 2014-10-22 浙江理工大学 基于rdf图路径游走的知识发现装置及方法
CN102999563A (zh) * 2012-11-01 2013-03-27 无锡成电科大科技发展有限公司 基于资源描述框架的网络资源语义检索方法及***
CN105447156A (zh) * 2015-11-30 2016-03-30 北京航空航天大学 资源描述框架分布式引擎及增量式更新方法
CN105760425A (zh) * 2016-01-17 2016-07-13 曲阜师范大学 一种本体数据存储方法
CN105760425B (zh) * 2016-01-17 2018-12-04 曲阜师范大学 一种本体数据存储方法
CN109101550A (zh) * 2018-07-09 2018-12-28 广州极天信息技术股份有限公司 语义网管理***、方法、设备以及存储介质
CN109101550B (zh) * 2018-07-09 2022-05-03 广州极天信息技术股份有限公司 语义网管理***、方法、设备以及存储介质

Similar Documents

Publication Publication Date Title
Bizer et al. Dbpedia-a crystallization point for the web of data
Weissenberg et al. An ontology-based approach to personalized situation-aware mobile service supply
Hyvönen Semantic portals for cultural heritage
CN101216851A (zh) 一种本体数据(Ontology)管理***和方法
Cole et al. Library marc records into linked open data: Challenges and opportunities
Yoose et al. The linked open data landscape in libraries and beyond
Orgel et al. A metadata model and mapping approach for facilitating access to heterogeneous cultural heritage assets
Hoang et al. Retracted: Semantic information integration with linked data mashups approaches
Tachmazidis et al. A Hypercat-enabled semantic Internet of Things data hub
Simon et al. Peripleo: a tool for exploring heterogenous data through the dimensions of space and time
Cayzer Semantic blogging: Spreading the semantic web meme
Singer Linked library data now!
Salas et al. Stdtrip: Promoting the reuse of standard vocabularies in open government data
Lu et al. Language engineering for the Semantic Web: A digital library for endangered languages
Orlandi et al. Semantic search on heterogeneous wiki systems
Hou et al. Modeling and representation of intangible cultural heritage knowledge using linked data and ontology
Stergiou et al. OpenAPI QL: searching in OpenAPI service catalogs
Piotrowski et al. The Labeling System: A New Approach to Overcome the Vocabulary Bottleneck
Zhao et al. Heterogeneous Social Linked Data Integration and Sharing for Public Transportation
Fakhre Alam et al. A comparative study of RDF and topic maps development tools and APIs
Kim et al. RDF based linked open data management as a DaaS platform
Cortese et al. Extending the Digital Archives of Italian Psychology with Semantic Data.
Mitchell et al. LA meta (data): Exploring vocabulary interoperability in libraries, Archives and Museums
Le et al. Vietnamese tourism linked open data
Plewe A qualified assertion database for the history of places

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20080709