CN101625694A - 一种存储多种标准地学元数据的方法及*** - Google Patents

一种存储多种标准地学元数据的方法及*** Download PDF

Info

Publication number
CN101625694A
CN101625694A CN200910091295A CN200910091295A CN101625694A CN 101625694 A CN101625694 A CN 101625694A CN 200910091295 A CN200910091295 A CN 200910091295A CN 200910091295 A CN200910091295 A CN 200910091295A CN 101625694 A CN101625694 A CN 101625694A
Authority
CN
China
Prior art keywords
metadata
standard
xml
earth science
document object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200910091295A
Other languages
English (en)
Inventor
王卷乐
冯敏
诸云强
宋佳
朱华忠
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Geographic Sciences and Natural Resources of CAS
Original Assignee
Institute of Geographic Sciences and Natural Resources of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Geographic Sciences and Natural Resources of CAS filed Critical Institute of Geographic Sciences and Natural Resources of CAS
Priority to CN200910091295A priority Critical patent/CN101625694A/zh
Publication of CN101625694A publication Critical patent/CN101625694A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种存储多种标准地学元数据的方法及其***,所述方法包括:步骤1,以XSD方式定义各个地学元数据标准,确定各个标准的标准标识,根据所述标准标识对所述标准的元数据项进行唯一标识,并对每个标准定义关键元数据信息项和元数据表的字段的映射规则;步骤2,以XML形式统一表达符合不同标准的元数据,以XML文档对象模型的方法解析和验证元数据结构;步骤3,将元数据XML文档对象模型转换为XML文本,采用BLOB字段存储XML文本形式表达的元数据,并依据所述映射规则将所述关键元数据信息项映射到元数据表。本发明能够实现地学元数据的信息共存和标准的共存。

Description

一种存储多种标准地学元数据的方法及***
技术领域
本发明涉及地球科学信息存储领域,尤其涉及一种存储多种标准地学元数据的方法及***。
背景技术
地学数据及各种资源不仅对地学相关科学研究具有重要意义,是科研工作者开展研究工作的必要基础,而且对社会经济建设也具有重要价值。然而,由于地学数据及各种资源在产生过程、表现形式、关键内容、主要用途等方面具有非常大的差异,且分散在不同位置、由不同组织和个人所拥有,对使用和应用带来巨大困难。元数据是解决这一问题的基本方式,这一点在国内外和各界都得到了广泛的认可。但是,在元数据的内容、结构和表达方式上却产生了巨大分歧,先后在国内外制定了数量众多的元数据标准。一方面,由于描述对象的特征和描述角度的不同,造成难以统一的现实问题;另一方面,不同地学元数据标准的内容结构和表达方式差异往往较大,而无法实现地学元数据的信息共存。在本申请中将地学元数据标准简称为标准。
地学数据的元数据是指地学相关数据集和信息资源的描述信息,是对空间特征的概括和抽取。用户利用元数据,可以迅速了解数据的名称、质量、比例尺、数据的组织方式等描述信息。由于地学数据存在数据量大、数据格式不统一和存储形式各异等特点,直接访问和浏览数据体比较困难,因此,地理元数据已经逐步从一种数据描述与索引的方法扩展到包括数据发现、数据转换、数据管理和数据使用的整个网络信息过程中不可或缺的工具和方法之一。
地学元数据标准的制定取得明显进展,目前国外比较著名的地学元数据标准包括FGDC(Federal Geographic Data Committee,美国联邦数据委员会)制定的CSDGM(Content Standard for Digital Geospatial Metadata,数字地理空间元数据内容标准)和ISO/TC211(International StandardsOrganization/Technical Committee 211,国际标准化组织地理信息技术委员会)制定的ISO 19115等。此外,一些通用型元数据标准也被应用于地学项目,如DC(Dublin Core,都柏林核心元数据)。近年国内的一些组织和机构也开展了地学元数据标准的制定工作,2004年在ISO 19115的基础上修改形成了《地理信息元数据》标准,此外还有国家地理信息中心起草的中国可持续发展信息元数据标准、中国科学院科学数据库核心元数据标准以及众多地学相关行业的元数据标准。不同元数据标准的元素和结构可能有很大差异,如DC 1.1版本由15元素构成,而ISO 19115则定义了300多个元数据要素(element),其中包括86个类(class)、282个属性(attribute)和56个关联(relation)。这些元数据标准一般采用结构化表达方法,一方面结构化内容表达形式更适合于组织信息项较多的信息体,但分析和处理的难度也更大;另一方面由于缺乏统一的元数据标准定义语言,导致元数据标准的定义表述不一致,如ISO 19115采用统一建模语言(Unified ModelingLanguage,UML)方式表达,而CSDGM等则采用规范化的文本方式。统一不同元数据标准的表达方式,便于计算机自动识别和分析元数据标准,也是支持多标准地学元数据的前提。XML(Extensible Markup Language,可扩展标记语言)是目前使用最广泛的结构化语言,可以满足元数据标准的定义、表达、验证、检索等操作需要。元数据标准往往只定义元数据的逻辑结构,而不规定具体的实现方式,在元数据表达和存储等方面国内外学者开展了相关研究。在吉林省农业信息网的构建过程中,通过采用数据库字段分别存储FGDC元数据各字段实现元数据的存储与管理;在地球***科学数据共享网一期平台的设计中,采用关系表分别存储关系项和数据项,实现对结构化元数据的支持;现有技术中还有关系化的XML存储方案,这种方案分别存储XML结构和内容。
以上研究提出的方案有效解决了特定地学元数据标准的元数据管理和共享,但由于元数据的结构和存储方式之间紧密绑定,难以用于多元数据标准共存以及动态的元数据标准变化情况。目前,在地学元数据共享方面仍然广泛存在元数据标准和内容不同以及元数据管理分散等问题,因此,实现支持多标准的地学元数据标准管理和共享平台是开展地学数据共享的重要基础。
XML元数据是以XML形式承载的元数据信息,其存储方式可概括为:(1)将XML的文本信息存储在变长的BLOB(Binary Large Object,二进制大对象)字段中。其优点是简单通用,但缺点是不能区分XML与普通文本或二进制信息,需要用户自行完成文本和文档对象模型(Document Object Model,DOM)信息之间的相互转换,也不能在数据库层面实现XML信息的分析和查询。(2)建立XML结构和二维表结构之间的映射,将XML的每个信息都对应到一个存储字段中。其优点是可以避免文本型字段不能实现数据库层面的查询问题,但缺点是只适合固定结构的XML结构。(3)使用专用的XML字段类型存储XML信息。其优点是由数据库提供专用的XML存储和查询等功能,并提供了一定的优化算法,性能较好且易用;但目前实现该功能的数据库并不多,而且在定义时需提供XML Schema,因而难以适应多标准XML信息的存储和管理。
经过调研和测试,采用BLOB字段存储元数据,然后开发解析和处理XML文本的功能模块,实现对基于XML的地学元数据存储的支持。由于在元数据管理方面还需其他的信息项,这些信息项与元数据存储字段存储在一个关系表。因此,采用BLOB方式存储XML信息将导致无法在数据库基础上开展数据搜索等操作。如果每次都加载和解析XML文档,再进行检索等处理,则性能难以满足要求。同时需要明确的一点是:经常需要进行检索的项只是元数据项中的一部分,在实际应用中并不是所有的项都需进行检索操作。
发明内容
为解决上述问题,本发明提供了一种存储多种标准地学元数据的方法及***,能够实现地学元数据的信息共存和标准的共存。
本发明公开了一种存储多种标准地学元数据的方法,包括:
步骤1,以XSD方式定义各个地学元数据标准,确定各个标准的标准标识,根据所述标准标识对所述标准的元数据项进行唯一标识,并对每个标准定义关键元数据信息项和元数据表的字段的映射规则;
步骤2,以XML形式统一表达符合不同标准的元数据,以XML文档对象模型的方法解析和验证元数据结构;
步骤3,将元数据XML文档对象模型转换为XML文本,采用BLOB字段存储XML文本形式表达的元数据,并依据所述映射规则将所述关键元数据信息项映射到元数据表。
所述步骤3后还包括:
步骤21,进行检索时,在元数据表上进行快速元数据信息检索。
所述步骤3后还包括:
步骤31,在读取时,从所述BLOB字段中提取XML文本,将所述XML文本解析为XML文档对象模型。
所述步骤31后还包括:
步骤41,进行检索时,以XPath方式对解析后的XML文档对象模型进行检索。
所述步骤1还包括定义元数据的表现形式和XSLT转换方法;
所述步骤3后还包括:
步骤51,在进行表现时,通过XSLT转换方法转换元数据为预设的表现形式。
所述步骤3进一步为,
步骤61,将验证后的元数据信息从XML文档对象模型序列化为XML文本字节流,并存储到BLOB字段中;
步骤62,根据所述映射规则,通过XPath方式从元数据的XML文档对象模型中提取关键元数据信息项,存储到对应的地学元数据标准的元数据表中。
本发明还公开了一种存储多种标准地学元数据的***,所述***包括:
地学元数据标准定义模块,用于以XSD方式定义各个地学元数据标准,确定各个标准的标准标识,根据所述标准标识对所述标准的元数据项进行唯一标识,并对每个标准定义关键元数据信息项和元数据表的字段的映射规则;
地学元数据标准解析模块,以XML形式统一表达符合不同标准的元数据,以XML文档对象模型的方法解析和验证元数据结构;
地学元数据标准存储模块,用于将元数据XML文档对象模型转换为XML文本,采用BLOB字段存储XML文本形式表达的元数据,并依据所述映射规则将所述关键元数据信息项映射到元数据表。
所述***还包括:
地学元数据标准检索模块,用于在元数据表上进行快速元数据信息检索,或从所述BLOB字段中提取XML文本,将所述XML文本解析为XML文档对象模型,以XPath方式对解析后的XML文档对象模型进行元数据信息检索。
所述地学元数据标准定义模块还用于定义元数据的表现形式和XSLT转换方法;
所述***还包括:
地学元数据标准表现模块,用于在进行表现时,通过XSLT转换方法转换元数据为预设的表现形式。
所述地学元数据标准存储模块进一步用于将验证后的元数据信息从XML文档对象模型序列化为XML文本字节流,并存储到BLOB字段中;根据映射规则,通过XPath方式从元数据的XML文档对象模型中提取关键元数据信息项,存储到对应的数据标准的元数据表中。
本发明的有益效果在于,通过对标准进行统一定义和标识,实现地学元数据的信息共存和标准的共存;通过建立同关键元数据项相映射的二维表,提高元数据的查询效率。
附图说明
图1是本发明的方法流程图;
图2是命名空间方法对标准进行标识的方法示意图;
图3是元数据存储中对元数据操作的方法流程图;
图4是实施例中第一地学元数据结构示例的数据逻辑结构;
图5是实施例中第二地学元数据结构示例的数据逻辑结构;
图6是本发明的***结构图。
具体实施方式
下面结合附图,对本发明做进一步的详细描述。
本发明方法如图1所示。
步骤S100,以XSD方式定义各个地学元数据标准,确定各个标准的标准标识,根据该标准标识对所述标准的元数据项进行唯一标识,并对每个标准定义关键元数据信息项和元数据表的字段的映射规则。
由于标准的结构差异较大,需要解决标准的定义问题。本发明采用XSD(XML Schema Definition,XML结构定义)作为标准的定义方式,XML为可扩展标记语言。XSD由W3C(World Wide Web Consortium,万维网协会)提出,适合于复杂信息体结构的定义。
地学元数据的结构复杂,现有技术中分为信息项定义和信息体结构两个部分,分别用于确定信息项的组成和信息项的相互关系。对于信息项定义,利用XSD已经预定义的元素类型,满足大部分元数据项的定义需要;而对于更复杂的定制元数据项,则通过XSD的扩展和约束机制进行定义,如数值范围规则,包括数值的有效范围、最大最小值;长度规则,包括字符串的长度;以及枚举规则,为所有可能取值的集合。对于信息体结构的定义,则采用XSD的复杂要素定义元数据项之间的组合关系,包括:序列方法和选择方法。
在具体实施过程中,部分标准已提供相应XSD的定义,直接采用,如ISO19139已提供XSD方式定义的ISO 19115。对于没有提供XSD定义的标准,则将该标准所制定的规则转换为XSD定义形式;通过XSD的信息项定义和信息体结构的定义要求进行实现。
对于每个所述标准将所述标准标识和所述标准的元数据项的标识结合为新标识,用所述新标识对所述标准的元数据项进行唯一标识。
所述标准标识为所述标准发布方的网站地址;
所述元数据项的标识为元数据项名称。
每个标准都独立的定义了各自的元数据信息项和结构的信息,如果仅通过元数据项的标识进行区分,则会造成不同元数据标准的定义冲突,如,以元数据项名称作为元数据项的标识,标准A和标准B都定义名称为“元数据标题”的元数据信息项,则仅通过该名称难以区分元数据所属标准。
对于各种标准的标识是联系元数据与其所属标准、以及避免不同标准的元数据项定义冲突的手段。本发明采用命名空间方法对标准进行标识,如图2所示,每个标准都赋予一个唯一的命名空间(URI),该命名空间和元素名称结合为新标识,用该新标识唯一标识该标准定义的元数据项。如:{http://www.geodata.com/metadata/geodata,元数据标题}和{http://www.geodata.com/metadata/mairs,元数据标题},能够区分不同元数据标准下的标题元数据项。在整合不同元数据标准时,确保每个准都提供唯一的命名空间定义,该标准的所有内容定义都在该命名空间下。
将关键元数据信息项映射到元数据表时,对于每个标准,确定所述标准的关键元数据项的位置;建立所述关键元数据项同所述元数据表的字段的映射关系。
针对地学元数据的特点,提取的关键元数据项包括:
ID(元数据ID,char(36))
TITLE(元数据标题,char(300))
KEYWORDS(元数据关键词,char(500))
ABSTRACT(元数据摘要,char(2000))
THEME(元数据分类,char(1000))
PRODUCER(元数据生产者,char(50))
DATETIME(数据生产日期,char(50))
ADMINNAME(数据集所属行政区,char(500))
GEONAME(数据集所属自然区,char(500))
EAST(数据集范围东至,float(10))
WEST(数据集范围西至,float(10))
SOUTH(数据集范围南至,float(10))
NORTH(数据集范围北至,float(10))
以XPath方式定义元数据信息项在元数据复合结构中的位置,建立元数据信息项与数据库字段之间的映射关系。
以XSLT方式定义元数据XML形式与HTML等显示形式或其他预设元数据格式的转换方式。
XPath和XSLT都是W3C的标准,用于在结构化的XML信息中定位信息项。具体实现上通过现有技术软件完成,例如,采用Apache Xalan软件包进行转换。
在地学元数据更新的同时,同时自动根据指定的映射规则,更新元数据表,保证映射信息与XML地学元数据内容的同步。
步骤S200,以XML形式统一表达符合不同标准的元数据,以XML文档对象模型的方法解析和验证元数据结构。
XML文档对象模型的方法是通过将元数据文本解析为可直接进行分析的XML对象模型,解析过程中加载定义元数据标准的XSD文件进行验证。
解析XML文本为XML文档对象模型为W3C的技术标准,具体实现可通过现有技术的中软件完成,例如采用Apache Xerces软件包进行XML文档对象模型的解析和序列化。
步骤S300,将元数据XML文档对象模型转换为XML文本,采用BLOB字段存储XML文本形式表达的元数据,并依据所述映射规则将所述关键元数据信息项映射到元数据表。
将元数据从XML文档对象模型形式序列化为XML文本形式,采用BLOB字段存储XML文本形式表达的元数据;
在采用BLOB字段存储XML文本形式表达的元数据时,通过上面提到的现有软件和工具将XML的文档对象模型序列化为文本字节流,并存储到BLOB字段中。
将整个地学元数据的XML信息序列化为文本字节流,存储于长度不受限制的BLOB字段中,避免由于地理元数据内容和所属标准不同造成的长度和结构差异。BLOB是常见的关系型数据库字段类型,因此该方法能够适用于通用数据库。
根据元数据标准中定义的映射规则,从元数据文档对象模型中提取关键项信息,然后将关键元数据信息项映射到元数据表。关键项信息是用定义映射规则的XPath从元数据对象模型中提取。XPath是现有技术标准,可通过上面提到的现有软件和工具实现提取过程。在存储后对进一步可以对元数据进行检索、读取、表现。
一种检索方法如下所述。
步骤400,进行检索时,在元数据表上进行快速元数据信息检索。
由于采用BLOB存储地学元数据信息,将导致无法在数据库基础上开展数据检索操作,而且如果每次都加载和解析XML文档,然后再进行搜索处理,会造成性能损失。同时需要明确的一点是:经常需要进行检索的项只是元数据项中的一部分,在实际应用中并不是所有的项都需要进行检索操作。因此,本发明在BLOB存储地学元数据的基础上,提出关键元数据项映射的方式:该方式通过从标准中提取对应的关键元数据项,并把该些关键元数据项映射到元数据表,来提高检索的效率。
读取如图3所示。
步骤500,在读取时,从所述BLOB字段中提取XML文本,将所述XML文本解析为XML文档对象模型。
对地学元数据进行读取时,从BLOB字段读取的地理元数据信息字节流,通过XML的文档对象模型或事件驱动模型两种常见方式进行解析。
基于上述读取方法,本发明的另一种检索方法如图3所示。
步骤600,进行检索时,以XPath方式对解析后的XML文档对象模型进行检索。
表现如图3所示。
步骤700,在进行表现时,通过XSLT转换方法转换元数据为预设的表现形式。
本发明在以上对标准和元数据项标识的基础上,以XML作为元数据的表达。相应的地学元数据处理阶段都围绕XML形式的地学元数据信息展开。
对地学元数据表现时,通过XSLT(Extensible Style LanguageTransformation,可扩展样式表语言转换),以XML信息的形式进行转换,从而得到文本或HTML形式的地学元数据表现形式,也可以转换得到符合预设其他元数据标准的地学元数据。
本发明方法的一实施例如下所述。
以图4和图5所示标准的信息结构为例,在该结构中包括了一个“元数据标识”元数据项、一个“地理空间范围”元数据项、以及其他元数据项。在第一标准示例和第二标准示例中对“地理空间范围”元数据项的表达方式存在差异,第一标准示例采用经纬度范围方式,而第二标准示例采用空间位置描述的方式。
根据元数据的逻辑结构,生成XSD方式表达的元数据标准定义,其中第一标准示例定义为:
<?xml version=″1.0″encoding=″UTF-8″?>
<xs:schema xmlns=″http://www.geodata.cn/metadata1″
xmlns:xs=″http://www.w3.org/2001/XMLSchema″
targetNamespace=″http://www.geodata.cn/metadata1″>
    <xs:element name=″地学元数据标准示例1″>
       <xs:complexType>
          <xs:sequence>
                  <xs:element name=″元数据标识″type=″xs:string″/>
                  <xs:element name=″地理空间范围″>
                     <xs:complexType>
                         <xs:sequence>
                             <xs:element name=″经纬度范围″>
                                 <xs:complexType>
                                     <xs:sequence>
                                        <xs:element name=″东″type=″xs:string″/>
                                        <xs:element name=″南″type=″xs:string″/>
                                        <xs:element name=″西″type=″xs:string″/>
                                        <xs:element name=″北″type=″xs:string″/>
                                    </xs:sequence>
                                </xs:complexType>
                            </xs:element>
                        </xs:sequence>
                    </xs:complexType>
                </xs:element>
                <xs:element name=″其他信息项″/>
                …
            </xs:sequence>
        </xs:complexType>
    </xs:element>
</xs:schema>
 第二标准示例定义为:
<?xml version=″1.0″encoding=″UTF-8″?>
<xs:schema xmlns=″http://www.geodata.cn/metadata2″
xmlns:xs=″http://www.w3.org/2001/XMLSchema″
targetNamespace=″http://www.geodata.cn/metadata2″>
    <xs:element name=″地学元数据标准示例2″>
        <xs:complexType>
            <xs:sequence>
                <xs:element name=″元数据标识″type=″xs:string″/>
                <xs:element name=″地理空间范围″>
                    <xs:complexType>
                        <xs:choice>
                            <xs:element name=″地理区域″type=″xs:string″/>
                            <xs:element name=″行政区域″type=″xs:string″/>
                        </xs:choice>
                    </xs:complexType>
                </xs:element>
                <xs:element name=″其他信息项″/>
                …
            </xs:sequence>
        </xs:complexType>
    </xs:element>
</xs:schema>
命名空间的取值选择与该元数据相关的URI(Uniform ResourceIdentifier,统一资源标识),本实施例中采用标准发布方的网站地址加元数据英文缩写的方式标识元数据,例如第一标准示例的命名空间为:http://www.geodata.cn/metadata1,第二标准示例名空间为:http://www.geodata.cn/metadata2。标准的命名空间需要反映在该标准的XSD结构中,所以将该命名空间的信息添加到了标准的XSD定义中。
其中元数据英文缩写使是元数据标准英文名称的缩写,比如一个元数据标准中文叫“地球***科学数据共享网核心元数据标准”,英文名为“GeodataCore Metadata Standard”,缩写就是“geodataCoreMetadata”,也可以缩写为其他形式如“geodata”,作用是为了避免重复。
以支持BLOB字段类型的关系型数据为基础,结合XML的处理功能模块或工具,实现对不同元数据标准的元数据的无差别表达、读写、以及检索、表现和转换。
以下分别以第一标准示例和第二标准示例为例进行说明。
符合第一标准示例的元数据为:
    <?xml version=″1.0″encoding=″UTF-8″?>
    <地学元数据标准示例1xmlns=″http://www.geodata.cn/metadata1″>
       <元数据标识>tmetadata1-01</元数据标识>
       <地理空间范围>
          <经纬度范围>
             <东>110</东>
             <南>37</南>
             <西>115</西>
             <北>40</北>
        </经纬度范围>
    </地理空间范围>
    <其他信息项/>
</地学元数据标准示例1>
符合第二标准示例的元数据为,
<?xml version=″1.0″encoding=″UTF-8″?>
<地学元数据标准示例2xmlns=″http://www.geodata.cn/metadata2″>
    <元数据标识>metadata2-01</元数据标识>
    <地理空间范围>
        <地理区域>华北平原</地理区域>
    </地理空间范围>
    <其他信息项/>
</地学元数据标准示例2>
对以上两种不同标准的元数据进行序列化存储和映射,实现无差别进行存储。
例如,在用户搜索“华北平原”(空间范围:110E,37N,115E,40N),则可以检索出元数据实例一和实例二,尽管他们来自不同元数据标准,以不同方式表征其地理信息,实例一采用经纬度范围,实例二采用地理区域名称。
从每个标准中,确定各关键元数据项的位置,该位置为具体路径信息,建立该关键元数据项与元数据表的映射关系,本实施例中元数据表为映射表,中各字段之间的映射关系,对于没有对应映射项的情况则略过。
对于第一标准示例,建立以下映射关系(字段名称->元数据信息项XPath):
定义“geo1”前缀为名空间http://www.geodata.cn/metadata1。
ID->/geo1:第一标准示例/geo1:元数据标识/text()
TITLE->/geo1:第一标准示例/geo1:标题/text()
KEYWORDS->/geo1:第一标准示例/geo1:关键词/text()
ABSTRACT->/geo1:第一标准示例/geo1:摘要/text()
THEME->/geo1:第一标准示例/geo1:分类/text()
PRODUCER->/geo1:第一标准示例/geo1:生产者/text()
DATETIME->/geo1:第一标准示例/geo1:生产日期/text()
ADMINNAME->无
GEONAME->无
EAST->/geo1:第一标准示例/geo1:地理空间范围/geo1:地理空间范围/geo1:东/text()
WEST->/geo1:第一标准示例/geo1:地理空间范围/geo1:地理空间范围/geo1:西/text()
SOUTH->/geo1:第一标准示例/geo1:地理空间范围/geo1:地理空间范围/geo1:南/text()
NORTH->/geo1:第一标准示例/geo1:地理空间范围/geo1:地理空间范围/geo1:北/text()
对于第二标准示例,可以建立以下映射关系。
定义“geo2”前缀为名空间http://www.geodata.cn/metadata2。
ID->/geo2:第二标准示例/geo2:元数据标识/text()
TITLE->/geo2:第二标准示例/geo2:标题/text()
KEYWORDS->/geo2:第二标准示例/geo2:关键词/text()
ABSTRACT->/geo2:第二标准示例/geo2:摘要/text()
THEME->/geo2:第二标准示例/geo2:分类/text()
PRODUCER->/geo2:第二标准示例/geo2:生产者/text()
DATETIME->/geo2:第二标准示例/geo2:生产日期/text()
ADMINNAME->/geo2:第二标准示例/geo2:地理空间范围/geo2:行政区域/text()
GEONAME->/geo2:第二标准示例/geo2:地理空间范围/geo2:地理区域/text()
EAST->无
WEST->无
SOUTH->无
NORTH->无
通过检索映射表,能够快速提取符合条件的地学元数据,并获取地学元数据中记录的地理空间范围(经纬度)和地理区域名称,用户或其他***则可以基于这些地理信息进行元数据的地理搜索和分析,例如:用户搜索“华北平原”(空间范围:110E,37N,115E,40N),则可以检索出元数据实例一和元数据实例二,尽管他们来自不同标准,以不同方式表征其地理信息,元数据实例一采用经纬度范围,元数据实例二采用地理区域名称。
本发明的地学元数据存储方法允许为每个元数据标准设定其独特的HTML元数据表现形式。通过XSLT定义定义该标准与其HTML表现形式之间的转换方式,也可以采用该方法定义该标准的元数据向其他元数据格式之间的转换方式。这种方法将元数据内容和表现形式分开,使元数据能够拥有多样的表现形式,也避免为迎合不同表现形式的需要而改变元数据内容。
以“第一标准示例”为例,可以定义以下XSLT转换定义:
    <?xml version=″1.0″encoding=″UTF-8″?>
    <xsl:stylesheet version=″1.0″
xmlns:xsl=″http://www.w3.org/1999/XSL/Transform″
xmlns:geo1=″http://www.geodata.cn/metadata1″>
      <xsl:output method=″html″/>
      <xsl:template match=″geo1:第一标准示例″>
         <div class=″MetadataTitle″><xsl:apply-templates
select=″geo1:标题/text()″/></div>
          <table>
             <tbody>
                <tr>
                   <td class=″CellTitle″>关键词</td>
                   <td class=″CellContent″><xsl:apply-templates
select=″geo1:关键词/text()″/></td>
                 </tr>
                 <tr>
                    <td class=″CellTitle″>摘要</td>
                    <td class=″CellContent″><xsl:apply-templates
select=″geo1:摘要/text()″/></td>
                 </tr>
                 <tr>
                    <td class=″CellTitle″>数据日期</td>
                    <td class=″CellContent″><xsl:apply-templates
select=″geo1:生产日期/text()″/></td>
     </tr>
     <tr>
        <td class=″CellTitle″>联系人</td>
        <td class=″CellContent″><xsl:apply-templates
select=″geo1:生产者/text()″/></td>
                 </tr>
                 <tr>
                    <td colspan=″2″>
                       <div>
                          <span class=″CellTitle1″>东:</span>
                          <xsl:apply-templates select=″geo1:地理空间范围/geo1:地理空间范围/geo1:东/text()″/>
                          <span class=″CellTitle1″>西:</span>
                          <xsl:apply-templates select=″geo1:地理空间范围/geo1:地理空间范围/geo1:西/text()″/>
                          <span class=″CellTitle1″>南:</span>
                          <xsl:apply-templates select=″geo1:地理空间范围/geo1:地理空间范围/geo1:南/text()″/>
                          <span class=″CellTitle1″>北:</span>
                          <xsl:apply-templates select=″geo1:地理空间范围/geo1:地理空间范围/geo1:北/text()″/>
                       </div>
                    </td>
                 </tr>
              </tbody>
           </table>
        </xsl:template>
      </xsl:stylesheet>
本发明的地学元数据存储方法还允许在XML形式元数据的基础上进行完全检索,这种方式的效率低于上述基于映射表的快速检索,但检索过程能够覆盖所有元数据项,适合用于快速检索不能适应的特殊情况。
本发明的存储多种标准地学元数据的***如图6所示,***包括:
地学元数据标准定义模块610,用于以XSD方式定义各个地学元数据标准,确定各个标准的标准标识,根据所述标准标识对所述标准的元数据项进行唯一标识,并对每个标准定义关键元数据信息项和元数据表的字段的映射规则。
对于每个所述标准将所述标准标识和所述标准的元数据项的标识结合为新标识,用所述新标识对所述标准的元数据项进行唯一标识。
所述标准标识为所述标准发布方的网站地址;
所述元数据项的标识为元数据项名称。
地学元数据标准解析模块620,以XML形式统一表达符合不同标准的元数据,以XML文档对象模型的方法解析和验证元数据结构。
地学元数据标准存储模块630,用于将元数据XML文档对象模型转换为XML文本,采用BLOB字段存储XML文本形式表达的元数据,并依据所述映射规则将所述关键元数据信息项映射到元数据表。
地学元数据标准存储模块630进一步用于将验证后的元数据信息从XML文档对象模型序列化为XML文本字节流,并存储到BLOB字段中;根据映射规则,通过XPath方式从元数据的XML文档对象模型中提取关键元数据信息项,存储到对应的数据标准的元数据表中。
较佳的,所述***还包括:
地学元数据标准检索模块,用于在元数据表上进行快速元数据信息检索,或从所述BLOB字段中提取XML文本,将所述XML文本解析为XML文档对象模型,以XPath方式对解析后的XML文档对象模型进行元数据信息检索。
较佳的,所述地学元数据标准定义模块610还用于定义元数据的表现形式和XSLT转换方法;
所述***还包括:
地学元数据标准表现模块,用于在进行表现时,通过XSLT转换方法转换元数据为预设的表现形式。
较佳的,所述***还包括:
地学元数据标准读取模块,用于从所述BLOB字段中提取XML文本,将所述XML文本解析为XML文档对象模型。
本领域的技术人员在不脱离权利要求书确定的本发明的精神和范围的条件下,还可以对以上内容进行各种各样的修改。因此本发明的范围并不仅限于以上的说明,而是由权利要求书的范围来确定的。

Claims (10)

1.一种存储多种标准地学元数据的方法,其特征在于,包括:
步骤1,以XSD方式定义各个地学元数据标准,确定各个标准的标准标识,根据所述标准标识对所述标准的元数据项进行唯一标识,并对每个标准定义关键元数据信息项和元数据表的字段的映射规则;
步骤2,以XML形式统一表达符合不同标准的元数据,以XML文档对象模型的方法解析和验证元数据结构;
步骤3,将元数据XML文档对象模型转换为XML文本,采用BLOB字段存储XML文本形式表达的元数据,并依据所述映射规则将所述关键元数据信息项映射到元数据表。
2.如权利要求1所述的存储多种标准地学元数据的方法,其特征在于,
所述步骤3后还包括:
步骤21,进行检索时,在元数据表上进行快速元数据信息检索。
3.如权利要求1所述的存储多种标准地学元数据的方法,其特征在于,
所述步骤3后还包括:
步骤31,在读取时,从所述BLOB字段中提取XML文本,将所述XML文本解析为XML文档对象模型。
4.如权利要求3所述的存储多种标准地学元数据的方法,其特征在于,
所述步骤31后还包括:
步骤41,进行检索时,以XPath方式对解析后的XML文档对象模型进行检索。
5.如权利要求1所述的存储多种标准地学元数据的方法,其特征在于,
所述步骤1还包括定义元数据的表现形式和XSLT转换方法;
所述步骤3后还包括:
步骤51,在进行表现时,通过XSLT转换方法转换元数据为预设的表现形式。
6.如权利要求1所述的存储多种标准地学元数据的方法,其特征在于,
所述步骤3进一步为,
步骤61,将验证后的元数据信息从XML文档对象模型序列化为XML文本字节流,并存储到BLOB字段中;
步骤62,根据所述映射规则,通过XPath方式从元数据的XML文档对象模型中提取关键元数据信息项,存储到对应的地学元数据标准的元数据表中。
7.一种存储多种标准地学元数据的***,其特征在于,所述***包括:
地学元数据标准定义模块,用于以XSD方式定义各个地学元数据标准,确定各个标准的标准标识,根据所述标准标识对所述标准的元数据项进行唯一标识,并对每个标准定义关键元数据信息项和元数据表的字段的映射规则;
地学元数据标准解析模块,以XML形式统一表达符合不同标准的元数据,以XML文档对象模型的方法解析和验证元数据结构;
地学元数据标准存储模块,用于将元数据XML文档对象模型转换为XML文本,采用BLOB字段存储XML文本形式表达的元数据,并依据所述映射规则将所述关键元数据信息项映射到元数据表。
8.如权利要求7所述的存储多种标准地学元数据的***,其特征在于,
所述***还包括:
地学元数据标准检索模块,用于在元数据表上进行快速元数据信息检索,或从所述BLOB字段中提取XML文本,将所述XML文本解析为XML文档对象模型,以XPath方式对解析后的XML文档对象模型进行元数据信息检索。
9.如权利要求7所述的存储多种标准地学元数据的***,其特征在于,
所述地学元数据标准定义模块还用于定义元数据的表现形式和XSLT转换方法;
所述***还包括:
地学元数据标准表现模块,用于在进行表现时,通过XSLT转换方法转换元数据为预设的表现形式。
10.如权利要求7所述的存储多种标准地学元数据的方法,其特征在于,
所述地学元数据标准存储模块进一步用于将验证后的元数据信息从XML文档对象模型序列化为XML文本字节流,并存储到BLOB字段中;根据映射规则,通过XPath方式从元数据的XML文档对象模型中提取关键元数据信息项,存储到对应的数据标准的元数据表中。
CN200910091295A 2009-08-17 2009-08-17 一种存储多种标准地学元数据的方法及*** Pending CN101625694A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200910091295A CN101625694A (zh) 2009-08-17 2009-08-17 一种存储多种标准地学元数据的方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200910091295A CN101625694A (zh) 2009-08-17 2009-08-17 一种存储多种标准地学元数据的方法及***

Publications (1)

Publication Number Publication Date
CN101625694A true CN101625694A (zh) 2010-01-13

Family

ID=41521545

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200910091295A Pending CN101625694A (zh) 2009-08-17 2009-08-17 一种存储多种标准地学元数据的方法及***

Country Status (1)

Country Link
CN (1) CN101625694A (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102195959A (zh) * 2010-03-11 2011-09-21 中兴通讯股份有限公司 Sip信令的xml数据的解析方法及装置
CN102521292A (zh) * 2011-11-29 2012-06-27 西安交通大学 一种基于模板对异构污染源集成数据的解析方法
CN102937998A (zh) * 2012-11-27 2013-02-20 北京邮电大学 一种应用于标识识别的元数据映射方法
CN103226621A (zh) * 2013-03-29 2013-07-31 中国科学院对地观测与数字地球科学中心 一种目标地物数据采集装置及***、方法
CN103617168A (zh) * 2013-10-22 2014-03-05 芜湖大学科技园发展有限公司 一种通用的元数据校验及导出方法
CN103810195A (zh) * 2012-11-09 2014-05-21 中国电信股份有限公司 索引生成方法和***
CN104798043A (zh) * 2014-06-27 2015-07-22 华为技术有限公司 一种数据处理方法和计算机***
CN106940693A (zh) * 2017-02-28 2017-07-11 广东智源信息技术有限公司 实验室原始记录单结构化处理方法
CN109086444A (zh) * 2018-08-17 2018-12-25 吉林亿联银行股份有限公司 一种数据标准化方法、装置及电子设备
CN112464032A (zh) * 2019-12-24 2021-03-09 上海汇招信息技术有限公司 清标方法
CN115774767A (zh) * 2023-02-10 2023-03-10 成都纵横自动化技术股份有限公司 一种地理信息元数据处理方法及装置

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102195959A (zh) * 2010-03-11 2011-09-21 中兴通讯股份有限公司 Sip信令的xml数据的解析方法及装置
CN102521292A (zh) * 2011-11-29 2012-06-27 西安交通大学 一种基于模板对异构污染源集成数据的解析方法
CN103810195B (zh) * 2012-11-09 2017-12-12 中国电信股份有限公司 索引生成方法和***
CN103810195A (zh) * 2012-11-09 2014-05-21 中国电信股份有限公司 索引生成方法和***
CN102937998A (zh) * 2012-11-27 2013-02-20 北京邮电大学 一种应用于标识识别的元数据映射方法
CN103226621A (zh) * 2013-03-29 2013-07-31 中国科学院对地观测与数字地球科学中心 一种目标地物数据采集装置及***、方法
CN103617168A (zh) * 2013-10-22 2014-03-05 芜湖大学科技园发展有限公司 一种通用的元数据校验及导出方法
CN104798043A (zh) * 2014-06-27 2015-07-22 华为技术有限公司 一种数据处理方法和计算机***
CN106940693A (zh) * 2017-02-28 2017-07-11 广东智源信息技术有限公司 实验室原始记录单结构化处理方法
CN106940693B (zh) * 2017-02-28 2020-09-01 广东智源信息技术有限公司 实验室原始记录单结构化处理方法
CN109086444A (zh) * 2018-08-17 2018-12-25 吉林亿联银行股份有限公司 一种数据标准化方法、装置及电子设备
CN109086444B (zh) * 2018-08-17 2020-12-29 吉林亿联银行股份有限公司 一种数据标准化方法、装置及电子设备
CN112464032A (zh) * 2019-12-24 2021-03-09 上海汇招信息技术有限公司 清标方法
CN115774767A (zh) * 2023-02-10 2023-03-10 成都纵横自动化技术股份有限公司 一种地理信息元数据处理方法及装置

Similar Documents

Publication Publication Date Title
CN101625694A (zh) 一种存储多种标准地学元数据的方法及***
CN107341262B (zh) 数据库中对象类型列的序列化、反序列化方法及装置
CN101344881A (zh) 海量文件型数据的索引生成方法及装置和搜索***
US20090024384A1 (en) Data processing method and system, program for realizing the method, and computer readable storage medium storing the program
Batcheller Automating geospatial metadata generation—An integrated data management and documentation approach
US20070055679A1 (en) Data expansion method and data processing method for structured documents
US20090125488A1 (en) Geographic XML database management system
CN101853305A (zh) 一种构建综合农业环境信息数据库的方法
CN108509199A (zh) 自动生成中文注释的方法、装置、设备及存储介质
Dunfey et al. Towards an open architecture for vector GIS
CN101794225A (zh) 一种基于gdom及其持久化的gml解析方法
CN101216851A (zh) 一种本体数据(Ontology)管理***和方法
Halfawy et al. Developing enterprise GIS-based data repositories for municipal infrastructure asset management
CN110147408A (zh) 针对多源异构空间数据的大数据集成***
CN101840426B (zh) 一种基于坐标分离的gml文档存储与查询方法
McGrath XML and Scientific File Formats
Faith et al. Connecting RDA and RDF: linked data for a wide world of connected possibilities
CN103377175A (zh) 基于分割的结构化文档转换
Varanka et al. Topographic mapping data semantics through data conversion and enhancement
Talbott et al. Mapping physical formats to logical models to extract data and metadata: The defuddle parsing engine
Ramachandran et al. Interchange technology for applications to facilitate generic access to heterogenous data formats
WO2009156527A1 (es) Procedimiento y sistema para generar automáticamente meta-datos de geodatos
Casarosa et al. Improving online access to archival data
Martins et al. Complex Data Transformations in Digital Libraries with Spatio-Temporal Information
Biancheri et al. EIHA?!? deploying Web and WAP services using XML technology

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20100113