CN115357817A - 一种标识体系互通***及方法 - Google Patents

一种标识体系互通***及方法 Download PDF

Info

Publication number
CN115357817A
CN115357817A CN202210872390.6A CN202210872390A CN115357817A CN 115357817 A CN115357817 A CN 115357817A CN 202210872390 A CN202210872390 A CN 202210872390A CN 115357817 A CN115357817 A CN 115357817A
Authority
CN
China
Prior art keywords
metadata
data
registration data
identification
identifier
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210872390.6A
Other languages
English (en)
Inventor
刘佳
夏晓蕾
王姝
王丽娟
吕雪峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Computer Network Information Center of CAS
Original Assignee
Computer Network Information Center of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Computer Network Information Center of CAS filed Critical Computer Network Information Center of CAS
Priority to CN202210872390.6A priority Critical patent/CN115357817A/zh
Publication of CN115357817A publication Critical patent/CN115357817A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/955Retrieval from the web using information identifiers, e.g. uniform resource locators [URL]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种标识体系互通***及方法。本方法为:1)各用户分别依据资源类型从存储服务器所提供的标识体系中选择一标识体系;然后用户根据所选标识体系的要求提交注册标识的标识符及所上传资源数据的元数据给所述存储服务器;2)所述存储服务器根据用户提交的注册标识的类型及元数据内容,对该用户的元数据进行标识后生成该用户的注册数据;3)关联信息服务器从所述存储服务器中获取用户的注册数据,根据注册数据中的元数据匹配关系,建立注册数据之间的关联关系;4)关联信息服务器根据收到的查询请求中的标识,查询与该标识关联的元数据信息。本发明实现了多标识体系下的跨标识体系的关联信息建立。

Description

一种标识体系互通***及方法
技术领域
本发明属于信息技术领域,涉及多标识体系的关联方法,具体涉及一种标识体系互通***及方法。
背景技术
随着大数据、区块链等技术的发展,数字标识技术解决数字资源永久存储与重复利用等问题的能力越来越受到业界的广泛共识和认可。各行业领域开始使用标识对各类资源进行标识与管理,市场呈现多种不同类型标识“百花齐放”态势。
然而,受限多种因素的影响,多种标识结构不一,难以兼容,存在“数据壁垒”,很难实现互通,这将为未来应用标识进行管理、数据资源使用带来极大隐患。标识间数据不互通不仅导致资源数据关联关系无法建立,难以有效利用标识及对应资源;同时标识数据由于关联关系不清,无法有效支撑上层“知识图谱”、“评价***”的有效应用,难以有效满足实际用户需求。
当前单一标识体系下,可以通过标识元数据分析实现数据间的关联关系的建立。在多标识体系,仅能通过异构标识技术,实现多种不同标识的相互解析,标识间元数据存在“数据壁垒”,目前暂未发现在多标识场景下建立关联关系方法的有效方式。
发明内容
针对现有技术中存在的问题,本发明的目的在于提供一种标识体系互通***及方法,解决多标识体系场景下的数据关联关系建立问题。
本技术方案是在多标识体系下的标识体系互通技术方案。本发明解决的关联关系类型包含:在相同或不同标识体系下,标识间使用关系、映射关系等关联关系。
本发明的技术方案为:
一种标识体系互通***,其特征在于包括关联信息服务器和存储服务器;其中,
所述存储服务器,用于为用户提供可选标识体系,以及接收用户根据所选标识体系上传的资源数据元数据并对元数据进行标识后生成该用户的注册数据;
所述关联信息服务器,用于根据从所述存储服务器中获取用户的注册数据,建立注册数据之间的关联关系;以及根据收到的查询请求中的标识,查询与该标识关联的元数据信息。
进一步的,所述存储服务器包括标识注册模块、标识存储模块、元数据存储模块和标识查询模块;其中,
所述标识注册模块,用于为用户提供可选的标识体系,并根据用户所选标识体系对该用户的元数据进行标识,生成该用户的注册数据;
所述标识存储模块,用于存储用户的注册数据,所述注册数据的格式为<标识类型:用户所选标识体系的标识符,存储用户资源数据的URL地址>;
所述元数据存储模块,用于存储用户根据所选标识体系上传的资源数据元数据;其中不同的标识体系对应不同的元数据信息,并设置不同标识体系之间元数据的映射关系;
所述标识查询模块,用于提供查询接口,根据输入的标识查询关联的元数据信息。
进一步的,所述标识体系为数据资源标识体系,对应的元数据的数据格式至少包含<资源标题、作者、作者所在组织、设备>;所述标识体系为组织资源标识体系,其对应的元数据的数据格式至少包含<组织名称、组织缩写、组织所在地、组织网址>;所述标识体系为人员资源标识体系,其对应的元数据的数据格式至少包含<姓名、出版名称、所在组织名称>;所述标识体系为设备标识体系,其对应的元数据的数据格式至少包含<设备名称、内部编号、启用年份、所在组织名称>。
进一步的,所述关联信息服务器包括关联信息抽取模块和关联信息数据库模块;其中,所述关联信息抽取模块,用于根据获取的注册数据建立各注册数据之间的关联关系,所述关联关系包括使用关系、映射关系;其中,如果两注册数据为相同标识体系的注册数据,则通过注册数据中的元数据进行匹配;若匹配,则在两注册数据之间建立关联并将关联信息存储到数据库模块中;如果两注册数据为不同标识体系的注册数据,则先依据两注册数据对应的标识体系之间元数据映射关系对第一注册数据中的元数据进行转换,将转换后的元数据信息与第二注册数据中的元数据进行匹配,若匹配,则在两注册数据之间建立关联并将关联信息存储到数据库模块中;
所述关联信息数据库模块,用于存储所述关联信息。
进一步的,两注册数据为第一注册数据、第二注册数据;所述关联信息的数据格式为<关联类型,第一注册数据中的关联对象的类型,第一注册数据中的关联对象的标识符,第一注册数据中的关联对象所属标识体系,第二注册数据中的关联对象的类型,第二注册数据中的关联对象的标识符,第二注册数据中的关联对象所属标识体系>。
进一步的,两注册数据为第一注册数据、第二注册数据;所述映射关系的数据格式为<映射类型,第一注册数据中映射对象的类型,第一注册数据中映射对象的标识符,第一注册数据中映射对象所属标识体系,第二注册数据中映射对象的类型,第二注册数据中映射对象的标识符,第二注册数据中映射对象所属标识体系>。
进一步的,根据不同的标识体系设置对应的元数据存储格式。
进一步的,所述存储服务器包括标识管理模块,用于对关联信息进行管理。
一种标识体系互通方法,其步骤包括:
1)各用户分别依据资源类型从存储服务器所提供的标识体系中选择一标识体系;然后用户根据所选标识体系的要求提交注册标识的标识符及所上传资源数据的元数据给所述存储服务器;
2)所述存储服务器根据用户提交的注册标识的类型及元数据内容,对该用户的元数据进行标识后生成该用户的注册数据;
3)关联信息服务器从所述存储服务器中获取用户的注册数据,根据注册数据中的元数据匹配关系,建立注册数据之间的关联关系;
4)关联信息服务器根据收到的查询请求中的标识,查询与该标识关联的元数据信息。
进一步的,关联信息服务器根据查询到的与该标识关联的元数据信息,生成基于该标识的关系图谱。
本***包含存储服务器和关联信息服务器。各部分功能如下:
1存储服务器
存储服务器主要存储多标识体系的标识与对应元数据。各用户分别向本发明的存储服务器进行注册,不同用户注册的标识体系可以不同;存储服务器主要包含以下模块:
(1)标识注册模块
为用户提供标识注册功能。为用户提供可选的标识体系,并根据用户所选标识体系对该用户的注册信息进行标识,生成该用户的注册数据。
(2)标识存储模块
标识存储模块存储需要进行关联关系建立的标识信息,具体注册数据格式为<标识类型:用户所选标识体系的标识符,存储用户资源数据的URL地址>。用户A选取了一个标识体系i,对自己的数据进行上传后,标识存储模块将用户A的标识后的数据按照格式<标识类型:标识符i,URL地址>进行存储;URL地址是用户A的数据存储地址。
(3)元数据存储模块
元数据存储库存储需要进行关联关系建立的标识对应的元数据信息,通常依据标识对象不同有所差别。
存储数据标识体系数据,除数据标识符外,其对应元数据具体数据格式至少包含<资源标题、作者、作者所在组织、设备>。
存储组织标识体系数据,除组织标识符外,其对应元数据具体数据格式至少包含<组织名称、组织缩写、组织所在地、组织网址>。
存储人员标识体系数据,除人员标识符外,其对应元数据具体数据格式至少包含<姓名、出版名称、所在组织名称>。
存储设备标识体系数据,除设备标识符外,其对应元数据具体数据格式至少包含<设备名称、内部编号、启用年份、所在组织名称>。
(4)标识管理模块
实现关联信息管理功能,包括修改、删除等功能。
(5)标识查询模块
实现关联信息查询功能,提供查询接口,通过输入一个资源标识查询到所有关联的信息。
2关联信息服务器
关联信息服务器,用于查询标识及对应数据关联关系,根据数据标识查询所相关联的信息。关联信息服务器包括以下模块:
(1)数据清洗模块
各标识由于服务的对象不同,其对应的元数据及数据结构也各不相同,关联前需要针对后续关联需求,通过清洗算法对入库元数据进行清洗,清洗后元数据内容将按照规范化数据结构存储到存储服务器。
(2)关联信息抽取模块
依据提交元数据信息及关联算法,从存储服务器中提取数据清洗模块处理后的元数据,在关系抽取模块中通过直接方式和分析方式对标识进行关系建立,并对标识关系进行抽取。数据关联信息包括使用关系、映射关系等关联关系。
(3)关联信息数据库模块
关联信息数据库模块存储建立关联关系的标识信息。关联信息存储结构与关联关系密切相关。
使用关系存储格式元数据,具体数据格式至少包含<关联类型,关联对象1类型,关联对象1标识符,关联对象1所属标识体系,关联对象2类型,关联对象2标识符,关联对象2所属标识体系>。
映射关系存储格式元数据,具体数据格式至少包含<映射类型,映射对象1类型,映射对象1标识符,映射对象1所属标识体系,映射对象2类型,映射对象2标识符,映射对象2所属标识体系>。
标识体系互通技术构建流程如图1所示,其步骤如下:
第一步:标识注册
用户根据行业类型及资源类型进行标识注册。
(1)用户依据需要依据资源类型选择标识体系。
(2)用户选择对应标识体系后,需依据标识体系要求提交注册标识的标识符及元数据。
(3)用户将对应信息提交后,标识注册模块将依据注册标识的类型及元数据内容进行注册和校验。
(4)模块依据标识体系判定规则对用户进行反馈。
第二步:建立标识存储库
维护和管理不同标识体系并建立标识存储库和标识元数据存储库,并将对应标识符和元数据存储到存储服务器中。
第三步:标识数据清洗
目前,不同标识体系,乃至于同一标识体系下的各注册机构对于同一资源的元数据在数据项内容、顺序上存在差异。为保证关联效果,需要在整理标识注册数据及元数据,规范化数据结构,提高数据质量,保证后续标识关联建立。
(1)建立映射关系
当前各注册机构在注册标识时元数据项存在一定差异。例如对于论文作者姓名字段,标识体系A中称呼为创建者,标识体系B中称呼为作者。为避免数据存储过程中信息缺失、错误,需要首先建立关联对象与目标对象的映射关系。
(2)形成规范化基础数据
建立完整映射关系后,通过数据清洗模块对数据进行重新清洗,将对应元数据重新存储到标准化结构中。规范化的数据结构依照资源类型至少包含以下信息。
2.1对于数据资源而言,规范化数据结构中的元数据项应包括资源名称、缩写、资源概述、资源类型、作者名称、作者所属机构信息;对于可能存在多个数据的数据项,例如缩写、作者名称、作者所属机构名称等信息,应采用列表存储方式,以保证数据准确机器可读。
2.2对于人员信息而言,规范化数据结构中的元数据项应包括人员姓名、曾用名、出版名、邮箱、所在机构名称信息;对于可能存在多个数据的数据项,例如曾用名、所在机构名称信息,应采用列表存储方式,以保证数据准确机器可读。同时若该人员存在多个所在机构信息,应通过增加时间字段,保证所在机构与时间的对照关系。
2.3对于机构信息而言,规范化数据结构中的元数据项应包括中英名称、缩写、所在国家信息。对于可能存在多个数据的数据项,例如缩写、所在国家名称信息,应采用列表存储方式,以保证数据准确机器可读。
2.4对于设备信息而言,规范化数据结构中的元数据项应包括设备名称类型、生产厂家、型号、名称、生产时间、启用时间、所在机构名称等信息。
第四步:标识关系抽取与存储
数据清洗完成后,将规范化数据通过关系抽取模块进行关系抽取,抽取方式包括直接方式和数据分析方式两种。
(1)直接方式
直接方式指标识元数据中包含关联信息及对应标识符时,关系抽取模块可以直接从标识元数据中抽取关联信息,并将建立的关联关系及对应信息存储到关联信息数据库模块。直接方式在相同标识体系和不同标识体系处理方式相同。
(2)数据分析方式
数据分析方式是指当标识元数据中包含的关联信息不包含对应标识时,关系抽取模块不能直接从抽取关联信息,而是需要通过数据分析的先找到对应标识再进行存储的方式。
若在相同标识体系下,则可通过关联信息匹配查询的方式,依据元数据标题、作者、关键词、所在机构等信息赋予权重并进行信息比对,若匹配后得分超过设定值,则将查找到的元数据关联,并将标识关联关系存储到关联信息数据库模块中。
若在不同标识体系下,则需先依据映射关系对数据进行转换,将转换后的元数据信息与其他标识存储元数据进行匹配查询,并依据关联信息匹配查询的方式,并将查找到的标识与元数据关联,并将标识关联关系存储到关联信息数据库模块中。
第五步:标识应用
通过已建立的标识关联关系进行应用,并通过将关联关系数据进行分析后可以形成跨标识体系的关联关系图谱,同时得到了在不同标识体系间标识之间的关联关系。
例如将数据标识体系A的标识通过本技术与人员标识体系B的标识相互关联,并依据其关联关系绘制人员与其产生资源的关联关系图谱,并获得标识体系A与标识体系B之间标识的关联关系。
这种关联关系的建立技术,可以叫做标识体系互通技术。通过该技术,可实现建立对应基于标识的关系图谱(网络拓扑)。
本发明的优点如下:
本发明提供了一种标识体系互通技术,通过构建标识之间关联信息,实现多标识体系下的跨标识体系的关联信息建立,为实现数据资源全生命周期管理、科研成果评价、数据溯源重用及引用等上层应用功能提供数据支撑。
附图说明
图1是本发明方法流程图。
具体实施方式
下面结合附图对本发明进行进一步详细描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
通过本发明方法的使用,在多标识体系共存的应用场景下,实现跨标识体系的标识数据关联关系建立问题。
实施例1:数据资源间引用与被引用关联信息建立
(1)若注册资源元数据包含其他数据资源标识及部分元数据,例如论文中参考文献中包含参考文献论文的标题与标识,可使用关系抽取模块中直接方式建立关联关系。
通过关系抽取模块则将该论文的论文名称、论文对应数据资源标识与参考论文的论文名称和对应数据资源标识注册到关联信息服务器中,存储关联类型为引用类型。关联类型中引用存储数据格式为<关联类型:引用;引用对象数据资源标识,引用对象数据资源标识类型,引用对象数据资源名称;被引用对象数据资源标识,被引用对象数据资源标识类型,被引用对象数据资源名称>。
(2)注册资源元数据仅包含部分元数据,不包含元数据对应标识。例如论文中参考文献中仅包含论文的标题、作者、出版时间等元数据信息,不包含论文对应标识,可使用关系抽取模块中数据分析方式建立关联关系。
将元数据进行数据清洗后,通过关联信息匹配查询的方式,依据元数据标题、作者、关键词、所在机构等信息赋予权重并进行信息比对。当匹配后得分超过设定值时,若找到标识与关联标识在同一标识体系下,则直接按照引用数据格式进行关联数据存储。若找到标识与关联标识在不同标识体系下,则需先进行数据清洗与格式规范化,依据规范化后数据进行数据存储,存储数据格式要求与上文一致。
实施例2:人员与数据资源之间的成果关联关系建立
(1)若提交注册的数据标识元数据中包含作者的姓名及对应标识符,则可使用关系抽取模块中直接方式建立关联关系。直接将该数据资源标识符与人员标识符相互关联,并将关联信息类型填写为成果。例如注册的论文DOI数据资源标识的论文元数据中论文的作者名称和对应人员资源标识,则可直接建立该数据资源与人员的关联关系,并将对应关系存储到关联信息服务器中,存储关联类型为成果类型。关联类型中成果存储数据格式为<关联类型:成果;成果数据资源标识,成果数据资源标识类型,成果数据资源名称;创建者人员标识,作者人员标识类型,作者姓名>。对于论文作者存储方式类似,关联类型中成果存储数据格式为<关联类型:成果;创建者人员标识,作者人员标识类型,作者姓名,成果数据资源标识,成果数据资源标识类型,成果数据资源名称>。
(2)若提交注册数据标识元数据仅包含作者部分信息,不包含对应标识符,则可使用关系抽取模块中数据分析方式建立关联关系。例如论文作者署名信息中仅包含作者的中英文名称及所在机构名称,不包含作者身份标识符信息。在这种情况下,数据标识所在标识体系一般不包含作者标识,进行关联关系确立时依照不同标识体系要求进行处理,需依据数据标识中所包含的元数据信息进行关联信息检索,依据作者中英文名称、所在机构、姓名缩写、出版姓名、发布时间等信息,赋予权重并进行信息比对。当匹配后得分超过设定值时,将找到人员标识信息与元数据信息进行数据清洗与格式规范化,依据规范化后数据进行数据关联,存储数据格式要求与上文一致。
实施例3:设备、人员与数据资源之间的设备使用关联关系建立
(1)若提交注册的数据标识的元数据中同时包含作者的姓名及对应人员标识符和使用设备名称及对应设备资源标识符,则可直接将该人员资源标识符与设备资源标识符相互关联,并将关联信息类型填写为使用。关联类型中就职存储数据格式为<关联类型:使用;作者人员标识,作者人员标识类型,作者姓名;设备资源标识,使用标识类型,使用名称>。
(2)若提交数据标识的元数据中仅包含作者姓名与使用设备部分信息时,首先应通过数据清洗与规范化数据处理,从提交数据标识元数据中提取使用设备元数据信息。考虑到部分数据标识中可能包含设备标识,例如HANDLE标识体系和CSTR标识体系,通过设备名称、编号、启用时间等信息赋予权重并进行信息比对。当匹配后得分超过设定值时,将该设备标识与数据标识进行数据关联,存储数据格式要求与上文一致。
若设备标识与数据标识不在同一标识体系时,需先进行数据清洗和规范化数据处理,例如将数据论文中致谢中表述感谢某机构设备,将其提取为该设备所属机构,并将其与机构标识中机构名称或简称进行映射与比对,若比对过程中比重得分超过设定值,则将该数据标识与设备标识相互关联,存储数据格式要求与上文一致。
实施例4:人员与机构之间的就职关联关系建立
(1)若提交注册的数据标识的元数据中同时包含作者的姓名及对应人员标识符和作者所在机构的名称及对应机构资源标识符,则可直接将该机构资源标识符与人员资源标识符相互关联,并将关联信息类型填写为就职。例如注册的论文DOI数据资源标识的论文元数据中包含论文的作者名称、作者人员资源标识、作者所在机构名称和机构资源标识,则可直接建立该人员与机构的关联关系,并将对应关系存储到关联信息服务器中,存储关联类型为就职类型。关联类型中就职存储数据格式为<关联类型:就职;作者人员标识,作者人员标识类型,作者姓名;机构资源标识,机构标识类型,机构名称>。
(2)若提交注册的人员标识的元数据中包含作者所在机构信息及对应机构标识符,则可直接将该机构资源标识符与人员资源标识符相互关联,并将关联信息类型填写为就职。例如注册的人员信息中写明2012年至2013年在北京大学生物系工作,则可直接建立该数据人员与机构的关联关系,并将对应关系存储到关联信息服务器中,存储关联类型为就职类型,存储数据格式要求与上文一致。
尽管为说明目的公开了本发明的具体实施例,其目的在于帮助理解本发明的内容并据以实施,本领域的技术人员可以理解:在不脱离本发明及所附的权利要求的精神和范围内,各种替换、变化和修改都是可能的。因此,本发明不应局限于最佳实施例所公开的内容,本发明要求保护的范围以权利要求书界定的范围为准。

Claims (10)

1.一种标识体系互通***,其特征在于,包括关联信息服务器和存储服务器;其中,
所述存储服务器,用于为用户提供可选标识体系,以及接收用户根据所选标识体系上传的资源数据元数据并对元数据进行标识后生成该用户的注册数据;
所述关联信息服务器,用于根据从所述存储服务器中获取用户的注册数据,建立注册数据之间的关联关系;以及根据收到的查询请求中的标识,查询与该标识关联的元数据信息。
2.如权利要求1所述的标识体系互通***,其特征在于,所述存储服务器包括标识注册模块、标识存储模块、元数据存储模块和标识查询模块;其中,
所述标识注册模块,用于为用户提供可选的标识体系,并根据用户所选标识体系对该用户的元数据进行标识,生成该用户的注册数据;
所述标识存储模块,用于存储用户的注册数据,所述注册数据的格式为<标识类型:用户所选标识体系的标识符,存储用户资源数据的URL地址>;
所述元数据存储模块,用于存储用户根据所选标识体系上传的资源数据元数据;其中不同的标识体系对应不同的元数据信息,并设置不同标识体系之间元数据的映射关系;
所述标识查询模块,用于提供查询接口,根据输入的标识查询关联的元数据信息。
3.如权利要求2所述的标识体系互通***,其特征在于,所述标识体系为数据资源标识体系,对应的元数据的数据格式至少包含<资源标题、作者、作者所在组织、设备>;所述标识体系为组织资源标识体系,其对应的元数据的数据格式至少包含<组织名称、组织缩写、组织所在地、组织网址>;所述标识体系为人员资源标识体系,其对应的元数据的数据格式至少包含<姓名、出版名称、所在组织名称>;所述标识体系为设备标识体系,其对应的元数据的数据格式至少包含<设备名称、内部编号、启用年份、所在组织名称>。
4.如权利要求2所述的标识体系互通***,其特征在于,所述关联信息服务器包括关联信息抽取模块和关联信息数据库模块;其中,
所述关联信息抽取模块,用于根据获取的注册数据建立各注册数据之间的关联关系,所述关联关系包括使用关系、映射关系;其中,如果两注册数据为相同标识体系的注册数据,则通过注册数据中的元数据进行匹配;若匹配,则在两注册数据之间建立关联并将关联信息存储到数据库模块中;如果两注册数据为不同标识体系的注册数据,则先依据两注册数据对应的标识体系之间元数据映射关系对第一注册数据中的元数据进行转换,将转换后的元数据信息与第二注册数据中的元数据进行匹配,若匹配,则在两注册数据之间建立关联并将关联信息存储到数据库模块中;
所述关联信息数据库模块,用于存储所述关联信息。
5.如权利要求4所述的标识体系互通***,其特征在于,两注册数据为第一注册数据、第二注册数据;所述关联信息的数据格式为<关联类型,第一注册数据中的关联对象的类型,第一注册数据中的关联对象的标识符,第一注册数据中的关联对象所属标识体系,第二注册数据中的关联对象的类型,第二注册数据中的关联对象的标识符,第二注册数据中的关联对象所属标识体系>。
6.如权利要求2或4所述的标识体系互通***,其特征在于,两注册数据为第一注册数据、第二注册数据;所述映射关系的数据格式为<映射类型,第一注册数据中映射对象的类型,第一注册数据中映射对象的标识符,第一注册数据中映射对象所属标识体系,第二注册数据中映射对象的类型,第二注册数据中映射对象的标识符,第二注册数据中映射对象所属标识体系>。
7.如权利要求2所述的标识体系互通***,其特征在于,根据不同的标识体系设置对应的元数据存储格式。
8.如权利要求2所述的标识体系互通***,其特征在于,所述存储服务器包括标识管理模块,用于对关联信息进行管理。
9.一种标识体系互通方法,其步骤包括:
1)各用户分别依据资源类型从存储服务器所提供的标识体系中选择一标识体系;然后用户根据所选标识体系的要求提交注册标识的标识符及所上传资源数据的元数据给所述存储服务器;
2)所述存储服务器根据用户提交的注册标识的类型及元数据内容,对该用户的元数据进行标识后生成该用户的注册数据;
3)关联信息服务器从所述存储服务器中获取用户的注册数据,根据注册数据中的元数据匹配关系,建立注册数据之间的关联关系;
4)关联信息服务器根据收到的查询请求中的标识,查询与该标识关联的元数据信息。
10.如权利要求9所述的方法,其特征在于,关联信息服务器根据查询到的与该标识关联的元数据信息,生成基于该标识的关系图谱。
CN202210872390.6A 2022-07-20 2022-07-20 一种标识体系互通***及方法 Pending CN115357817A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210872390.6A CN115357817A (zh) 2022-07-20 2022-07-20 一种标识体系互通***及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210872390.6A CN115357817A (zh) 2022-07-20 2022-07-20 一种标识体系互通***及方法

Publications (1)

Publication Number Publication Date
CN115357817A true CN115357817A (zh) 2022-11-18

Family

ID=84031093

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210872390.6A Pending CN115357817A (zh) 2022-07-20 2022-07-20 一种标识体系互通***及方法

Country Status (1)

Country Link
CN (1) CN115357817A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116431104A (zh) * 2022-12-02 2023-07-14 东莞盟大集团有限公司 基于区块链技术标识解析应用的低代码开发方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116431104A (zh) * 2022-12-02 2023-07-14 东莞盟大集团有限公司 基于区块链技术标识解析应用的低代码开发方法

Similar Documents

Publication Publication Date Title
CN103368992B (zh) 一种信息推送方法及装置
CA2365705C (en) A system for collecting specific information from several sources of unstructured digitized data
CN101408876A (zh) 一种电子文档全文检索的方法及***
CN110019836A (zh) 一种智能问答方法及装置
CN111459985A (zh) 标识信息处理方法及装置
CN102411582B (zh) 图片搜索方法、装置及客户端
CN102262640A (zh) 一种全文检索文档数据库的方法及装置
CN105512197A (zh) 一种文档数字化归档的装置及其归档和查询方法
CN101149758A (zh) 搜索***及搜索方法
CN110929125A (zh) 搜索召回方法、装置、设备及其存储介质
CN103037029B (zh) 基于绑定注册的域名whois查询方法和服务***
CN105760380A (zh) 数据库查询方法、装置及***
CN113553305A (zh) 一种工业互联网标识处理方法及装置
CN101339560B (zh) 一种搜索系列性数据的方法、装置及一种搜索引擎***
JP2019204535A (ja) 会計支援システム
CN104636368B (zh) 数据检索方法、装置及服务器
CN102508901A (zh) 基于内容的海量图像检索方法和***
CN111782595A (zh) 海量文件管理方法、装置、计算机设备和可读存储介质
CN115357817A (zh) 一种标识体系互通***及方法
CN109947759A (zh) 一种数据索引建立方法、索引检索方法及装置
CN105930313A (zh) 处理通知信息的方法和装置
CN110362732A (zh) 一种信息***内容搜索的方法
CN105677745A (zh) 一种通用高效自助数据查询***及实现方法
CN113641796A (zh) 数据搜索方法、***及存储介质
CN101650738A (zh) 卡拉ok歌曲的全向智能检索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination