CN114610898A - 一种供应链运营知识图谱构建方法和*** - Google Patents
一种供应链运营知识图谱构建方法和*** Download PDFInfo
- Publication number
- CN114610898A CN114610898A CN202210222047.7A CN202210222047A CN114610898A CN 114610898 A CN114610898 A CN 114610898A CN 202210222047 A CN202210222047 A CN 202210222047A CN 114610898 A CN114610898 A CN 114610898A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- data
- supply chain
- ontology
- chain operation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/242—Query formulation
- G06F16/243—Natural language query formulation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/288—Entity relationship models
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/83—Querying
- G06F16/835—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/80—Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
- G06F16/84—Mapping; Conversion
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Mathematical Physics (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种供应链运营知识图谱构建方法和***。该方包括:获取供应链运营过程中的数据;对获取的供应链运营过程中的数据进行知识抽取;根据所抽取的知识构建本体库,并基于本体库对供应链多源数据进行知识融合;对知识融合后的数据进行知识加工,以保证知识的入库质量;将知识加工后的数据采用图数据库进行存储,形成供应链运营知识图谱;以供应链运营知识图谱为基础实现知识服务应用,包括面向供应链运营领域的知识语义检索服务、基于用户画像的知识精准推送服务。本发明构建了融合多数据源的知识图谱,能够实现不同领域内数据的快速查询,能够支撑语义检索功能,满足用户对跨阶段知识关联检索的需求,提高协同工作效率,提升辅助决策水平。
Description
技术领域
本发明属于信息技术领域,具体涉及一种供应链运营知识图谱构建方法和***。
背景技术
在大数据时代背景下,随着海量数据的出现以及多数据源融合交叉应用,传统的数据管理模式以及查询方式受到一定的制约。近年来,知识图谱(Knowledge Graph)作为一种新的知识表示方法和数据管理模式,在自然语言处理、问题回答、信息检索等领域有着重要的应用。知识图谱是结构化的语义知识库,用于以符号形式描述物理世界中的概念及其相互关系;其基本组成单位是“实体-关系-实体”三元组,以及实体及其相关属性-值对,实体间通过关系相互联结,构成网状的知识结构。
随着谷歌知识图谱的发布,知识图谱的构建与应用研究引起了学术界和工业界的广泛关注。在国内,知识图谱的构建与研究已经起步,相应取得许多重要的研究成果。如:搜狗的知立方、百度知心;复旦大学GDM实验室设计了一种面向图书阅读领域的中文知识图谱。
知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。
知识图谱,是通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。
现有的行业领域知识图谱通常采用手工构建方式,缺乏统一的构建方法,且这类知识库目标是特定行业领域,因此,其描述范围极为有限。针对这些问题,提出了将不同领域知识库进行融合成一个知识图谱,旨在构建语义一致、结构一致的多数据融合知识图谱,实现对不同领域内的知识进行查询和展示,从而提高了数据查询效率。
供应链是由供应商、制造商、仓库、配送中心和渠道商等构成的物流网络。同一企业可能构成这个网络的不同组成节点,但更多的情况下是由不同的企业构成这个网络中的不同节点。比如,在某个供应链中,同一企业可能既在制造商、仓库节点,又在配送中心节点等占有位置。在分工愈细,专业要求愈高的供应链中,不同节点基本上由不同的企业组成。在供应链各成员单位间流动的原材料、在制品库存和产成品等就构成了供应链上的货物流。统计数据表明,企业供应链可以耗费企业高达25%的运营成本。
传统的供应链主要是通过个人经验判断的方式解决相关的问题。而很多时候供应链的问题是多重因素构成的复杂问题,单纯的专家经验无法给与准确的判断,构建统一的供应链知识图谱技术则是解决这一问题的主要方式。
发明内容
本发明针对供应链运行中中存在的相关问题,提供一种供应链运营知识图谱构建方法和***。
本发明采用的技术方案如下:
一种供应链运营知识图谱构建方法,包括以下步骤:
获取供应链运营过程中的数据,包括结构化数据、半结构化数据以及非机构化数据;
对获取的供应链运营过程中的数据进行知识抽取,包括实体抽取、关系抽取以及属性抽取;
根据所抽取的知识构建本体库,并基于本体库对供应链多源数据进行知识融合;
对知识融合后的数据进行知识加工,以保证知识的入库质量;
将知识加工后的数据采用图数据库进行存储,形成供应链运营知识图谱。
进一步地,所述根据所抽取的知识构建本体库,并基于本体库对供应链多源数据进行知识融合,包括:首先构建领域本体库,然后将领域本体库进行融合以形成全局本体库,然后对各个领域的知识库进行实体对齐和实体链接。
进一步地,所述构建领域本体库,包括:
从领域的关系数据库中抽取出关系模式;
利用转换规则将关系模式映射为领域本体模型,所述转换规则包括:将关系模式中的表名转换为本体中的概念名;将表与表间的关系转换为本体中的概念与概念的关系;将关系模式中的字段名转换为本体的属性名;
对领域本体模型进行评估和校验,评估和校验通过后建立领域内的本体库。
进一步地,所述将领域本体库进行融合以形成全局本体库,包括:
首先,采用相似性检测规则对不同领域内的本体进行检测,包括语义相似性检测、概念相似性检测、属性相似性检测、数据格式相似性检测,从而将不同领域内的相同或相似概念进行统一;
其次,采用冲突解决规则消除相同或相似概念的歧义,剔除冗余和错误概念;
最后,将剩余的领域本体经过冲突解决和实体消岐处理,映射到全局本体库。
进一步地,所述实体链接采用基于约束向量嵌入转换算法实现,其步骤包括:将知识图谱中的实体和关系,通过嵌入方式投影到低维向量空间;在向量空间中通过向量平移转换操作,计算头、尾实体及关系在向量空间中的损失函数值,实现头尾实体的关系链接;增加关系语义约束条件,使得所预测出的实体间的关系满足关系的语义类型。
进一步地,以所述供应链运营知识图谱为基础实现知识服务应用,包括面向供应链运营领域的知识语义检索服务、基于用户画像的知识精准推送服务。
进一步地,所述面向供应链运营领域的知识语义检索服务,包括以下步骤:
意图识别:通过自然语言处理技术,对用户的检索查询内容进行意图分类,根据预测的意图类型定位到供应链运营知识图谱对应的本***置;
信息抽取:通过自然语言处理技术,实现用户的检索查询内容中的实体及其关系的识别;
语义匹配:根据定位好的本体,及从用户检索查询内容抽取的实体与关系,通过自然语言处理技术高效匹配到供应链运营知识图谱中对应的实体及其关系,并根据匹配到的实体以答案的方式反馈给用户。
进一步地,所述基于用户画像的知识精准推送服务,包括以下步骤:
获取用户画像数据,包括用户背景、检索习惯,以全方位、立体化地展示用户的历史查阅痕迹;
基于用户画像数据,实现精准信息的推送服务;所述推送服务不仅实现同一字段返回同类型的多个检索结果,而且还依据语义分析返回与之相关的其他业务信息,实现以信息关联的角度指引用户从模糊检索到精准定位。
一种采用上述方法的供应链运营知识图谱构建***,其包括:
数据获取模块,用于获取供应链运营过程中的数据,包括结构化数据、半结构化数据以及非机构化数据;
知识抽取模块,用于对获取的供应链运营过程中的数据进行知识抽取,包括实体抽取、关系抽取以及属性抽取;
知识融合模块,用于根据所抽取的知识构建本体库,并基于本体库对供应链多源数据进行知识融合;
知识加工模块,用于对知识融合后的数据进行知识加工,以保证知识的入库质量;
知识存储模块,用于将知识加工后的数据采用图数据库进行存储,形成供应链运营知识图谱。
进一步地,上述***还包括知识服务应用模块,用于以所述供应链运营知识图谱为基础实现知识服务应用,包括面向供应链运营领域的知识语义检索服务、基于用户画像的知识精准推送服务。
本发明的有益效果如下:
1)本发明充分利用不同领域内的知识,在融合多种数据源的情况下,构建了多数据源的知识图谱,能够实现不同领域内数据的快速查询。
2)本发明的供应链运营知识图谱将能够支撑语义检索功能,满足用户对于跨阶段知识关联检索的需求,提高协同工作效率,提升辅助决策水平。
3)本发明的基于用户画像的精准推送能够针对用户的历史检索习惯,实现精准信息推送服务,不仅可以实现同一字段返回同类型的多个检索结果,而且还依据语义分析返回与之相关的其他业务信息,实现以信息关联的角度指引用户从模糊检索到精准定位,从而解决返回结果单一以及检索对象描述难等问题,为用户的跨业务检索提供支撑,能够提高工作效率。
附图说明
图1是供应链运营知识图谱总体技术路线图。
图2是知识图谱构建流程图。
图3是从关系数据中构造领域本体库过程示意图。
图4是全局本体库构建过程示意图。
图5是不同知识库实体对齐过程示意图。
具体实施方式
下面通过具体实施例和附图,对本发明做进一步详细说明。
1.总体技术路线
本发明的供应链知识图谱构建及应用的技术路线如图1所示,包括数据源、知识图谱构建、知识服务***、知识服务应用四大板块。其中数据源是支撑知识服务应用的基础,该板块的数据来自于王家岭、大海则煤厂中规划设计、施工建设以及生产运维三个阶段所产生的结构化、非结构化以及半结构化数据。知识图谱构建主要通过融合来自供应链运营中产生的数据,实现多源异构数据库的语义集成,并形成统一的供应链运营知识图谱。知识服务***以供应链运营知识图谱为基础,将支撑面向供应链运营的知识服务应用,其中包括知识语义检索、知识精准推送等。
2.供应链运营知识图谱构建
供应链运营知识图谱构建流程如图2所示,形成结构化的语义知识库。
供应链运营知识图谱是以数据资源池的数据为基础,通过知识获取、知识融合、知识处理和知识存储实现图谱构建,为知识图谱分析提供数据支撑。如图2所示,其主要实现步骤如下:
1)数据获取。通过将运营过程中各类财务、管理、物流、生产、设计研发等方面数据进行收集和采集,形成选煤厂知识图谱构建的数据基础,数据包括结构化数据、半结构化数据以及非机构化数据。
2)知识抽取。本阶段目的是从异构数据源中自动抽取信息得到结构化的知识单元,可通过接口服务从MIM大数据平台的数据资源池中已经处理好的BIM模型数据抽取出图谱构建的相关信息。知识抽取的关键技术包含实体抽取、关系抽取以及属性抽取,是图谱构建的重要环节。
3)通过所抽取的知识及其领域范畴,并结合专家领域知识与经验,实现供应链运营知识本体构建。
4)知识融合。通过共指消解、实体消歧、实体链接等技术实现煤厂设计知识库、建设知识库、运维知识库中知识的整合补足。针对同一个实体,从煤厂运作的不同阶段出发获得该实体的完整描述,从而将各类数据建立起实体关联。
5)知识加工。知识融合后的数据并不能直接进行存储,需要通过一定程度的质量评估,保证知识的入库质量,为知识服务提供保障。
6)知识存储。将知识加工后的数据采用Neo4j图数据库进行存储,便于以图数据结构的形式来查询数据,为知识图谱的上层应用提供数据支撑。
3供应链多源数据融合
为了能充分利用不同领域内的知识,实现不同领域内数据快速查询,本发明在融合多种数据源的情况下,构建了多数据源的知识图谱。首先对不同领域内构建不同领域的本体库,然后将不同领域的本体库经过映射形成全局本体库,接着对各个领域的知识库进行实体对齐和实体链接,丰富和拓展所构造的多数据融合的知识图谱。
3.1)数据源
用于构建知识图谱的本体库数据源可以来源于结构化数据、半结构化数据和非结构化数据,以及现有的一些通用知识图谱库等。
1)结构化数据。其主要是指关系数据库中的表、excel表以及其它具有结构的数据。
2)半结构化数据。其主要指介于结构化数据和无结构化数据之间,通常的XML、HTML等相关网页属于半结构化数据。半结构化数据主要来源于***、百度百科等。
3)无结构化数据。其主要指纯文本资料、图像和声音等数据。
3.2)本体库构建
本体(ontology)是对概念进行建模的规范,是描述客观世界的抽象模型,以形式化方式对概念及其之间的联系给出明确的定义。本体定义了知识图谱中的数据模式,因而,本体构建研究的成果能在很大程度上辅助知识图谱的构建。针对不同的应用领域和不同的需求,本体构建的方法也有所不同。本发明利用本体语言OWL(Web Ontology Language)从多种数据源中构建相应的领域本体库,然后通过映射形成全局本体库。
3.2.1)领域本体库构建
本实施例的领域本体库构建其主要数据源是来自于环境监测数据库、空气污染检测数据库和医疗健保数据库。除此之外,也利用相关领域的网站数据等。下面重点介绍从关系数据库中获取领域本体库的过程,如图3所示。
首先,领域内的关系数据库是针对特定领域而创建的,该数据库包含了领域内的表达方法和具体应用的详细信息,因此,可以从领域的关系数据库中抽取出关系模式,分析关系数据库中表的信息和字段信息,建立相应的概念模型。
其次,由于关系模式包括表与字段之间的关系,以及表与表之间的联系,而本体库则是包括概念与概念之间的关系、概念与属性间的联系。因此,要利用一定的规则将关系模式映射为本体模型。本文设计了一系列转换规则,如:将关系模式中的表名转换为本体中的概念名;表与表间的关系转换为本体中的概念与概念的关系;将关系模式中的字段名转换为本体的属性名等。通过上述的转换规则,可以获得领域本体模型。
最后,对领域本体模型进行评估和校验。该部分重点是对所构造的领域本体模型进行检验,查看是否满足本体库的构建原则,本体模型中的术语是否正确,本体模型中的概念及其关系是否完整等。通过对本体模型评估后,可以建立领域内的本体库。
关系数据库可具有完整的数据模式,包含完整的表结构和完整性约束条件。因此可以将数据库中的关系名转换为本体中的概念,部分字段名转换为本体中的属性,示例如表1、表2所示,其中表1将关系名转换为本体概念的OWL语言,表2将字段名转换为属性名的OWL语言。
表1表2
另外,为了扩充和完善领域本体库,需要对非关系型的数据进行采集和填充。本实施例对行业领域内的半结构化数据进行结构化处理,对相应百科网站通过网页爬虫技术获取相应的知识,并将半结构化数据转换成结构化数据,最后利用上述关系数据转换成本体的规则进行转换。
3.2.2)全局本体库构建
为了能便于构建多数据融合的知识图谱,需要将多个领域内的本体库进行融合,构建全局本体库。其过程如图4所示。在上述构建的领域本体库基础上,通过相似性检测和冲突解决等规则,将多个领域的本体库融合在一起组成了全局本体库。其步骤如下:
首先,由于不同领域内的本体库进行知识融合,对存在着一些相同或相似的概念和属性等,采用了相似性检测规则对这些不同领域内的本体进行检测。如:语义相似性检测、概念相似性检测、属性相似性检测、数据格式相似性检测等。通过这些相似性检测后,能将不同领域内的相同或相似本体进行统一,但并不能解决它们之间的冲突。
其次,采用冲突解决规则对上面存在着相似概念或属性等进行解决。通过冲突解决规则可以消除概念的歧义,剔除冗余和错误概念,从而保证全局本体库的质量。主要是对上述中存在着相近或相似的概念或属性进行消除,使其达到统一,并合并为全局本体。
最后,将剩余的领域本体经过冲突解决和实体消岐等处理,映射到全局本体库,与上面经过处理后各个领域本体库相结合,从而实现全局本体的构建。
3.3)实体对齐
实体对齐(entity alignment)也称为实体匹配或实体解析,是判断相同或不同数据集中的2个实体是否指向真实世界同一对象的过程。实体对齐目的是:发现在不同知识库中具有不同实体名称,但却代表着现实世界中同一事物的实体,将这些实体进行合并,且用具有唯一标识对该实体进行标识,最后将该实体添加到相应的知识图谱中。针对不同知识库的实体对齐过程。即在给定不同的知识库,通过先验对齐数据以及调整参数和相关外部资料的作用下,进行实体匹配的算法计算,最终得到实体间的对齐结果。不同知识库实体对齐过程如图5所示。
虽然在构建全局本体库时,针对不同领域内本体库的实体做了实体消岐处理,然而,这里的实体对齐是为了丰富和拓展知识图谱,从现有的通用知识图谱及其相关的资料中,利用实体对齐方法,提取实体及实体间的关系来填充知识图谱。现阶段有关实体对齐的算法较多,常用的有:基于传统概率模型的实体对齐方法、基于机器学习的实体对齐方法、基于相似性传播实体对齐方法、基于LDA模型的实体对齐方法、基于CRF模型的实体对齐方法、基于Markov逻辑网的实体对齐方法等。
本发明采用基于相似性传播实体对齐方法,该算法将实体对齐问题看成是一个全局匹配评分目标函数的优化问题进行建模,属于二元分类问题,可通过贪婪优化算法求得其近似解。基本过程如下:(1)对于开放链接数据及行业领域的百科数据中实体,进行提取得到了实体的同义名称集合;(2)通过实体对齐的方法,将这些实体与上述构建的知识图谱中的实体进行匹配,把结果作为实体合并的候选实体集;(3)将这些候选实体集中的实体,通过比对它们的上层概念,如果具有相同的上层概念,则将它们合并为一个实体。
3.4)实体链接
实体链接(entity linking)是指对于从文本中抽取得到的实体对象,将其链接到知识图谱中对应的正确实体对象的操作。而实体链接预测是指在给定的知识图谱中,预测出缺失的实体间的关系,从而丰富和拓展知识图谱。其基本思想是首先根据给定三元组的头(尾)实体和关系,从知识图谱中或其它相关文本数据,选出一组候选实体对象,然后通过实体链接预测算法,计算出正确的尾(头)实体,并将得到的三元组添加到相应的知识图谱中。现阶段有关知识图谱实体链接预测算法较多。常用的有:基于向量嵌入转换算法、基于张量分解算法、基于路径推理算法、结合文本推理算法等。
本发明在现有技术基础上,提出了基于约束向量嵌入转换算法,获得较好的实体链接预测结果。其基本思想是:将知识图谱中的实体和关系,通过嵌入(embedding)方式投影到低维向量空间,并在向量空间中通过向量平移转换操作,计算头、尾实体及关系在向量空间中的损失函数值,实现头尾实体的关系链接。而基于约束嵌入转换算法,是在原有向量嵌入转换算法的基础上,增加了关系语义约束条件,使得所预测出实体间的关系要满足关系的语义类型。如:对于关系“出生于”,其头实体通常是人或动物,而尾实体通常是时间或地点。
4供应链运营知识图谱应用
4.1)面向供应链运营领域的知识语义检索服务
供应链运营数据的碎片化现象突出,各***产生的多源异构数据缺乏语义关联,导致跨阶段的知识关联检索需求受到抑制,数据利用率不高。针对该问题,本发明通过构建的供应链运营知识图谱,提供面向供应链运营领域的语义检索服务,以满足选煤厂工作人员在设计、实施和运营不同阶段中对跨阶段关联知识获取的需求。面向供应链运营领域的语义检索服务有助于提升相关业务人员的对知识的检索效率,有利于提高工作质效。
供应链在运行和运营中存在不同企业不同业务单元的独立运作和基于供应链的总体调配。而每一个独立运营的个体均存在一定的自有规律,在总体协调中个体之间缺乏统一的协作,这也是供应链运营初期造成各类问题的主要原因。而这种问题多数具有普遍性和共性,同样的问题在不同的供应链中可能已产生一定的解决方案,并能够指导其他供应链问题的解决。基于此情况,构建基于知识图谱的供应链问题库和解决方案检索体系则变得尤为重要。
知识图谱是对客观世界认识的形式化表示,通过三元组的方式表征客观事物中的实体、事件以及之间的关系。相对于传统基于关键词的搜索技术,语义搜索在知识图谱的知识支持下,将用户搜索输入的关键词,映射为知识图谱中客观世界的概念和实体,搜索结果直接显示出满足用户需求的结构化信息内容。语义搜索利用知识图谱可以准确地捕捉用户搜索意图,借助于知识图谱,直接给出满足用户搜索意图的答案,而不仅仅是包含关键词的内容。
而本发明中,供应链运营知识图谱覆盖了三阶段中产生的非结构化文本数据、图片数据、视频监控数据、标准数据、物联网采集数据、及其它结构化数据等。在知识图谱构建过程中,通过应用信息抽取、时空关联、实体链接、本体匹配等技术,实现来自不同业务中多源异构数据的语义集成。表现为时空强相关的知识连接在一起,不同阶段中语义关联的知识连接在一起。本发明的供应链运营知识图谱能够支撑语义检索功能,满足用户对于跨阶段知识关联检索的需求,提高协同工作效率,提升辅助决策水平。
基于供应链运营知识图谱的语义检索功能的主要实现步骤如下:
1)意图识别。通过自然语言处理技术,对用户的检索查询内容进行意图分类。根据预测的意图类型定位到供应链运营知识图谱对应的本***置。
2)信息抽取。主要是通过自然语言处理技术,实现用户的检索查询内容中的实体及其关系的识别。
3)语义匹配。根据定位好的本体,及从用户检索查询内容抽取的实体与关系,通过自然语言处理技术高效匹配到供应链运营知识图谱中对应的实体及其关系,并根据匹配到的实体以答案的方式反馈给用户。
上述三个步骤对应图1的“知识服务***”中的意图识别、信息抽取、语义匹配。图1的“知识服务***”中的关联分析是指();知识分类管理是指();历史行为分析是指()。
通过语义检索的方式,供应链生产端将散落在各***中的全生命周期信息进行了归集,并通过知识图谱分类构建成设备、工艺、厂房、动线等类别的知识库。选煤厂在进行设备安装、保养、维护及厂区进行改扩建时,知识库将成为其开展工作的主要科学依据。
通过语义检索的方式,供应链将散落在各***中的全生命周期信息进行了归集,并通过知识图谱分类构建成设备、工艺、厂房、动线等类别的知识库。供应链生产链中在进行设备安装、保养、维护及厂区进行改扩建时,知识库将成为其开展工作的主要科学依据。
4.2)基于用户画像的知识精准推送服务
在实现供应链数字化转型过程中最重要的任务是打破各业务阶段数据孤岛,实现供应链各业务单元数据的关联管理。本发明通过知识图谱实现数据融合,将各类数据整合起来,便于用户的统一管理和分析。
供应链存在众多知识性资料,这些资料可以应用到的供应链的组织、生产、营销、资金拨付、质检、物流、售后服务的不同阶段。但是原有的数据孤岛模式让这些资料散落各处,没有形成很好的串联和梳理,而在需要这些资料支撑时无法快速有效果获得。
然而,在基于知识图谱的语义检索过程中,常面临着以下问题:
1.检索结果不一定是用户想要的内容。由于实现了各业务阶段的数据融合,使得数据范围拓宽到其他领域,返回的结果可能是其他领域的相关数据,使得用户需要多次检索才能实现准确的信息查询。
2.用户不能准确描述被检索对象。语义检索过程是通过对输入字段的语义分析,然后从库里面查询与该字段最相近的信息并返回,在业务数据交叉查询过程中,若输入字段与检索对象不符,将不能准确返回用户想要的结果;为提高选煤厂三大业务阶段的工作效率,以上问题亟需解决。
基于用户画像的精准推送是针对用户的历史检索习惯,从而实现精准信息推送服务。用户精准画像数据包括选煤厂设计、实施、运维三大业务阶段的用户背景、检索习惯等基本信息,能够全方位、立体化地展示用户的历史查阅痕迹,为***分析用户查阅偏好提供客观依据。用户背景是指用户的业务属性,检索习惯是指用户对检索对象的偏好,包括数据类别和数据内容。
该推送服务不仅可以实现同一字段返回同类型的多个检索结果,而且还依据语义分析返回与之相关的其他业务信息,实现以信息关联的角度指引用户从模糊检索到精准定位,从而解决返回结果单一以及检索对象描述难等问题,为用户的跨业务检索提供支撑,进一步提高选煤厂在设计、施工、运维三大业务阶段的工作效率。
供应链在进行产业链运营、供应商选择、物流协作、生产过程管理、质检管理、金融链授信与资金拨付、产业链品牌构建等各方面需要大量的专业知识进行支撑。在这过程中,通过基于用户画像的知识精准推送服务则是根据各阶段可能出现的知识需求进行前置搜集与整理,主动将这些知识推送给选煤厂管理、运营、维修、安监和培训岗位人员。从而达到对于不同人员的前置培训与相关问题出现时解决方案的快速生成,保障各类知识对于选煤厂运营方面的支撑。面向供应链运营领域的知识精准推送服务有助于为相关业务人员提供个性化的知识关联,有利于提高工作效率。
以上公开的本发明的具体实施例,其目的在于帮助理解本发明的内容并据以实施,本领域的普通技术人员可以理解,在不脱离本发明的精神和范围内,各种替换、变化和修改都是可能的。本发明不应局限于本说明书的实施例所公开的内容,本发明的保护范围以权利要求书界定的范围为准。
Claims (10)
1.一种供应链运营知识图谱构建方法,其特征在于,包括以下步骤:
获取供应链运营过程中的数据,包括结构化数据、半结构化数据以及非机构化数据;
对获取的供应链运营过程中的数据进行知识抽取,包括实体抽取、关系抽取以及属性抽取;
根据所抽取的知识构建本体库,并基于本体库对供应链多源数据进行知识融合;
对知识融合后的数据进行知识加工,以保证知识的入库质量;
将知识加工后的数据采用图数据库进行存储,形成供应链运营知识图谱。
2.根据权利要求1所述的方法,其特征在于,所述根据所抽取的知识构建本体库,并基于本体库对供应链多源数据进行知识融合,包括:首先构建领域本体库,然后将领域本体库进行融合以形成全局本体库,然后对各个领域的知识库进行实体对齐和实体链接。
3.根据权利要求2所述的方法,其特征在于,所述构建领域本体库,包括:
从领域的关系数据库中抽取出关系模式;
利用转换规则将关系模式映射为领域本体模型,所述转换规则包括:将关系模式中的表名转换为本体中的概念名;将表与表间的关系转换为本体中的概念与概念的关系;将关系模式中的字段名转换为本体的属性名;
对领域本体模型进行评估和校验,评估和校验通过后建立领域内的本体库。
4.根据权利要求2所述的方法,其特征在于,所述将领域本体库进行融合以形成全局本体库,包括:
首先,采用相似性检测规则对不同领域内的本体进行检测,包括语义相似性检测、概念相似性检测、属性相似性检测、数据格式相似性检测,从而将不同领域内的相同或相似概念进行统一;
其次,采用冲突解决规则消除相同或相似概念的歧义,剔除冗余和错误概念;
最后,将剩余的领域本体经过冲突解决和实体消岐处理,映射到全局本体库。
5.根据权利要求2所述的方法,其特征在于,所述实体链接采用基于约束向量嵌入转换算法实现,其步骤包括:将知识图谱中的实体和关系,通过嵌入方式投影到低维向量空间;在向量空间中通过向量平移转换操作,计算头、尾实体及关系在向量空间中的损失函数值,实现头尾实体的关系链接;增加关系语义约束条件,使得所预测出的实体间的关系满足关系的语义类型。
6.根据权利要求1所述的方法,其特征在于,以所述供应链运营知识图谱为基础实现知识服务应用,包括面向供应链运营领域的知识语义检索服务、基于用户画像的知识精准推送服务。
7.根据权利要求6所述的方法,其特征在于,所述面向供应链运营领域的知识语义检索服务,包括以下步骤:
意图识别:通过自然语言处理技术,对用户的检索查询内容进行意图分类,根据预测的意图类型定位到供应链运营知识图谱对应的本***置;
信息抽取:通过自然语言处理技术,实现用户的检索查询内容中的实体及其关系的识别;
语义匹配:根据定位好的本体,及从用户检索查询内容抽取的实体与关系,通过自然语言处理技术高效匹配到供应链运营知识图谱中对应的实体及其关系,并根据匹配到的实体以答案的方式反馈给用户。
8.根据权利要求6所述的方法,其特征在于,所述基于用户画像的知识精准推送服务,包括以下步骤:
获取用户画像数据,包括用户背景、检索习惯,以全方位、立体化地展示用户的历史查阅痕迹;
基于用户画像数据,实现精准信息的推送服务;所述推送服务不仅实现同一字段返回同类型的多个检索结果,而且还依据语义分析返回与之相关的其他业务信息,实现以信息关联的角度指引用户从模糊检索到精准定位。
9.一种采用权利要求1~8中任一权利要求所述方法的供应链运营知识图谱构建***,其特征在于,包括:
数据获取模块,用于获取供应链运营过程中的数据,包括结构化数据、半结构化数据以及非机构化数据;
知识抽取模块,用于对获取的供应链运营过程中的数据进行知识抽取,包括实体抽取、关系抽取以及属性抽取;
知识融合模块,用于根据所抽取的知识构建本体库,并基于本体库对供应链多源数据进行知识融合;
知识加工模块,用于对知识融合后的数据进行知识加工,以保证知识的入库质量;
知识存储模块,用于将知识加工后的数据采用图数据库进行存储,形成供应链运营知识图谱。
10.根据权利要求9所述的***,其特征在于,还包括知识服务应用模块,用于以所述供应链运营知识图谱为基础实现知识服务应用,包括面向供应链运营领域的知识语义检索服务、基于用户画像的知识精准推送服务。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210222047.7A CN114610898A (zh) | 2022-03-09 | 2022-03-09 | 一种供应链运营知识图谱构建方法和*** |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210222047.7A CN114610898A (zh) | 2022-03-09 | 2022-03-09 | 一种供应链运营知识图谱构建方法和*** |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114610898A true CN114610898A (zh) | 2022-06-10 |
Family
ID=81861303
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210222047.7A Pending CN114610898A (zh) | 2022-03-09 | 2022-03-09 | 一种供应链运营知识图谱构建方法和*** |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114610898A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116127047A (zh) * | 2023-04-04 | 2023-05-16 | 北京大学深圳研究生院 | 企业信息库的建立方法与装置 |
CN116720819A (zh) * | 2023-08-10 | 2023-09-08 | 福建省闽清双棱纸业有限公司 | 一种融合知识图谱和神经网络的浸渍纸原料管理*** |
WO2023246007A1 (zh) * | 2022-06-23 | 2023-12-28 | 广州大学 | 一种个性化定制下的价值链知识发现方法 |
CN117473199A (zh) * | 2023-11-17 | 2024-01-30 | 广东永锢电子机械科技有限公司 | 应用于供应链物流***的信息推送方法及*** |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN113722564A (zh) * | 2021-09-09 | 2021-11-30 | 国网电子商务有限公司 | 基于空间图卷积能源物资供应链的可视化方法及装置 |
-
2022
- 2022-03-09 CN CN202210222047.7A patent/CN114610898A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109284394A (zh) * | 2018-09-12 | 2019-01-29 | 青岛大学 | 一种从多源数据集成视角构建企业知识图谱的方法 |
CN113722564A (zh) * | 2021-09-09 | 2021-11-30 | 国网电子商务有限公司 | 基于空间图卷积能源物资供应链的可视化方法及装置 |
Non-Patent Citations (3)
Title |
---|
吴运兵: "基于多数据源的知识图谱构建方法研究", 福州大学学报(自然科学版), pages 329 - 335 * |
李肖俊: "多源异构数据情境中学术知识图谱模型构建研究", 现代情报, pages 88 - 97 * |
黄恒琪: "知识图谱研究综述", 计算机应用***, pages 1 - 12 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023246007A1 (zh) * | 2022-06-23 | 2023-12-28 | 广州大学 | 一种个性化定制下的价值链知识发现方法 |
CN116127047A (zh) * | 2023-04-04 | 2023-05-16 | 北京大学深圳研究生院 | 企业信息库的建立方法与装置 |
CN116720819A (zh) * | 2023-08-10 | 2023-09-08 | 福建省闽清双棱纸业有限公司 | 一种融合知识图谱和神经网络的浸渍纸原料管理*** |
CN116720819B (zh) * | 2023-08-10 | 2023-10-27 | 福建省闽清双棱纸业有限公司 | 一种融合知识图谱和神经网络的浸渍纸原料管理*** |
CN117473199A (zh) * | 2023-11-17 | 2024-01-30 | 广东永锢电子机械科技有限公司 | 应用于供应链物流***的信息推送方法及*** |
CN117473199B (zh) * | 2023-11-17 | 2024-03-19 | 广东永锢电子机械科技有限公司 | 应用于供应链物流***的信息推送方法及*** |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Industrial big data analytics: challenges, methodologies, and applications | |
CN112612902A (zh) | 一种电网主设备的知识图谱构建方法及设备 | |
CN114610898A (zh) | 一种供应链运营知识图谱构建方法和*** | |
CN108701254A (zh) | 用于动态族系跟踪、重建和生命周期管理的***和方法 | |
Pardillo et al. | Using ontologies for the design of data warehouses | |
CN110990590A (zh) | 一种基于强化学习和迁移学习的动态金融知识图谱构建方法 | |
CA2906232A1 (en) | Domain-specific syntax tagging in a functional information system | |
CN111191047A (zh) | 一种面向人机协作拆卸任务的知识图谱构建方法 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台*** | |
CN117271767A (zh) | 基于多智能体的运维知识库的建立方法 | |
Wang et al. | Research on evaluation model of music education informatization system based on machine learning | |
Slimani | A study investigating typical concepts and guidelines for ontology building | |
Garcia-Buendia et al. | A bibliometric study of lean supply chain management research: 1996–2020 | |
Boukhari et al. | The role of user requirements in data repository design | |
Ouaret et al. | AuMixDw: Towards an automated hybrid approach for building XML data warehouses | |
Nica et al. | New research directions in knowledge discovery and allied spheres | |
Аndroshchuk et al. | Model of explicit knowledge management in organizational and technical systems | |
Duque et al. | Data Mining to Support Decision-Making—A Research Approach | |
Eckhardt et al. | Uncertainty issues and algorithms in automating process connecting web and user | |
Khan et al. | Cloud-based big data management and analytics for scholarly resources: Current trends, challenges and scope for future research | |
Huang et al. | Big Data-driven Intelligent Analysis for Art Design Schemes Based on Grey Correlation | |
Belhadef | A new bidirectional method for ontologies matching | |
Tomingas et al. | Discovering Data Lineage from Data Warehouse Procedures | |
CN113868322B (zh) | 一种语义结构解析方法、装置、设备及虚拟化***、介质 | |
Kopaygorodsky | Methods and technologies of building an intelligent service for energy technology forecasting |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |