CN115599923A - 一种电网标准知识抽取方法 - Google Patents
一种电网标准知识抽取方法 Download PDFInfo
- Publication number
- CN115599923A CN115599923A CN202211299499.1A CN202211299499A CN115599923A CN 115599923 A CN115599923 A CN 115599923A CN 202211299499 A CN202211299499 A CN 202211299499A CN 115599923 A CN115599923 A CN 115599923A
- Authority
- CN
- China
- Prior art keywords
- extraction
- data
- knowledge
- model
- entities
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000605 extraction Methods 0.000 title claims abstract description 109
- 238000000034 method Methods 0.000 claims abstract description 30
- 238000013075 data extraction Methods 0.000 claims abstract description 24
- 238000010276 construction Methods 0.000 claims abstract description 23
- 238000012545 processing Methods 0.000 claims abstract description 19
- 230000008569 process Effects 0.000 claims abstract description 14
- 238000004519 manufacturing process Methods 0.000 claims abstract description 10
- 230000006870 function Effects 0.000 claims description 10
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000010801 machine learning Methods 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000012549 training Methods 0.000 claims description 4
- 238000012550 audit Methods 0.000 claims description 3
- 238000004140 cleaning Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 claims description 3
- 238000010606 normalization Methods 0.000 claims description 3
- 238000012800 visualization Methods 0.000 claims description 3
- 238000009411 base construction Methods 0.000 claims description 2
- 238000013499 data model Methods 0.000 claims description 2
- 238000003860 storage Methods 0.000 abstract description 18
- 230000003993 interaction Effects 0.000 abstract description 4
- 230000008520 organization Effects 0.000 abstract description 4
- 239000000284 extract Substances 0.000 description 7
- 238000007726 management method Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 238000002372 labelling Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000013475 authorization Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 102100038367 Gremlin-1 Human genes 0.000 description 1
- 101001032872 Homo sapiens Gremlin-1 Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000015654 memory Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000013439 planning Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000013403 standard screening design Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/901—Indexing; Data structures therefor; Storage structures
- G06F16/9024—Graphs; Linked lists
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/06—Energy or water supply
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y04—INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
- Y04S—SYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
- Y04S10/00—Systems supporting electrical power generation, transmission or distribution
- Y04S10/50—Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Economics (AREA)
- Water Supply & Treatment (AREA)
- Human Resources & Organizations (AREA)
- Life Sciences & Earth Sciences (AREA)
- Software Systems (AREA)
- Public Health (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- Strategic Management (AREA)
- Tourism & Hospitality (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供了一种电网标准知识抽取方法,属于电网数据技术领域,该本发明电网标准知识抽取方法,获取数据更新,引入的各类形态的原始数据,以本体构建***定义知识生产目标,输出数据抽取模型;根据数据抽取模型对不同的原始数据进行数据抽取处理,得到各类型的电网数据;将各类型的电网数据转换形成知识图谱数据,并建立实体以及实体间关系。通过结构化、非结构化等的数据接入,完成来源库数据到知识图谱的自动化构建,提供结构化数据入图能力。通过集合知识组织、存储、提取、推理方法和工具为一体,节省了专业技术人员大量的时间,为电力调度、设备管理、数据交互、业务查询等知识更迭迅速提供了基础。
Description
技术领域
本发明涉及电网数据技术领域,具体而言,涉及一种电网标准知识抽取方法。
背景技术
传统的知识组织和管理方式已经无法满足当前电力***的需要。当前,以知识表示和知识推理为基础的知识库在电力***中得到了较多应用,如:结合传统专家***的智能决策***,故障定位***和输电网规划决策等。
但是,这些知识库大多依赖于专家提取、整理并将数据以图标形式存储于数据库的传统知识管理方式,其所能够存储的知识结构较为单一,且每次更新都需要专业技术人员花费大量时间。特别对于电力调度、设备管理、数据交互、业务查询等知识更迭迅速的领域,现有的知识管理方式已经严重滞后于***的发展需要。
电力***亟需新型、自动、智能的知识组织、存储、提取、推理方法和工具,把海量离散的信息点聚合成为语义网络,引入业界成熟稳定的图谱构建功能体系能让该环节事半功倍。为此,我们提出一种电网标准知识抽取方法,以解决上述技术背景中的问题。
发明内容
为了弥补以上不足,本发明提供了一种电网标准知识抽取方法,旨在改善现有技术电网知识抽取的问题。
本发明是这样实现的:一种电网标准知识抽取方法,包括
获取数据更新,引入的各类形态的原始数据,以本体构建***定义知识生产目标,输出数据抽取模型;
根据数据抽取模型对不同的原始数据进行数据抽取处理,得到各类型的电网数据;
将各类型的电网数据转换形成知识图谱数据,并建立实体以及实体间关系。
在本发明的一种优选技术方案中,所述本体构建***在技术架构上遵从标准化数字加工与标准招标技术规范,进行标准数字化加工及标准知识库构建及标准知识图谱构建工具模型与构建过程支持服务。
在本发明的一种优选技术方案中,所述数据模型的过程,包括步骤:通过机器学习算法处理数据更新结果,训练数据抽取模型。
在本发明的一种优选技术方案中,所述数据抽取模型的抽取方式包括章条抽取、术语抽取、指标抽取、公式抽取、图片抽取和表格抽取。
章条:对每个层级的章条进行抽取与加工,支持章条关联嵌套,即分层级处理,父层级章条可包含子层级章条。
术语:支持对术语进行抽取,抽取结果包含术语名称、术语定义等。
指标与指标值:对标准内的指标(包含文字型条款、数值型)进行抽取,以key-value形式输出。
公式:对标准内的公式进行抽取,需包含公式名称、具体公式。
图片:对标准内的非纯文字图片进行抽取,输出图片资源,需包含图片名称、图片资源文件。
表格:对标准内的表格进行抽取,抽取结果为支持抽取为图片与excel表两类,包含表名(如有)、表头(如有)、行数据、列数据等。
在本发明的一种优选技术方案中,所述各类型的电网数据的知识抽取包括结构化抽取、半结构化抽取和非结构化抽取,利用结构化抽取、半结构化抽取和非结构化抽取转换形成知识图谱构建。
在本发明的一种优选技术方案中,所述知识图谱具体功能包括:支持从自由文本中识别实体、关系、属性,可通过人工干预模型的方式,优化自由文本抽取的准确率;支持从结构化数据源中直接转化数据,与知识图谱schema映射对齐,自动生产知识图谱数据;支持自定义知识图谱抽取模型,包括调优模型、优化词表、定义模板等;支持机器学习模型、机器规则及人工方式进行实体、属性、关系的映射、清洗、融合、归一、建边、补全;图谱知识生产全流程支持可视化、白盒化以及审核干预。
在本发明的一种优选技术方案中,还包括实体抽取模块和关联抽取模块。
在本发明的一种优选技术方案中,所述实体抽取模块是从文本数据中抽取数据中的实体,该实体抽取模块由三个小模块组成,三个小模块分别是三个模型,即Transformer模型、BiGRU模型、CRF模型,通过三个部分的各个模型的功能最后完成实体抽取的任务。
在***的设计思路中,将命名实体识别为序列标注任务进行处理。其总体思路则是将给定的一个序列,对其中的每一个元素做相应的标记或者说是给其中的每一个元素打一个标签,这个标签这是BIOES中的一个标签。对于其中是实体的元素则根据标签作为实体处理,而对于非实体的标签则,将其中的O标签作为对应实体的属性,之后再存储的过程中进行相应的去重操作。
在本发明的一种优选技术方案中,所述关联抽取模块是判定实体与实体之间的一个关系,先对实体进行抽取,然后接着是对实体间的关系进行判定,借用在实体抽取的BiGRU模型,然后再结合另外的Attention,对实体间的关系进行抽取,其中BiGRU部分得到句子的相应的label序列,然后利用Attention进行相关的关系多分类的思路进行关系抽取。
在本发明的一种优选技术方案中,所述Attention中多分类的任务通过softmax分类器进行预测句子的分类标签。
本发明的有益效果是:本发明电网标准知识抽取方法,获取数据更新,引入的各类形态的原始数据,以本体构建***定义知识生产目标,输出数据抽取模型;根据数据抽取模型对不同的原始数据进行数据抽取处理,得到各类型的电网数据;将各类型的电网数据转换形成知识图谱数据,并建立实体以及实体间关系。知识提取提供针对不同数据源的知识提取服务,所有知识提取服务均以任务的形式在后台进行周期性的运行,保证各类外部数据的持续接入。通过结构化、非结构化等的数据接入,完成来源库数据到知识图谱的自动化构建,提供结构化数据入图能力。通过集合知识组织、存储、提取、推理方法和工具为一体,把海量离散的信息点聚合成为语义网络,节省了专业技术人员大量的时间,为电力调度、设备管理、数据交互、业务查询等知识更迭迅速提供了基础。
附图说明
为了更清楚地说明本发明实施方式的技术方案,下面将对实施方式中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1是本发明实施方式提供的电网标准知识抽取方法的流程示意图;
图2为本发明实施方式提供的知识抽取***组成示意图;
图3为本发明实施方式提供的实体抽取模块模型结构示意图。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
实施例
请参阅图1-3,本发明提供一种技术方案:一种电网标准知识抽取方法,包括
获取数据更新,引入的各类形态的原始数据,以本体构建***定义知识生产目标,输出数据抽取模型;
根据数据抽取模型对不同的原始数据进行数据抽取处理,得到各类型的电网数据;
将各类型的电网数据转换形成知识图谱数据,并建立实体以及实体间关系。
在本发明实施例中,本体构建***在技术架构上遵从标准化数字加工与标准招标技术规范,进行标准数字化加工及标准知识库构建及标准知识图谱构建工具模型与构建过程支持服务。
在本发明实施例中,数据模型的过程,包括步骤:通过机器学习算法处理数据更新结果,训练数据抽取模型。
在本发明实施例中,数据抽取模型的抽取方式包括章条抽取、术语抽取、指标抽取、公式抽取、图片抽取和表格抽取。
章条:对每个层级的章条进行抽取与加工,支持章条关联嵌套,即分层级处理,父层级章条可包含子层级章条。
术语:支持对术语进行抽取,抽取结果包含术语名称、术语定义等。
指标与指标值:对标准内的指标(包含文字型条款、数值型)进行抽取,以key-value形式输出。
公式:对标准内的公式进行抽取,需包含公式名称、具体公式。
图片:对标准内的非纯文字图片进行抽取,输出图片资源,需包含图片名称、图片资源文件。
表格:对标准内的表格进行抽取,抽取结果为支持抽取为图片与excel表两类,包含表名(如有)、表头(如有)、行数据、列数据等。
在本发明实施例中,各类型的电网数据的知识抽取包括结构化抽取、半结构化抽取和非结构化抽取,利用结构化抽取、半结构化抽取和非结构化抽取转换形成知识图谱构建。
知识图谱生产工具模型构建,提供图谱构建过程支撑服务、协助完成变压器及断路器设备标准知识图谱构建。包括:知识建模、提取功能、知识消歧、图谱构建功能、图谱存储与查询功能的方案与实施工具,支持对知识进行抽取、schema构建、图谱构建、修改图谱并实时展示等。
在本发明实施例中,知识图谱具体功能包括:支持从自由文本中识别实体、关系、属性,可通过人工干预模型的方式,优化自由文本抽取的准确率;支持从结构化数据源中直接转化数据,与知识图谱schema映射对齐,自动生产知识图谱数据;支持自定义知识图谱抽取模型,包括调优模型、优化词表、定义模板等;支持机器学习模型、机器规则及人工方式进行实体、属性、关系的映射、清洗、融合、归一、建边、补全;图谱知识生产全流程支持可视化、白盒化以及审核干预。
在本发明实施例中,本发明一种电网标准知识抽取方法还包括实体抽取模块和关联抽取模块。
请参阅图3,在本发明实施例中,实体抽取模块是从文本数据中抽取数据中的实体,该实体抽取模块由三个小模块组成,三个小模块分别是三个模型,即Transformer模型、BiGRU模型、CRF模型,通过三个部分的各个模型的功能最后完成实体抽取的任务。
在***的设计思路中,将命名实体识别为序列标注任务进行处理。其总体思路则是将给定的一个序列,对其中的每一个元素做相应的标记或者说是给其中的每一个元素打一个标签,这个标签这是BIOES中的一个标签。对于其中是实体的元素则根据标签作为实体处理,而对于非实体的标签则,将其中的O标签作为对应实体的属性,之后再存储的过程中进行相应的去重操作。
Transformer模型
使用Transformer模型得到positional embedding。如图3所示,将文本中的句子输入transformer模型中,经过transformer模型运算之后得到相关句子的positionalembedding,之后则是将positional embedding作为输入再输入到下一层模型中。在Transformer模型的搭建方面,使用TensorFlow进行搭建。
BiGRU模型
根据BiGRU模型的原理出发,搭建双层的GRU模型,并根据实际需求确定GRU单元细胞的数量,该模型的目的是将上一部分Transformer模型的结果做为该模型的输入,最后从BiGRU模型得到的结果是则是Transformer模型中结果positional embedding经过该模型的一个一个label序列,label序列经过最后的CRF的概率计算,来确定其中的哪一些词语属于实体,哪一些词语不属于实体。该模型中的输入方面,因为在模型训练过程中不可能根据positional embedding的长度动态改变BiGRU输入单元的大小,因此需要预先保留足够的输入长度,对于positional embedding长度不够的情况,使用0进行补充。BiGRU模型的实现方式通过TensorFlow进行编写相应代码。
CRF模型
CRF模型的功能是计算label序列中的各个序列的概率,由概率最大的序列来决定其中的哪一部分是否属于实体。其中,BiGRU模型的输出label序列是一个矩阵,每一列有5个数字,列中的每一行数字代表BIOES模式中的概率;CRF的输入是一个序列,因此将BiGRU的结果label序列以每一行作为一个序列当作CRF模型打的输入,然后计算该列的概率,然后再比较label序列中最大值,然后根据其label序列中的概率来判别元句子中哪一些是属于实体。
在该部分除了要解决实体抽取之外还额外对知识抽取中属性抽取的工作进行部分实现,首先根据其标注序列选取对应的词语,然后去掉重复的部分,剩余的词语作为句子中抽取出的实体的属性。
在本发明实施例中,关联抽取模块是判定实体与实体之间的一个关系,先对实体进行抽取,然后接着是对实体间的关系进行判定,借用在实体抽取的BiGRU模型,然后再结合另外的Attention,对实体间的关系进行抽取,其中BiGRU部分得到句子的相应的label序列,然后利用Attention进行相关的关系多分类的思路进行关系抽取。
在本发明实施例中,Attention中多分类的任务通过softmax分类器进行预测句子的分类标签。
综上所述:本发明电网标准知识抽取方法,获取数据更新,引入的各类形态的原始数据,以本体构建***定义知识生产目标,输出数据抽取模型;根据数据抽取模型对不同的原始数据进行数据抽取处理,得到各类型的电网数据;将各类型的电网数据转换形成知识图谱数据,并建立实体以及实体间关系。知识提取提供针对不同数据源的知识提取服务,所有知识提取服务均以任务的形式在后台进行周期性的运行,保证各类外部数据的持续接入。通过结构化、非结构化等的数据接入,完成来源库数据到知识图谱的自动化构建,提供结构化数据入图能力。通过集合知识组织、存储、提取、推理方法和工具为一体,把海量离散的信息点聚合成为语义网络,节省了专业技术人员大量的时间,为电力调度、设备管理、数据交互、业务查询等知识更迭迅速提供了基础。
知识抽取后采用知识存储***进行存储,知识存储子***,包括图谱存储引擎,文本存储引擎。图谱存储引擎构建超大规模高性能分布式图索引及存储引擎。支持常见的图形模型Property Graph和类似Gremlin的图灵完备的图查询语言,提供图原生的存储引擎,存储架构上支持多种的存储介质/***,内存或直接SSD,具备分布式存储能力,满足海量图谱数据的存储需求,以及多活实例,快速故障切换,实现服务的高可用能力。文本知识存储引擎整合经过了深度效果与性能优化的elasticsearch,提供面向大规模文本数据的存储检索***,***容量可扩展,且提供一系列可优化的配置。
图谱存储引擎:
图数据库BGraph是一种高性能商用图数据库,适用于数据高度关联并进行深度分析的应用场景。BGraph的核心是高性能图形数据库引擎,在知识图谱***中应用和实践多年,能支持数亿级的实体和毫秒级的响应延迟,提供分布式和高可用能力,满足企业级应用的需求。
以上所述仅为本发明的优选实施方式而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种电网标准知识抽取方法,其特征在于,包括
获取数据更新,引入的各类形态的原始数据,以本体构建***定义知识生产目标,输出数据抽取模型;
根据数据抽取模型对不同的原始数据进行数据抽取处理,得到各类型的电网数据;
将各类型的电网数据转换形成知识图谱数据,并建立实体以及实体间关系。
2.根据权利要求1所述的电网标准知识抽取方法,其特征在于,所述本体构建***在技术架构上遵从标准化数字加工与标准招标技术规范,进行标准数字化加工及标准知识库构建及标准知识图谱构建工具模型与构建过程支持服务。
3.根据权利要求1所述的电网标准知识抽取方法,其特征在于,所述数据模型的过程,包括步骤:通过机器学习算法处理数据更新结果,训练数据抽取模型。
4.根据权利要求1所述的电网标准知识抽取方法,其特征在于,所述数据抽取模型的抽取方式包括章条抽取、术语抽取、指标抽取、公式抽取、图片抽取和表格抽取。
5.根据权利要求1所述的电网标准知识抽取方法,其特征在于,所述各类型的电网数据的知识抽取包括结构化抽取、半结构化抽取和非结构化抽取,利用结构化抽取、半结构化抽取和非结构化抽取转换形成知识图谱构建。
6.根据权利要求5所述的电网标准知识抽取方法,其特征在于,所述知识图谱具体功能包括:支持从自由文本中识别实体、关系、属性,可通过人工干预模型的方式,优化自由文本抽取的准确率;支持从结构化数据源中直接转化数据,与知识图谱schema映射对齐,自动生产知识图谱数据;支持自定义知识图谱抽取模型,包括调优模型、优化词表、定义模板等;支持机器学习模型、机器规则及人工方式进行实体、属性、关系的映射、清洗、融合、归一、建边、补全;图谱知识生产全流程支持可视化、白盒化以及审核干预。
7.根据权利要求1所述的电网标准知识抽取方法,其特征在于,还包括实体抽取模块和关联抽取模块。
8.根据权利要求7所述的电网标准知识抽取方法,其特征在于,所述实体抽取模块是从文本数据中抽取数据中的实体,该实体抽取模块由三个小模块组成,三个小模块分别是三个模型,即Transformer模型、BiGRU模型、CRF模型,通过三个部分的各个模型的功能最后完成实体抽取的任务。
9.根据权利要求7所述的电网标准知识抽取方法,其特征在于,所述关联抽取模块是判定实体与实体之间的一个关系,先对实体进行抽取,然后接着是对实体间的关系进行判定,借用在实体抽取的BiGRU模型,然后再结合另外的Attention,对实体间的关系进行抽取,其中BiGRU部分得到句子的相应的label序列,然后利用Attention进行相关的关系多分类的思路进行关系抽取。
10.根据权利要求9所述的电网标准知识抽取方法,其特征在于,所述Attention中多分类的任务通过softmax分类器进行预测句子的分类标签。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211299499.1A CN115599923A (zh) | 2022-10-22 | 2022-10-22 | 一种电网标准知识抽取方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211299499.1A CN115599923A (zh) | 2022-10-22 | 2022-10-22 | 一种电网标准知识抽取方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115599923A true CN115599923A (zh) | 2023-01-13 |
Family
ID=84848365
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211299499.1A Pending CN115599923A (zh) | 2022-10-22 | 2022-10-22 | 一种电网标准知识抽取方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115599923A (zh) |
-
2022
- 2022-10-22 CN CN202211299499.1A patent/CN115599923A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yan et al. | KnowIME: a system to construct a knowledge graph for intelligent manufacturing equipment | |
CN112612902A (zh) | 一种电网主设备的知识图谱构建方法及设备 | |
CN113553420B (zh) | 基于知识图谱的电网故障处理规程推荐方法和*** | |
CN111552813A (zh) | 一种基于电网全业务数据的电力知识图谱构建方法 | |
CN106447346A (zh) | 一种智能电力客服***的构建方法及*** | |
CN114077674A (zh) | 一种电网调度知识图谱数据优化方法及*** | |
CN113434634A (zh) | 知识图谱构建方法、装置 | |
CN110704577A (zh) | 一种电网调度数据的搜索方法及*** | |
CN112685570B (zh) | 一种基于多标签图的电网网架知识图谱的构建方法 | |
CN115757810A (zh) | 一种知识图谱标准本体构建方法 | |
CN112100506B (zh) | 信息推送方法、***、设备及存储介质 | |
CN115438199A (zh) | 一种基于智慧城市场景数据中台技术的知识平台*** | |
CN113946686A (zh) | 电力营销知识图谱构建方法及*** | |
CN113220901A (zh) | 基于增强智能的写作构思辅助***、网路*** | |
CN115858829A (zh) | 一种基于算力网络的多源异构环境数据资产构建方法 | |
CN114153821A (zh) | 一种基于图论的电量图数据库构建及搜索方法 | |
CN111625596B (zh) | 新能源实时消纳调度的多源数据同步共享方法及*** | |
CN115937881A (zh) | 一种知识图谱构建标准表格内容自动识别方法 | |
CN117010373A (zh) | 一种电力设备资产管理数据所属类别和组的推荐方法 | |
CN115238099A (zh) | 一种面向能源行业设备的工业互联网数据中台构建方法 | |
CN116401338A (zh) | 一种基于数据资产智能检索输入输出要求设计特征提取和注意力机制及其方法 | |
CN115017251B (zh) | 一种用于智慧城市的标准映射地图建立方法及*** | |
CN116011564A (zh) | 一种面向电力设备的实体关系补全方法、***及应用 | |
CN115827885A (zh) | 一种运维知识图谱的构建方法、装置及电子设备 | |
CN115757735A (zh) | 一种面向电网数字化建设成果资源的智能检索方法及*** |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |