CN116662504A - 电力知识语义分析***及其方法 - Google Patents

电力知识语义分析***及其方法 Download PDF

Info

Publication number
CN116662504A
CN116662504A CN202310623950.9A CN202310623950A CN116662504A CN 116662504 A CN116662504 A CN 116662504A CN 202310623950 A CN202310623950 A CN 202310623950A CN 116662504 A CN116662504 A CN 116662504A
Authority
CN
China
Prior art keywords
knowledge
semantic
feature vector
map
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310623950.9A
Other languages
English (en)
Inventor
梁寿愚
何宇斌
李映辰
张坤
吴小刚
李文朝
胡荣
周华锋
江伟
顾慧杰
符秋稼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Southern Power Grid Co Ltd
Original Assignee
China Southern Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Southern Power Grid Co Ltd filed Critical China Southern Power Grid Co Ltd
Priority to CN202310623950.9A priority Critical patent/CN116662504A/zh
Publication of CN116662504A publication Critical patent/CN116662504A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3346Query execution using probabilistic model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3347Query execution using vector based model
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • G06F16/353Clustering; Classification into predefined classes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/02Knowledge representation; Symbolic representation
    • G06N5/027Frames
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/06Energy or water supply
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y04INFORMATION OR COMMUNICATION TECHNOLOGIES HAVING AN IMPACT ON OTHER TECHNOLOGY AREAS
    • Y04SSYSTEMS INTEGRATING TECHNOLOGIES RELATED TO POWER NETWORK OPERATION, COMMUNICATION OR INFORMATION TECHNOLOGIES FOR IMPROVING THE ELECTRICAL POWER GENERATION, TRANSMISSION, DISTRIBUTION, MANAGEMENT OR USAGE, i.e. SMART GRIDS
    • Y04S10/00Systems supporting electrical power generation, transmission or distribution
    • Y04S10/50Systems or methods supporting the power network operation or management, involving a certain degree of interaction with the load-side end user applications

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Mathematical Physics (AREA)
  • Business, Economics & Management (AREA)
  • Evolutionary Computation (AREA)
  • Economics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Software Systems (AREA)
  • Computing Systems (AREA)
  • Human Computer Interaction (AREA)
  • Water Supply & Treatment (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Probability & Statistics with Applications (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Molecular Biology (AREA)
  • Human Resources & Organizations (AREA)
  • Marketing (AREA)
  • Primary Health Care (AREA)
  • Strategic Management (AREA)
  • Tourism & Hospitality (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

一种电力知识语义分析***及其方法,其构建电网物理模型图谱、电网运行数据图谱和调度语义图谱,并融合电网物理模型图谱、电网运行数据图谱和调度语义图谱以得到电网知识图谱;通过知识图谱快速处理各类结构化及非结构化文本,提取知识,并将其消纳整理,形成可推理的知识结构;以基于电网知识图谱实现电网知识的智能问答,进而减轻知识的归纳和学习成本。

Description

电力知识语义分析***及其方法
技术领域
本申请涉及智能化分析技术领域,并且更具体地,涉及电力知识语义分析***及其方法。
背景技术
目前,集中式新能源场站数量截至2021年底已达到848个,分属400余家不同企业主体;分布式新能源场站数量已超过8万个,隶属3000家以上投资机构(不含个人户主),并且新型电力***发、输、变、配、用多结构相互耦合,必然形成庞大的知识体系,直接导致海量运行数据难以管控分析。
通过传统的加大对调度运行人员培训方式实现对庞大知识体系的认知和应用,时间和经济成本高,并且认知能力提升有限,难以适应新形势的发展。
发明内容
为了解决上述技术问题,提出了本申请。本申请的实施例提供了一种电力知识语义分析***及其方法,其构建电网物理模型图谱、电网运行数据图谱和调度语义图谱,并融合电网物理模型图谱、电网运行数据图谱和调度语义图谱以得到电网知识图谱;通过知识图谱快速处理各类结构化及非结构化文本,提取知识,并将其消纳整理,形成可推理的知识结构;以基于电网知识图谱实现电网知识的智能问答,进而减轻知识的归纳和学习成本。
第一方面,提供了一种电力知识语义分析方法,其包括:
构建电网物理模型图谱、电网运行数据图谱和调度语义图谱;
融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱;
获取电力知识提问;
对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量;
将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵;
以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量;
对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及
将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。
在上述电力知识语义分析方法中,所述语义解析模型为包含词嵌入层的Bert模型。
在上述电力知识语义分析方法中,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量,包括;对所述电力知识提问进行语句识别和实体识别以得到多个问题组件,其中,所述问题组件包括概念、关系和属性;使用所述语义解析模型的词嵌入层对所述多个问题组件进行词嵌入化以得到多个问题组件词嵌入向量:以及,使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量。
在上述电力知识语义分析方法中,使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量,包括:将所述多个问题组件词嵌入向量进行一维排列以得到全局词嵌入特征向量;计算所述全局词嵌入特征向量与所述多个问题组件词嵌入向量中各个问题组件词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,分别以所述多个概率值中各个概率值作为权重对所述多个问题组件词嵌入向量中各个问题组件词嵌入向量进行加权以得到所述电力知识提问语义理解特征向量。
在上述电力知识语义分析方法中,对所述分类特征向量进行特征分布优化以得到优化分类特征向量,包括:以如下优化公式对所述分类特征向量进行特征分布优化以得到优化分类特征向量;其中,所述优化公式为:
v′i=(μσ)vi 2+viμ+(vi-σ)μ2
其中,V表示所述分类特征向量,μ和σ是所述分类特征向量中所有位置的特征值集合的均值和标准差,vi是所述分类特征向量的第i个位置的特征值,v′i是所述优化分类特征向量的第i个位置的特征值。
在上述电力知识语义分析方法中,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签,包括:使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
第二方面,提供了一种电力知识语义分析***,其包括:
图谱构件模块,用于构建电网物理模型图谱、电网运行数据图谱和调度语义图谱;
图谱融合模块,用于融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱;
电力知识获取模块,用于获取电力知识提问;
语义解析模块,用于对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量;
图神经网络模块,用于将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵;
向量计算模块,用于以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量;
优化模块,用于对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及
备选答案的序列标签生成模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。
在上述电力知识语义分析***中,所述语义解析模型为包含词嵌入层的Bert模型。
在上述电力知识语义分析***中,所述语义解析模块,包括;识别单元,用于对所述电力知识提问进行语句识别和实体识别以得到多个问题组件,其中,所述问题组件包括概念、关系和属性;词嵌入单元,用于使用所述语义解析模型的词嵌入层对所述多个问题组件进行词嵌入化以得到多个问题组件词嵌入向量:以及,上下文编码单元,用于使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量。
在上述电力知识语义分析***中,所述上下文编码单元,包括:一维排列子单元,用于将所述多个问题组件词嵌入向量进行一维排列以得到全局词嵌入特征向量;自注意力子单元,用于计算所述全局词嵌入特征向量与所述多个问题组件词嵌入向量中各个问题组件词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;标准化子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;概率值计算子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,加权子单元,用于分别以所述多个概率值中各个概率值作为权重对所述多个问题组件词嵌入向量中各个问题组件词嵌入向量进行加权以得到所述电力知识提问语义理解特征向量
与现有技术相比,本申请提供的电力知识语义分析***及其方法,其构建电网物理模型图谱、电网运行数据图谱和调度语义图谱,并融合电网物理模型图谱、电网运行数据图谱和调度语义图谱以得到电网知识图谱;通过知识图谱快速处理各类结构化及非结构化文本,提取知识,并将其消纳整理,形成可推理的知识结构;以基于电网知识图谱实现电网知识的智能问答,进而减轻知识的归纳和学习成本。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为根据本申请实施例的调度业务知识图谱构建示意图。
图2为根据本申请实施例的电网本体图谱与调度语义图谱融合示意图。
图3为根据本申请实施例的基于调度知识图谱的问答服务示意图。
图4为根据本申请实施例的基于调度知识图谱的智能操作推理服务示意图。
图5为根据本申请实施例的调控智能训练示意图。
图6为根据本申请实施例的调控智能体应用。
图7为根据本申请实施例的电力知识语义分析方法的场景示意图。
图8为根据本申请实施例的电力知识语义分析方法的流程图。
图9为根据本申请实施例的电力知识语义分析方法的架构示意图。
图10为根据本申请实施例的电力知识语义分析方法中步骤140的子步骤的流程图。
图11为根据本申请实施例的电力知识语义分析方法中步骤143的子步骤的流程图。
图12为根据本申请实施例的电力知识语义分析方法中步骤180的子步骤的流程图。
图13为根据本申请实施例的电力知识语义分析***的框图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
除非另有说明,本申请实施例所使用的所有技术和科学术语与本申请的技术领域的技术人员通常理解的含义相同。本申请中所使用的术语只是为了描述具体的实施例的目的,不是旨在限制本申请的范围。
在本申请实施例记载中,需要说明的是,除非另有说明和限定,术语“连接”应做广义理解,例如,可以是电连接,也可以是两个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
需要说明的是,本申请实施例所涉及的术语“第一\第二\第三”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二\第三”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二\第三”区分的对象在适当情况下可以互换,以使这里描述的本申请的实施例可以除了在这里图示或描述的那些以外的顺序实施。
本申请的目标为:(1)构建新型调度AI认知服务,实现220kV及以上电网模型、实时数据的图谱化知识接入、知识建模和生成,建设电网本体知识图谱;实现调度语义文档,主要包含《电力调度管理规程》、《调度运行操作管理规定》、《高压直流***调度运行管理规定》等电网操作规程文档的图谱化生成,建设调度语义知识图谱;(2)实现电网本体知识图谱和调度语义知识图谱的融合,并进建立更新机制,实现电网模型和实时运行数据图谱知识的及时更新;(3)构建调度语义文档的机器阅读和智能问答服务,建设电网操作规程文档《电力调度管理规程》、《调度运行操作管理规定》、《高压直流***调度运行管理规定》等的预训练能力、机器阅读能力、问题自动化生成能力以及基于图谱知识的问答能力。(4)构建基于调度知识图谱的推理服务,基于电网本体知识图谱和调度语义知识图谱融合的“电网调度一张图”,实现操作规则图谱生成、电网运行状态推理、设备连通性推理分析等图谱推理服务;(5)构建电网运行强化学***衡、机组出力上下限、机组爬坡约束、线路潮流约束、断面潮流约束等作为约束条件;支持对线路、机组、变压器故障以及故障概率设置,通过自定义故障将扰动设置到训练过程中。
在本申请中,随着新型电力***的加速建设,新能源接入占比显著提高,其波动性、随机性和弱支持性使得电网不确定性增加,传统模式难以实现多目标导向的调度控制问题越来越严重;另外,电力行业各部门间联系越发紧密,发、输、变、配、用多结构相互耦合形成了巨大的知识体系,传统依靠人力实现对电力知识的认知已无法满足电网调度要求的问题。因此,本申请提出一种电力调度知识图谱模型构建方法,建立新型调度AI认知服务平台,拟解决传统依靠人力实现对电力知识的认知已无法满足电网调度要求的问题;提出基于OCS的电力***模型和实时数据、电力***分析仿真软件、以及openAI gym/Ray等框架研发电网运行强化学习环境,拟解决传统决策模式难以实现多目标导向的调度控制问题。
例如,在本申请一具体示例中,集中式新能源场站数量截至2021年底已达到848个,分属400余家不同企业主体;分布式新能源场站数量已超过8万个,隶属3000家以上投资机构(不含个人户主),并且新型电力***发、输、变、配、用多结构相互耦合,必然形成庞大的知识体系,直接导致海量运行数据难以管控分析。而通过传统的加大对调度运行人员培训方式实现对庞大知识体系的认知和应用,时间和经济成本高,并且认知能力提升有限,难以适应新形势的发展。因此需要探索新的技术手段,支撑运行人员构建新的认知服务能力。
应可以理解,知识图谱能够快速处理各类结构化及非结构化文本,提取知识,并将其消纳整理,形成可推理的知识结构,其大大减轻了知识的归纳和学***台,包括知识库、分析AI算法库等。如图1所示,解决调度业务结构化和非结构化数据的知识艰难自动化生成的问题。(2)研究电网本体图谱与调度语义图谱融合技术:研究调度领域知识图谱模型融合技术,实现电力***模型图谱、实时数据图谱和调度语义图谱的融合,形成调度业务一张图。如图2所示,解决知识之间独立存在,无法建立连接协同应用的问题。(3)研究基于调度知识图谱的问答服务:基于该调度AI认知服务平台,研究基于DKEPLM(Dispatch Knowledge-Enhanced Pretrain Language Model,知识增强的预训练语言模型),DMRC(DispatchMachine Reading Comprehension,机器阅读理解),DPR(Dispatch Passage Ranking,篇章排序算法),L2AD(Learn to Ask for Dispatch,问题自动生成技术开发)四合一算法的调度文档自动理解、存储、训练与问答技术,实现调度文档机器阅读和智能问答服务。如图3所示,解决庞大业务数据无法便捷应用的问题。(4)研究基于调度知识图谱的推理服务:基于调度知识图谱对电网运行的认知能力,结合电网操作防误和电网操作步骤生成的业务逻辑,研究基于调度知识图图谱的推理服务,支撑电网操作智能防误和操作票智能生成,如图4所示。
值得一提的是,新能源发电随机性大,海量的新能源接入,必然导致***惯量不断下降、抵御故障能力降低、故障形态更加复杂、连锁反应风险增加等问题,使得电网运行不确定性大幅增加,控制难得问题将越发严重。传统单一调度决策已经不能实现***的最优控制,要求多***联合分析决策,而仅靠人力简单计算无法实现。因此需要研究新得技术手段,辅助运行人员进行高效稳定的电网控制。
经过各个行业的应用研究证明,强化学习可以通过神经网络自主学习,优化自身控制策略。其不需要精确目标函数;可实时在线决策;具有更强鲁棒性和稳定收敛结果。可以快速解决复杂耦合问题。基于强化学习可以进一步实现电力***调控决策、故障预案演练等功能。详细描述如下:(1)利用OCS***数据和BPA工具等提供电力***仿真数据,模拟多场景下的电力***模型,使智能体能不断学习优化自身调控策略,建立鲁棒性强的调控智能体,如图5。(2)调控智能体根据电网情况提出合适的调控决策,辅助调度员更轻松的完成调度工作。在面对台风、等特殊场景时,在维持电网稳定的前提下,得到适合不同场景的最优调控方案,实现不同场景下智能体的自动生成,如图6。
针对上述技术需求,本申请的技术构思为:构建电网物理模型图谱、电网运行数据图谱和调度语义图谱,并融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱。知识图谱能够快速处理各类结构化及非结构化文本,提取知识,并将其消纳整理,形成可推理的知识结构,其大大减轻了知识的归纳和学习成本。进而,基于所述电网知识图谱来构建基于图谱知识的问答方案。
相应地,在本申请的技术方案中,首先构建电网物理模型图谱、电网运行数据图谱和调度语义图谱。具体地,通过电网模型知识文档来构建电网物理模型图谱、通过电网运行实时数据的图谱化知识接入来构造所述电网运行数据图谱,以及,通过电网操作规程文档的图谱化来得到所述调度语义图谱。
所述电网物理模型图谱是描述电力***中各种物理元素之间关系的基础,包括发电机、变电站、配电站等。了解这些元素的特性和拓扑结构,可以帮助更好地理解电力***的运行机制,从而提高对电力知识的理解和把握。
所述电网运行数据图谱是描述电力***运行状态的关键,包括电压、电流、功率等参数。监测这些数据并进行分析,可以帮助及时发现问题和异常情况,并采取相应的措施进行处理和修复。所述调度语义图谱包含了各种调度规则和策略,是保证电力***运行安全和稳定的重要手段。通过深入研究和学习这些规则和策略,可以为***的优化和改进提供参考,提高电力***的运行效率和质量。
接着,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱。这里,通过融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱可解决知识之间的独立存在、无法建立连接协同应用的问题。具体地,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱,是为了得到更加全面、准确的电网知识图谱,其中,所述三个子图谱分别描述了电力***中的物理结构、实时运行状态和调度规程等不同方面的知识信息。将它们融合成一个整体,可以弥补各自在某些方面的不足,进一步提升电网知识图谱的完备性和实用性。具体来说,通过融合电网物理模型图谱和电网运行数据图谱,就可以建立电力设备之间的联系,并将其与实时运行数据相结合,更好地理解各个设备之间的耦合关系和影响因素,从而实现对电力***运行情况的全面监测和预测。同时,通过融合调度语义图谱,还可以将电力调度指令与具体的设备操作相联系,实现智能化的电网运营管理。
在本申请一个具体的示例中,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱的过程,包括:
首先,对电网物理模型图谱、电网运行数据图谱和调度语义图谱进行语义建模,将其中的实体、属性和关系转化为统一的知识表示形式。然后,设计一个融合策略,将三个子图谱中相同的实体、属性和关系进行匹配和整合。例如,对于连接着两个变电站的输电线路这样的概念,在电网物理模型图谱、电网运行数据图谱和调度语义图谱中都有所涉及,可以根据它们的共性将其匹配成同一个实体。进而,基于融合策略,将三个子图谱整合成一个全面的电网知识图谱。这个过程需要进行一定的数据清洗和冗余信息消除处理,以保证得到的知识图谱结构合理、完备、准确。最终,将知识图谱存储在合适的图数据库中,并对其进行索引和优化,以支持智能问答***的高效查询和检索。
接着,获取电力知识提问。这里,获取电力知识提问,是为了让智能问答***能够理解和响应用户的需求。在实际应用场景中,用户可能会对电力***的各个方面有不同的疑问和需求,例如设备故障、运行状态、调度指令等。通过获取这些电力知识提问,可以根据用户的具体需求提供相应的回答,从而满足用户的信息查询需求。同时,电力***是一个复杂的领域,其中涵盖了大量的专业术语和知识点。如果用户没有相关领域知识,则很难准确地描述自己的问题。因此,通过获取电力知识提问,可以帮助用户更好地表达自己的需求,从而获得更加精准的答案。
接着,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量。对所述电力知识提问进行语句识别和实体识别,是为了将自然语言表示的问题转化为机器可处理的结构化形式。在电力知识智能问答***中,用户可能会以各种自然语言形式提出问题,而这些问题需要转化为计算机可以处理的结构化数据,才能进行后续的处理和分析。
具体来说,对电力知识提问进行语句识别和实体识别,可以将问题文本拆分成概念、关系和属性等组件,从而更好地理解问题的意图和内容。例如,对于一个涉及到电力设备故障的问题,“哪些设备发生了故障?”可以被识别为包含“设备”、“故障”等实体的查询语句,进一步被转化为相应的结构化查询。通过实体识别和语句识别,可以将问题解构为基本的语义单元,为后续的语义理解和计算打下基础。在得到经过语句识别和实体识别后的结构化问题后,需要输入语义解析模型进行深度语义理解,得到电力知识提问的语义理解特征向量。这个特征向量可以表示问题文本的语义含义,并用于后续的知识匹配和分类。通过语义理解模型的处理,可以提高智能问答***对问题的理解能力,从而更准确地回答用户提出的电力知识问题。
然后,将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵。这里,将电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵,是为了将知识图谱中的信息转化为计算机可以处理和分析的向量表示形式。
传统的基于规则的问答***主要依赖于手工编写的规则和模板,难以处理大规模、复杂的问题。而图神经网络技术可以从结构化数据中自动学习节点和边的表示,并在此基础上进行图级别的计算和推理。通过将电网知识图谱输入图神经网络模型,可以学习到图中各个实体之间的关系及其嵌入表示,从而更好地理解这些实体之间的语义关系。
具体来说,通过图神经网络模型对电网知识图谱进行计算,可以得到电网语义知识图谱特征矩阵,其中每个实体都被表示为一个向量。这个向量包含了该实体在电网知识图谱中的位置、连接关系和语义信息等多维度特征,可以用于后续的知识匹配和分类任务。同时,由于图神经网络对局部子图的处理效果优良,所以它也可以捕捉到一些全局性质,比如电力***中的重要节点、关键路径等。
接着,以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量。这里,以电力知识提问语义理解特征向量作为查询特征向量,计算其与电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量,是为了将电力知识提问和电网知识图谱之间建立联系,从而实现问题分类和回答。
在电力知识智能问答***中,用户提出的问题需要通过分类模型进行分类,以确定问题类型和所需的回答信息。因此,需要将查询文本转化为计算机可处理的形式,并与电网知识图谱之间进行匹配和比较,以找到最佳的问题分类和答案。具体来说,将电力知识提问语义理解特征向量作为查询特征向量,可以将问题文本表示成一个多维向量。这个向量包含了问题文本的重要信息和语义特征,可以用于后续的问题分类和回答。而电网语义知识图谱特征矩阵则表示了知识图谱中各个实体的向量表示,可以用于知识匹配和分类任务。
通过计算查询特征向量与电网语义知识图谱特征矩阵之间的点积或余弦相似度等指标,就可以得到一个分类特征向量。这个向量可以表示当前问题与电网知识图谱中相应实体之间的相关性和匹配程度,从而确定最佳的问题分类和答案。
最终,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。也就是,将所述分类特征向量输入所述分类器以通过所述分类器来确定所述电力知识提问所属的答案的序列标签。这样,基于所述电网知识图谱实现电网知识的智能问答。
特别地,在本申请的技术方案中,以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量时,本质上是将所述电力知识提问语义理解特征向量所表示的问题语义信息映射到所述电网知识图谱的高维语义特征空间中,因所述电网语义知识图谱特征矩阵通过图神经网络模型生成而所述电力知识提问语义理解特征向量通过语义编码器生成,因此,所述电网语义知识图谱特征矩阵具有非欧拓扑结构,而所述电力知识提问语义理解特征向量仍在欧式空间中,因此,在将所述电力知识提问语义理解特征向量和所述电网语义知识图谱特征矩阵之间的矩阵乘积时,空间结构范式的错配会使得所述分类特征向量的局部分布受到错配,这就会导致所述分类特征向量的特征分布的不规则化,从而影响通过分类器的分类结果的精准度。
基于此,本申请的申请人对所述分类特征向量V进行流形曲面的高斯概率密度参数二次正则化,具体表示为:
v′i=(μσ)vi 2+viμ+(vi-σ)μ2
其中μ和σ是特征值集合vi∈V的均值和标准差,且v′i是优化后的所述分类特征向量V′的第i个位置的特征值。
具体地,为了解决所述分类特征向量V的特征集合的高维特征分布在查询特征映射的高维特征空间内的分布不规则化的问题,通过特征值针对分类器的类概率分布的高斯概率密度参数的似然性进行所述分类特征向量V的各个特征值的二次正则化,来将基于目标类概率的高斯概率密度参数的参数空间内的等距离分布进行特征值的平滑约束,以获得高维特征的流形曲面表达的原始概率密度似然函数在参数空间内的规则化重整,从而提升优化后的所述分类特征向量V′的特征分布的规则性,以提升优化后的所述分类特征向量V′通过分类器的分类准确性。
通过上述基于图谱知识的问答方案,可实现如下技术效果:1)电力调度是一个非常复杂的领域,需要处理各种数据和信息。使用知识图谱和问答服务可以更好地整合这些信息,并为用户提供更快速、更精确的答案。2)电力行业需要高效率的解决方案,以满足客户需求并提高经济效益。通过提供基于算法的技术,可以使企业在处理信息时更加快速、准确,从而提高生产效率和商业竞争力。3)随着社会的发展和科技的进步,人们对电力行业的要求也在不断提高。使用知识图谱和问答服务等技术,可以提高企业的智能化水平,更好地满足客户需求,同时提高企业在市场上的竞争力。4)电力调度作为一项重要的基础设施,其管理和维护需要专业技术和知识。使用基于算法的技术,可以更好地管理和存储这些信息,并且可以帮助培养更多的电力行业专业人才。
图7为根据本申请实施例的电力知识语义分析方法的场景示意图。如图7所示,在该应用场景中,首先,构建电网物理模型图谱(例如,如图7中所示意的C1)、电网运行数据图谱(例如,如图7中所示意的C2)和调度语义图谱(例如,如图7中所示意的C3),以及,获取电力知识提问(例如,如图7中所示意的C4);然后,将获取的电网物理模型图谱、电网运行数据图谱、调度语义图谱和电力知识提问输入至部署有电力知识语义分析算法的服务器(例如,如图7中所示意的S)中,其中所述服务器能够基于电力知识语义分析算法对所述电网物理模型图谱、所述电网运行数据图谱、所述调度语义图谱和所述电力知识提问值进行处理,以生成用于表示备选答案的序列标签的分类结果。
在介绍了本申请的基本原理之后,下面将参考附图来具体介绍本申请的各种非限制性实施例。
在本申请的一个实施例中,图8为根据本申请实施例的电力知识语义分析方法的流程图。如图8所示,根据本申请实施例的电力知识语义分析方法100,包括:110,构建电网物理模型图谱、电网运行数据图谱和调度语义图谱;120,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱;130,获取电力知识提问;140,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量;150,将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵;160,以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量;170,对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及,180,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。
图9为根据本申请实施例的电力知识语义分析方法的架构示意图。如图9所示,在该网络架构中,首先,构建电网物理模型图谱、电网运行数据图谱和调度语义图谱;然后,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱;接着,获取电力知识提问;然后,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量;接着,将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵;然后,以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量;接着,对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及,最后,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。
具体地,在步骤110中,构建电网物理模型图谱、电网运行数据图谱和调度语义图谱。针对上述技术需求,本申请的技术构思为:构建电网物理模型图谱、电网运行数据图谱和调度语义图谱,并融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱。知识图谱能够快速处理各类结构化及非结构化文本,提取知识,并将其消纳整理,形成可推理的知识结构,其大大减轻了知识的归纳和学习成本。进而,基于所述电网知识图谱来构建基于图谱知识的问答方案。
相应地,在本申请的技术方案中,首先构建电网物理模型图谱、电网运行数据图谱和调度语义图谱。具体地,通过电网模型知识文档来构建电网物理模型图谱、通过电网运行实时数据的图谱化知识接入来构造所述电网运行数据图谱,以及,通过电网操作规程文档的图谱化来得到所述调度语义图谱。
所述电网物理模型图谱是描述电力***中各种物理元素之间关系的基础,包括发电机、变电站、配电站等。了解这些元素的特性和拓扑结构,可以帮助更好地理解电力***的运行机制,从而提高对电力知识的理解和把握。
所述电网运行数据图谱是描述电力***运行状态的关键,包括电压、电流、功率等参数。监测这些数据并进行分析,可以帮助及时发现问题和异常情况,并采取相应的措施进行处理和修复。所述调度语义图谱包含了各种调度规则和策略,是保证电力***运行安全和稳定的重要手段。通过深入研究和学习这些规则和策略,可以为***的优化和改进提供参考,提高电力***的运行效率和质量。
具体地,在步骤120中,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱。接着,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱。这里,通过融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱可解决知识之间的独立存在、无法建立连接协同应用的问题。
具体地,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱,是为了得到更加全面、准确的电网知识图谱,其中,所述三个子图谱分别描述了电力***中的物理结构、实时运行状态和调度规程等不同方面的知识信息。将它们融合成一个整体,可以弥补各自在某些方面的不足,进一步提升电网知识图谱的完备性和实用性。具体来说,通过融合电网物理模型图谱和电网运行数据图谱,就可以建立电力设备之间的联系,并将其与实时运行数据相结合,更好地理解各个设备之间的耦合关系和影响因素,从而实现对电力***运行情况的全面监测和预测。同时,通过融合调度语义图谱,还可以将电力调度指令与具体的设备操作相联系,实现智能化的电网运营管理。
在本申请一个具体的示例中,融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱的过程,包括:
首先,对电网物理模型图谱、电网运行数据图谱和调度语义图谱进行语义建模,将其中的实体、属性和关系转化为统一的知识表示形式。然后,设计一个融合策略,将三个子图谱中相同的实体、属性和关系进行匹配和整合。例如,对于连接着两个变电站的输电线路这样的概念,在电网物理模型图谱、电网运行数据图谱和调度语义图谱中都有所涉及,可以根据它们的共性将其匹配成同一个实体。进而,基于融合策略,将三个子图谱整合成一个全面的电网知识图谱。这个过程需要进行一定的数据清洗和冗余信息消除处理,以保证得到的知识图谱结构合理、完备、准确。最终,将知识图谱存储在合适的图数据库中,并对其进行索引和优化,以支持智能问答***的高效查询和检索。
具体地,在步骤130中,获取电力知识提问。接着,获取电力知识提问。这里,获取电力知识提问,是为了让智能问答***能够理解和响应用户的需求。在实际应用场景中,用户可能会对电力***的各个方面有不同的疑问和需求,例如设备故障、运行状态、调度指令等。通过获取这些电力知识提问,可以根据用户的具体需求提供相应的回答,从而满足用户的信息查询需求。同时,电力***是一个复杂的领域,其中涵盖了大量的专业术语和知识点。如果用户没有相关领域知识,则很难准确地描述自己的问题。因此,通过获取电力知识提问,可以帮助用户更好地表达自己的需求,从而获得更加精准的答案。
具体地,在步骤140中,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量。接着,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量。对所述电力知识提问进行语句识别和实体识别,是为了将自然语言表示的问题转化为机器可处理的结构化形式。在电力知识智能问答***中,用户可能会以各种自然语言形式提出问题,而这些问题需要转化为计算机可以处理的结构化数据,才能进行后续的处理和分析。
具体来说,对电力知识提问进行语句识别和实体识别,可以将问题文本拆分成概念、关系和属性等组件,从而更好地理解问题的意图和内容。例如,对于一个涉及到电力设备故障的问题,“哪些设备发生了故障?”可以被识别为包含“设备”、“故障”等实体的查询语句,进一步被转化为相应的结构化查询。通过实体识别和语句识别,可以将问题解构为基本的语义单元,为后续的语义理解和计算打下基础。在得到经过语句识别和实体识别后的结构化问题后,需要输入语义解析模型进行深度语义理解,得到电力知识提问的语义理解特征向量。这个特征向量可以表示问题文本的语义含义,并用于后续的知识匹配和分类。通过语义理解模型的处理,可以提高智能问答***对问题的理解能力,从而更准确地回答用户提出的电力知识问题。
其中,所述语义解析模型为包含词嵌入层的Bert模型。
图10为根据本申请实施例的电力知识语义分析方法中步骤140的子步骤的流程图,如图10所示,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量,包括;141,对所述电力知识提问进行语句识别和实体识别以得到多个问题组件,其中,所述问题组件包括概念、关系和属性;142,使用所述语义解析模型的词嵌入层对所述多个问题组件进行词嵌入化以得到多个问题组件词嵌入向量:以及,143,使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量。
图11为根据本申请实施例的电力知识语义分析方法中步骤143的子步骤的流程图,如图11所示,使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量,包括:1431,将所述多个问题组件词嵌入向量进行一维排列以得到全局词嵌入特征向量;1432,计算所述全局词嵌入特征向量与所述多个问题组件词嵌入向量中各个问题组件词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;1433,分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;1434,将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,1435,分别以所述多个概率值中各个概率值作为权重对所述多个问题组件词嵌入向量中各个问题组件词嵌入向量进行加权以得到所述电力知识提问语义理解特征向量。
上下文编码器旨在挖掘得到词序列中上下文之间的隐藏模式,可选地,编码器包括:CNN(Convolutional Neural Network,卷积神经网络)、Recursive NN(RecursiveNeural Network,递归神经网络)、语言模型(Language Model)等。基于CNN的方法对于局部特征有比较好的提取效果,但其对于句子中的长程依赖(Long-termDependency)问题效果欠佳,因此基于Bi-LSTM(Long Short-Term Memory,长短期记忆网络)的编码器被广泛使用。Recursive NN把句子当作树状结构而非序列进行处理,从理论上而言具有更强的表示能力,但其存在样本标注难度大、深层易梯度消失、难以并行计算等弱点,因此在实际应用中使用较少。Transformer是应用广泛的网络结构了,同时具有CNN和RNN的特性,对于全局特征有较好的提取效果,同时相较于RNN(RecurrentNeural Network,循环神经网络)在并行计算上具有一定优势。
具体地,在步骤150中,将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵。然后,将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵。这里,将电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵,是为了将知识图谱中的信息转化为计算机可以处理和分析的向量表示形式。
传统的基于规则的问答***主要依赖于手工编写的规则和模板,难以处理大规模、复杂的问题。而图神经网络技术可以从结构化数据中自动学习节点和边的表示,并在此基础上进行图级别的计算和推理。通过将电网知识图谱输入图神经网络模型,可以学习到图中各个实体之间的关系及其嵌入表示,从而更好地理解这些实体之间的语义关系。
具体来说,通过图神经网络模型对电网知识图谱进行计算,可以得到电网语义知识图谱特征矩阵,其中每个实体都被表示为一个向量。这个向量包含了该实体在电网知识图谱中的位置、连接关系和语义信息等多维度特征,可以用于后续的知识匹配和分类任务。同时,由于图神经网络对局部子图的处理效果优良,所以它也可以捕捉到一些全局性质,比如电力***中的重要节点、关键路径等。
图神经网络的研究与图嵌入或网络嵌入密切相关,图嵌入或网络嵌入是数据挖掘和机器学习界日益关注的另一个课题。图嵌入旨在通过保留图的网络拓扑结构和节点内容信息,将图中顶点表示为低维向量,以便使用简单的机器学习算法(例如,支持向量机分类)进行处理。许多图嵌入算法通常是无监督的算法,它们可以大致可以划分为三个类别,即矩阵分解、随机游走和深度学习方法。同时图嵌入的深度学习方法也属于图神经网络,包括基于图自动编码器的算法(如DNGR和SDNE)和无监督训练的图卷积神经网络(如GraphSage)。图神经网络划分为五大类别,分别是:图卷积网络(Graph Convolution Networks,GCN)、图注意力网络(Graph Attention Networks)、图自编码器(Graph Autoencoders)、图生成网络(Graph Generative Networks)和图时空网络(Graph Spatial-temporal Networks)。
图卷积网络(Graph Convolutional Network,GCN)进行卷积操作主要有两种方法:一种是基于谱分解,即谱分解图卷积。另一种是基于节点空间变换,即空间图卷积。Bruna等人第一次将卷积神经网路泛化到图数据上,提出两种并列的图卷积模型——谱分解图卷积和空间图卷积;基于自编码器的GNN被称为图自编码器(Graph Auto-encoder,GAE),可以半监督或者无监督地学习图节点信息。在深度学习领域,自编码器(Auto-encoder,AE)是一类将输入信息进行表征学习的人工神经网络;图生成网络(GraphGenerative Network,GGN)是一类用来生成图数据的GNN,其使用一定的规则对节点和边进行重新组合,最终生成具有特定属性和要求的目标图;图循环网络(Graph RecurrentNetwork,GRN)是最早出现的一种GNN模型。相较于其他的GNN算法,GRN通常将图数据转换为序列,在训练的过程中序列会不断地递归演进和变化;注意力机制可以让一个神经网络只关注任务学习所需要的信息,它能够选择特定的输入。在GNN中引入注意力机制可以让神经网络关注对任务更加相关的节点和边,提升训练的有效性和测试的精度,由此形成图注意力网络(Graph Attention Network,GAT)。
具体地,在步骤160中,以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量。接着,以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量。这里,以电力知识提问语义理解特征向量作为查询特征向量,计算其与电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量,是为了将电力知识提问和电网知识图谱之间建立联系,从而实现问题分类和回答。
在电力知识智能问答***中,用户提出的问题需要通过分类模型进行分类,以确定问题类型和所需的回答信息。因此,需要将查询文本转化为计算机可处理的形式,并与电网知识图谱之间进行匹配和比较,以找到最佳的问题分类和答案。具体来说,将电力知识提问语义理解特征向量作为查询特征向量,可以将问题文本表示成一个多维向量。这个向量包含了问题文本的重要信息和语义特征,可以用于后续的问题分类和回答。而电网语义知识图谱特征矩阵则表示了知识图谱中各个实体的向量表示,可以用于知识匹配和分类任务。
通过计算查询特征向量与电网语义知识图谱特征矩阵之间的点积或余弦相似度等指标,就可以得到一个分类特征向量。这个向量可以表示当前问题与电网知识图谱中相应实体之间的相关性和匹配程度,从而确定最佳的问题分类和答案。
具体地,在步骤170中,对所述分类特征向量进行特征分布优化以得到优化分类特征向量。特别地,在本申请的技术方案中,以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量时,本质上是将所述电力知识提问语义理解特征向量所表示的问题语义信息映射到所述电网知识图谱的高维语义特征空间中,因所述电网语义知识图谱特征矩阵通过图神经网络模型生成而所述电力知识提问语义理解特征向量通过语义编码器生成,因此,所述电网语义知识图谱特征矩阵具有非欧拓扑结构,而所述电力知识提问语义理解特征向量仍在欧式空间中,因此,在将所述电力知识提问语义理解特征向量和所述电网语义知识图谱特征矩阵之间的矩阵乘积时,空间结构范式的错配会使得所述分类特征向量的局部分布受到错配,这就会导致所述分类特征向量的特征分布的不规则化,从而影响通过分类器的分类结果的精准度。
基于此,本申请的申请人对所述分类特征向量V进行流形曲面的高斯概率密度参数二次正则化,具体表示为:对所述分类特征向量进行特征分布优化以得到优化分类特征向量,包括:以如下优化公式对所述分类特征向量进行特征分布优化以得到优化分类特征向量;其中,所述优化公式为:
v′i=(μσ)vi 2+viμ+(vi-σ)μ2
其中,V表示所述分类特征向量,μ和σ是所述分类特征向量中所有位置的特征值集合的均值和标准差,vi是所述分类特征向量的第i个位置的特征值,v′i是所述优化分类特征向量的第i个位置的特征值。
具体地,为了解决所述分类特征向量V的特征集合的高维特征分布在查询特征映射的高维特征空间内的分布不规则化的问题,通过特征值针对分类器的类概率分布的高斯概率密度参数的似然性进行所述分类特征向量V的各个特征值的二次正则化,来将基于目标类概率的高斯概率密度参数的参数空间内的等距离分布进行特征值的平滑约束,以获得高维特征的流形曲面表达的原始概率密度似然函数在参数空间内的规则化重整,从而提升优化后的所述分类特征向量V′的特征分布的规则性,以提升优化后的所述分类特征向量V′通过分类器的分类准确性。
具体地,在步骤180中,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。最终,将所述分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。也就是,将所述分类特征向量输入所述分类器以通过所述分类器来确定所述电力知识提问所属的答案的序列标签。这样,基于所述电网知识图谱实现电网知识的智能问答。
图12为根据本申请实施例的电力知识语义分析方法中步骤180的子步骤的流程图,如图12所示,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签,包括:181,使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,182,将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
综上,基于本申请实施例的电力知识语义分析方法100被阐明,其构建电网物理模型图谱、电网运行数据图谱和调度语义图谱,并融合电网物理模型图谱、电网运行数据图谱和调度语义图谱以得到电网知识图谱;通过知识图谱快速处理各类结构化及非结构化文本,提取知识,并将其消纳整理,形成可推理的知识结构;以基于电网知识图谱实现电网知识的智能问答,进而减轻知识的归纳和学习成本。
在本申请的一个实施例中,图13为根据本申请实施例的电力知识语义分析***的框图。如图13所示,根据本申请实施例的电力知识语义分析***200,包括:图谱构件模块210,用于构建电网物理模型图谱、电网运行数据图谱和调度语义图谱;图谱融合模块220,用于融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱;电力知识获取模块230,用于获取电力知识提问;语义解析模块240,用于对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量;图神经网络模块250,用于将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵;向量计算模块260,用于以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量;优化模块270,用于对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及,备选答案的序列标签生成模块280,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。
在一个具体示例中,在上述电力知识语义分析***中,所述语义解析模型为包含词嵌入层的Bert模型。
在一个具体示例中,在上述电力知识语义分析***中,所述语义解析模块,包括;识别单元,用于对所述电力知识提问进行语句识别和实体识别以得到多个问题组件,其中,所述问题组件包括概念、关系和属性;词嵌入单元,用于使用所述语义解析模型的词嵌入层对所述多个问题组件进行词嵌入化以得到多个问题组件词嵌入向量:以及,上下文编码单元,用于使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量。
在一个具体示例中,在上述电力知识语义分析***中,所述上下文编码单元,包括:一维排列子单元,用于将所述多个问题组件词嵌入向量进行一维排列以得到全局词嵌入特征向量;自注意力子单元,用于计算所述全局词嵌入特征向量与所述多个问题组件词嵌入向量中各个问题组件词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;标准化子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;概率值计算子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及,加权子单元,用于分别以所述多个概率值中各个概率值作为权重对所述多个问题组件词嵌入向量中各个问题组件词嵌入向量进行加权以得到所述电力知识提问语义理解特征向量。
在一个具体示例中,在上述电力知识语义分析***中,所述优化模块,用于:以如下优化公式对所述分类特征向量进行特征分布优化以得到优化分类特征向量;其中,所述优化公式为:
v′i=(μσ)vi 2+viμ+(vi-σ)μ2
其中,V表示所述分类特征向量,μ和σ是所述分类特征向量中所有位置的特征值集合的均值和标准差,vi是所述分类特征向量的第i个位置的特征值,v′i是所述优化分类特征向量的第i个位置的特征值。
在一个具体示例中,在上述电力知识语义分析***中,所述备选答案的序列标签生成模块,包括:编码单元,用于使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及,分类结果单元,用于将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
这里,本领域技术人员可以理解,上述电力知识语义分析***中的各个单元和模块的具体功能和操作已经在上面参考图1到图12的电力知识语义分析方法的描述中得到了详细介绍,并因此,将省略其重复描述。
本申请还提供了一种计算机程序产品,所述计算机程序产品包括指令,当所述指令被执行时,以使得装置执行对应于上述方法中的操作。
在本申请的一个实施例中,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有执行上述所述方法的计算机程序。
应可以理解,本申请的实施例可提供为方法、***、或计算机程序产品。因此,可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请实施例的方法、***、和计算机程序产品的流程图和/或框图来描述的。应理解可由计算机程序指令实现流程图和/或框图中的每一流程和/或方框、以及流程图和/或框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或框图一个方框或多个方框中指定的功能的步骤。
以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。
本申请中涉及的器件、装置、设备、***的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、***。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。
还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。
提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。
最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者终端设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。
为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

Claims (10)

1.一种电力知识语义分析方法,其特征在于,包括:
构建电网物理模型图谱、电网运行数据图谱和调度语义图谱;
融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱;
获取电力知识提问;
对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量;
将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵;
以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量;
对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及
将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。
2.根据权利要求1所述的电力知识语义分析方法,其特征在于,所述语义解析模型为包含词嵌入层的Bert模型。
3.根据权利要求2所述的电力知识语义分析方法,其特征在于,对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量,包括;
对所述电力知识提问进行语句识别和实体识别以得到多个问题组件,其中,所述问题组件包括概念、关系和属性;
使用所述语义解析模型的词嵌入层对所述多个问题组件进行词嵌入化以得到多个问题组件词嵌入向量:以及
使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量。
4.根据权利要求3所述的电力知识语义分析方法,其特征在于,使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量,包括:
将所述多个问题组件词嵌入向量进行一维排列以得到全局词嵌入特征向量;
计算所述全局词嵌入特征向量与所述多个问题组件词嵌入向量中各个问题组件词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;
分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;
将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及
分别以所述多个概率值中各个概率值作为权重对所述多个问题组件词嵌入向量中各个问题组件词嵌入向量进行加权以得到所述电力知识提问语义理解特征向量。
5.根据权利要求4所述的电力知识语义分析方法,其特征在于,对所述分类特征向量进行特征分布优化以得到优化分类特征向量,包括:以如下优化公式对所述分类特征向量进行特征分布优化以得到优化分类特征向量;
其中,所述优化公式为:
v′i=(μσ)vi 2+viμ+(vi-σ)μ2
其中,V表示所述分类特征向量,μ和σ是所述分类特征向量中所有位置的特征值集合的均值和标准差,vi是所述分类特征向量的第i个位置的特征值,v′i是所述优化分类特征向量的第i个位置的特征值。
6.根据权利要求5所述的电力知识语义分析方法,其特征在于,将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签,包括:
使用所述分类器的多个全连接层对所述优化分类特征向量进行全连接编码以得到编码分类特征向量;以及
将所述编码分类特征向量通过所述分类器的Softmax分类函数以得到所述分类结果。
7.一种电力知识语义分析***,其特征在于,包括:
图谱构件模块,用于构建电网物理模型图谱、电网运行数据图谱和调度语义图谱;
图谱融合模块,用于融合所述电网物理模型图谱、所述电网运行数据图谱和所述调度语义图谱以得到电网知识图谱;
电力知识获取模块,用于获取电力知识提问;
语义解析模块,用于对所述电力知识提问进行语句识别和实体识别后,输入语义解析模型以得到电力知识提问语义理解特征向量;
图神经网络模块,用于将所述电网知识图谱通过图神经网络模型以得到电网语义知识图谱特征矩阵;
向量计算模块,用于以所述电力知识提问语义理解特征向量作为查询特征向量,计算其与所述电网语义知识图谱特征矩阵之间的乘积以得到分类特征向量;
优化模块,用于对所述分类特征向量进行特征分布优化以得到优化分类特征向量;以及
备选答案的序列标签生成模块,用于将所述优化分类特征向量通过分类器以得到分类结果,所述分类结果用于表示备选答案的序列标签。
8.根据权利要求7所述的电力知识语义分析***,其特征在于,所述语义解析模型为包含词嵌入层的Bert模型。
9.根据权利要求8所述的电力知识语义分析***,其特征在于,所述语义解析模块,包括;
识别单元,用于对所述电力知识提问进行语句识别和实体识别以得到多个问题组件,其中,所述问题组件包括概念、关系和属性;
词嵌入单元,用于使用所述语义解析模型的词嵌入层对所述多个问题组件进行词嵌入化以得到多个问题组件词嵌入向量:以及
上下文编码单元,用于使用所述语义解析模型的Bert模型对所述多个问题组件词嵌入向量进行上下文语义编码以得到所述电力知识提问语义理解特征向量。
10.根据权利要求9所述的电力知识语义分析***,其特征在于,所述上下文编码单元,包括:
一维排列子单元,用于将所述多个问题组件词嵌入向量进行一维排列以得到全局词嵌入特征向量;
自注意力子单元,用于计算所述全局词嵌入特征向量与所述多个问题组件词嵌入向量中各个问题组件词嵌入向量的转置向量之间的乘积以得到多个自注意力关联矩阵;
标准化子单元,用于分别对所述多个自注意力关联矩阵中各个自注意力关联矩阵进行标准化处理以得到多个标准化后自注意力关联矩阵;
概率值计算子单元,用于将所述多个标准化后自注意力关联矩阵中各个标准化后自注意力关联矩阵通过Softmax分类函数以得到多个概率值;以及
加权子单元,用于分别以所述多个概率值中各个概率值作为权重对所述多个问题组件词嵌入向量中各个问题组件词嵌入向量进行加权以得到所述电力知识提问语义理解特征向量。
CN202310623950.9A 2023-05-29 2023-05-29 电力知识语义分析***及其方法 Pending CN116662504A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310623950.9A CN116662504A (zh) 2023-05-29 2023-05-29 电力知识语义分析***及其方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310623950.9A CN116662504A (zh) 2023-05-29 2023-05-29 电力知识语义分析***及其方法

Publications (1)

Publication Number Publication Date
CN116662504A true CN116662504A (zh) 2023-08-29

Family

ID=87714728

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310623950.9A Pending CN116662504A (zh) 2023-05-29 2023-05-29 电力知识语义分析***及其方法

Country Status (1)

Country Link
CN (1) CN116662504A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116593890A (zh) * 2023-05-18 2023-08-15 湖州越球电机有限公司 永磁同步电机转子及其成型检测方法
CN117235281A (zh) * 2023-09-22 2023-12-15 武汉贝塔世纪科技有限公司 基于知识图谱技术的多元数据管理方法及***
CN118296604A (zh) * 2024-06-06 2024-07-05 徐州医科大学 一种基于数字孪生技术的计算机***多层风险监测方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116593890A (zh) * 2023-05-18 2023-08-15 湖州越球电机有限公司 永磁同步电机转子及其成型检测方法
CN116593890B (zh) * 2023-05-18 2023-10-20 湖州越球电机有限公司 永磁同步电机转子及其成型检测方法
CN117235281A (zh) * 2023-09-22 2023-12-15 武汉贝塔世纪科技有限公司 基于知识图谱技术的多元数据管理方法及***
CN118296604A (zh) * 2024-06-06 2024-07-05 徐州医科大学 一种基于数字孪生技术的计算机***多层风险监测方法

Similar Documents

Publication Publication Date Title
Liao et al. Fault diagnosis of power transformers using graph convolutional network
CN116662504A (zh) 电力知识语义分析***及其方法
CN116245033B (zh) 人工智能驱动的电力***分析方法及智能软件平台
CN114138759B (zh) 基于知识图谱推理的二次设备故障处理推送方法及***
Deng et al. Research on event logic knowledge graph construction method of robot transmission system fault diagnosis
CN114661905A (zh) 一种基于bert的电网故障诊断方法
CN115563968A (zh) 水电运检知识自然语言人工智能***及方法
CN116523042A (zh) 一种电网调度实体关系联合抽取方法及***
CN115730085A (zh) 电网调度自动化***设备状态评估模型构建方法及***
CN115409122A (zh) 一种变电设备并发故障分析方法、***、设备及介质
Zheng et al. [Retracted] Application Based on Artificial Intelligence in Substation Operation and Maintenance Management
CN115129842A (zh) 一种用于户外变电站的智能问答方法及置于户外的机器人
Xinjie et al. A Construction Method for the Knowledge Graph of Power Grid Supervision Business
Li et al. Power grid fault detection method based on cloud platform and improved isolated forest
Chong et al. Description for Smart Grid: Towards the Ontological Approach
Gao et al. GridOnto: knowledge representation and extraction for fault events in power grid
Liu et al. Semantic repeatability screening mechanism of intelligent learning platform based on Bi-LSTM
Yan et al. Construction of Dynamic Knowledge Graph for Grid day-ahead Scheduling Optimization Decision
Yin et al. Multi-kernel support vector classifier for fault diagnosis of transformers
Xuan et al. Distribution network risk prediction based on status assessment and semi-invariant method
Gu et al. Research on the Knowledge Graph Construction Technology and its Power Grid Applications
Pi et al. Construction and application of knowledge graph for intelligent decision-making of power grid fault handling
Liao et al. Analysis of New Distribution Network Planning Using Artificial Intelligence Semantic Recognition
Zhang et al. Construction and application of aerospace quality knowledge graph
Cai et al. Research on construction method and application of knowledge graph for power transformer intelligent operation and maintenance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination