CN111046191A - 一种电力领域语义增强方法和装置 - Google Patents

一种电力领域语义增强方法和装置 Download PDF

Info

Publication number
CN111046191A
CN111046191A CN201911354481.5A CN201911354481A CN111046191A CN 111046191 A CN111046191 A CN 111046191A CN 201911354481 A CN201911354481 A CN 201911354481A CN 111046191 A CN111046191 A CN 111046191A
Authority
CN
China
Prior art keywords
knowledge
constant
acquiring
logic network
power
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201911354481.5A
Other languages
English (en)
Other versions
CN111046191B (zh
Inventor
嵇友浪
邹云峰
俞阳
章劲秋
姚奥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nanjing Yunwen Network Technology Co ltd
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Original Assignee
Nanjing Yunwen Network Technology Co ltd
Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nanjing Yunwen Network Technology Co ltd, Electric Power Research Institute of State Grid Jiangsu Electric Power Co Ltd filed Critical Nanjing Yunwen Network Technology Co ltd
Priority to CN201911354481.5A priority Critical patent/CN111046191B/zh
Publication of CN111046191A publication Critical patent/CN111046191A/zh
Application granted granted Critical
Publication of CN111046191B publication Critical patent/CN111046191B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Optimization (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Artificial Intelligence (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种电力领域语义增强方法和装置,所述方法包括获取一阶逻辑规则库,并将所述一阶逻辑规则库变成从句形式,形成从句集合;所述一阶逻辑规则库是基于电力客服领域的相关业务规则数据集生成;基于训练数据集,借助电力知识图谱和实体识别技术获取到电力领域所有的常量及常量知识;基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重;将获取到的电力领域文本通过电力知识图谱和实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识,最终获取到隐含在电力知识图谱的潜在知识。本发明能够有效地将多源知识进行融合,精确地解答用户问句,提高电力智能问答的进度。

Description

一种电力领域语义增强方法和装置
技术领域
本发明属于电力信息处理技术领域,具体涉及一种电力领域语义增强方法和装置。
背景技术
提高推理类问题的回答能力是提升电力客服智能问题回答正确率和准确率的关键,为此,需要找出那些隐藏或隐含在知识图谱中的知识来充实知识图谱,以满足回答推理类问题中对知识的需求。这些知识主要包括领域实体间的上下位、部分与整体、等价等关系下隐藏的知识。在电力知识领域范围内存在大量知识推理与知识蕴含场景。因此找出电力客服领域知识图谱中隐藏和隐含的知识,以应对推理类问题的问答是研究的关键和难点之一。
发明内容
针对上述问题,本发明提出一种电力领域语义增强方法和装置,不仅能够提高电力营销知识图谱的深度,同时降低人工维护图谱带来的相关成本。
为了实现上述技术目的,达到上述技术效果,本发明通过以下技术方案实现:
第一方面,本发明提供了一种电力领域语义增强方法,包括:
获取一阶逻辑规则库,并将所述一阶逻辑规则库变成从句形式,形成从句集合;所述一阶逻辑规则库是基于电力客服领域的相关业务规则数据集生成;
基于训练数据集,借助电力知识图谱和实体识别技术获取到电力领域所有的常量及常量知识;
基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重;
将获取到的电力领域文本通过电力知识图谱和实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识,最终获取到隐含在电力知识图谱的潜在知识。
可选地,所述常量为实体;所述常量知识为实体间的关系。
可选地,所述基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重,包括以下步骤:
基于所述从句集合和常量生成马尔可夫逻辑网络;
基于所述常量知识学习马尔可夫逻辑网络的权重。
可选地,在马尔可夫逻辑网络中,状态xi的概率为:
P(x)=(1/Z)exp(∑iwifi(x))
其中,状态x是马尔可夫逻辑网络结点下的一组取值,Z为归一化因子;wi为第i条知识的权重,fi(x)为状态x在第i条知识下的特征,如果状态x第i条知识下为真,则fi(x)=1,否则fi(x)=0;
所述权重的学习公式为:
Figure BDA0002335522840000021
其中,
Figure BDA0002335522840000022
是权重wi的导数,X为所有状态x的集合,ni(X)是指在第i条知识下X中为真的数量,x′是指X中的每一个状态,Pw(x′)是指用当前权重w计算的P(x′)。
第二方面,本发明提供了一种电力领域语义增强装置,包括:
获取单元,用于获取一阶逻辑规则库,并将所述一阶逻辑规则库变成从句形式,形成从句集合;所述一阶逻辑规则库是基于电力客服领域的相关业务规则数据集生成;
第一计算单元,用于基于训练数据集,借助电力知识图谱和实体识别技术获取到电力领域所有的常量及常量知识;
第二计算单元,用于基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重;
推理单元,用于将获取到的电力领域文本通过电力知识图谱和实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识,最终获取到隐含在电力知识图谱的潜在知识。
可选地,所述常量为实体;所述常量知识为实体间的关系。
可选地,所述基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重,包括以下步骤:
基于所述从句集合和常量生成马尔可夫逻辑网络;
基于所述常量知识学习马尔可夫逻辑网络的权重。
可选地,在马尔可夫逻辑网络中,状态xi的概率为:
P(x)=(1/Z)exp(∑iwifi(x))
其中,状态x是马尔可夫逻辑网络结点下的一组取值,Z为归一化因子;wi为第i条知识的权重,fi(x)为状态x在第i条知识下的特征,如果状态x第i条知识下为真,则fi(x)=1,否则fi(x)=0;
所述权重的学习公式为:
Figure BDA0002335522840000023
其中,
Figure BDA0002335522840000024
是权重wi的导数,X为所有状态x的集合,ni(X)是指在第i条知识下X中为真的数量,x′是指X中的每一个状态,Pw(x′)是指用当前权重w计算的P(x′)。
与现有技术相比,本发明的有益效果:
本发明重点解决推理蕴含类知识,对业务逻辑明晰、知识点潜在关系符合相关应用场景描述的数据有效整合成图谱可构建的知识,提高电力营销知识图谱的深度,同时降低人工维护图谱带来的相关成本。
附图说明
为了使本发明的内容更容易被清楚地理解,下面根据具体实施例并结合附图,对本发明作进一步详细的说明,其中:
图1为本发明一种实施例的电力领域语义增强方法的流程示意图;
图2为本发明一种实施例的马尔可夫逻辑网络示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明的保护范围。
下面结合附图对本发明的应用原理作详细的描述。
实施例1
本发明实施例中提供了一种电力领域语义增强方法,如图1所示,具体包括以下步骤:
(1)获取一阶逻辑规则库,并将所述一阶逻辑规则库变成从句形式,形成从句集合(也即子句集合形式);所述一阶逻辑规则库是基于电力客服领域的相关业务规则数据集生成;
(2)基于训练数据集,借助电力知识图谱和实体识别技术获取到电力领域所有的常量及常量知识;所述常量为实体;所述常量知识为实体间的关系;
(3)基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重;
(4)将获取到的电力领域文本通过电力知识图谱和实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识,最终获取到隐含在电力知识图谱的潜在知识。
在本发明实施例的一种具体实施方式中,所述步骤(1)具体为:
根据电力客服领域的业务规则库中相关业务规则数据集,生成一阶逻辑规则库,再把一阶逻辑规则库变为从句形式。所述的规则数据集是指电力领域描述电力业务及其基础知识的文本。比如“电表箱受到影响会导致错误告警”就是业务规则库里的一条规则。为了构建马尔可夫逻辑网络,需要将这些规则转化为一阶逻辑规则及其从句形式,注意:从句形式只是一阶逻辑规则的一种表现形式,它们是等价的。表1列举了两条业务规则及其一阶逻辑形式。
表1
Figure BDA0002335522840000041
在本发明实施例的一种具体实施方式中,所述基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重,包括以下步骤:
基于所述从句集合和常量生成马尔可夫逻辑网络;
基于所述常量知识学习马尔可夫逻辑网络的权重。
可选地,在马尔可夫逻辑网络中,状态xi的概率为:
P(x)=(1/Z)exp(∑iwifi(x))
其中,状态x是马尔可夫逻辑网络结点下的一组取值,Z为归一化因子;wi为第i条知识的权重,fi(x)为状态x在第i条知识下的特征,如果状态x第i条知识下为真,则fi(x)=1,否则fi(x)=0;
所述权重的学习公式为:
Figure BDA0002335522840000042
其中,
Figure BDA0002335522840000043
是权重wi的导数,X为所有状态x的集合,ni(X)是指在第i条知识下X中为真的数量,x′是指X中的每一个状态,Pw(x′)是指用当前权重w计算的P(x′)。
在本发明实施例的一种具体实施方式中,所述步骤(4)具体为:
将电力领域文本(比如用户问题)通过知识图谱是实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识。通过该步骤就可以获取到大量的隐含在电力知识图谱的潜在知识。比如已知规则F2成立,那么规则F1成立的概率是多少,其计算公式为:
Figure BDA0002335522840000051
其中XF2是指F2规则下成立的状态集合,x∈XF1∩XF2是在两个规则下都成立的状态集合,P(x)可由公式1计算,如果F1成立的概率很大,那么就相当于发现了一条正确的规则,即知识。
举个例子,假设有两个设备A和B,那么根据表1的两条逻辑规则构建的马尔可夫逻辑网络如下图2所示。假设F2规则成立,那么图2中的三个节点可能取值分别是111,100,010,001,011,000共六种可能,那么就可以根据公式计算F1规则成立的概率,显然大部分数据情况下只要电力设备收到了影响,必然会错误告警,因此F1规则成立的概率会很大,即规则F1是成立的。
实施例2
基于与实施例1相同的发明构思,本发明实施例中提供了一种电力领域语义增强装置,包括:
获取单元,用于获取一阶逻辑规则库,并将所述一阶逻辑规则库变成从句形式,形成从句集合;所述一阶逻辑规则库是基于电力客服领域的相关业务规则数据集生成;
第一计算单元,用于基于训练数据集,借助电力知识图谱和实体识别技术获取到电力领域所有的常量及常量知识;
第二计算单元,用于基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重;
推理单元,用于将获取到的电力领域文本通过电力知识图谱和实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识,最终获取到隐含在电力知识图谱的潜在知识。
可选地,所述常量为实体;所述常量知识为实体间的关系。
可选地,所述基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重,包括以下步骤:
基于所述从句集合和常量生成马尔可夫逻辑网络;
基于所述常量知识学习马尔可夫逻辑网络的权重。
可选地,在马尔可夫逻辑网络中,状态xi的概率为:
P(x)=(1/Z)exp(∑iwifi(x))
其中,状态x是马尔可夫逻辑网络结点下的一组取值,Z为归一化因子;wi为第i条知识的权重,fi(x)为状态x在第i条知识下的特征,如果状态x第i条知识下为真,则fi(x)=1,否则fi(x)=0;
所述权重的学习公式为:
Figure BDA0002335522840000061
其中,
Figure BDA0002335522840000062
是权重wi的导数,X为所有状态x的集合,ni(X)是指在第i条知识下X中为真的数量,x′是指X中的每一个状态,Pw(x′)是指用当前权重w计算的P(x′)。
其余部分均与实施例1相同。
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内。本发明要求保护范围由所附的权利要求书及其等效物界定。

Claims (8)

1.一种电力领域语义增强方法,其特征在于,包括:
获取一阶逻辑规则库,并将所述一阶逻辑规则库变成从句形式,形成从句集合;所述一阶逻辑规则库是基于电力客服领域的相关业务规则数据集生成;
基于训练数据集,借助电力知识图谱和实体识别技术获取到电力领域所有的常量及常量知识;
基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重;
将获取到的电力领域文本通过电力知识图谱和实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识,最终获取到隐含在电力知识图谱的潜在知识。
2.根据权利要求1所述的一种电力领域语义增强方法,其特征在于:所述常量为实体;所述常量知识为实体间的关系。
3.根据权利要求1所述的一种电力领域语义增强方法,其特征在于,所述基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重,包括以下步骤:
基于所述从句集合和常量生成马尔可夫逻辑网络;
基于所述常量知识学习马尔可夫逻辑网络的权重。
4.根据权利要求3所述的一种电力领域语义增强方法,其特征在于:
在马尔可夫逻辑网络中,状态xi的概率为:
P(x)=(1/Z)exp(∑iwifi(x))
其中,状态x是马尔可夫逻辑网络结点下的一组取值,Z为归一化因子;wi为第i条知识的权重,fi(x)为状态x在第i条知识下的特征,如果状态x第i条知识下为真,则fi(x)=1,否则fi(x)=0;
所述权重的学习公式为:
Figure FDA0002335522830000011
其中,
Figure FDA0002335522830000012
是权重wi的导数,X为所有状态x的集合,ni(X)是指在第i条知识下X中为真的数量,x′是指X中的每一个状态,Pw(x′)是指用当前权重w计算的P(x′)。
5.一种电力领域语义增强装置,其特征在于,包括:
获取单元,用于获取一阶逻辑规则库,并将所述一阶逻辑规则库变成从句形式,形成从句集合;所述一阶逻辑规则库是基于电力客服领域的相关业务规则数据集生成;
第一计算单元,用于基于训练数据集,借助电力知识图谱和实体识别技术获取到电力领域所有的常量及常量知识;
第二计算单元,用于基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重;
推理单元,用于将获取到的电力领域文本通过电力知识图谱和实体识别技术获取到知识,然后通过马尔可夫逻辑网络权重推理得到一条新的知识,最终获取到隐含在电力知识图谱的潜在知识。
6.根据权利要求5所述的一种电力领域语义增强装置,其特征在于,所述常量为实体;所述常量知识为实体间的关系。
7.根据权利要求5所述的一种电力领域语义增强装置,其特征在于,所述基于所述从句集合、常量及常量知识,生成马尔可夫逻辑网络并学习权重,包括以下步骤:
基于所述从句集合和常量生成马尔可夫逻辑网络;
基于所述常量知识学习马尔可夫逻辑网络的权重。
8.根据权利要求5所述的一种电力领域语义增强装置,其特征在于:
在马尔可夫逻辑网络中,状态xi的概率为:
P(x)=(1/Z)exp(∑iwifi(x))
其中,状态x是马尔可夫逻辑网络结点下的一组取值,Z为归一化因子;wi为第i条知识的权重,fi(x)为状态x在第i条知识下的特征,如果状态x第i条知识下为真,则fi(x)=1,否则fi(x)=0;
所述权重的学习公式为:
Figure FDA0002335522830000021
其中,
Figure FDA0002335522830000022
是权重wi的导数,X为所有状态x的集合,ni(X)是指在第i条知识下X中为真的数量,x′是指X中的每一个状态,Pw(x′)是指用当前权重w计算的P(x′)。
CN201911354481.5A 2019-12-25 2019-12-25 一种电力领域语义增强方法和装置 Active CN111046191B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911354481.5A CN111046191B (zh) 2019-12-25 2019-12-25 一种电力领域语义增强方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911354481.5A CN111046191B (zh) 2019-12-25 2019-12-25 一种电力领域语义增强方法和装置

Publications (2)

Publication Number Publication Date
CN111046191A true CN111046191A (zh) 2020-04-21
CN111046191B CN111046191B (zh) 2022-11-01

Family

ID=70239673

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911354481.5A Active CN111046191B (zh) 2019-12-25 2019-12-25 一种电力领域语义增强方法和装置

Country Status (1)

Country Link
CN (1) CN111046191B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114925190A (zh) * 2022-05-30 2022-08-19 南瑞集团有限公司 一种基于规则推理与gru神经网络推理的混合推理方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902165A (zh) * 2019-03-08 2019-06-18 中国科学院自动化研究所 基于马尔科夫逻辑网的智能交互式问答方法、***、装置
CN110334212A (zh) * 2019-07-01 2019-10-15 南京审计大学 一种基于机器学习的领域性审计知识图谱构建方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109902165A (zh) * 2019-03-08 2019-06-18 中国科学院自动化研究所 基于马尔科夫逻辑网的智能交互式问答方法、***、装置
CN110334212A (zh) * 2019-07-01 2019-10-15 南京审计大学 一种基于机器学习的领域性审计知识图谱构建方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114925190A (zh) * 2022-05-30 2022-08-19 南瑞集团有限公司 一种基于规则推理与gru神经网络推理的混合推理方法
CN114925190B (zh) * 2022-05-30 2023-08-04 南瑞集团有限公司 一种基于规则推理与gru神经网络推理的混合推理方法

Also Published As

Publication number Publication date
CN111046191B (zh) 2022-11-01

Similar Documents

Publication Publication Date Title
CN112100383B (zh) 一种面向多任务语言模型的元-知识微调方法及平台
CN114064918B (zh) 一种多模态事件知识图谱构建方法
CN110705301B (zh) 实体关系抽取方法及装置、存储介质、电子设备
CN110674840B (zh) 一种多方证据关联模型构建方法和证据链提取方法及装置
CN109271537B (zh) 一种基于蒸馏学习的文本到图像生成方法和***
Ferreira et al. Towards automatic content analysis of social presence in transcripts of online discussions
CN111967761B (zh) 一种基于知识图谱的监控预警方法、装置及电子设备
CN115858758A (zh) 一种多非结构化数据识别的智慧客服知识图谱***
CN111159409B (zh) 基于人工智能的文本分类方法、装置、设备、介质
CN116795973A (zh) 基于人工智能的文本处理方法及装置、电子设备、介质
CN109582761A (zh) 一种基于网络平台的词语相似度的中文智能问答***方法
CN113593661A (zh) 临床术语标准化方法、装置、电子设备及存储介质
CN106649662A (zh) 一种领域词典的构建方法
CN117520491A (zh) 一种基于大语言模型的智能问答方法与装置
Chen et al. Label distribution‐based noise correction for multiclass crowdsourcing
CN117520522B (zh) 一种基于rpa和ai结合的智能对话方法、装置及电子设备
CN111046191B (zh) 一种电力领域语义增强方法和装置
CN116561288B (zh) 事件查询方法、装置、计算机设备、存储介质及程序产品
CN113239143A (zh) 融合电网故障案例库的输变电设备故障处理方法及***
Briciu et al. AutoAt: A deep autoencoder-based classification model for supervised authorship attribution
CN113792544B (zh) 顾及地理空间分布的文本情感分类方法及装置
CN110377845B (zh) 基于区间半监督lda的协同过滤推荐方法
CN113010658A (zh) 一种智能问答知识库构建方法、***、终端以及存储介质
CN112905747A (zh) 一种基于语义分析技术的专业制度档案问答机器人***
CN113010670B (zh) 账号信息聚类方法、检测方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant