CN114328819A - 一种基于知识图谱的电力安全生产隐患预控方法 - Google Patents
一种基于知识图谱的电力安全生产隐患预控方法 Download PDFInfo
- Publication number
- CN114328819A CN114328819A CN202111452265.1A CN202111452265A CN114328819A CN 114328819 A CN114328819 A CN 114328819A CN 202111452265 A CN202111452265 A CN 202111452265A CN 114328819 A CN114328819 A CN 114328819A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- safety
- production
- hidden danger
- knowledge graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004519 manufacturing process Methods 0.000 title claims abstract description 68
- 238000000034 method Methods 0.000 title claims abstract description 38
- 238000012549 training Methods 0.000 claims abstract description 26
- 238000000605 extraction Methods 0.000 claims abstract description 23
- 238000004458 analytical method Methods 0.000 claims abstract description 22
- 238000007781 pre-processing Methods 0.000 claims abstract description 17
- 238000005516 engineering process Methods 0.000 claims abstract description 10
- 238000013135 deep learning Methods 0.000 claims abstract description 8
- 230000008569 process Effects 0.000 claims abstract description 7
- 230000006399 behavior Effects 0.000 claims description 12
- 230000011218 segmentation Effects 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 8
- 230000004913 activation Effects 0.000 claims description 6
- 238000013527 convolutional neural network Methods 0.000 claims description 6
- 238000013136 deep learning model Methods 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 6
- 230000003595 spectral effect Effects 0.000 claims description 6
- 238000001228 spectrum Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000012795 verification Methods 0.000 claims description 6
- 238000010276 construction Methods 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 4
- 230000018109 developmental process Effects 0.000 claims description 4
- 238000011160 research Methods 0.000 claims description 4
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 3
- 230000002457 bidirectional effect Effects 0.000 claims description 3
- 238000002372 labelling Methods 0.000 claims description 3
- 230000009466 transformation Effects 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims 1
- 230000002265 prevention Effects 0.000 abstract description 2
- 230000034994 death Effects 0.000 description 4
- 231100000517 death Toxicity 0.000 description 4
- 238000010586 diagram Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000004927 fusion Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 238000010248 power generation Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000004451 qualitative analysis Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
一种基于知识图谱的电力安全生产隐患预控方法,其步骤是:采用自然语言预处理技术提取相关的电力生产安全隐患知识样本集,利用特征提取算法对信息进行预处理;构建基于知识图谱的电力生产安全知识模型;将生成的事故安全隐患和安全信息记录关系知识库存储到Elasticsearch数据库中;通过深度学习技术对不断输入的处理完毕的电力生产安全信息候选集进行训练,用训练好的模型得到知识推理网络链,将得出的训练结果集放入电力生产安全记录知识库中进行逐一匹配,并进行知识推理分析,得出分析结果。本发明可提升安全隐患信息管理效率,实现隐患事件的预控和防治,保证在生产作业过程中的人身安全,避免生产安全事故发生。
Description
技术领域
本发明涉及一种基于知识图谱的电力安全生产隐患预控方法。
背景技术
电力企业生产的高风险、无序复杂以及信息量较大等特点,使它成为安全事故发生率较高的行业。虽然电力行业相关法规及安全规范对预防事故有着积极的作用,但电力安全事故却时有发生。2018年,国家能源局发布了《2017年全国电力安全事故通报》,据事故原因统计:违反操作规程造成32起40人死亡,安全装置缺少造成6起6人死亡,设备设施有缺陷造成4起5人死亡,劳动组织不合理造成4起4人死亡,违反操作规程和安全装置缺少是导致事故多发的主要原因,分别占到事故总起数的60%和11%。目前电力生产监管多以三评档案、安全隐患整改率、安规调考、作业评价等文本形式开展,缺乏对电力生产中存在的安全隐患问题的定性分析和可视化分析研究。在电力生产中存在的以下三方面问题:
1.电力行业相关法规及安全规范之间本文格式不同,且原始本文信息不能直接用以处理分析,急需开展电力生产安全相关本文信息融合清洗的预处理方法。由于电网资源数据存在大量半结构化和非结构化数据,多以中文文本数据为主,而文本语言中存在许多标点、连接词等无用信息词汇,因此需要对文本数据进行预处理,提取关键信息词汇。目前专业分类有13种左右,需要人为根据“事故隐患内容”确定专业分类。同时由于各种管理规程多样,需要根据隐患的现实内容,人工查找和确定该隐患违反了哪个规程,中哪条具体规定。并且要根据《国家电网公司安全事故调查规定》等文件确定事件的伤害程度。
2.企业针对各类故障的应急预案不够完善,大部分隐患的排除依然依靠经验,缺少***化、标准化的应急预案措施。且各类生产监管信息文本繁杂多样,一旦发生电力安全问题,逐一层层排查问题根源不但浪费时间而且最大程度浪费了人力物力,并且造成巨大的经济损失。因此,对各类安全隐患数据进行分析建立知识关系网络,可以明晰安全信息之间的关联性。
3.发现电力生产隐患发生后,尚缺乏完整的快速隐患预控机制,以指导操作人员更高效的整改存在的问题。企业正常运行过程中,不能及时对可能出现的隐患进行预警,且隐患整改缺乏智能化管理,导致隐患不能及时全面的排除。没有充分将各种信息综合,对企业安全生产态势及风险进行评估与预测,做到对隐患故障快速预警响应。
发明内容
本发明的目的是解决现有技术存在的上述问题,提供一种基于知识图谱的电力安全生产隐患预控方法。
本发明的技术解决方案是:一种基于知识图谱的电力安全生产隐患预控方法,其步骤是:
步骤1、首先采用自然语言预处理技术提取相关的电力生产安全隐患知识样本集,对于采取的样本集进行词素切分,利用特征提取算法对信息进行预处理。
步骤2、构建基于知识图谱的电力生产安全知识模型
首先,根据电力安全生产预处理信息本文,对电力生产操作人员的人因和操作隐患进行分析,用双向长短记忆网络(用Deepdive方法)生成满足实体-关系-实体的三元组,将实体-关系抽取分成两个模块,先抽取头实体,后联合抽取尾实体-关系;
其次,组成候选关系实体对集,采用弱监督的方法对候选关系实体对集中的多个候选关系实体对进行学习和标注,生成候选关系实体,建立关系实体对,形成知识连接网络;
最后,根据生成网络关系建立事故安全隐患和安全信息记录关系知识库。
步骤3、将生成的事故安全隐患和安全信息记录关系知识库存储到Elasticsearch数据库中,通过将数据提交到Elasticsearch数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户。
步骤4、通过深度学习技术对不断输入的处理完毕的电力生产安全信息候选集进行训练,用训练好的模型得到知识推理网络链,将得出的训练结果集放入电力生产安全记录知识库中进行逐一匹配,并进行知识推理分析,得出分析结果。
进一步,步骤4进行知识推理分析时,利用关键词贡献分析构建研究主题的关联图谱,图谱显示违规行为、不安全行为在图谱中占有核心位置,通过高频关键词共现揭示电力生产安全隐患和安全事故发展脉络。
进一步地,步骤1中采用基于爬虫的方法对电力安全生产数据进行文本特征提取,具体过程是:首先寻找与电力生产安全信息相关的目标网站并分析其结构,所述目标网站为含有电力生产监管中的三评档案、安全隐患整改率、安规调考、作业评价相关信息的网站,然后编写爬虫进行网站内容爬取,解析爬取到的数据,利用小波多窗谱特征提取算法对信息文本得实体、关系、属性进行提取预处理。
进一步,所述小波多窗谱特征提取算法流程如下,首先构建小波函数,得到智能数据库的特征双曲调频母小波定义为:
通过小波多窗谱特征提取,得到小波函数Xθ(t)的宽带模型为:
双曲调频小波的多普勒容限为:
得到小波多窗谱特征出现的概率权重为:
wij=β×w(ep kq)(β>1)
最后实现对同类信息关键词的合并及分类,降低后续分析数据干扰,为后续知识图谱构建提供基础。
进一步,爬虫编辑时利用爬虫调节器获取价值数据,所述爬虫调节器是由URL管理器、网页下载器和页面分析器组成。
进一步,所述知识图谱包括隐患、人身安全隐患和电力安全隐患。
进一步,步骤2中抽取头实体的公式是:
抽取尾实体-关系的公式是:
进一步,步骤3中通过深度学习训练数据,将数据集切分为训练集、验证集和测试集,训练集用以训练深度学习模型;验证集用以评估模型结果,进而辅助模型调参;测试集用于模型的预测,通过准确率、精确率、召回率、F1Score和ROC曲线对模型进行评估,所述深度学习模型是:
Input:Values of x over a mini-batch:B={x1...m};
Parameters to be learned:γ,β
Output:{yi=BNγ,β(xi)}
进一步,使用BM25算法进行Elasticsearch数据库搜索相关性评分,公式如下:
上式中wi表示qi的权重,R(qi,d)为qi和d的相关性,Score(Q,d)就是每个语素qi和d的相关性的加权和。
进一步,步骤3中通过卷积神经网络进行训练,卷积神经网络的公式如下:
(1)仿射变换:
(2)激活前:
(3)激活后:
训练后得到知识推理网络链。
进一步,步骤4中知识推理分析时最终做出决策判断行为或目标是否构成隐患,如构成隐患则找到与隐患相关的因素。
本发明的有益效果是:针对电力企业生产的高风险、无序复杂以及信息量较大等安全隐患进行深入分析,从可能出现的技术安全隐患、电力生产监管角度出发,首先采用自然语言预处理技术提取相关的电力生产安全隐患知识样本集,对于采取的样本集进行词素切分,利用特征提取算法对信息进行预处理。其次,采用知识图谱构建方法对重要信息进行安全隐患分析,组成候选关系实体对集,采用弱监督的方法对候选关系实体进行学习和标注,形成知识连接网络,根据生成网络关系构建知识库。最后,通过深度学习技术进行训练,得到知识推理网络链,找到与隐患相关的因素,并进行知识推理,实现通过高频关键词共现揭示电力生产安全隐患和安全事故发展脉络。能够挖掘数据的隐性信息,并整合大量电力安全生产相关文本内容得到可视化信息,通过知识图谱的可视化展示把复杂的信息非常直观的呈现出来,从多个方面对安全隐患信息的整体关联情况可以一目了然。使安全管理者根据潜在安全事故快速掌握内部与之关联的各类风险隐患。其主要解决针对电力企业生产环节众多、风险较高、操作复杂、信息量大,尤其是电力生产安全管理中难以快速、全面、准确对企业安全隐患进行综合分析的问题,建立适用于电力安全隐患数据的知识推理模型,挖掘隐患关联因素并推理隐患演化过程,发现安全隐患发生的规律性和周期性,提升安全隐患信息管理效率,实现隐患事件的预控和防治,保证在生产作业过程中的人身安全,避免生产安全事故发生。
附图说明
图1是本发明的爬虫示意图;
图2是本发明实施例知识图谱结构示意图;
图3是本发明的Elasticsearch数据库结构示意图;
图4是本发明的深度学习过程示意图;
图5是本发明的流程图。
具体实施方式
下面结合附图和实施例对本发明进行详细说明:
一种基于知识图谱的电力安全生产隐患预控方法,其步骤是:
步骤1、多元异构数据融合文本特征提取
首先采用自然语言预处理技术提取相关的电力生产安全隐患知识样本集,对于采取的样本集进行词素切分,利用特征提取算法对信息进行预处理;
采用基于爬虫的方法对电力安全生产数据进行文本特征提取,具体过程是:首先寻找与电力生产安全信息相关的目标网站并分析其结构,所述目标网站为含有电力生产监管中的三评档案、安全隐患整改率、安规调考、作业评价相关信息的网站,然后编写爬虫进行网站内容爬取,爬虫编辑时利用爬虫调节器获取价值数据,所述爬虫调节器是由URL管理器、网页下载器和页面分析器组成,如图1所示。解析爬取到的数据,利用小波多窗谱特征提取算法对信息文本得实体、关系、属性进行提取预处理。
所述小波多窗谱特征提取算法流程如下,首先构建小波函数,得到智能数据库的特征双曲调频母小波定义为:
通过小波多窗谱特征提取,得到小波函数Xθ(t)的宽带模型为:
双曲调频小波的多普勒容限为:
得到小波多窗谱特征出现的概率权重为:
wij=β×u(ep kq)(β>1)
最后实现对同类信息关键词的合并及分类,降低后续分析数据干扰,为后续知识图谱构建提供基础。
步骤2、构建基于知识图谱的电力生产安全知识模型
首先根据电力安全生产预处理信息本文,对电力生产操作人员的人因和操作隐患进行分析,用双向长短记忆网络生成满足实体-关系-实体的三元组,构建包括包括隐患、人身安全隐患、电力安全隐患和原因的知识图谱,如图2所示。将实体-关系抽取分成两个模块,先抽取头实体,后联合抽取尾实体-关系;
所述抽取头实体的公式是:
抽取尾实体-关系的公式是:
组成候选关系实体对集,采用弱监督的方法对候选关系实体对集中的多个候选关系实体对进行学习和标注,生成候选关系实体,建立关系实体对,形成知识连接网络;根据生成网络关系建立事故安全隐患和安全信息记录关系知识库。
步骤3、知识库存储
将生成的事故安全隐患和安全信息记录关系知识库存储到Flasticsearch数据库中,如图3所示,通过将数据提交到Elasticsearch数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户;
使用BM25算法进行Flasticsearch数据库搜索相关性评分,公式如下:
上面式子中wi表示qi的权重,R(qi,d)为qi和d的相关性,Score(Q,d)就是每个语素qi和d的相关性的加权和。
步骤4、电力生产安全隐患关系推理仿真
通过深度学习技术对不断输入的处理完毕的电力生产安全信息候选集进行训练,如图4所示,将数据集切分为训练集、验证集和测试集,训练集用以训练深度学习模型;验证集用以评估模型结果,进而辅助模型调参;测试集用于模型的预测,通过准确率、精确率、召回率、F1Score和ROC曲线对模型进行评估,所述深度学习模型是:
Input:Values of x over a mini-batch:B={x1...m};
Parameters to be learned:γ,β
Output:{yi=BNγ,β(xi)}
用训练好的模型得到知识推理网络链,将得出的训练结果集放入电力生产安全记录知识库中进行逐一匹配得出分析结果,并进行,最终做出决策判断行为或目标是否构成隐患,如构成隐患则找到与隐患相关的因素。知识推理分析时利用关键词贡献分析构建研究主题的关联图谱,图谱显示违规行为、不安全行为在图谱中占有核心位置,实现通过高频关键词共现揭示电力生产安全隐患和安全事故发展脉络。
进一步,步骤3中通过卷积神经网络进行训练,卷积神经网络的公式如下:
(1)仿射变换:
(2)激活前:
(3)激活后:
训练后得到知识推理网络链。
步骤4中知识推理分析时最终做出决策判断行为或目标是否构成隐患,如构成隐患则找到与隐患相关的因素。
以上仅为本发明的具体实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于知识图谱的电力安全生产隐患预控方法,其特征是:
步骤1、首先采用自然语言预处理技术提取相关的电力生产安全隐患知识样本集,对于采取的样本集进行词素切分,利用特征提取算法对信息进行预处理。
步骤2、构建基于知识图谱的电力生产安全知识模型
首先,根据电力安全生产预处理信息本文,对电力生产操作人员的人因和操作隐患进行分析,用双向长短记忆网络(用Deepdive方法)生成满足实体-关系-实体的三元组,将实体-关系抽取分成两个模块,先抽取头实体,后联合抽取尾实体-关系;
其次,组成候选关系实体对集,采用弱监督的方法对候选关系实体对集中的多个候选关系实体对进行学习和标注,生成候选关系实体,建立关系实体对,形成知识连接网络;
最后,根据生成网络关系建立事故安全隐患和安全信息记录关系知识库。
步骤3、将生成的事故安全隐患和安全信息记录关系知识库存储到Elasticsearch数据库中,通过将数据提交到Elasticsearch数据库中,再通过分词控制器去将对应的语句分词,将其权重和分词结果一并存入数据,当用户搜索数据时候,再根据权重将结果排名,打分,再将返回结果呈现给用户。
步骤4、通过深度学习技术对不断输入的处理完毕的电力生产安全信息候选集进行训练,用训练好的模型得到知识推理网络链,将得出的训练结果集放入电力生产安全记录知识库中进行逐一匹配,并进行知识推理分析,得出分析结果。
2.根据权利要求1所述的一种基于知识图谱的电力安全生产隐患预控方法,其特征是:步骤4进行知识推理分析时,利用关键词贡献分析构建研究主题的关联图谱,图谱显示违规行为、不安全行为在图谱中占有核心位置,通过高频关键词共现揭示电力生产安全隐患和安全事故发展脉络。
3.根据权利要求1所述的一种基于知识图谱的电力安全生产隐患预控方法,其特征是:步骤1中采用基于爬虫的方法对电力安全生产数据进行文本特征提取,具体过程是:首先寻找与电力生产安全信息相关的目标网站并分析其结构,所述目标网站为含有电力生产监管中的三评档案、安全隐患整改率、安规调考、作业评价相关信息的网站,然后编写爬虫进行网站内容爬取,解析爬取到的数据,利用小波多窗谱特征提取算法对信息文本得实体、关系、属性进行提取预处理。
5.根据权利要求3所述的一种基于知识图谱的电力安全生产隐患预控方法,其特征是:所述爬虫编辑时利用爬虫调节器获取价值数据,所述爬虫调节器是由URL管理器、网页下载器和页面分析器组成。
6.根据权利要求3所述的一种基于知识图谱的电力安全生产隐患预控方法,其特征是:所述知识图谱所述知识图谱包括隐患、人身安全隐患和电力安全隐患。
10.根据权利要求1述的一种基于知识图谱的电力安全生产隐患预控方法,其特征是:步骤4中知识推理分析时最终做出决策判断行为或目标是否构成隐患,如构成隐患则找到与隐患相关的因素。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111452265.1A CN114328819A (zh) | 2021-11-30 | 2021-11-30 | 一种基于知识图谱的电力安全生产隐患预控方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111452265.1A CN114328819A (zh) | 2021-11-30 | 2021-11-30 | 一种基于知识图谱的电力安全生产隐患预控方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114328819A true CN114328819A (zh) | 2022-04-12 |
Family
ID=81049430
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111452265.1A Pending CN114328819A (zh) | 2021-11-30 | 2021-11-30 | 一种基于知识图谱的电力安全生产隐患预控方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114328819A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115222070A (zh) * | 2022-06-16 | 2022-10-21 | 南京泓和云安全科技有限公司 | 一种智慧消防快速定位维保问题的数据分析方法 |
-
2021
- 2021-11-30 CN CN202111452265.1A patent/CN114328819A/zh active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115222070A (zh) * | 2022-06-16 | 2022-10-21 | 南京泓和云安全科技有限公司 | 一种智慧消防快速定位维保问题的数据分析方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhong et al. | Deep learning and network analysis: Classifying and visualizing accident narratives in construction | |
CN110188344A (zh) | 一种多特征融合的关键词提取方法 | |
Jing et al. | Correlation analysis and text classification of chemical accident cases based on word embedding | |
Xu et al. | Cause analysis of hot work accidents based on text mining and deep learning | |
CN113656805B (zh) | 一种面向多源漏洞信息的事件图谱自动构建方法及*** | |
JP2021504789A (ja) | Esg基盤の企業評価遂行装置及びその作動方法 | |
CN109918505B (zh) | 一种基于文本处理的网络安全事件可视化方法 | |
CN113688169B (zh) | 基于大数据分析的矿山安全隐患辨识与预警*** | |
Rashid et al. | Feature level opinion mining of educational student feedback data using sequential pattern mining and association rule mining | |
Pimm et al. | Natural Language Processing (NLP) tools for the analysis of incident and accident reports | |
CN113239208A (zh) | 一种基于知识图谱的标注训练模型 | |
Aljedaani et al. | Learning sentiment analysis for accessibility user reviews | |
CN114860882A (zh) | 一种基于文本分类模型的公平竞争审查辅助方法 | |
JP2023008943A (ja) | データマイニング方法、装置、電子機器及び記憶媒体 | |
CN115544272A (zh) | 基于注意力机制的化工事故原因知识图谱构建方法 | |
Chen et al. | Association mining of near misses in hydropower engineering construction based on convolutional neural network text classification | |
CN115858807A (zh) | 一种基于航空装备故障知识图谱的问答*** | |
CN116028646A (zh) | 一种基于机器学习的电网调度领域知识图谱构建方法 | |
Gao et al. | Listening to Users' Voice: Automatic Summarization of Helpful App Reviews | |
CN114328819A (zh) | 一种基于知识图谱的电力安全生产隐患预控方法 | |
Luo et al. | Convolutional neural network algorithm–based novel automatic text classification framework for construction accident reports | |
Moon et al. | Analysis of construction accidents based on semantic search and natural language processing | |
US20170132731A1 (en) | Intellectual property evaluation system, intellectual property evaluation system control method, and intellectual property evaluation program | |
Bella et al. | Semi-supervised approach for recovering traceability links in complex systems | |
CN116629609A (zh) | 一种基于文本挖掘的企业安全生产风险等级划分方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |