CN109165275B - 基于深度学习的智能变电站操作票信息智能搜索匹配方法 - Google Patents
基于深度学习的智能变电站操作票信息智能搜索匹配方法 Download PDFInfo
- Publication number
- CN109165275B CN109165275B CN201810818470.7A CN201810818470A CN109165275B CN 109165275 B CN109165275 B CN 109165275B CN 201810818470 A CN201810818470 A CN 201810818470A CN 109165275 B CN109165275 B CN 109165275B
- Authority
- CN
- China
- Prior art keywords
- word
- information
- layer
- operation ticket
- neural network
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
Abstract
本发明公开了一种基于深度学习的智能变电站操作票信息智能搜索匹配方法。类似智能站监控信息调度联调、站内程序化操作的验证等工作,当前只能人工逐条进行,需要耗费大量的人力和时间,极大影响工程进度。本发明采用的技术方案包括:利用关键词提取技术提取操作票中的操作对象信息;建立用于操作票信息智能搜索匹配的双层神经网络模型;利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象。本发明能够基于自然语言处理相关技术,建立起操作票信息与SCD文件之间的关联,解决变电站操作票信息的智能识别和搜索匹配,进而服务于完整高效的变电站智能调试工作。
Description
技术领域
本发明涉及人工智能、电网智能变电领域,具体地说是一种基于深度学习的智能变电站操作票信息智能搜索匹配方法。
背景技术
随着智能电网的发展,信息网络规模不断增大,不同应用***之间的信息交换大大增加,信息环节对物理***的影响问题将更加突出。电力***应用集成是减少工作量、提高电能质量、提高电力企业经济效益的必要手段,但是电力企业在信息化过程中基本以业务部门为依托进行条块分割,各个应用***相互独立且高度自治,导致电网建模和数据名称不一致问题严重,信息匹配已经是应用集成急需解决的问题。
问题具体表现为:为了满足各类应用的需求,在智能站工程调试阶段需要开展大量工作来验证信息是否匹配。类似智能站监控信息调度联调、站内程序化操作的验证等工作,当前只能人工逐条进行,需要耗费大量的人力和时间,极大影响工程进度。
发明内容
本发明所要解决的技术问题是克服上述现有技术存在的缺陷,提供一种基于深度学习的智能变电站操作票信息智能搜索匹配方法,实现自动化作业,以替代往常的人工作业模式,为实际工程生产和调试中的工作提供技术支撑。
为解决上述技术问题,本发明采用的技术方案是:基于深度学习的智能变电站操作票信息智能搜索匹配方法,其包括以下步骤:
S1,利用关键词提取技术提取操作票中的操作对象信息;
S2,建立用于操作票信息智能搜索匹配的双层神经网络模型;
S3,利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象。
作为上述技术方案的补充,步骤S1中,关键词提取技术利用基于BP神经网络模型的由字构词分词法和根据分词结果利用循环神经网络模型实现操作票中操作对象的识别。
作为上述技术方案的补充,步骤S1中,基于BP神经网络模型的由字构词分词法进行分词,其过程如下:
选取操作票每个字前后各K个字,连同该字本身输入共2*K+1个字;选择每个字的向量维度为L,则输入神经网络模型的维度L*(2*K+1);采用三层BP神经网络,输入层为L*(2*K+1)个神经元,隐藏层为L个神经元,输出层为4个神经元,每个神经元对应该字的词位分别为S,B,M,E的概率,S,B,M,E分别对应字单独成词、词首、词中、词尾;从输出词位概率值中选择概率最大的词位作为该字的词位类别。
为了利用操作票每个字的上下文信息,本发明采用基于知识进行分词方法中的BP神经网络进行分词。该方法对操作票每个字的上下文信息记忆能力比较好,拥有不错的容错效果;同时该方法采用非线性并行处理方法,并且在分词中可以自动处理和学习得到的知识和信息,解决了操作票信息较多带来的速度问题。
作为上述技术方案的补充,步骤S1中,根据分词结果利用循环神经网络模型实现操作票中操作对象的识别,其过程如下:
将所得分词序列依次转换为词向量,选择词的向量维度为M;设定足够长的词数N,不足的后面补空,则循环神经网络模型的输入为M*N的向量,对应循环神经网络模型的输入层;第二层为双LSTM(Long Short Term Memory Network,长短时记忆网络);输出层输出2维的分类情况,输出的分类结果为0和1,代表该词是否为操作对象,0表示否,1表示是。
为了解决操作票中每个词的时序敏感及操作票内容长度不确定问题,本发明采用了循环神经网络(RNN)模型。
作为上述技术方案的补充,步骤S2中,搜索匹配采用的规则为:判断两条信息所属的组别是否相同,如果两条信息的组别不同,则认定两条信息不匹配;如果两条信息属于同一组别,再判断两条信息的具体设备信息是否相同,给出最终的匹配结果。
由于操作票中线路或设备信息的通常格式为“间隔+具体设备信息”。相比不同间隔,同一间隔下设备的信息之间的相似程度显然要高。因此,本发明将间隔抽象为组别。
作为上述技术方案的补充,步骤S2中,基于搜索匹配规则,采用双层神经网络模型,第一层区分组内和组外项:组外为‘0’,组内为‘1’;第二层区分匹配项:组内不匹配为‘0’,组内匹配为‘1’;其中每层神经网络模型采用深度BP神经网络或深度循环神经网络,模型的输出为操作票信息与SCD文件中DO对象是否匹配的结果。
作为上述技术方案的补充,根据每层采用神经网络的不同,双层神经网络共有四种结构,分别为:BP_1、BP_2,表示模型的第一、二层均采用BP模型;BP_1、LSTM_2,表示模型的第一层采用BP模型,第二层采用LSTM模型;LSTM_1、BP_2,表示模型的第一层采用LSTM模型,第二层采用BP模型;LSTM_1、LSTM_2,表示模型的第一、二层均采用LSTM模型。
作为上述技术方案的补充,步骤S3中,根据步骤S2中神经网络的输出结果是‘0’、‘1’的概率,遍历判断操作票信息与SCD文件中所有DO对象是否匹配;其中‘1’的概率即为相似度或匹配度,其大小表示操作票信息与SCD信息的匹配程度,由此选择匹配度最大的SCD文件中的DO对象作为某条操作票信息的最佳匹配结果。
与现有技术相比,本发明具有的有益效果是:
(1)利用BP神经网络实现了中文分词。
(2)利用循环神经网络完成了操作票关键字提取。
(3)利用双层深度学习模型(即双层神经网络模型)实现了操作票信息的搜索匹配。
本发明能够基于自然语言处理相关技术,建立起操作票信息与SCD文件之间的关联,解决变电站操作票信息的智能识别和搜索匹配,进而服务于完整高效的变电站智能调试工作。
附图说明
图1为本发明基于深度学习的智能变电站操作票信息智能搜索匹配方法的流程图;
图2为本发明操作票信息与SCD文件中的DO对象搜索匹配流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本发明的限制;对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。附图中描述位置关系仅用于示例性说明,不能理解为对本发明的限制。
下面将结合本发明中的附图,对本发明技术方案进行详细介绍。本发明技术方案的实施主要包括以下步骤(流程图见附图1):
S1,利用关键词提取技术提取操作票中的操作对象信息
(1)利用BP神经网络模型进行中文分词。
取操作票中每个字前后各3个字,前后3个字连同该字本身输入共7个字。选择每个字的向量维度为100,则输入神经网络模型的维度100*(2*3+1)=700。采用三层BP神经网络,输入层为700个神经元,隐藏层为100个神经元,输出层为4个神经元,每个神经元对应该字的词位分别为S,B,M,E(S,B,M,E分别为字单独成词(S)、词首(B)、词中(M)、词尾(E))的概率。
从输出词位概率值中选择概率最大的词位作为该字的词位类别,对操作票的每个字进行依次进行同样处理便可以完成对整个操作票的分词。例如操作票“合上仙永线50121闸刀”经过分词后得到“合上仙永线50121闸刀”。
(2)根据分词结果利用循环神经网络模型实现操作票中操作对象信息识别。
将步骤(1)所得分词序列依次转换为词向量,选择词的向量维度为10。足够长的词数30(不足的后面补空),作为固定输入的维度,则神经网络模型的输入为30*10的向量,对应循环神经网络模型的输入层;第二层为双LSTM,隐藏层为128个神经元;输出层输出以0,1表示的2维分类情况(0和1分别对应该词是否为设备或线路,1表示是,0表示否)。
经过操作后,从操作票分词结果中提取了以“仙永线50122闸刀”表示的线路及设备信息。
S2,建立用于操作票信息智能搜索匹配的双层神经网络模型;
(1)输入SCD文件中的DO对象,作为信息1。
(2)确定搜索匹配规则。将操作票提取后的信息作为信息2。两条信息的匹配规则为:首先判断两条信息所属的组别是否相同,如果两条信息的组别不同,则认定两条信息不匹配;如果两条信息属于同一组别,再判断两条信息的具体设备信息是否相同,给出最终的匹配结果(搜索规则流程图见附图2)。
以操作票指令为“合上仙永线50121闸刀”例,搜索匹配结果即为表1所示。
表1操作票信息搜索匹配SCD示例
S3,利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象
经过匹配度计算结果排序比较得出,搜索匹配的最佳结果为“仙永线5012开关.50121闸刀合闸”。
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (3)
1.基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,包括以下步骤:
S1,利用关键词提取技术提取操作票中的操作对象信息;
S2,建立用于操作票信息智能搜索匹配的双层神经网络模型;
S3,利用相似度计算和排序从SCD文件中提取与操作票信息匹配的DO对象;
步骤S1中,关键词提取技术利用基于BP神经网络模型的由字构词分词法和根据分词结果利用循环神经网络模型实现操作票中操作对象的识别;
步骤S1中,基于BP神经网络模型的由字构词分词法进行分词,其过程如下:
选取操作票每个字前后各K个字,连同该字本身输入共2*K+1个字;选择每个字的向量维度为L,则输入神经网络模型的维度L*(2*K+1);采用三层BP神经网络,输入层为L*(2*K+1)个神经元,隐藏层为L个神经元,输出层为4个神经元,每个神经元对应该字的词位分别为S,B,M,E的概率,S,B,M,E分别对应字单独成词、词首、词中、词尾;从输出词位概率值中选择概率最大的词位作为该字的词位类别;
步骤S1中,根据分词结果利用循环神经网络模型实现操作票中操作对象的识别,其过程如下:
将所得分词序列依次转换为词向量,选择词的向量维度为M;设定足够长的词数N,不足的后面补空,则循环神经网络模型的输入为M*N的向量,对应循环神经网络模型的输入层;第二层为双LSTM;输出层输出2维的分类情况,输出的分类结果为0和1,代表该词是否为操作对象,0表示否,1表示是;
步骤S2中,搜索匹配采用的规则为:判断两条信息所属的组别是否相同,如果两条信息的组别不同,则认定两条信息不匹配;如果两条信息属于同一组别,再判断两条信息的具体设备信息是否相同,给出最终的匹配结果;
步骤S2中,基于搜索匹配规则,采用双层神经网络模型,第一层区分组内和组外项:组外为‘0’,组内为‘1’;第二层区分匹配项:组内不匹配为‘0’,组内匹配为‘1’;其中每层神经网络模型采用深度BP神经网络或深度循环神经网络,模型的输出为操作票信息与SCD文件中DO对象是否匹配的结果。
2.根据权利要求1所述的基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,根据每层采用神经网络的不同,双层神经网络共有四种结构,分别为:BP_1、BP_2,表示模型的第一、二层均采用BP模型;BP_1、LSTM_2,表示模型的第一层采用BP模型,第二层采用LSTM模型;LSTM_1、BP_2,表示模型的第一层采用LSTM模型,第二层采用BP模型;LSTM_1、LSTM_2,表示模型的第一、二层均采用LSTM模型。
3.根据权利要求2所述的基于深度学习的智能变电站操作票信息智能搜索匹配方法,其特征在于,步骤S3中,根据步骤S2中神经网络的输出结果是‘0’、‘1’的概率,遍历判断操作票信息与SCD文件中所有DO对象是否匹配;其中‘1’的概率即为相似度或匹配度,其大小表示操作票信息与SCD信息的匹配程度,由此选择匹配度最大的SCD文件中的DO对象作为某条操作票信息的最佳匹配结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810818470.7A CN109165275B (zh) | 2018-07-24 | 2018-07-24 | 基于深度学习的智能变电站操作票信息智能搜索匹配方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810818470.7A CN109165275B (zh) | 2018-07-24 | 2018-07-24 | 基于深度学习的智能变电站操作票信息智能搜索匹配方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109165275A CN109165275A (zh) | 2019-01-08 |
CN109165275B true CN109165275B (zh) | 2021-03-02 |
Family
ID=64898207
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810818470.7A Active CN109165275B (zh) | 2018-07-24 | 2018-07-24 | 基于深度学习的智能变电站操作票信息智能搜索匹配方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109165275B (zh) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111353487A (zh) * | 2019-08-20 | 2020-06-30 | 国网浙江省电力有限公司台州供电公司 | 用于变电站的设备信息提取方法 |
CN111523241B (zh) * | 2020-04-28 | 2023-06-13 | 国网浙江省电力有限公司湖州供电公司 | 用电负荷逻辑信息模型的构建方法 |
CN112017411A (zh) * | 2020-08-21 | 2020-12-01 | 广东电网有限责任公司清远供电局 | 一种变电站作业防误预警*** |
CN112749509B (zh) * | 2020-12-30 | 2022-06-10 | 西华大学 | 一种基于lstm神经网络的智能变电站故障诊断方法 |
CN112700008B (zh) * | 2021-01-06 | 2022-06-28 | 青岛弯弓信息技术有限公司 | 一种云组态平台的模型匹配处理方法及*** |
CN113656532B (zh) * | 2021-08-16 | 2024-05-07 | 雅砻江流域水电开发有限公司 | 工作票与操作票智能检索*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5630020A (en) * | 1989-06-09 | 1997-05-13 | U.S. Philips Corporation | Learning method and neural network structure |
CN105224511A (zh) * | 2015-09-23 | 2016-01-06 | 山东网聪信息科技有限公司 | 一种智能变电站scd文件的校验方法 |
CN105975456A (zh) * | 2016-05-03 | 2016-09-28 | 成都数联铭品科技有限公司 | 一种企业实体名称分析识别*** |
CN107153946A (zh) * | 2017-04-28 | 2017-09-12 | 国家电网公司 | 智能站二次安措自动生成方法及*** |
CN108021552A (zh) * | 2017-11-09 | 2018-05-11 | 国网浙江省电力公司电力科学研究院 | 一种电力***操作票内容提取方法及*** |
-
2018
- 2018-07-24 CN CN201810818470.7A patent/CN109165275B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5630020A (en) * | 1989-06-09 | 1997-05-13 | U.S. Philips Corporation | Learning method and neural network structure |
CN105224511A (zh) * | 2015-09-23 | 2016-01-06 | 山东网聪信息科技有限公司 | 一种智能变电站scd文件的校验方法 |
CN105975456A (zh) * | 2016-05-03 | 2016-09-28 | 成都数联铭品科技有限公司 | 一种企业实体名称分析识别*** |
CN107153946A (zh) * | 2017-04-28 | 2017-09-12 | 国家电网公司 | 智能站二次安措自动生成方法及*** |
CN108021552A (zh) * | 2017-11-09 | 2018-05-11 | 国网浙江省电力公司电力科学研究院 | 一种电力***操作票内容提取方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN109165275A (zh) | 2019-01-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109165275B (zh) | 基于深度学习的智能变电站操作票信息智能搜索匹配方法 | |
CN111914644B (zh) | 一种基于双模态协同的弱监督时序动作定位方法及*** | |
CN109783818B (zh) | 一种企业行业分类方法 | |
Mei et al. | Sgnn: A graph neural network based federated learning approach by hiding structure | |
WO2018218707A1 (zh) | 一种基于神经网络与注意力机制的情报关系提取方法 | |
CN110309331A (zh) | 一种基于自监督的跨模态深度哈希检索方法 | |
CN103345656B (zh) | 一种基于多任务深度神经网络的数据识别方法及装置 | |
CN110188192B (zh) | 一种多任务网络构建与多尺度的罪名法条联合预测方法 | |
CN111597420B (zh) | 基于深度学习的轨道交通规范关系抽取方法 | |
CN113610540B (zh) | 一种河蟹防伪溯源方法及*** | |
CN111881677A (zh) | 基于深度学习模型的地址匹配算法 | |
CN111753024A (zh) | 一种面向公共安全领域的多源异构数据实体对齐方法 | |
CN111522965A (zh) | 一种基于迁移学习的实体关系抽取的问答方法及*** | |
CN112419096B (zh) | 基于nlp信息萃取与少样本自学习的用户用电诉求工单自动流转方法 | |
CN113407660B (zh) | 非结构化文本事件抽取方法 | |
CN102289522A (zh) | 一种对于文本智能分类的方法 | |
CN112395417A (zh) | 基于深度学习的网络舆情演化仿真方法及*** | |
CN109683871A (zh) | 基于图像目标检测方法的代码自动生成装置及方法 | |
CN109871449A (zh) | 一种基于语义描述的端到端的零样本学习方法 | |
CN115526236A (zh) | 一种基于多模态对比学习的文本网络图分类方法 | |
CN111209362A (zh) | 基于深度学习的地址数据解析方法 | |
CN113434688A (zh) | 用于舆情分类模型训练的数据处理方法和装置 | |
CN113849653A (zh) | 一种文本分类方法及装置 | |
CN116010581A (zh) | 一种基于电网隐患排查场景的知识图谱问答方法及*** | |
CN114238524B (zh) | 基于增强样本模型的卫星频轨数据信息抽取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |