CN107665192A - 一种调度运行告警信息自动分类装置及方法 - Google Patents

一种调度运行告警信息自动分类装置及方法 Download PDF

Info

Publication number
CN107665192A
CN107665192A CN201711226028.7A CN201711226028A CN107665192A CN 107665192 A CN107665192 A CN 107665192A CN 201711226028 A CN201711226028 A CN 201711226028A CN 107665192 A CN107665192 A CN 107665192A
Authority
CN
China
Prior art keywords
information
word segmentation
word
segmentation result
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201711226028.7A
Other languages
English (en)
Inventor
缪仁国
陈东
顾黎强
张麟
沈健
吴世敏
孙立明
潘晨亮
宓佳璟
戴睿昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
State Grid Shanghai Electric Power Co Ltd
Original Assignee
State Grid Shanghai Electric Power Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by State Grid Shanghai Electric Power Co Ltd filed Critical State Grid Shanghai Electric Power Co Ltd
Priority to CN201711226028.7A priority Critical patent/CN107665192A/zh
Publication of CN107665192A publication Critical patent/CN107665192A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种调度运行告警信息自动分类装置及方法,该装置包含文本数据库,用于存储遥信信息;自然语言理解模块,其输入端连接于文本数据库,用于对遥信信息进行分词处理得到分词结果信息;短语分析模块,其输入端连接于自然语言理解模块输出端,用于对分词结果信息进行分析得出分词结果信息对应的告警分类信息。本发明运用自然语言处理技术,对遥信信息描述进行语义分析,计算机自动对遥信信息进行告警分类,提高工作效率。

Description

一种调度运行告警信息自动分类装置及方法
技术领域
本发明涉及人工智能中的语义技术和语义搜索的领域,特别涉及一种调度运行告警信息自动分类装置及方法。
背景技术
计算机和互联网的结合产生了大量的信息,这使得我们很快有被淹没的感觉。事实也是这样,我们在对付非常规海量信息的同时,也不断地在制造新的信息。这个信息量是以几何级数方式增长的。人们把希望放在了计算机对海量信息的有效处理上,期待不但从信息淹没中被解放出来,也能够更好地利用这些海量信息。
目前,调度运行需要监视的变电站遥信信息日益增多,每一个遥信信息都必须按照电网告警分类法进行分类。以110千伏变电站为例,大约有1200条遥信信息,由此可见人工分类工作量之大。
发明内容
本发明的目的是提供一种调度运行告警信息自动分类装置及方法,运用自然语言处理技术,对遥信信息描述进行语义分析,计算机自动对遥信信息进行告警分类,提高工作效率。
为了实现以上目的,本发明是通过以下技术方案实现的:
一种调度运行告警信息自动分类装置,其特点是,包含:
文本数据库,用于存储遥信信息;
自然语言理解模块,其输入端连接于文本数据库,用于对遥信信息进行分词处理得到分词结果信息;
短语分析模块,其输入端连接于自然语言理解模块输出端,用于对分词结果信息进行分析得出分词结果信息对应的告警分类信息。
所述的自然语言理解模块包含:
词语分割单元,其输入端连接于文本数据库,用于对遥信信息进行词语的切割,成为若干个词语;
词语分析单元,其输入端连接于词语分割单元,用于对输入的若干个词语进行词语分析得到分词结果信息。
所述的短语分析模块包含:
语义分析单元,用于对所述的分词结果信息进行需求词识别、同义词分析及近义词替换处理得到分词结果的语义;
匹配告警分类单元,其输入端连接语义分析单元,用于将所述分词结果的语义进行匹配,得出告警分类信息。
该装置还包含一专有本体库,其输入端连接短语分析模块,用于将得到的告警分类信息放入到专有本体库中。
一种调度运行告警信息自动分类方法,其特点是,该方法包含如下步骤:
S1,存储遥信信息;
S2,对遥信信息进行分词处理得到分词结果信息;
S3,对分词结果信息进行分析得出分词结果信息对应的告警分类信息。
所述的步骤S2包含:
S2.1,对遥信信息进行词语的切割,成为若干个词语;
S2.2,对输入的若干个词语进行词语分析得到分词结果信息。
所述的步骤S3包含:
S3.1,对所述的分词结果信息进行需求词识别、同义词分析及近义词替换处理得到分词结果的语义;
S3.2,将所述分词结果的语义进行匹配,得出告警分类信息。
本发明与现有技术相比,具有以下优点:
本发明运用自然语言处理技术,对遥信信息描述进行语义分析,计算机自动对遥信信息进行告警分类,提高工作效率。
附图说明
图1为本发明一种调度运行告警信息自动分类装置的结构示意图。
具体实施方式
以下结合附图,通过详细说明一个较佳的具体实施例,对本发明做进一步阐述。
如图1所示,一种调度运行告警信息自动分类装置,包含:文本数据库100,用于存储遥信信息;自然语言理解模块200,其输入端连接于文本数据库,用于对遥信信息进行分词处理得到分词结果信息;短语分析模块300,其输入端连接于自然语言理解模块输出端,用于对分词结果信息进行分析得出分词结果信息对应的告警分类信息。
上述的自然语言理解模块包含:
词语分割单元201,其输入端连接于文本数据库100,用于对遥信信息进行词语的切割,成为若干个词语;
词语分析单元202,其输入端连接于词语分割单元,用于对输入的若干个词语进行词语分析得到分词结果信息,具体的,与预先建立的电网告警专用语言模型对比,进行权重打分得到分词结果信息。
上述的短语分析模块包含:
语义分析单元301,用于对所述的分词结果信息进行需求词识别、同义词分析及近义词替换处理得到分词结果的语义;
匹配告警分类单元302,其输入端连接语义分析单元,用于将所述分词结果的语义进行匹配,得出告警分类信息。
在具体实施例中,该装置还包含一专有本体库400,其输入端连接短语分析模块,用于将得到的告警分类信息放入到专有本体库中。
一种调度运行告警信息自动分类方法,该方法包含如下步骤:
S1,存储遥信信息;
S2,对遥信信息进行分词处理得到分词结果信息;
S3,对分词结果信息进行分析得出分词结果信息对应的告警分类信息。
所述的步骤S2包含:
S2.1,对遥信信息进行词语的切割,成为若干个词语;
S2.2,对输入的若干个词语进行词语分析得到分词结果信息。
所述的步骤S3包含:
S3.1,对所述的分词结果信息进行需求词识别、同义词分析及近义词替换处理得到分词结果的语义;
S3.2,将所述分词结果的语义进行匹配,得出告警分类信息。
综上所述,本发明一种调度运行告警信息自动分类装置及方法,运用自然语言处理技术,对遥信信息描述进行语义分析,计算机自动对遥信信息进行告警分类,提高工作效率。
尽管本发明的内容已经通过上述优选实施例作了详细介绍,但应当认识到上述的描述不应被认为是对本发明的限制。在本领域技术人员阅读了上述内容后,对于本发明的多种修改和替代都将是显而易见的。因此,本发明的保护范围应由所附的权利要求来限定。

Claims (7)

1.一种调度运行告警信息自动分类装置,其特征在于,包含:
文本数据库,用于存储遥信信息;
自然语言理解模块,其输入端连接于文本数据库,用于对遥信信息进行分词处理得到分词结果信息;
短语分析模块,其输入端连接于自然语言理解模块输出端,用于对分词结果信息进行分析得出分词结果信息对应的告警分类信息。
2.如权利要求1所述的调度运行告警信息自动分类装置,其特征在于,所述的自然语言理解模块包含:
词语分割单元,其输入端连接于文本数据库,用于对遥信信息进行词语的切割,成为若干个词语;
词语分析单元,其输入端连接于词语分割单元,用于对输入的若干个词语进行词语分析得到分词结果信息。
3.如权利要求1所述的调度运行告警信息自动分类装置,其特征在于,所述的短语分析模块包含:
语义分析单元,用于对所述的分词结果信息进行需求词识别、同义词分析及近义词替换处理得到分词结果的语义;
匹配告警分类单元,其输入端连接语义分析单元,用于将所述分词结果的语义进行匹配,得出告警分类信息。
4.如权利要求1所述的调度运行告警信息自动分类装置,其特征在于,还包含一专有本体库,其输入端连接短语分析模块,用于将得到的告警分类信息放入到专有本体库中。
5.一种调度运行告警信息自动分类方法,其特征在于,该方法包含如下步骤:
S1,存储遥信信息;
S2,对遥信信息进行分词处理得到分词结果信息;
S3,对分词结果信息进行分析得出分词结果信息对应的告警分类信息。
6.如权利要求5所述的调度运行告警信息自动分类方法,其特征在于,所述的步骤S2包含:
S2.1,对遥信信息进行词语的切割,成为若干个词语;
S2.2,对输入的若干个词语进行词语分析得到分词结果信息。
7.如权利要求1所述的调度运行告警信息自动分类方法,其特征在于,所述的步骤S3包含:
S3.1,对所述的分词结果信息进行需求词识别、同义词分析及近义词替换处理得到分词结果的语义;
S3.2,将所述分词结果的语义进行匹配,得出告警分类信息。
CN201711226028.7A 2017-11-29 2017-11-29 一种调度运行告警信息自动分类装置及方法 Pending CN107665192A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201711226028.7A CN107665192A (zh) 2017-11-29 2017-11-29 一种调度运行告警信息自动分类装置及方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201711226028.7A CN107665192A (zh) 2017-11-29 2017-11-29 一种调度运行告警信息自动分类装置及方法

Publications (1)

Publication Number Publication Date
CN107665192A true CN107665192A (zh) 2018-02-06

Family

ID=61144551

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201711226028.7A Pending CN107665192A (zh) 2017-11-29 2017-11-29 一种调度运行告警信息自动分类装置及方法

Country Status (1)

Country Link
CN (1) CN107665192A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866173A (zh) * 2019-11-21 2020-03-06 贵州电网有限责任公司 一种基于深度学习的遥信梳理方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105550291A (zh) * 2015-12-10 2016-05-04 百度在线网络技术(北京)有限公司 文本分类方法和装置
US20160283583A1 (en) * 2014-03-14 2016-09-29 Tencent Technology (Shenzhen) Company Limited Method, apparatus, and storage medium for text information processing
CN106933798A (zh) * 2015-12-31 2017-07-07 北京城市网邻信息技术有限公司 信息分析的方法及装置
CN107340766A (zh) * 2017-07-10 2017-11-10 浙江大学 基于相似度的电力调度告警信号文本归类及故障诊断方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20160283583A1 (en) * 2014-03-14 2016-09-29 Tencent Technology (Shenzhen) Company Limited Method, apparatus, and storage medium for text information processing
CN105550291A (zh) * 2015-12-10 2016-05-04 百度在线网络技术(北京)有限公司 文本分类方法和装置
CN106933798A (zh) * 2015-12-31 2017-07-07 北京城市网邻信息技术有限公司 信息分析的方法及装置
CN107340766A (zh) * 2017-07-10 2017-11-10 浙江大学 基于相似度的电力调度告警信号文本归类及故障诊断方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110866173A (zh) * 2019-11-21 2020-03-06 贵州电网有限责任公司 一种基于深度学习的遥信梳理方法

Similar Documents

Publication Publication Date Title
US20200143289A1 (en) Systems and method for performing contextual classification using supervised and unsupervised training
CN108334495A (zh) 短文本相似度计算方法及***
CN106874292B (zh) 话题处理方法及装置
CN110968684B (zh) 一种信息处理方法、装置、设备及存储介质
CN108804432A (zh) 一种基于网络媒体数据流发现并跟踪热点话题的方法、***和装置
CN113837531A (zh) 一种基于网络评论的产品质量问题发现及风险评估方法
CN103841216A (zh) 一种基于云平台的网络舆情监控***
CN107967290A (zh) 一种基于海量科研资料的知识图谱网络构建方法及***、介质
CN107423288A (zh) 一种基于无监督学习的中文分词***及方法
Bin Abdur Rakib et al. Using the reddit corpus for cyberbully detection
Mulki et al. Tw-star at semeval-2018 task 1: Preprocessing impact on multi-label emotion classification
CN110298041A (zh) 垃圾文本过滤方法、装置、电子设备及存储介质
CN110674378A (zh) 基于余弦相似度和最小编辑距离的中文语义识别方法
CN111723564A (zh) 一种针对随案电子卷宗的事件抽取及处理方法
CN104573030A (zh) 一种文本情绪预测方法及装置
Korobkin et al. Method of identification of patent trends based on descriptions of technical functions
Chang et al. A METHOD OF FINE-GRAINED SHORT TEXT SENTIMENT ANALYSIS BASED ON MACHINE LEARNING.
CN111522948A (zh) 一种智能处理公文的方法及其***
CN107665192A (zh) 一种调度运行告警信息自动分类装置及方法
CN107480270A (zh) 一种基于用户反馈数据流的实时个性化推荐方法及***
Mohsen et al. A performance comparison of machine learning classifiers for Covid-19 Arabic Quarantine tweets sentiment analysis
Tang et al. Jointly considering Siamese network and MatchPyramid network for text semantic matching
CN110413985B (zh) 一种相关文本片段搜索方法及装置
Park Discovering meaningful trends in the inaugural addresses of north korean leader via text mining
CN110633468A (zh) 一种关于对象特征提取的信息处理方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20180206

RJ01 Rejection of invention patent application after publication