CN111126070A - 一种基于机器学习的电力领域的语意分析方法 - Google Patents

一种基于机器学习的电力领域的语意分析方法 Download PDF

Info

Publication number
CN111126070A
CN111126070A CN201911086996.1A CN201911086996A CN111126070A CN 111126070 A CN111126070 A CN 111126070A CN 201911086996 A CN201911086996 A CN 201911086996A CN 111126070 A CN111126070 A CN 111126070A
Authority
CN
China
Prior art keywords
information
machine learning
semantic analysis
negative
analysis method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911086996.1A
Other languages
English (en)
Inventor
严宇平
梁哲恒
蔡徽
龙震岳
萧展辉
曾纪钧
张金波
林细君
郑杰生
黄杰韬
邓安明
段福亮
陈哲瀚
黄载瑜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangdong Power Grid Co Ltd
Original Assignee
Guangdong Power Grid Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangdong Power Grid Co Ltd filed Critical Guangdong Power Grid Co Ltd
Priority to CN201911086996.1A priority Critical patent/CN111126070A/zh
Publication of CN111126070A publication Critical patent/CN111126070A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明属于语义分析技术领域,尤其为一种基于机器学习的电力领域的语意分析方法,包括以下步骤:获取用户反馈信息;对反馈信息按照情感极性分为消极或积极;机器学习模块介入;在语料中获取特征,并对积极和消极的情感词分开执行;最终得到两个分支,分别表示文本的正向感情值和负向感情值;通过电脑获取用户反馈信息,并将用户的反馈信息输入数据库,根据数据库内,具有预先设定的有关于感情极性的特征信息,按照情感极性分为消极或积极,在对信息的处理过程中机器学习模块介入,减少信息筛选时间,加快筛选效率,可以强化机器对关键特征信息的判断速度,积累更多的特征信息,做出更多直观的可视化结论。

Description

一种基于机器学习的电力领域的语意分析方法
技术领域
本发明属于语义分析技术领域,具体涉及一种基于机器学习的电力领域的语意分析方法。
背景技术
随着科技的快速发展以及社群平台的兴盛,透过各种输入接口提供各种信息(例如:文字消息、语音消息)已成为人们日常生活中不可或缺的元素,在不同的应用领域中,如何正确地解读人们所提供的信息,以便基于解读后的信息提供适当的响应或/及服务,是一个日益重要的议题。
在电力领域中,电力部门需要掌握用户的反馈信息,根据用户的反馈,来判断实施过程中还存在哪些不足,以提供更好的服务,目前针对电力领域用户的反馈通常是由人工客户来解决,但是随着反馈形式的多样化,以及用户的基数较大的问题,人工服务已经不能提供更好的服务,因此,需要一种基于机器学习的电力领域的语意分析方法,结合大数据、机器学习以及语义分析,来高效、直观的反映用户反馈,做到更好的服务效果。
发明内容
为解决上述背景技术中提出的问题。本发明提供了一种基于机器学习的电力领域的语意分析方法,具有高效、直观的反映用户反馈信息的特点。
为实现上述目的,本发明提供如下技术方案:一种基于机器学习的电力领域的语意分析方法,包括以下步骤:
S1、获取用户反馈信息;
S2、对反馈信息按照情感极性分为消极或积极;
S3、机器学习模块介入;
S4、在语料中获取特征,并对积极和消极的情感词分开执行;
S5、最终得到两个分支,分别表示文本的正向感情值和负向感情值。
优选的,所述S3中机器学习模块的学习方法包括以下步骤:
S31、对训练文本进行人工标注;
S32、有监督的机器学习;
S33、提取特征,在可选信息内实现降维。
优选的,所述S1、S2和S4组成对反馈信息的分析处理模块。
优选的,所述S31中的训练文本为电力领域以及日常用语的词语库。
优选的,所述S31中人工标注为将词语标注为消极、积极或者中性词语。
优选的,所述S32中有监督的机器学习方式为:对做出判断的过程中出现的特征信息进行记忆,并记录输出结果,判断特征信息与结果的关联性。
优选的,所述S33中的特征信息与所述S4中获取特征信息一致,均为所述S31中人工标注信息。
与现有技术相比,本发明的有益效果是:
本发明中,通过电脑获取用户反馈信息,并将用户的反馈信息输入数据库,根据数据库内,具有预先设定的有关于感情极性的特征信息,按照情感极性分为消极或积极,在对信息的处理过程中机器学习模块介入,遇到标注的特征信息,会优先处理,提取特征,在可选信息内实现降维,减少信息筛选时间,加快筛选效率,并且在积累了更多的基础数据之后,可以强化机器对关键特征信息的判断速度,积累更多的特征信息,做出更多直观的可视化结论,对于电力部门的服务效率会提高,快速解决问题。
附图说明
附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
图1为本发明的方法步骤示意图;
图2为本发明的分析方法示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1-2,本发明提供以下技术方案:一种基于机器学习的电力领域的语意分析方法,包括以下步骤:
S1、获取用户反馈信息;
S2、对反馈信息按照情感极性分为消极或积极;
S3、机器学习模块介入;
S4、在语料中获取特征,并对积极和消极的情感词分开执行;
S5、最终得到两个分支,分别表示文本的正向感情值和负向感情值。
本实施例中,通过电脑获取用户反馈信息,并将用户的反馈信息输入数据库,根据数据库内,具有预先设定的有关于感情极性的特征信息,按照情感极性分为消极或积极,在对信息的处理过程中机器学习模块介入,机器学习模块内设有用于训练的文本信息,并针对特征信息进行预先标注,令机器在处理信息时,遇到标注的特征信息,会优先处理,提取特征,在可选信息内实现降维,减少信息筛选时间,加快筛选效率,并且在积累了更多的基础数据之后,可以强化机器对关键特征信息的判断速度,积累更多的特征信息,做出更多直观的可视化结论,对于电力部门的服务效率会提高,快速解决问题。
具体的,S3中机器学习模块的学习方法包括以下步骤:
S31、对训练文本进行人工标注;
S32、有监督的机器学习;
S33、提取特征,在可选信息内实现降维。
本实施例中,机器学习模块内设有用于训练的文本信息,并由人工进行标注,令机器在处理信息时,遇到标注的特征信息,会优先处理,提取特征,在可选信息内实现降维,减少信息筛选时间,加快筛选效率,并且在积累了更多的基础数据之后,可以强化机器对关键特征信息的判断速度,积累更多的特征信息,在基于大数据的基础上,可以做出更多直观的可视化结论。
具体的,S1、S2和S4组成对反馈信息的分析处理模块,获取用户反馈信息,并对反馈信息按照情感极性分为消极或积极,在语料中获取特征,并对积极和消极的情感词分开执行,最终得到两个分支,分别表示文本的正向感情值和负向感情值,来对用户的反馈信息进行处理,来分析用户表达的意思,快速做出反馈。
具体的,S31中的训练文本为电力领域以及日常用语的词语库,可以在本领域中,快速判断用户所要表达的意思。
具体的,S31中人工标注为将词语标注为消极、积极或者中性词语,对用户反馈的信息进行分类,方便对信息进行处理。
具体的,S32中有监督的机器学习方式为:对做出判断的过程中出现的特征信息进行记忆,并记录输出结果,判断特征信息与结果的关联性,此行为是一种长期重复行为,能够得出特征信息与结果的关联性,方便后期对用户反馈信息的关系。
具体的,S33中的特征信息与S4中获取特征信息一致,均为S31中人工标注信息,由人工对一些特征信息进行标注,可添加或者删减更加方便,起到导向作用。
最后应说明的是:以上所述仅为本发明的优选实施例而已,并不用于限制本发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.一种基于机器学习的电力领域的语意分析方法,其特征在于,包括以下步骤:
S1、获取用户反馈信息;
S2、对反馈信息按照情感极性分为消极或积极;
S3、机器学习模块介入;
S4、在语料中获取特征,并对积极和消极的情感词分开执行;
S5、最终得到两个分支,分别表示文本的正向感情值和负向感情值。
2.根据权利要求1所述的一种基于机器学习的电力领域的语意分析方法,其特征在于:所述S3中机器学习模块的学习方法包括以下步骤:
S31、对训练文本进行人工标注;
S32、有监督的机器学习;
S33、提取特征,在可选信息内实现降维。
3.根据权利要求1所述的一种基于机器学习的电力领域的语意分析方法,其特征在于:所述S1、S2和S4组成对反馈信息的分析处理模块。
4.根据权利要求2所述的一种基于机器学习的电力领域的语意分析方法,其特征在于:所述S31中的训练文本为电力领域以及日常用语的词语库。
5.根据权利要求2所述的一种基于机器学习的电力领域的语意分析方法,其特征在于:所述S31中人工标注为将词语标注为消极、积极或者中性词语。
6.根据权利要求2所述的一种基于机器学习的电力领域的语意分析方法,其特征在于:所述S32中有监督的机器学习方式为:对做出判断的过程中出现的特征信息进行记忆,并记录输出结果,判断特征信息与结果的关联性。
7.根据权利要求2所述的一种基于机器学习的电力领域的语意分析方法,其特征在于:所述S33中的特征信息与所述S4中获取特征信息一致,均为所述S31中人工标注信息。
CN201911086996.1A 2019-11-08 2019-11-08 一种基于机器学习的电力领域的语意分析方法 Pending CN111126070A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911086996.1A CN111126070A (zh) 2019-11-08 2019-11-08 一种基于机器学习的电力领域的语意分析方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911086996.1A CN111126070A (zh) 2019-11-08 2019-11-08 一种基于机器学习的电力领域的语意分析方法

Publications (1)

Publication Number Publication Date
CN111126070A true CN111126070A (zh) 2020-05-08

Family

ID=70495719

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911086996.1A Pending CN111126070A (zh) 2019-11-08 2019-11-08 一种基于机器学习的电力领域的语意分析方法

Country Status (1)

Country Link
CN (1) CN111126070A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908753A (zh) * 2017-11-20 2018-04-13 合肥工业大学 基于社交媒体评论数据的客户需求挖掘方法及装置
CN108763216A (zh) * 2018-06-01 2018-11-06 河南理工大学 一种基于中文数据集的文本情感分析方法
CN109408809A (zh) * 2018-09-25 2019-03-01 天津大学 一种基于词向量的针对汽车产品评论的情感分析方法
CN109670167A (zh) * 2018-10-24 2019-04-23 国网浙江省电力有限公司 一种基于Word2Vec的电力客服工单情感量化分析方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107908753A (zh) * 2017-11-20 2018-04-13 合肥工业大学 基于社交媒体评论数据的客户需求挖掘方法及装置
CN108763216A (zh) * 2018-06-01 2018-11-06 河南理工大学 一种基于中文数据集的文本情感分析方法
CN109408809A (zh) * 2018-09-25 2019-03-01 天津大学 一种基于词向量的针对汽车产品评论的情感分析方法
CN109670167A (zh) * 2018-10-24 2019-04-23 国网浙江省电力有限公司 一种基于Word2Vec的电力客服工单情感量化分析方法

Similar Documents

Publication Publication Date Title
CN109344395B (zh) 一种数据处理方法、装置、服务器及存储介质
CN105095288B (zh) 数据分析方法及数据分析装置
CN106886567B (zh) 基于语义扩展的微博突发事件检测方法及装置
CN107066537A (zh) 热点新闻生成方法、设备、电子设备
CN107766371A (zh) 一种文本信息分类方法及其装置
CN106557410B (zh) 基于人工智能的用户行为分析方法和装置
CN107688576B (zh) 一种cnn-svm模型的构建及倾向性分类方法
CN110516203B (zh) 争议焦点分析方法、装置、电子设备及计算机可存储介质
CN111143571A (zh) 实体标注模型的训练方法、实体标注方法以及装置
CN109388705B (zh) 一种文本意图分类方法
CN110321549B (zh) 基于序列化学习、关系挖掘、时序分析的新概念挖掘方法
CN105760524A (zh) 一种科学新闻标题的多层次多分类方法
CN111144116B (zh) 一种文档知识结构化的抽取方法及装置
CN108241658B (zh) 一种日志模式发现方法及***
CN113094512B (zh) 一种工业生产制造中故障分析***及方法
CN108536762A (zh) 一种大批量文本数据自动分析方案
CN116108857B (zh) 信息抽取方法、装置、电子设备以及存储介质
CN112446622A (zh) 企业微信会话评价方法、***、电子设备及存储介质
CN114265942A (zh) 知识单元抽取方法、装置、设备和介质
CN111126070A (zh) 一种基于机器学习的电力领域的语意分析方法
CN111815358A (zh) 一种基于跨境电商平台的大数据用户挖掘方法及***
CN107451215B (zh) 特征文本抽取方法及装置
CN112328812B (zh) 基于自调参数的领域知识抽取方法与***、电子设备
CN111723580B (zh) 基于语音识别与图像识别的电力调度厂站信息图效验方法
CN112506405B (zh) 一种基于互联网监管领域的人工智能语音大屏指挥方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination