CN114662469B - 情感分析方法、装置、电子设备及存储介质 - Google Patents
情感分析方法、装置、电子设备及存储介质 Download PDFInfo
- Publication number
- CN114662469B CN114662469B CN202210179198.9A CN202210179198A CN114662469B CN 114662469 B CN114662469 B CN 114662469B CN 202210179198 A CN202210179198 A CN 202210179198A CN 114662469 B CN114662469 B CN 114662469B
- Authority
- CN
- China
- Prior art keywords
- emotion analysis
- role
- pruning
- predicate
- analysis object
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 248
- 230000008451 emotion Effects 0.000 title claims abstract description 242
- 238000013138 pruning Methods 0.000 claims abstract description 131
- 238000000034 method Methods 0.000 claims description 42
- 239000003607 modifier Substances 0.000 claims description 36
- 238000012790 confirmation Methods 0.000 claims description 9
- 230000015654 memory Effects 0.000 claims description 9
- 230000000295 complement effect Effects 0.000 claims description 2
- 238000009966 trimming Methods 0.000 claims 1
- 238000013473 artificial intelligence Methods 0.000 abstract description 3
- 238000010801 machine learning Methods 0.000 abstract description 3
- 238000003058 natural language processing Methods 0.000 abstract description 2
- 238000012549 training Methods 0.000 description 19
- 238000010586 diagram Methods 0.000 description 14
- 238000004891 communication Methods 0.000 description 8
- 238000004590 computer program Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 7
- 238000012360 testing method Methods 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 6
- 238000000605 extraction Methods 0.000 description 6
- 238000012545 processing Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 5
- 239000000284 extract Substances 0.000 description 4
- 230000006870 function Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000003062 neural network model Methods 0.000 description 4
- 230000002996 emotional effect Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 238000013145 classification model Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000006403 short-term memory Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000008485 antagonism Effects 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 239000012141 concentrate Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000013589 supplement Substances 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/253—Grammatical analysis; Style critique
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Data Mining & Analysis (AREA)
- Biomedical Technology (AREA)
- Computing Systems (AREA)
- Molecular Biology (AREA)
- Evolutionary Computation (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Databases & Information Systems (AREA)
- Machine Translation (AREA)
Abstract
本公开提供了一种情感分析方法、装置、电子设备及存储介质,涉及机器学习与自然语言处理等人工智能技术领域。具体实现方案为:识别指定语句中的情感分析对象的角色;基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息;基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感。本公开,能够有效地提高情感分析的准确性。
Description
技术领域
本公开涉及计算机技术领域,具体涉及机器学习与自然语言处理等人工智能技术领域,尤其涉及一种情感分析方法、装置、电子设备及存储介质。
背景技术
情感分析致力于分析文本中涉及的事物的情感倾向,其在社会舆情分析中有着广泛而重要的应用。
现有的情感分析***,主要采用神经网络模型对输入文本进行建模。然后基于建模得到的表示进行情感分析。例如,为了提升模型的泛化能力,可以先引入大规模的预训练模型。然后采用标注有情感类别的训练文本,对预训练模型进行训练,使得该神经网络模型学习到情感分析的能力。
发明内容
本公开提供了一种情感分析方法、装置、电子设备及存储介质。
根据本公开的一方面,提供了一种情感分析方法,包括:
识别指定语句中的情感分析对象的角色;
基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息;
基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感。
根据本公开的另一方面,提供了一种情感分析装置,包括:
识别模块,用于识别指定语句中的情感分析对象的角色;
修剪模块,用于基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息;
分析模块,用于基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感。
根据本公开的再一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的又一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行如上所述的方面和任一可能的实现方式的方法。
根据本公开的再另一方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现如上所述的方面和任一可能的实现方式的方法。
根据本公开的技术,能够有效地提高情感分析的准确性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开第一实施例的示意图;
图2是根据本公开第二实施例的示意图;
图3是本公开提供的一个指定语句的示例;
图4是本公开提供的另一个指定语句的示例;
图5是本公开的四种设置下模型面对RevTgt攻击的评估示意图;
图6是本公开的四种设置下模型面对RevNon攻击的评估示意图;
图7是本公开的四种设置下模型面对AddDiff攻击的评估示意图;
图8是根据本公开第三实施例的示意图;
图9是用来实现本公开实施例的上述方法的电子设备的框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的全部其他实施例,都属于本公开保护的范围。
需要说明的是,本公开实施例中所涉及的终端设备可以包括但不限于手机、个人数字助理(Personal Digital Assistant,PDA)、无线手持设备、平板电脑(TabletComputer)等智能设备;显示设备可以包括但不限于个人电脑、电视等具有显示功能的设备。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
随着技术水平的发展,尤其是近年深度学习技术的发展,模型对于文本的长距离依赖的建模能力越来越强。模型能力的增强在提升***效果的同时,也会引入更严重的过拟合问题和可能,使得模型对于噪声更为敏感,更容易被人为精心设计的对抗所攻击。因此,现有的情感分析方法对噪声较为敏感。
图1是根据本公开第一实施例的示意图;如图1所示,本实施例提供一种情感分析方法,可以应用于任意的情感分析装置中,具体可以包括如下步骤:
S101、识别指定语句中的情感分析对象的角色;
S102、基于情感分析对象的角色对指定语句进行修剪,获取到修剪后的剪枝结果信息;
S103、基于剪枝结果信息,分析情感分析对象在指定语句中的情感。
本实施例的情感分析装置可以为任意的电子实体,或者也可以为软件集成的应用或者插件等,使用时运行在各种类型的终端上。
本实施例中的情感分析是用于对句子中的情感分析对象的情感进行分析。例如,对于任意指定语句,可以请求分析该指定语句中的任意一个情感分析对象的情感。
需要说明的是,本实施例中的指定语句中的情感分析对象可以由用户指定,或者也可以由其他具有情感分需求的装置来指定。例如,用户在做研究时,可以对于每个指定语句选择一个情感分析对象,来分析该情感分析对象在该指定语句中的情感。或者也可以采用预先训练的情感分析对象选择模型,从指定语句中筛选一个情感分析对象,来分析该情感分析对象在指定语句中的情感。
在本实施例中,识别指定语句中的情感分析对象的角色,指的是该情感分析对象在该指定语句中承担的角色。
进一步地,在本实施例中,需要基于情感分析对象的角色对指定语句进行修剪,以去除指定语句中与情感分析对象没有关系的噪声,避免噪声对情感分析的影响,最终获取到修剪后的剪枝结果信息。
例如,本实施例的修剪可以包括基于情感分析对象的角色,从指定语句中剪去与情感分析对象无关的信息。或者也可以包括基于情感分析对象的角色,从指定语句中提取与情感分析对象的角色相关的信息。无论采用哪种方式,均可以实现剪枝的效果,获取到修剪后的剪枝结果信息。本实施例的剪枝结果信息也可以理解为指定语句中、与情感分析对象的角色相关的精简信息。该精简信息中没有任何其他无关的噪声。
本实施例的情感分析方法,通过基于情感分析对象的角色对指定语句进行修剪,获取到修剪后的剪枝结果信息,并基于剪枝结果信息,分析情感分析对象在指定语句中的情感,由于该剪枝结果信息去除了所有与情感分析对象的角色无关的噪声信息,在分析情感分析对象在指定语句中的情感时,可以减少噪声对分析结果的影响,能够有效地提高指定语句中的情感分析对象的情感分析的准确性,而且能够有效地提升情感分析的鲁棒性。
图2是根据本公开第二实施例的示意图;如图2所示,本实施例的情感分析方法,在上述图1所示实施例的技术方案的基础上,进一步更加详细地描述本公开的技术方案。如图2所示,本实施例的情感分析方法,具体可以包括如下步骤:
S201、采用依存句法分析工具识别指定语句中的情感分析对象的角色;
由于本实施例中要分析情感分析对象在指定语句中的情感,而情感分析对象一般在句中扮演主语或宾语的角色,偶尔扮演谓语的角色。例如“很好用”中的“用”这一对象在句中就是作谓语。而对于句子中的其他角色,不存在情感,所以情感分析对象通常不会为其他角色。但是实际应用中,若情感分析对象标注错误,情感分析对象为指定语句中的其他角色,当然,按照本实施例的流程也可以对其进行情感分析,可能最终情感分析的结果偏向于无情感之类的标识。
对于主语对象,基于依存句法分析一般可以将其识别为nominal subject,简称nsubj;或者可以将其识别为passive nominal subject,简称nsubjpass;或者可以将其识别为clausal subject,简称csubj;或者可以将其识别为passive clausal subject,简称csubjpass。而宾语对象一般可以将其识别为direct object,简称dobj;或者可以将其识别为object of preposition,简称pobj;或者可以将其识别为object,简称obj;或者可以将其识别为attribute,简称attr。而谓语对象一般可以将其识别为verb。
例如,图3是本公开提供的一个指定语句的示例。如图3所示,以指定语句是“Thefood is delicious but the service is bad”为例,采用依存句法分析工具分析指定语句中的每个词语的角色,角色标注结果如图3所示。若指定的情感分析对象为“theservice”,则可以识别其为主语。
该步骤S201为上述图1所示实施例的步骤S101的一种实现方式。通过该方式,能够准确地确定情感分析对象的角色。
可选地,在本公开的一个实施例中,还可以采用预先训练的角色识别模型,识别指定语句中的情感分析对象的角色。
该角色识别模型可以基于依存句法分析的原理来建模。使用之前,可以采用大量的标注有各词语的角色的训练语句对该角色识别模型进行训练,使得该角色识别模型可以学习到识别语句中各角色的能力。采用该角色识别模型,能够准确地识别到情感分析对象在指定语句中的角色。
S202、检测情感分析对象的角色是主语、谓语还是宾语;若是主语,执行步骤S203;若是谓语,执行步骤S204;若是宾语,执行步骤S205;
S203、从指定语句中提取主语、主语对应的谓语、谓语的修饰语、主语对应的宾语及宾语的修饰语,作为剪枝结果信息;执行步骤S206;
若情感分析对象的角色为主语,需要注意的是,在某些情况下,一个主语可以有多个谓语和宾语。例如在句子“My phone is quite old but still works well.”中,主语“phone”就存在两个谓语”is”和”works”。此时,需要提取主语对应的每一个谓语以及谓语的修饰语。
S204、从指定语句中提取谓语、谓语对应的介词以及补语,作为剪枝结果信息;执行步骤S213;
例如,以”It is of high quality,has a killer GUI,easy to use.”为例,若情感分析对象为“use”,在语句中为谓语,基于上述提取策略,可以提取“It is easy touse.”作为剪枝结果信息。
S205、从指定语句中提取宾语、宾语对应的修饰语、宾语对应的主语及主语的修饰语、宾语对应的谓语及谓语的修饰语,作为剪枝结果信息;执行步骤S206;
若情感分析对象的角色为宾语,需要注意的是,一个宾语只允许存在一个谓语,但是在有些情况下,可以允许存在多个主语。此时,需要提取宾语对应的每一个主语以及主语的修饰语。
上述步骤S203-S205,分别为情感分析对象的角色为主语、谓语以及宾语时,对应的剪枝策略,基于上述剪枝策略,可以分别获取到相应剪枝结果信息。
具体地,为了提取剪枝结果信息中的相关内容,可以基于依存句法分析结果中情感分析对象的角色以及其他各词语的角色,基于分析结果,可以先建立句法分析树。然后进一步采用上述步骤S203-S205的策略,抽取情感分析对象以及情感分析对象的相关信息。
例如,当情感分析对象为主语时,从该情感分析对象在句法分析树上的节点出发,先提取它对应的形容词和动词。然后再提取形容词对应的副词,动词对应的副词和宾语。之后再提取宾语的形容词以及形容词的副词。从上述描述中,很容易发现该抽取过程其实是一个广度优先遍历的过程,总之,要将情感分析对象相关的信息都抽取出来。如下表格1给出了每种给定角色相关的角色。在广度优先遍历过程中,需要将每种给定角色相邻的相关角色都会被提取到相关队列中,该相关队列中提取到的所有信息便是剪枝结果信息。其中给定角色不仅包括情感分析对象的角色,还包括基于情感分析对象的角色遍历到的相关角色。
表1
S206、检测指定语句中情感分析对象对应的谓语是否存在共轭角色;若存在,执行步骤S207;若不存在,执行步骤S210;
S207、检测情感分析对象是否为谓语对应的最近的主语或者宾语;若不是,执行步骤S208;若是,确定剪枝结果信息中提取的信息正确,不需要修改;执行步骤S210;
S208、删除剪枝结果信息中提取的该谓语的修饰语;执行步骤S209;
S209、提取该谓语的共轭角色对应的修饰语;将该谓语的共轭角色对应的修饰语追加至剪枝结果信息中;执行步骤S210;
上述步骤S206-S209为情感分析对象为主语或者宾语时,检测到情感分析对象对应的谓语存在共轭角色时,对剪枝结果信息的更新。
因为共轭角色“conjunction”的存在,上述方法有时会错误地提取和情感分析对象不相关的谓语。以句子“The food is delicious but the service is bad.”为例。对于情感分析对象”the service”而言,其相关的谓语只有第二个”is”。但是因为第一个”is”和第二个”is”在句法分析树中是共轭关系,所以第一个”is”也会被上述方法提取,导致相关内容的提取错误。此时,需要采用步骤S206-S209,对剪枝结果信息做更新,能够有效地保证剪枝结果信息的准确性。
步骤S207的方式可以为反向确认的方式,本实施例中通过引入谓语的反向确认方式,可以对剪枝结果信息进行再次确认,并在提取错误是,及时进行更新。具体地,在该反向确认的方式中,对于每个动词,识别其对应的最近的主语或宾语。如果分析对象不是该谓语最近的主语或宾语时,则剪枝结果信息中不应提取该动词及其相关联的内容。此时若剪枝结果信息中已提取了该谓语及相关信息,则进行删除,并重新提取共轭角色的谓语的相关信息。例如,仍以句子“The food is delicious but the service is bad.”为例,情感分析对象为第一个“service”时,通过反向确认,第一个“is”最近的主语是“food”,而不是“service”,剪枝结果信息中不应该提取第一个“is”对应的主语“food”;而是要提取第二个“is”对应的主语“service”。
该实现方式中,将步骤S206-S209的共轭角色的分析放在步骤S203和步骤S206之后。
可选地,本实施例中,也可以将共轭角色的分析的过程放在步骤S203和步骤S206之前,此时,对应地,在步骤S202中检测情感分析对象的角色是主语或者宾语时,可以包括如下步骤:
(1)检测指定语句中情感分析对象对应的谓语是否存在共轭角色;若存在,执行步骤(2);若不在存在,基于情感分析对象对应的角色,直接执行步骤S203或者S205。
(2)基于情感分析对象,采用反向确认的方式,识别情感分析对象的谓语;执行步骤(3);
(3)标识情感分析对象的谓语。
例如,本实施例的反向确认的方式,就是检测两个共轭角色的谓语中哪个的主语或者宾语是该情感分析对象,那么那个谓语便是情感分析对象的谓语。本实施例中,可以对情感分析对象的谓语做一个标识,以便于在提取时能够准确的提取到情感分析对象的谓语以及谓语对应的修饰语。采用该方式,也能够有效地保证剪枝结果信息的准确性。
S210、对情感分析对象做共指解析,检测指定语句中是否存在与情感分析对象指代相同的共指对象;若存在,执行步骤S211;若不存在,执行步骤S213;
S211、基于共指对象,从指定语句中追加提取共指对象的相关信息;执行步骤S212;
S212、将共指对象的相关信息追加至剪枝结果信息中;执行步骤S213;
在实际应用中,情感分析对象会以不同的形式出现在句子中的多个部位,而情感分析对象给定的形式是固定的。在这种情况下,如果不能识别这些对对象不同形式的表达将会导致剪枝结果信息的丢失。以指定句子“I buy the computer just last month,itdoes not work now.”、情感分析对象是“computer”为例。在该指定句子中,“it”和“computer”描述的是同一个对象。在该情况下,如果不能正确识别这点,只会提取“I buythe computer just last month.”作为剪枝结果信息,而丢失了“it does not worknow”,这一重要内容。
基于此,本实施例中引入上述步骤S210-S212的共指解析过程。具体地,当情感分析对象是主语或宾语时,需要执行该做共指解析过程,识别出和情感分析对象指代相同的共指对象。和提取情感分析对象的相关信息相同的方式,对应提取共指对象的相关信息。如共指对象为主语时,可以按照步骤S203提取共指对应的相关信息;若共指对象为宾语时,可以按照步骤S205提取共指对象的相关信息。最后将情感分析对象的相关信息和共指对象的相关信息一起构成剪枝结果信息。
步骤S210-S212是以共指分析过程位于步骤S203和步骤S205之后进行为例。实际应用中,步骤S210-S212也可以在步骤S202之后,在确定情感分析对象为主语或者宾语时,同时执行步骤S210-S212,或者在步骤S203和步骤S205之前执行,在此不做限定。
S213、检测剪枝结果信息是否为指定语句中的子句信息;若是,执行步骤S214;若不是,执行步骤S216;
S214、从指定语句中追加提取子句信息对应的主句信息;执行步骤S215;
S215、将主句信息追加至剪枝结果信息中;执行步骤S216;
步骤S213-S215一定在获取到剪枝结果信息之后进行。具体地,在度情感分析中,有时候情感分析对象是子句的组成部分而不是主句的组成部分。这种情况下,按照本实施例的上述提取方式只会提取子句的内容而不会提取主句的内容。
例如,图4是本公开提供的另一个指定语句的示例。如图4所示,情感分析对象为“the entire suit of software”时,“the entire suit of software”是子句“theentire suit of software works together.”的主语,上述提取方法只会提取该子句。这显然是不充分、不合理。在这种情况下,本实施例中需要进一步提取情感分析对象对应的主句。为此,本实施例中提出进一步识别和提取对应的主句信息。具体地,通过对句法分析树进行解析发现子句是主句的宾语“the way”的补语,说明其为子句,可以进一步提取“theway”及其相关内容,即提取子句对应的主句信息。
基于上述各步骤的处理,可以得到相对于指定语句,非常精简的剪枝结果信息。例如,如下表2为一个原始语句和剪枝结果语句的示例,其中加粗字体为对应的情感分析对象。
表2
从上述表3中,可以直观地看出本实施例的剪枝方案能有效剔除句子中对情感分析对象的情感分析冗余的信息。
S216、采用预先训练的情感分析模型,基于剪枝结果信息,分析情感分析对象在指定语句中的情感。
本实施例中,将上述步骤剪枝得到的剪枝结果信息,输入至预先训练的情感分析模型中,此时该剪枝结果信息相对于原始的指定语句,已经去除了很多的噪声,能够减少噪声对指定对象情感分析的影响。此时该情感分析模型基于输入的剪枝结果信息,可以准确地预测到情感分析对象在指定语句中的情感。而且,采用该情感分析模型进行情感分析,不仅可以提高情感分析的准确性,还能够提高情感分析的智能性。
本实施例的情感分析模型可以为一个二分类或者多分类的模型。具体依据训练时该情感分类模型设定的分类的类别数量来定。例如,若为二分类时,对应的情感分类可以设置为positive和passive,分别标识正向的积极乐观的情感和负向的消极悲观的情感。若为三分类或者多分类的时候,可以将情绪分为三种、或者多种等级,分别标识不同程度的情感。
该情感分析模型在训练时,可以采用多条训练样本对该情感分析模型进行训练。其中每一条训练样本中包括训练语句、该训练语句中指定的训练对象以及该训练对象在该训练语句中的情感类别。采用多条训练样本对该情感分析模型进行训练,可以使得该情感分析模型学习到情感分析的能力。
本实施例的情感分析模型可以采用长短记忆(Long Short-Term Memory;LSTM)结构或Transformer结构的神经网络模型。
本实施例的情感分析方法,基于情感分析对象是主语、谓语或者宾语的不同情况,可以采用相应的剪枝策略,准确地获取到剪枝结果信息,以有效地去除指定语句中与情感分析对象无关的噪声;并进一步基于剪枝结果信息和预先训练的情感分析模型,能够准确地预测情感分析对象在指定语句中的情感。本实施例的技术方案,能够有效地提高情感分析对象的情感分析的准确性;而且由于采用了剪枝操作得到剪枝结果信息,有效地去除了噪声,减少噪声对情感分析的影响,能够进一步有效地提高整个情感分析方案的鲁棒性。
进一步地,本实施例中,针对于情感分析对象为主语或者宾语,若情感分析对象的谓语存在共轭角色时,还可以进一步采用反向确认的方式,更新剪枝结果信息,能够有效地确保剪枝结果信息的准确性,进而进一步有效地提高情感分析对象的情感分析的准确性。
进一步地,本实施例中,针对于情感分析对象为主语或者宾语,还要进一步做共指解析,并在情感分析对象存在共指对象时,进一步提取共指对象的相关信息,添加至剪枝结果信息中,能够进一步地确保剪枝结果信息的全面性和准确性。进而可以进一步有效地提高情感分析对象的情感分析的准确性。
进一步地,本实施例中,针对于剪枝结果信息为指定语句中的一个子句信息时,还可以进一步提取对应的主句信息,也能够进一步地确保剪枝结果信息的全面性和准确性。进而可以进一步有效地提高情感分析对象的情感分析的准确性。
在本公开中,还可以对本公开的基于剪枝后的剪枝结果信息,对情感分析对象进行情感分析的效果进行验证。具体地,可以在多个典型数据集上进行测试,以检测本公开方案的性能。
例如,下面分析本公开的方案面对三个典型攻击RevTgt、RevNon、以及AddDiff的表现,其中RevTgt通过反转情感分析对象的情感极性来施加对抗;RevNon通过反转非情感分析对象的情感极性来施加对抗;而AddDiff通过引入和分析对象情感不一致的内容来施加对抗。如下表3为三种攻击的介绍以及对应的示例,其中示例中的加粗字体为情感分析对象。
表3
在本公开的测试中,测试了基于长短期记忆网络(Long Short-Term Memory;LSTM)结构和Transformer结构的神经网络模型。前者使用了预训练的词袋模型Glove模型,后者使用了预训练的语言模型BERT模型。每个模型在四种设置下进行试验:Origin、TrimOrigin、Attack、TrimAttack。
其中Origin设置下,模型在原始训练数据集和测试数据集上进行训练和测试。在TrimOrigin设置下,模型在采用本公开的剪枝方案修剪后的训练数据集和测试数据集上进行训练和测试。在Attack设置下,模型在原始训练数据集上进行训练,在攻击后的测试数据集上进行测试。在TrimAttack设置下,模型在修剪过的被攻击的训练数据集和测试数据集上进行训练和测试。
进一步地,使用宏平均(Macro-F1)对***进行评估。对该指标而言,值越大表示***表现越好。图5是本公开的四种设置下模型面对RevTgt攻击的评估示意图。图6是本公开的四种设置下模型面对RevNon攻击的评估示意图。图7是本公开的四种设置下模型面对AddDiff攻击的评估示意图。其中图5、图6和图7中的纵坐标都是Macro-F1的值。
根据图5、图6和图7所示的结果,可以得知:
1、模型在Attack设置下的表现较在Origin设置下的表现差很多。这反映了模型在面对这三种攻击时的脆弱性,同时也说明了鲁棒的情感分析的重要性。
2、很多情况下,模型在TrimOrigin设置下的表现较在Origin设置下的表现更好,可以说明本公开的句子剪枝技术,甚至能提高模型在常规样本上的泛化能力。对应地,可以解释为:句子剪枝能使得模型更专注于分析对象相关的信息,而舍去无关信息,从而降低模型对训练数据集的过拟合。
3、模型在TrimAttack设置下的表现较在Attack设置下的表现更好,可以说明本公开的句子剪枝技术,能有效提高模型在面对这三种攻击时的鲁棒性。
图8是根据本公开第三实施例的示意图;如图8所示,本实施例提供一种情感分析装置800,包括:
识别模块801,用于识别指定语句中的情感分析对象的角色;
修剪模块802,用于基于情感分析对象的角色对指定语句进行修剪,获取到修剪后的剪枝结果信息;
分析模块803,用于基于剪枝结果信息,分析情感分析对象在指定语句中的情感。
本实施例的情感分析装置800,通过采用上述模块实现情感分析的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关实施例的记载,在此不再赘述。
可选地,在本公开的一个实施例中,修剪模块802,用于:
若情感分析对象的角色为主语,从指定语句中提取主语、主语对应的谓语、谓语的修饰语、主语对应的宾语及宾语的修饰语,作为剪枝结果信息;
若情感分析对象的角色为宾语,从指定语句中提取宾语、宾语的修饰语、宾语对应的主语及主语的修饰语、宾语对应的谓语及谓语的修饰语,作为剪枝结果信息;或者
若情感分析对象的角色为谓语,从指定语句中提取谓语、谓语对应的介词以及补语,作为剪枝结果信息。
可选地,在本公开的一个实施例中,修剪模块802,还用于:
若情感分析对象的角色为主语或者宾语时,检测指定语句中情感分析对象对应的谓语是否存在共轭角色;
若存在,检测情感分析对象是否为谓语对应的最近的主语或者宾语;
若不是,删除剪枝结果信息中提取的谓语的修饰语;
提取谓语的共轭角色对应的修饰语;
将谓语的共轭角色对应的修饰语追加至剪枝结果信息中。
可选地,在本公开的一个实施例中,修剪模块802,还用于:
若情感分析对象的角色为主语或者宾语时,检测指定语句中情感分析对象对应的谓语是否存在共轭角色;
若存在,基于情感分析对象,采用反向确认的方式,识别情感分析对象的谓语;
标识情感分析对象的谓语。
可选地,在本公开的一个实施例中,修剪模块802,还用于:
检测剪枝结果信息是否为指定语句中的子句信息;
若是,从指定语句中追加提取子句信息对应的的主句信息;
将主句信息追加至剪枝结果信息中。
可选地,在本公开的一个实施例中,修剪模块802,还用于:
若情感分析对象的角色为主语或者宾语时,对情感分析对象做共指解析,检测指定语句中是否存在与情感分析对象指代相同的共指对象;
若存在,基于共指对象,从指定语句中提取共指对象的相关信息;
将共指对象的相关信息添加至剪枝结果信息中。
可选地,在本公开的一个实施例中,识别模块801,用于:
采用依存句法分析工具识别指定语句中的情感分析对象的角色;或者
采用预先训练的角色识别模型,识别指定语句中的情感分析对象的角色。
可选地,在本公开的一个实施例中,分析模803,用于:
采用预先训练的情感分析模型,基于剪枝结果信息,分析情感分析对象在指定语句中的情感。
上述实施例的情感分析装置800,通过采用上述模块实现情感分析的实现原理以及技术效果,与上述相关方法实施例的实现相同,详细可以参考上述相关实施例的记载,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如本公开的上述方法。例如,在一些实施例中,本公开的上述方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM 902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的本公开的上述方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行本公开的上述方法。
本文中以上描述的***和技术的各种实施方式可以在数字电子电路***、集成电路***、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上***的***(SOC)、复杂可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程***上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储***、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储***、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行***、装置或设备使用或与指令执行***、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体***、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的***和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的***和技术实施在包括后台部件的计算***(例如,作为数据服务器)、或者包括中间件部件的计算***(例如,应用服务器)、或者包括前端部件的计算***(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的***和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算***中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将***的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机***可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式***的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (18)
1.一种情感分析方法,包括:
识别指定语句中的情感分析对象的角色;
基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息;
基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感;
基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息,包括:
若所述情感分析对象的角色为主语,从所述指定语句中提取所述主语、所述主语对应的谓语、谓语的修饰语、所述主语对应的宾语及所述宾语的修饰语,作为所述剪枝结果信息。
2.根据权利要求1所述的方法,其中,基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息,还包括:
若所述情感分析对象的角色为宾语,从所述指定语句中提取所述宾语、所述宾语的修饰语、所述宾语对应的主语及所述主语的修饰语、所述宾语对应的谓语及所述谓语的修饰语,作为所述剪枝结果信息;或者
若所述情感分析对象的角色为谓语,从所述指定语句中提取所述谓语、所述谓语对应的介词以及补语,作为所述剪枝结果信息。
3.根据权利要求2所述的方法,其中,若所述情感分析对象的角色为主语或者宾语时,基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息之后,所述方法还包括:
检测所述指定语句中所述情感分析对象对应的谓语是否存在共轭角色;
若存在,检测所述情感分析对象是否为所述谓语对应的最近的主语或者宾语;
若不是,删除所述剪枝结果信息中提取的所述谓语的修饰语;
提取所述谓语的共轭角色对应的修饰语;
将所述谓语的共轭角色对应的修饰语追加至所述剪枝结果信息中。
4.根据权利要求2所述的方法,其中,若所述情感分析对象的角色为主语或者宾语时,基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息之前,所述方法还包括:
检测所述指定语句中所述情感分析对象对应的谓语是否存在共轭角色;
若存在,基于所述情感分析对象,采用反向确认的方式,识别所述情感分析对象的谓语;
标识所述情感分析对象的谓语。
5.根据权利要求2所述的方法,其中,所述方法还包括:
检测所述剪枝结果信息是否为所述指定语句中的子句信息;
若是,从所述指定语句中追加提取所述子句信息对应的主句信息;
将所述主句信息追加至所述剪枝结果信息中。
6.根据权利要求2所述的方法,其中,若所述情感分析对象的角色为主语或者宾语时,所述方法还包括:
对所述情感分析对象做共指解析,检测所述指定语句中是否存在与所述情感分析对象指代相同的共指对象;
若存在,基于所述共指对象,从所述指定语句中提取所述共指对象的相关信息;
将所述共指对象的相关信息添加至所述剪枝结果信息中。
7.根据权利要求1-6任一所述的方法,其中,识别指定语句中的情感分析对象的角色,包括:
采用依存句法分析工具识别所述指定语句中的所述情感分析对象的角色;或者
采用预先训练的角色识别模型,识别所述指定语句中的所述情感分析对象的角色。
8.根据权利要求1-6任一所述的方法,其中,基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感,包括:
采用预先训练的情感分析模型,基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感。
9.一种情感分析装置,包括:
识别模块,用于识别指定语句中的情感分析对象的角色;
修剪模块,用于基于所述情感分析对象的角色对所述指定语句进行修剪,获取到修剪后的剪枝结果信息;
分析模块,用于基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感;
所述修剪模块,用于:
若所述情感分析对象的角色为主语,从所述指定语句中提取所述主语、所述主语对应的谓语、谓语的修饰语、所述主语对应的宾语及所述宾语的修饰语,作为所述剪枝结果信息。
10.根据权利要求9所述的装置,其中,所述修剪模块,还用于:
若所述情感分析对象的角色为宾语,从所述指定语句中提取所述宾语、所述宾语的修饰语、所述宾语对应的主语及所述主语的修饰语、所述宾语对应的谓语及所述谓语的修饰语,作为所述剪枝结果信息;或者
若所述情感分析对象的角色为谓语,从所述指定语句中提取所述谓语、所述谓语对应的介词以及补语,作为所述剪枝结果信息。
11.根据权利要求10所述的装置,其中,所述修剪模块,还用于:
若所述情感分析对象的角色为主语或者宾语时,检测所述指定语句中所述情感分析对象对应的谓语是否存在共轭角色;
若存在,检测所述情感分析对象是否为所述谓语对应的最近的主语或者宾语;
若不是,删除所述剪枝结果信息中提取的所述谓语的修饰语;
提取所述谓语的共轭角色对应的修饰语;
将所述谓语的共轭角色对应的修饰语追加至所述剪枝结果信息中。
12.根据权利要求10所述的装置,其中,所述修剪模块,还用于:
若所述情感分析对象的角色为主语或者宾语时,检测所述指定语句中所述情感分析对象对应的谓语是否存在共轭角色;
若存在,基于所述情感分析对象,采用反向确认的方式,识别所述情感分析对象的谓语;
标识所述情感分析对象的谓语。
13.根据权利要求10所述的装置,其中,所述修剪模块,还用于:
检测所述剪枝结果信息是否为所述指定语句中的子句信息;
若是,从所述指定语句中追加提取所述子句信息对应的主句信息;
将所述主句信息追加至所述剪枝结果信息中。
14.根据权利要求10所述的装置,其中,所述修剪模块,还用于:
若所述情感分析对象的角色为主语或者宾语时,对所述情感分析对象做共指解析,检测所述指定语句中是否存在与所述情感分析对象指代相同的共指对象;
若存在,基于所述共指对象,从所述指定语句中提取所述共指对象的相关信息;
将所述共指对象的相关信息添加至所述剪枝结果信息中。
15.根据权利要求9-14任一所述的装置,其中,所述识别模块,用于:
采用依存句法分析工具识别所述指定语句中的所述情感分析对象的角色;或者
采用预先训练的角色识别模型,识别所述指定语句中的所述情感分析对象的角色。
16.根据权利要求9-14任一所述的装置,其中,所述分析模块,用于:
采用预先训练的情感分析模型,基于所述剪枝结果信息,分析所述情感分析对象在所述指定语句中的情感。
17.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-8中任一项所述的方法。
18.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-8中任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210179198.9A CN114662469B (zh) | 2022-02-25 | 2022-02-25 | 情感分析方法、装置、电子设备及存储介质 |
US17/942,116 US20230274088A1 (en) | 2022-02-25 | 2022-09-10 | Sentiment parsing method, electronic device, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210179198.9A CN114662469B (zh) | 2022-02-25 | 2022-02-25 | 情感分析方法、装置、电子设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114662469A CN114662469A (zh) | 2022-06-24 |
CN114662469B true CN114662469B (zh) | 2023-04-07 |
Family
ID=82026988
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210179198.9A Active CN114662469B (zh) | 2022-02-25 | 2022-02-25 | 情感分析方法、装置、电子设备及存储介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20230274088A1 (zh) |
CN (1) | CN114662469B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20230342822A1 (en) * | 2018-12-11 | 2023-10-26 | Hiwave Technologies Inc. | Method and system of sentiment-based tokenization and secure deployment thereof |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110232181B (zh) * | 2018-03-06 | 2022-09-23 | 阿里巴巴(中国)有限公司 | 评论分析方法及装置 |
CN110852095B (zh) * | 2018-08-02 | 2023-09-19 | ***股份有限公司 | 语句热点提取方法及*** |
WO2021262408A1 (en) * | 2020-06-26 | 2021-12-30 | Oracle International Corporation | Improved discourse parsing |
CN113434682A (zh) * | 2021-06-30 | 2021-09-24 | 平安科技(深圳)有限公司 | 文本情感分析方法、电子装置及存储介质 |
CN113792542A (zh) * | 2021-10-12 | 2021-12-14 | 南京新一代人工智能研究院有限公司 | 一种融合句法分析和语义角色剪枝的意图理解方法 |
-
2022
- 2022-02-25 CN CN202210179198.9A patent/CN114662469B/zh active Active
- 2022-09-10 US US17/942,116 patent/US20230274088A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US20230274088A1 (en) | 2023-08-31 |
CN114662469A (zh) | 2022-06-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220004714A1 (en) | Event extraction method and apparatus, and storage medium | |
EP3819785A1 (en) | Feature word determining method, apparatus, and server | |
EP4123496A2 (en) | Method and apparatus for extracting text information, electronic device and storage medium | |
WO2023116561A1 (zh) | 一种实体提取方法、装置、电子设备及存储介质 | |
EP4191544A1 (en) | Method and apparatus for recognizing token, electronic device and storage medium | |
CN113836925A (zh) | 预训练语言模型的训练方法、装置、电子设备及存储介质 | |
CN112990035A (zh) | 一种文本识别的方法、装置、设备以及存储介质 | |
JP2023025126A (ja) | 深層学習モデルのトレーニング方法及び装置、テキストデータ処理方法及び装置、電子機器、記憶媒体、並びにコンピュータプログラム | |
CN114662469B (zh) | 情感分析方法、装置、电子设备及存储介质 | |
CN115017898A (zh) | 敏感文本的识别方法、装置、电子设备及存储介质 | |
US20230052623A1 (en) | Word mining method and apparatus, electronic device and readable storage medium | |
CN116383382A (zh) | 敏感信息的识别方法、装置、电子设备及存储介质 | |
CN114201607B (zh) | 一种信息处理的方法和装置 | |
CN113312451B (zh) | 文本标签确定方法和装置 | |
CN114818736A (zh) | 文本处理方法、用于短文本的链指方法、装置及存储介质 | |
CN112818972A (zh) | 兴趣点图像的检测方法、装置、电子设备及存储介质 | |
CN113641724A (zh) | 知识标签挖掘方法、装置、电子设备及存储介质 | |
CN114186552B (zh) | 文本分析方法、装置、设备及计算机存储介质 | |
US11907668B2 (en) | Method for selecting annotated sample, apparatus, electronic device and storage medium | |
CN116244740B (zh) | 一种日志脱敏方法、装置、电子设备及存储介质 | |
CN116628004B (zh) | 信息查询方法、装置、电子设备及存储介质 | |
CN113326691B (zh) | 数据处理方法和装置、电子设备、计算机可读介质 | |
CN113656592B (zh) | 基于知识图谱的数据处理方法、装置、电子设备和介质 | |
CN113971216B (zh) | 数据处理方法、装置、电子设备和存储器 | |
CN114064847A (zh) | 一种文本检测方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |