CN111325016B - 一种文本处理方法、***、设备、介质 - Google Patents
一种文本处理方法、***、设备、介质 Download PDFInfo
- Publication number
- CN111325016B CN111325016B CN202010079923.6A CN202010079923A CN111325016B CN 111325016 B CN111325016 B CN 111325016B CN 202010079923 A CN202010079923 A CN 202010079923A CN 111325016 B CN111325016 B CN 111325016B
- Authority
- CN
- China
- Prior art keywords
- text
- target
- clause
- feature vector
- preset
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 28
- 230000008451 emotion Effects 0.000 claims abstract description 93
- 230000009471 action Effects 0.000 claims abstract description 75
- 238000012545 processing Methods 0.000 claims abstract description 28
- 238000013528 artificial neural network Methods 0.000 claims description 57
- 125000004122 cyclic group Chemical group 0.000 claims description 43
- 230000000306 recurrent effect Effects 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 13
- 238000005516 engineering process Methods 0.000 claims description 8
- 230000002457 bidirectional effect Effects 0.000 claims description 4
- 238000007781 pre-processing Methods 0.000 claims description 4
- 238000000605 extraction Methods 0.000 abstract description 33
- 230000000694 effects Effects 0.000 abstract description 8
- 238000000034 method Methods 0.000 description 22
- 230000008569 process Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000011218 segmentation Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000002708 enhancing effect Effects 0.000 description 2
- 230000004927 fusion Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000009849 deactivation Effects 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/044—Recurrent networks, e.g. Hopfield networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Molecular Biology (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种文本处理方法、***、设备、介质,该方法包括:对预设文本栈中第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;对第一文本序列特征向量、第二文本序列特征向量以及第三序列特征向量进行拼接,得到目标序列特征向量,并确定目标执行动作;判断预设文本栈和预设文本缓存器是否均为空,如果否,重新执行相应的步骤。这样能够联合抽取出目标文本中的情感子句以及对应的情感原因,且对情感子句以及对应的情感原因的抽取误差小,增强了抽取效果和性能。
Description
技术领域
本申请涉及数据处理技术领域,特别涉及一种文本处理方法、***、设备、介质。
背景技术
文本情感-原因抽取任务是研究社交媒体情感分布及其形成原因的重要技术。文本情感-原因的主要任务针对给定文本,抽取文本中表达情感倾向性的子句并找出造成该情感的原因子句。例如:前天室友约我一起出去逛街,结果回来时发现手机丢了,好伤心啊!其中,情感子句为好伤心啊,情感原因为结果回来时发现手机丢了。在传统情感原因分析的研究中,通常采用单任务学习模型,也即将情感抽取和情感原因发现看作两个独立的任务。这种单任务学习模型需要针对不同的任务设计不同的学习模型,这种方式导致情感原因抽取效率低下且对于情感抽取的误差会传递到情感原因发现任务中,导致情感原因抽取误差增大,模型性能下降。此外,单任务学习模型难以捕获不同任务之间的相互影响,使得单任务学习模型在优化阶段,梯度的反向传播倾向于陷入局部极小值,得到局部最优解,导致情感原因抽取效果差。
发明内容
有鉴于此,本申请的目的在于提供一种文本处理方法、装置、设备、介质,能够联合抽取出目标文本中的情感子句以及对应的情感原因,且对情感子句以及对应的情感原因的抽取误差小,增强了抽取效果和性能。其具体方案如下:
第一方面,本申请公开了一种文本处理方法,包括:
S11:利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;
S12:利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;
S13:利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;
S14:利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因;
S15:判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新进入步骤S11。
可选的,所述文本处理方法,还包括:
对目标文本进行预处理,得到所述目标文本的关键词集;
利用词嵌入技术对所述关键词集进行处理,得到所述目标文本中各个子句对应的向量化文本子句。
可选的,所述利用词嵌入技术对所述关键词集进行处理,得到所述目标文本中各个子句对应的向量化文本子句之后,还包括:
将所述预设文本栈初始化为所述目标文本中的第一个向量化文本子句和第二个向量化文本子句;
将所述预设文本缓存器初始化为所述目标文本中除所述第一个向量化文本子句和所述第二个向量化文本子句之外的所述向量化文本子句。
可选的,所述利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量,包括:
利用单向循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量。
可选的,所述利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量,包括:
利用双向循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量。
可选的,所述利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,包括:
利用训练后多层全连接网络对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量。
可选的,所述根据所述目标序列特征向量确定目标执行动作,包括:
如果所述目标执行动作为移动,则将所述预设文本缓存器中的第二目标文本子句移动到所述预设文本栈中;
如果所述目标执行动作为第一左规约,则将所述预设文本栈中的第一目标文本子句中的第二个目标文本子句标记为第一个目标文本子句的原因,并将所述第二个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第二左规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为情感子句,并将所述第二个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第一右规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为所述第二个目标文本子句的原因,并将所述第一个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第二右规约,则将所述预设文本栈中的第一目标文本子句中的所述第二个目标文本子句标记为情感子句,并将所述第一个目标文本子句从所述预设文本栈中移除。
第二方面,本申请公开了一种文本处理***,包括:
文本栈编码器,用于利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;
文本缓存编码器,用于利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;
动作序列编码器,用于利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;
训练后分类器,用于对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因;
判断模块,用于判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新调用所述文本栈编码器。
第三方面,本申请公开了一种文本处理设备,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现前述公开的文本处理方法。
第四方面,本申请公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述公开的文本处理方法。
可见,本申请先利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;再利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;然后利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;接着利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因;再判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新开始执行利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量的步骤。这样能够联合抽取出目标文本中的情感子句以及对应的情感原因,且对情感子句以及对应的情感原因的抽取误差小,增强了抽取效果和性能。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请公开的一种文本处理方法流程图;
图2为本申请公开的一种具体的文本处理方法流程图;
图3为本申请公开的一种文本处理***结构示意图;
图4为本申请公开的一种具体的文本处理***结构示意图;
图5为本申请公开的一种文本处理设备结构图;
图6为本申请公开的一种电子设备结构图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
目前,在情感原因分析的研究中,通常采用单任务学习模型,也即将情感抽取和情感原因发现看作两个独立的任务。这种单任务学习模型需要针对不同的任务设计不同的学习模型,这种方式导致情感原因抽取效率低下且对于情感抽取的误差会传递到情感原因发现任务中,导致情感原因抽取误差增大,模型性能下降。此外,单任务学习模型难以捕获不同任务之间的相互影响,使得单任务学习模型在优化阶段,梯度的反向传播倾向于陷入局部极小值,得到局部最优解,导致情感原因抽取效果差。有鉴于此,本申请提出了一种文本处理方法,能够联合抽取出目标文本中的情感子句以及对应的情感原因,且对情感子句以及对应的情感原因的抽取误差小,增强了抽取效果和性能。
参见图1所示,本申请实施例公开了一种文本处理方法,该方法包括:
步骤S11:利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量。
在具体的实施过程中,需要利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量。其中,所述第一目标文本子句为所述预设文本栈中的从栈顶开始的第一个文本子句和第二个文本子句,且所述预设文本栈中的目标文本子句为向量化之后的文本子句,对所述预设文本栈中的第一目标文本子句进行文本序列特征抽取是为了找到相应的文本子句之间的相互关系,提高文本中情感子句和对应情感原因抽取的准确度。所述利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量,包括:利用双向循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量。也即,所述第一循环神经网络可以为双向循环神经网络。
步骤S12:利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量。
在得到所述第一文本序列特征向量之后,还需要利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征进行抽取,得到第二文本序列特征向量。所述第二目标文本子句为所述预设文本缓存器中的第一个文本子句,所述第二目标文本子句在目标文本中与所述预设文本栈中的第一目标文本子句相连接。所述预设文本缓存器中的目标文本子句也为向量化之后的文本子句。所述利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量,包括:利用双向循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量。也即,所述第二循环神经网络可以为双向循环神经网络。
步骤S13:利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量。
在得到所述第二文本序列特征向量之后,还需要利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量。其中,所述历史动作为预先进行文本的情感子句和对应情感原因抽取时进行的动作。所述利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量,包括:利用单向循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量。也即,所述第三循环神经网络为单向循环神经网络。
步骤S14:利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因。
在具体的实施过程中,在得到所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量之后,还需要利用预先得到的训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因。所述利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,包括:利用训练后多层全连接网络对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量。也即,所述训练后分类器可以为多层全连接网络。
所述根据所述目标序列特征向量确定目标执行动作,包括:如果所述目标执行动作为移动,则将所述预设文本缓存器中的第二目标文本子句移动到所述预设文本栈中;如果所述目标执行动作为第一左规约,则将所述预设文本栈中的第一目标文本子句中的第二个目标文本子句标记为第一个目标文本子句的原因,并将所述第二个目标文本子句从所述预设文本栈中移除;如果所述目标执行动作为第二左规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为情感子句,并将所述第二个目标文本子句从所述预设文本栈中移除;如果所述目标执行动作为第一右规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为所述第二个目标文本子句的原因,并将所述第一个目标文本子句从所述预设文本栈中移除;如果所述目标执行动作为第二右规约,则将所述预设文本栈中的第一目标文本子句中的所述第二个目标文本子句标记为情感子句,并将所述第一个目标文本子句从所述预设文本栈中移除。具体的,如果所述目标执行动作为移动,则将所述预设文本缓存器中的第二目标文本子句移动到所述预设文本栈中;如果所述目标执行动作为左规约(Yes),则将所述预设文本栈中的第一目标文本子句中的第二个目标文本子句标记为第一个目标文本子句的原因,并将所述第二个目标文本子句从所述预设文本栈中移除;如果所述目标执行动作为左规约(No),则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为情感子句,并将所述第二个目标文本子句从所述预设文本栈中移除;如果所述目标执行动作为右规约(Yes),则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为所述第二个目标文本子句的原因,并将所述第一个目标文本子句从所述预设文本栈中移除;如果所述目标执行动作为右规约(No),则将所述预设文本栈中的第一目标文本子句中的所述第二个目标文本子句标记为情感子句,并将所述第一个目标文本子句从所述预设文本栈中移除。其中,所述预设文本栈中的第一目标文本子句中的第一个目标文本子句为所述预设文本栈中从栈顶开始的第一个文本子句,所述第二个目标文本子句为所述预设文本栈中从栈顶开始的第二个文本子句。在根据所述目标序列特征向量确定目标执行动作之后,还包括:将确定出的所述情感子句和对应的情感原因进行输出。
步骤S15:判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新进入步骤S11。
在根据所述目标序列特征向量确定目标执行动作之后,还需要判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新执行进入步骤S11。如果是,则对当前目标文本的情感子句和对应的情感原因抽取的任务结束。
可见,本申请先利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;再利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;然后利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;接着利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因;再判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新开始执行利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量的步骤。这样能够联合抽取出目标文本中的情感子句以及对应的情感原因,且对情感子句以及对应的情感原因的抽取误差小,增强了抽取效果和性能。
参见图2所示,本申请实施例公开了一种具体的文本处理方法,该方法包括:
步骤S21:对目标文本进行预处理,得到所述目标文本的关键词集。
本实施例中,开始对目标文本的情感子句和对应的情感原因进行抽取之前,需要先对所述目标文本进行预处理,得到所述目标文本的关键词集。其中,所述对目标文本进行预处理,包括:对目标文本进行分词、分句以及去停用词,得到所述目标文本的词集;利用关键词提取算法,从所述词集中确定出所述目标文本对应的关键词集。或,将对所述目标文本进行分词、分句以及去停用词之后得到的词集直接作为关键词集。所述利用关键词提取算法,从所述词集中确定出所述目标文本对应的关键词集,可以减小后续处理中相应的工作量,提高文本的处理处理效率。
步骤S22:利用词嵌入技术对所述关键词集进行处理,得到所述目标文本中各个子句对应的向量化文本子句。
可以理解的是,在得到所述关键词集之后,需要利用词嵌入技术对所述关键词集进行处理,得到所述目标文本中各个子句对应的向量化文本子句。
步骤S23:将预设文本栈初始化为所述目标文本中的第一个向量化文本子句和第二个向量化文本子句。
在得到所述目标文本中各个喜剧对应的向量化文本子句之后,还需要对预设文本栈进行初始化。具体的,将所述预设文本栈初始化为所述目标文本中的第一个向量化文本子句和第二个向量化文本子句。
步骤S24:将预设文本缓存器初始化为所述目标文本中除所述第一个向量化文本子句和所述第二个向量化文本子句之外的所述向量化文本子句。
可以理解的是,也需要对预设文本缓存器进行初始化,具体的,将所述预设文本缓存器初始化为所述目标文本中除所述第一个向量化文本子句和所述第二个向量化文本子句之外的所述向量化文本子句。
步骤S25:利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量。
步骤S26:利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量。
步骤S27:利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量。
步骤S28:利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因。
步骤S29:判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新进入步骤S25。
步骤S25至步骤S29的具体实施过程可以参考前述实施例中公开的内容,在此不再赘述。
参见图3所示,本申请实施例公开了一种文本处理***,包括:
文本栈编码器11,用于利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;
文本缓存编码器12,用于利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;
动作序列编码器13,用于利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;
训练后分类器14,用于对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因;
判断模块15,用于判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新调用所述文本栈编码器。
可见,本申请先利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;再利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;然后利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;接着利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因;再判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新执行利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量的步骤。这样能够联合抽取出目标文本中的情感子句以及对应的情感原因,且对情感子句以及对应的情感原因的抽取误差小,增强了抽取效果和性能。
在具体的实施过程中,所述动作序列编码器13,用于利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量,且所述动作序列编码器13利用Scheduled Sampling方法缓解训练阶段和推理阶段动作分布存在不一致性问题,提高文本中情感子句和对应的情感原因抽取的准确率。
参见图4所示,为文本处理***结构示意图。所述文本处理***包括文本栈编码器、文本缓存编码器、动作序列编码器以及分类器,所述文本栈编码器用于对预设文本栈中的目标文本的子句进行文本序列特征提取并编码,得到第一文本序列特征向量St,所述文本缓存编码器用于对预设文本缓存器中的目标文本的子句进行文本序列特征提取并编码,得到第二文本序列特征向量bt,所述动作序列编码器用于对预先得到的历史动作的动作序列特征进行抽取并编码,得到第三序列特征向量at,所述分类器用于对所述第一文本序列特征向量St、所述第二文本序列特征向量bt以及所述第三序列特征向量at进行特征融合并确定下一步动作,其中,所述特征融合也即对特征进行拼接。
进一步的,参见图5所示,本申请实施例还公开了一种文本处理设备,包括:处理器21和存储器22。
其中,所述存储器22,用于存储计算机程序;所述处理器21,用于执行所述计算机程序,以实现前述实施例中公开的文本处理方法。
其中,关于上述文本处理方法的具体过程可以参考前述实施例中公开的相应内容,在此不再进行赘述。
进一步的,参见图6所示,本申请还公开了一种电子设备20。所述电子设备20可以实现前述公开的文本处理方法步骤,图中的内容不能被认为是对本申请的使用范围的任何限制。
图6为本申请实施例提供的一种电子设备20的结构示意图,该电子设备具体可以包括但不限于平板电脑、笔记本电脑或台式电脑等。
通常,本实施例中的电子设备20包括:处理器21和存储器22。
其中,处理器21可以包括一个或多个处理核心,比如四核心处理器、八核心处理器等。处理器21可以采用DSP(digital signal processing,数字信号处理)、FPGA(field-programmable gate array,现场可编程们阵列)、PLA(programmable logic array,可编程逻辑阵列)中的至少一种硬件来实现。处理器21也可以包括主处理器和协处理器,主处理器是用于对在唤醒状态下的数据进行处理的处理器,也称CPU(central processing unit,中应处理器);协处理器是用于对在待机状态下的数据进行处理的低功耗处理器。在一些实施例中,处理器21可以集成有GPU(graphics processing unit,图像处理器),GPU用于负责显示屏所需要显示的图像的渲染和绘制。一些实施例中,处理器21可以包括AI(artificialintelligence,人工智能)处理器,该AI处理器用于处理有关机器学习的计算操作。
存储器22可以包括一个或多个计算机可读存储介质,计算机可读存储介质可以是非暂态的。存储器22还可以包括高速随机存取存储器,以及非易失性存储器,比如一个或多个磁盘存储设备、闪存存储设备。本实施例中,存储器22至少用于存储以下计算机程序221,其中,该计算机程序被处理器21加载并执行之后,能够实现前述任一实施例中公开的由用户终端侧执行的方法步骤。另外,存储器22所存储的资源还可以包括操作***222和数据223等,存储方式可以是短暂存储也可以是永久存储。其中,操作***222可以是Windows、Unix、Linux等。数据223可以包括各种各样的数据。
在一些实施例中,电子设备20还可包括有显示屏23、输入输出接口24、通信接口25、传感器26、电源27以及通信总线28。
本技术领域人员可以理解,图6中示出的结构并不构成对电子设备20的限定,可以包括比图示更多或更少的组件。
进一步的,本申请实施例还公开了一种计算机可读存储介质,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现前述实施例中公开的文本处理方法步骤。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。
最后,还需要说明的是,在本文中,诸如第一和第二之类的关系术语仅仅用来将一个实体或者操作与另一个实体或者操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得一系列包含其他要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上对本申请所提供的一种文本处理方法、***、设备、介质进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
Claims (9)
1.一种文本处理方法,其特征在于,包括:
S11:利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;
S12:利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;
S13:利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;其中,所述历史动作为预先进行文本的情感子句和对应情感原因抽取时进行的动作;
S14:利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出目标文本中的情感子句和对应的情感原因;
S15:判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新进入步骤S11;
其中,所述根据所述目标序列特征向量确定目标执行动作,包括:
如果所述目标执行动作为移动,则将所述预设文本缓存器中的第二目标文本子句移动到所述预设文本栈中;
如果所述目标执行动作为第一左规约,则将所述预设文本栈中的第一目标文本子句中的第二个目标文本子句标记为第一个目标文本子句的原因,并将所述第二个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第二左规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为情感子句,并将所述第二个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第一右规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为所述第二个目标文本子句的原因,并将所述第一个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第二右规约,则将所述预设文本栈中的第一目标文本子句中的所述第二个目标文本子句标记为情感子句,并将所述第一个目标文本子句从所述预设文本栈中移除。
2.根据权利要求1所述的文本处理方法,其特征在于,还包括:
对目标文本进行预处理,得到所述目标文本的关键词集;
利用词嵌入技术对所述关键词集进行处理,得到所述目标文本中各个子句对应的向量化文本子句。
3.根据权利要求2所述的文本处理方法,其特征在于,所述利用词嵌入技术对所述关键词集进行处理,得到所述目标文本中各个子句对应的向量化文本子句之后,还包括:
将所述预设文本栈初始化为所述目标文本中的第一个向量化文本子句和第二个向量化文本子句;
将所述预设文本缓存器初始化为所述目标文本中除所述第一个向量化文本子句和所述第二个向量化文本子句之外的所述向量化文本子句。
4.根据权利要求1所述的文本处理方法,其特征在于,所述利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量,包括:
利用单向循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量。
5.根据权利要求1所述的文本处理方法,其特征在于,所述利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量,包括:
利用双向循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量。
6.根据权利要求1所述的文本处理方法,其特征在于,所述利用训练后分类器对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,包括:
利用训练后多层全连接网络对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量。
7.一种文本处理***,其特征在于,包括:
文本栈编码器,用于利用第一循环神经网络对预设文本栈中的第一目标文本子句进行文本序列特征抽取,得到第一文本序列特征向量;
文本缓存编码器,用于利用第二循环神经网络对预设文本缓存器中的第二目标文本子句进行文本序列特征抽取,得到第二文本序列特征向量;
动作序列编码器,用于利用第三循环神经网络对预先得到的历史动作的动作序列特征进行抽取,得到第三序列特征向量;其中,所述历史动作为预先进行文本的情感子句和对应情感原因抽取时进行的动作;
训练后分类器,用于对所述第一文本序列特征向量、所述第二文本序列特征向量以及所述第三序列特征向量进行拼接,得到目标序列特征向量,并根据所述目标序列特征向量确定目标执行动作,以便确定出所述目标文本中的情感子句和对应的情感原因;
判断模块,用于判断所述预设文本栈和所述预设文本缓存器是否均为空,如果否,则重新调用所述文本栈编码器;
其中,所述训练后分类器,具体用于:
如果所述目标执行动作为移动,则将所述预设文本缓存器中的第二目标文本子句移动到所述预设文本栈中;
如果所述目标执行动作为第一左规约,则将所述预设文本栈中的第一目标文本子句中的第二个目标文本子句标记为第一个目标文本子句的原因,并将所述第二个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第二左规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为情感子句,并将所述第二个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第一右规约,则将所述预设文本栈中的第一目标文本子句中的所述第一个目标文本子句标记为所述第二个目标文本子句的原因,并将所述第一个目标文本子句从所述预设文本栈中移除;
如果所述目标执行动作为第二右规约,则将所述预设文本栈中的第一目标文本子句中的所述第二个目标文本子句标记为情感子句,并将所述第一个目标文本子句从所述预设文本栈中移除。
8.一种文本处理设备,其特征在于,包括:
存储器和处理器;
其中,所述存储器,用于存储计算机程序;
所述处理器,用于执行所述计算机程序,以实现权利要求1至6任一项所述的文本处理方法。
9.一种计算机可读存储介质,其特征在于,用于保存计算机程序,其中,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的文本处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010079923.6A CN111325016B (zh) | 2020-02-04 | 2020-02-04 | 一种文本处理方法、***、设备、介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010079923.6A CN111325016B (zh) | 2020-02-04 | 2020-02-04 | 一种文本处理方法、***、设备、介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111325016A CN111325016A (zh) | 2020-06-23 |
CN111325016B true CN111325016B (zh) | 2024-02-02 |
Family
ID=71167141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010079923.6A Active CN111325016B (zh) | 2020-02-04 | 2020-02-04 | 一种文本处理方法、***、设备、介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111325016B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114416974A (zh) * | 2021-12-17 | 2022-04-29 | 北京百度网讯科技有限公司 | 模型训练方法、装置、电子设备及存储介质 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280064A (zh) * | 2018-02-28 | 2018-07-13 | 北京理工大学 | 分词、词性标注、实体识别及句法分析的联合处理方法 |
CN110162636A (zh) * | 2019-05-30 | 2019-08-23 | 中森云链(成都)科技有限责任公司 | 基于d-lstm的文本情绪原因识别方法 |
CN110245349A (zh) * | 2019-05-21 | 2019-09-17 | 武汉数博科技有限责任公司 | 一种句法依存分析方法、装置及一种电子设备 |
CN110276066A (zh) * | 2018-03-16 | 2019-09-24 | 北京国双科技有限公司 | 实体关联关系的分析方法及相关装置 |
CN110704890A (zh) * | 2019-08-12 | 2020-01-17 | 上海大学 | 一种融合卷积神经网络和循环神经网络的文本因果关系自动抽取方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11238339B2 (en) * | 2017-08-02 | 2022-02-01 | International Business Machines Corporation | Predictive neural network with sentiment data |
-
2020
- 2020-02-04 CN CN202010079923.6A patent/CN111325016B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108280064A (zh) * | 2018-02-28 | 2018-07-13 | 北京理工大学 | 分词、词性标注、实体识别及句法分析的联合处理方法 |
CN110276066A (zh) * | 2018-03-16 | 2019-09-24 | 北京国双科技有限公司 | 实体关联关系的分析方法及相关装置 |
CN110245349A (zh) * | 2019-05-21 | 2019-09-17 | 武汉数博科技有限责任公司 | 一种句法依存分析方法、装置及一种电子设备 |
CN110162636A (zh) * | 2019-05-30 | 2019-08-23 | 中森云链(成都)科技有限责任公司 | 基于d-lstm的文本情绪原因识别方法 |
CN110704890A (zh) * | 2019-08-12 | 2020-01-17 | 上海大学 | 一种融合卷积神经网络和循环神经网络的文本因果关系自动抽取方法 |
Non-Patent Citations (1)
Title |
---|
Emotion-cause pair extraction: A new task to emotion analysis in texts;Rui xia等;《Proceedings of the 57th Conference of the Association for Computational Linguistics. Florence》;20190604;全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN111325016A (zh) | 2020-06-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112685565B (zh) | 基于多模态信息融合的文本分类方法、及其相关设备 | |
CN111062217B (zh) | 语言信息的处理方法、装置、存储介质及电子设备 | |
KR102431568B1 (ko) | 엔티티 단어 인식 방법 및 장치 | |
US11398228B2 (en) | Voice recognition method, device and server | |
CN112989970A (zh) | 文档版面分析方法、装置、电子设备及可读存储介质 | |
US20220358955A1 (en) | Method for detecting voice, method for training, and electronic devices | |
CN115512005A (zh) | 一种数据处理方法及其装置 | |
CN116543076B (zh) | 图像处理方法、装置、电子设备及存储介质 | |
CN114936631A (zh) | 一种模型处理方法及装置 | |
CN110909578A (zh) | 一种低分辨率图像识别方法、装置和存储介质 | |
CN116541492A (zh) | 一种数据处理方法及相关设备 | |
CN111325016B (zh) | 一种文本处理方法、***、设备、介质 | |
CN115761839A (zh) | 人脸活体检测模型的训练方法、人脸活体检测方法及装置 | |
CN114861758A (zh) | 多模态数据处理方法、装置、电子设备及可读存储介质 | |
CN117971487A (zh) | 一种高性能算子生成方法、装置、设备及存储介质 | |
CN113807512B (zh) | 机器阅读理解模型的训练方法、装置及可读存储介质 | |
CN113139110A (zh) | 区域特征处理方法、装置、设备、存储介质和程序产品 | |
WO2024098763A1 (zh) | 文本操作图互检方法及模型训练方法、装置、设备、介质 | |
CN116049597B (zh) | 网页的多任务模型的预训练方法、装置及电子设备 | |
CN117038099A (zh) | 医疗类术语标准化方法以及装置 | |
CN110019952A (zh) | 视频描述方法、***及装置 | |
CN116758558A (zh) | 基于跨模态生成对抗网络的图文情感分类方法及*** | |
US20220392205A1 (en) | Method for training image recognition model based on semantic enhancement | |
WO2023137903A1 (zh) | 基于粗糙语义的回复语句确定方法、装置及电子设备 | |
CN116306672A (zh) | 一种数据处理方法及其装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |