CN111581954A

CN111581954A - 一种基于语法依存信息的文本事件抽取方法及装置

Info

Publication number: CN111581954A
Application number: CN202010412904.0A
Authority: CN
Inventors: 乔林波; 李东升; 孙涛; 赖志权; 黄震; 冯大为; 陈易欣; 王庆林; 梅松竹; 符永铨; 阚志刚; 冯琳慧; 翟琪; 唐宇; 韩毅
Original assignee: National University of Defense Technology
Current assignee: National University of Defense Technology
Priority date: 2020-05-15
Filing date: 2020-05-15
Publication date: 2020-08-25
Anticipated expiration: 2040-05-15
Also published as: CN111581954B

Abstract

本发明公开一种基于语法依存信息的文本事件抽取方法及装置，该方法步骤包括：S1.获取原始非结构化文本数据中各条待处理语句，并提取各条待处理语句的分布式表示向量；S2.获取各条待处理语句中各个单词之间的语法依存关系信息，构建得到各个单词之间的语法依存关系树；S3.根据各条待处理语句的分布式表示向量以及各个单词之间的语法依存关系树使用图神经网络进行迭代，提取得到各个单词的具有语法依存信息的特征向量；S4.使用步骤S3提取得到的特征向量进行事件抽取，得到事件抽取结果。本发明能够充分挖掘上下文语义信息进行事件抽取，具有实现方法简单、抽取精度高等优点。

Description

一种基于语法依存信息的文本事件抽取方法及装置

技术领域

本发明涉及信息抽取技术领域，尤其涉及一种基于语法依存信息的文本事件抽取方法及装置。

背景技术

互联网上存在着大量的文本数据，而这些文本大多是以非表格结构化的形式存在，因此为帮助人们理解日益增长的非结构化文本数据，降低人们的学习代价，快速地从海量的非结构化文本中发现事件显得越来越重要。在信息抽取领域中，事件是指实体参与者之间的关系和状态的变化，一般将事件抽取任务定义为：识别特定类型的事件，并进行包括事件的类型和子类型、事件论元角色在内的相关信息的确定和抽取。针对事件抽取任务，可将事件抽取的任务分成两大核心子任务：(1)输入上下文文本，识别文本包含的事件类型；(2)结合输入的上下文，识别事件类型对应的事件论元角色。

针对事件抽取，目前主要采用以下两种方式实现：

一种是采用基于模板匹配的方法，一般分为两个步骤：模板构造和模式匹配，即首先由专家根据领域知识人工定义一系列事件模板；然后对事件的识别和抽取通过模板匹配实现，模板匹配即将人工定义的模板与上下文文本按文字匹配。但是该类基于模板的方法需要专家按照领域人工预先定义事件模板，实际仅适用于特定领域，在一般领域的文本上不具有实际可操作性。

另一种是应用机器学习来实现事件抽取的方法，例如通过将事件抽取建模为一个两阶段多分类问题，再应用机器学习分类算法来进行问题求解，其中，第一阶段为事件触发词抽取，第二阶段为事件论元角色抽取；每个阶段的多分类过程中，将输入文本的每个单词分类为相应的类别即完成抽取。

上述基于机器学***。以事件触发词抽取为例，目前应用机器学习来实现事件抽取的方法在ACE2005数据集上事件触发词的准确率最高仍不到80％。因而亟需提供一种文本事件抽取方法，以使得能够充分挖掘文本中上下文语义信息，提高事件抽取的精度。

发明内容

本发明要解决的技术问题就在于：针对现有技术存在的技术问题，本发明提供一种能够充分挖掘文本中上下文语法信息，实现方法简单、事件抽取精度高的基于语法依存信息的文本事件抽取方法及装置。

为解决上述技术问题，本发明提出的技术方案为：

一种基于语法依存信息的文本事件抽取方法，步骤包括：

S1.获取原始非结构化文本数据中各条待处理语句，并提取各条待处理语句的分布式表示向量；

S2.获取各条待处理语句中各个单词之间的语法依存关系信息，构建得到各个单词之间的语法依存关系树；

S3.根据各条待处理语句的所述分布式表示向量以及各个单词之间的所述语法依存关系树使用图神经网络(Graph Convolutional Network，GCN)进行迭代，提取得到各个单词的具有语法依存信息的特征向量；

S4.使用步骤S3提取得到的特征向量进行事件抽取，得到事件抽取结果。

进一步的，所述步骤S1中使用预训练模型提取各条待处理语句的分布式表示向量。

进一步的，所述预训练模型具体为BERT(Bidirectional EncoderRepresentations from Transformers)模型，所述步骤S1中具体通过先获取所述BERT模型所需的预训练权重，再基于获取的所述预训练权重通过调用编码函数得到各条语句S＝[w₁,w₂,…,w_m]的分布式表示O＝[o₁,o₂,…,o_m]，其中w₁～w_m分别为各条语句S中各个单词，o₁～o_m分别为输入语句S中对应各个单词的分布式表示。

进一步的，所述步骤S3的具体步骤包括：

S31.图构建：根据各个单词之间的所述语法依存关系树构建图G＝(V,E)，其中V为所述语法依存关系树中所有节点[v₁,v₂,…,v_m]的集合，每个节点为一个单词，各节点[v₁,v₂,…,v_m]与[w₁,w₂,…,w_m]按顺序一一对应，w₁～w_m分别为各条语句中各个单词，m为单词数量，E为根据所述语法依存关系树中各个节点间的连接关系构建得到的集合，其中E内每条边e为所对应连接的两个节点之间的语法依存关系；

S32.特征向量提取：以构建的所述图G为输入使用图神经网络进行迭代，其中基于所述分布式表示向量将各节点v_i初始化设置为对应的单词w_i的分布式表示o_i，i＝1,2,…,m，经过迭代后得到各节点v_i在图神经网络中的特征向量，并作为对应各个单词w_i的所述具有语法依存信息的特征向量。

进一步的，所述步骤S32中使用图神经网络进行迭代时，在所述图神经网络的第k层，节点v_i在所述图神经网络中的特征向量

为：

其中，0＜k＜L，L为所述图神经网络的网络层数

N(w_i)为节点w_i的邻接节点，

为边w(w_i，w_j)的类型对应的权重，

为边e(w_i，w_j)对应偏置系数；

将单词w_i在L层的特征向量

作为单词w_i的所述具有语法依存信息的特征向量。

进一步的，所述步骤S4的步骤包括：

S41.事件触发词分类：对步骤S3中提取得到的各个单词的所述具有语法依存信息的特征向量使用分类器进行分类，得到各个单词的触发词分类结果，识别出各个单词是否为事件触发词以及获取识别出的所述事件触发词对应的具体事件类型；

S42.事件论元角色分类：将步骤S3提取出的特征向量中对应所述事件触发词的特征向量分别与原始文本数据的各个单词所对应的特征向量进行拼接，得到组合特征向量，对得到的各所述组合特征向量使用分类器进行分类，得到各单词的事件论元角色分类结果；

S43.抽取结果输出：由识别出的事件触发词以及所述事件论元角色分类结果得到最终的事件抽取结果。

进一步的，所述步骤S41中获取识别出的所述事件触发词对应的具体事件类型时，包括根据所述触发词分类结果，将识别出的所述事件触发词外的所有单词视为候选事件元素，并依次与所述事件触发词进行特征向量拼接，对拼接得到的特征向量使用分类器进行分类，得到候选事件的分类结果。

进一步的，所述步骤S42中，具体将所述步骤S41中识别出的事件触发词w_T对应的特征向量

与原始文本数据的各个单词w_i的特征向量的

分别相拼接，形成组合特征向量

其中i＝1,2,…,m，m为单词数量，使用一个多分类器对得到的组合特征向量H_i进行分类，得到单词w_i的论元角色分类结果[w_A1,w_A2,…,w_Ar]，r为分类为事件论元角色的数目。

一种基于语法依存信息的文本事件抽取装置，包括：

分布式表示模块，用于获取原始非结构化文本数据中各条待处理语句，并提取各条待处理语句的分布式表示向量；

语法依存信息获取及树构建模块，用于获取各条待处理语句中各个单词之间的语法依存关系信息，构建得到各个单词之间的语法依存关系树；

特征向量提取模块，用于根据各条待处理语句的所述分布式表示向量以及各个单词之间的所述语法依存关系树使用图神经网络进行迭代，提取得到各个单词的具有语法依存信息的特征向量；

事件抽取模块，用于使用所述特征向量提取模块提取得到的特征向量进行事件抽取，得到事件抽取结果。

一种存储有计算机程序的计算机可读存储介质，所述计算机程序执行时实现如上述基于语法依存信息的文本事件抽取方法。

与现有技术相比，本发明的优点在于：

1、本发明基于语法依存信息的文本事件抽取方法及装置，通过获取原始文本的分布式表示以及文本中单词之间的语法依存信息，结合图神经网络迭代提取具有语法依存信息的特征向量进行事件抽取，使得在事件抽取过程中引入额外的语法依存关系信息来丰富特征，可以充分利用文本中的上下文语法信息，准确的从非结构化文本中抽取事件的关键信息，从而能够有效提升事件抽取中触发词和论元角色的分类精度，提高事件抽取的准确率。

2、本发明基于语法依存信息的文本事件抽取方法及装置，进一步通过获取各个单词之间的语法依存关系树形成一个无向图，基于构建的图使用图神经网络迭代得到各个单词在图上的特征向量，能够结合图神经网络迭代方式有效提取出非结构化文本中具有语法依存关系信息的特征向量，从而可以充分挖掘出文本中的上下文语义信息进行事件抽取。

3、本发明基于语法依存信息的文本事件抽取方法及装置，进一步通过将事件抽取任务抽象为一个多分类任务，基于提取的具有语法依存关系的特征向量进行事件触发词分类，再由事件触发词与原始文本数据的各个单词进行特征拼接，使用拼接后的组合特征向量来进行事件论元角色分类，事件触发词以及事件论元角色分类分类过程中均引入了语法依存关系信息，可以充分利用文本中的上下文语法信息，有效提高事件触发词和事件论元角色的分类精度，从而提高事件抽取精度。

4、本发明基于语法依存信息的文本事件抽取方法及装置，进一步通过使用预训练模型来提取输入语句的分布式表示，能够结合预训练模型以及语法依存关系信息，快速、高效的提取出具有语法依存关系信息的特征向量，从而进一步充分挖掘出文本中的上下文语法信息。

附图说明

图1是本实施例基于语法依存信息的文本事件抽取方法的实现流程示意图。

图2是在具体应用实施例中获取输入语句各个单词之间语法依存关系树的原理示意图。

图3是本实施例中提取输入语句的分布式表示的原理示意图。

图4是本实施例中使用图神经网络提取特征向量的实现原理示意图。

图5是本实施例中实现候选事件类型分类的实现原理示意图。

具体实施方式

以下结合说明书附图和具体优选的实施例对本发明作进一步描述，但并不因此而限制本发明的保护范围。

如图1所示，本实施例基于语法依存信息的文本事件抽取方法的步骤包括：

S1.分布式表示：获取原始非结构化文本数据中各条待处理语句，并提取各条待处理语句的分布式表示向量；

S2.语法依存信息获取及树构建：获取各条待处理语句中各个单词之间的语法依存关系信息，构建得到各个单词之间的语法依存关系树；

S3.特征向量提取：根据各条待处理语句的分布式表示向量以及各个单词之间的语法依存关系树使用图神经网络GCN进行迭代，提取得到各个单词的具有语法依存信息的特征向量；

S4.事件抽取：使用步骤S3提取得到的特征向量进行事件抽取，得到事件抽取结果。

语法依存关系即是句子内部各个单词的依存结构所表达的关系，该依存结构展示了一个单词所依赖于的另外一个单词，词与词之间的二元非对称关系即为依存关系，具体描述为从head(被修饰的主题)用箭头指向dependent(修饰语)。如图2所示为具体应用实施例中获取的各个单词之间的树形语法依存关系，即单词之间的语法依存关系树，其中DT、NN、VBD、WRB、IN、NNP分别为语法依存的类型。由单词之间的语法依存关系能够反映文本的上下文语法信息。

本实施例通过在文本事件抽取过程中，提取文本中语句的分布式表示后，获取单词之间的语法依存关系信息构建语法依存关系树，基于文本的分布式表示、语法依存关系树结合使用图神经网络GCN迭代来获取各个单词的特征向量，得到具有语法依存信息的特征向量，再利用该特征向量进行事件抽取，由于事件抽取过程中引入了额外的语法依存关系信息来丰富特征，使得可以充分利用文本中的上下文语法信息，准确从非结构化文本中抽取事件的关键信息，从而能够有效提升事件抽取中触发词和论元角色的分类精度，提高事件抽取的准确率。

本实施例步骤S1中具体使用预训练模型提取各条待处理语句的分布式表示向量，通过使用预训练模型来提取输入语句的分布式表示，能够结合预训练模型以及语法依存关系信息，快速、高效的提取出具有语法依存关系信息的特征向量，从而充分挖掘出文本中的上下文语法信息。

本实施例中预训练模型具体可采用BERT模型，步骤S1中具体通过先获取BERT模型所需的预训练权重，再基于获取的预训练权重通过调用编码函数得到各条语句S＝[w₁,w₂,…,w_m]的分布式表示O＝[o₁,o₂,…,o_m]，其中w₁～w_m分别为各条语句S中各个单词，o₁～o_m分别为输入语句S中各个单词的分布式表示向量。

在具体应用实施例中，对输入语句“A man died when a tank fired inBaghad”，通过BERT模型获得每个单词的分布式表示如图3所示，其中EN、Trm、TN分别对应为初始输入、中间结点以及分布式表示。

可以理解的是，还可以根据实际需求采用其他方式获取原始文本每个单词的分布式表示。

本实施例步骤S2中具体可通过调用斯坦福自然语言处理(StandfordNLP)工具的语法依存关系解析接口，生成各个单词之间的语法依存关系树。将原始文本数据的语句输入至StandfordNLP工具的语法依存关系解析接口，输出即为所需语法依存关系树。在具体应用实施例中获得的各个单词之间的语法依存关系构造语法依存关系树T如图2所示。可以理解的是，还可以根据实际需求采用其他方式获取单词之间的语法依存关系以及生成各个单词之间的语法依存关系树。

本实施例中，步骤S3的具体步骤包括：

S31.图构建：根据各个单词之间的语法依存关系树构建图G＝(V,E)，其中V为语法依存关系树中所有节点[v₁,v₂,…,v_m]的集合，每个节点为一个单词，[v₁,v₂,…,v_m]与[w₁,w₂,…,w_m]按顺序一一对应，w₁～w_m分别为各条语句中各个单词，m为单词数量，E为根据语法依存关系树中各个节点间的连接关系构建得到的集合，其中E内每条边e为所对应连接的两个节点之间的语法依存关系，e为无向边；

S32.特征向量提取：以构建的图G为输入使用图神经网络GCN进行迭代，其中基于分布式表示向量将各节点v_i初始化设置为对应的单词w_i的分布式表示o_i，i＝1,2,…,m，经过迭代后得到各节点v_i在图神经网络GCN中的特征向量，并作为对应各个单词w_i的具有语法依存信息的特征向量。

本实施例通过获取输入句子各个单词之间的语法依存关系树，形成一个无向图G，在构建的图G的基础上，使用图神经网络GCN迭代得到各个单词在图G上的特征向量，提取出非结构化文本的语法依存关系的特征向量，也即为非结构化文本的语法依存关系的分布式表示，能够结合图神经网络迭代方式有效提取出非结构化文本中具有语法依存关系信息的特征向量，从而可以充分挖掘出文本中的上下文语义信息，利用该具有语法依存信息的特征向量可以更为准确的抽取出文本中的关键信息，提高事件抽取精度。

本实施例步骤S32中使用图神经网络GCN进行迭代时，在图神经网络GCN的第k层，节点v_i在图神经网络GCN中的特征向量

具体为：

其中，0＜k＜L，L为图神经网络的网络层数

N(w_i)为节点w_i的邻接节点，

为边e(w_i，w_j)的类型对应的权重，

为边e(w_i，w_j)对应偏置系数，具体设置为邻居节点数目的倒数；

将单词w_i在L层的特征向量

作为单词w_i的具有语法依存信息的特征向量，即基于语法依存关系树经过图神经网络迭代后得到的特征向量

即为对应单词w_i的具有语法依存信息的特征向量。

本实施例将事件抽取任务抽象为一个多分类任务，对获得的每个单词特征向量进行分类，获得事件触发词和事件论元角色，步骤S4的具体步骤包括：

S41.事件触发词分类：对步骤S3中提取得到的各个单词的具有语法依存信息的特征向量使用分类器进行分类，得到各个单词的触发词分类结果，识别出各个单词是否为事件触发词以及获取识别出的事件触发词对应的具体事件类型；

S42.事件论元角色分类：将步骤S3提取出的特征向量中对应事件触发词的特征向量分别与原始文本数据的各个单词所对应的特征向量进行拼接，得到组合特征向量，对得到的各组合特征向量使用分类器进行分类，得到各单词的事件论元角色分类结果；

S43.抽取结果输出：由识别出的事件触发词以及事件论元角色得到最终的事件抽取结果。

本实施例基于步骤3提取的具有语法依存关系的特征向量，使用神经网络分类器来进行事件触发词分类，再基于事件触发词分类结果，将事件触发词与原始文本数据的各个单词进行特征拼接，使用拼接后的组合特征向量来进行事件论元角色分类，事件触发词以及事件论元角色分类分类过程中由于均引入了语法依存关系信息，可以充分利用文本中的上下文语法信息，有效提高事件触发词和事件论元角色的分类精度，从而提高事件抽取精度。

在具体应用实施例中，如图4所示，进行特征提取时，首先基于如图2所获得的的分布式表示向量使用语法依存关系构建图G，并在图神经网络上进行迭代，获得神经网络上的分布式表示，即为具有语法依存信息的特征向量，以用于事件触发词分类；利用事件触发词分类结果，将前后两部分分布式表示相拼接得到最终的分布式表示向量，即为拼接得到的组合特征向量，以用于事件论元角色分类。

在具体应用实施例中，步骤S41中事件触发词分类时，首先将各个单词w_i的特征向量

(图神经网络迭代得到的特征向量)输入至一个多分类器C_T，对各个单词w_i的特征向量

进行分类，得到各个单词的触发词分类结果，分类结果指示各个单词是否是事件触发词w_T以及触发词所对应的具体事件类型，事件触发词所对应的特征向量为

K为迭代层数。

步骤S42中事件论元角色时，具体将步骤S41中识别出的事件触发词w_T对应的特征向量

与原始文本数据的各个单词的特征向量的

分别相拼接，形成组合特征向量

其中i＝1,2,…,m，m为单词数量，使用一个多分类器对得到的组合特征向量H_i进行分类，得到单词w_i的论元角色分类结果[w_A1,w_A2,…,w_Ar]，r为分类为事件论元角色的数目。完成事件触发词以及事件论元角色分类后，将事件触发词的结果和事件论元角色的结果相组合，得到事件的多元组{w_T，w_A1,w_A2,…,w_Ar}，即为最终事件抽取结果。

可以理解的是，利用具有语法依存信息的特征向量进行分类以抽取事件时，还可以根据实际需求提取具有其他语义信息的特征向量以进一步丰富特征，从而进一步提高事件抽取精度。

如图5所示，本实施例步骤S41中获取识别出的事件触发词对应的具体事件类型时，包括通过根据触发词分类结果，将识别出的所述事件触发词外的所有单词视为候选事件元素，并依次与事件触发词进行特征向量拼接，对拼接得到的特征向量使用分类器进行分类，得到候选事件的分类结果。

本实施例上述文本事件抽取方法，通过使用预训练模型来提取非结构化文本的分布式表示，使用基于图神经网络GCN的图模型来提取非结构化文本的语法依存关系的分布式表示，得到具有语法依存关系的特征向量，使用具有语法依存关系的特征向量进行事件触发词分类，再基于事件触发词分类结果，将原始非结构化文本的各单词和事件触发词进行特征拼接形成组合特征向量，使用组合特征向量进行事件论元角色分类，能够充分利用文本中的上下文语法信息，有效提高事件触发词和事件论元角色的分类精度，从而提高事件抽取精度。

本实施例基于语法依存信息的文本事件抽取装置包括：

特征向量提取模块，用于根据各条待处理语句的所述分布式表示向量以及各个单词之间的语法依存关系树使用图神经网络进行迭代，提取得到各个单词的具有语法依存信息的特征向量；

事件抽取模块，用于使用特征向量提取模块提取得到的特征向量进行事件抽取，得到事件抽取结果。

本实施例中，特征向量提取模块具体包括：

图构建单元，用于根据各个单词之间的所述语法依存关系树构建图G＝(V,E)，其中V为所述语法依存关系树中所有节点[v₁,v₂,…,v_m]的集合，每个节点为一个单词，各节点[v₁,v₂,…,v_m]与[w₁,w₂,…,w_m]按顺序一一对应，w₁～w_m分别为各条待处理语句中各个单词，m为单词数量，E为根据所述语法依存关系树中各个节点间的连接关系构建得到的集合，其中E内每条边e为所对应连接的两个节点之间的语法依存关系；

特征向量提取单元，用于以构建的所述图G为输入使用图神经网络进行迭代，其中基于所述分布式表示向量将各节点v_i初始化设置为对应的单词w_i的分布式表示o_i，i＝1,2,…,m，经过迭代后得到各节点v_i在图神经网络中的特征向量，并作为对应各个单词w_i的所述具有语法依存信息的特征向量。

本实施例中，事件抽取模块具体包括：

事件触发词分类单元，用于对特征向量提取模块中提取得到的各个单词的所述具有语法依存信息的特征向量使用分类器进行分类，得到各个单词的触发词分类结果，识别出各个单词是否为事件触发词以及获取识别出的所述事件触发词对应的具体事件类型；

事件论元角色分类单元，用于将特征向量提取模块提取出的特征向量中对应所述事件触发词的特征向量分别与原始文本数据的各个单词所对应的特征向量进行拼接，得到组合特征向量，对得到的各所述组合特征向量使用分类器进行分类，得到各单词的事件论元角色分类结果；

抽取结果输出单元，用于由识别出的所述事件触发词以及所述事件论元角色分类结果得到最终的事件抽取结果。

本实施例基于语法依存信息的文本事件抽取装置与上述基于语法依存信息的文本事件抽取方法为一一对应，在此不再一一赘述。

本实施例存储有计算机程序的计算机可读存储介质，计算机程序执行时实现如上述基于语法依存信息的文本事件抽取方法。

上述只是本发明的较佳实施例，并非对本发明作任何形式上的限制。虽然本发明已以较佳实施例揭露如上，然而并非用以限定本发明。因此，凡是未脱离本发明技术方案的内容，依据本发明技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均应落在本发明技术方案保护的范围内。

Claims

1.一种基于语法依存信息的文本事件抽取方法，其特征在于，步骤包括：

S3.根据各条待处理语句的所述分布式表示向量以及各个单词之间的所述语法依存关系树使用图神经网络进行迭代，提取得到各个单词的具有语法依存信息的特征向量；

2.根据权利要求1所述的基于语法依存信息的文本事件抽取方法，其特征在于：所述步骤S1中使用预训练模型提取各条待处理语句的分布式表示向量。

3.根据权利要求2所述的基于语法依存信息的文本事件抽取方法，其特征在于：所述预训练模型具体为BERT模型，所述步骤S1中具体通过先获取所述BERT模型所需的预训练权重，再基于获取的所述预训练权重通过调用编码函数得到各条语句S＝[w₁,w₂,…,w_m]的分布式表示O＝[o₁,o₂,…,o_m]，其中w₁～w_m分别为各条语句S中各个单词，o₁～o_m分别为输入语句S中对应各个单词的分布式表示。

4.根据权利要求1或2或3所述的基于语法依存信息的文本事件抽取方法，其特征在于，所述步骤S3的具体步骤包括：

S31.图构建：根据各个单词之间的所述语法依存关系树构建图G＝(V,E)，其中V为所述语法依存关系树中所有节点[v₁,v₂,…,v_m]的集合，每个节点为一个单词，各节点[v₁,v₂,…,v_m]与[w₁,w₂,…,w_m]按顺序一一对应，w₁～w_m分别为各条待处理语句中各个单词，m为单词数量，E为根据所述语法依存关系树中各个节点间的连接关系构建得到的集合，其中E内每条边e为所对应连接的两个节点之间的语法依存关系；

5.根据权利要求4所述的基于语法依存信息的文本事件抽取方法，其特征在于，所述步骤S32中使用图神经网络进行迭代时，在所述图神经网络的第k层，节点v_i在所述图神经网络中的特征向量

为：

其中，0＜k＜L，L为所述图神经网络的网络层数，N(w_i)为节点w_i的邻接节点，

为边e(w_i，w_j)的类型对应的权重，

为边e(w_i，w_j)对应偏置系数；

将单词w_i在L层的特征向量

作为单词w_i的所述具有语法依存信息的特征向量。

6.根据权利要求1或2或3所述的基于语法依存信息的文本事件抽取方法，其特征在于，所述步骤S4的步骤包括：

S43.抽取结果输出：由识别出的所述事件触发词以及所述事件论元角色分类结果得到最终的事件抽取结果。

7.根据权利要求6所述的基于语法依存信息的文本事件抽取方法，其特征在于：所述步骤S41中获取识别出的所述事件触发词对应的具体事件类型时，包括根据所述触发词分类结果，将识别出的所述事件触发词外的所有单词视为候选事件元素，并依次与所述事件触发词进行特征向量拼接，对拼接得到的特征向量使用分类器进行分类，得到候选事件的分类结果。

8.根据权利要求6所述的基于语法依存信息的文本事件抽取方法，其特征在于：所述步骤S42中，具体将所述步骤S41中识别出的事件触发词w_T对应的特征向量

与原始文本数据的各个单词w_i的特征向量

分别相拼接，形成组合特征向量

9.一种基于语法依存信息的文本事件抽取装置，其特征在于，包括：

10.一种存储有计算机程序的计算机可读存储介质，所述计算机程序执行时实现如权利要求1～8中任意一项所述基于语法依存信息的文本事件抽取方法。