CN110209816A - 基于对抗模仿学习的事件识别及分类方法、***、装置 - Google Patents
基于对抗模仿学习的事件识别及分类方法、***、装置 Download PDFInfo
- Publication number
- CN110209816A CN110209816A CN201910440322.0A CN201910440322A CN110209816A CN 110209816 A CN110209816 A CN 110209816A CN 201910440322 A CN201910440322 A CN 201910440322A CN 110209816 A CN110209816 A CN 110209816A
- Authority
- CN
- China
- Prior art keywords
- vector
- event
- input information
- information
- word
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 67
- 230000007246 mechanism Effects 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 6
- 238000012549 training Methods 0.000 claims description 31
- 230000006870 function Effects 0.000 claims description 11
- 238000012512 characterization method Methods 0.000 claims description 10
- 239000011159 matrix material Substances 0.000 claims description 5
- 238000010606 normalization Methods 0.000 claims description 3
- 230000004069 differentiation Effects 0.000 claims 1
- 238000003058 natural language processing Methods 0.000 abstract description 5
- 238000009825 accumulation Methods 0.000 abstract description 4
- 230000035508 accumulation Effects 0.000 abstract description 4
- 239000000284 extract Substances 0.000 abstract description 4
- 230000010354 integration Effects 0.000 abstract 1
- 238000000605 extraction Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 239000004615 ingredient Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000002360 explosive Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Machine Translation (AREA)
- Character Discrimination (AREA)
Abstract
本发明属于自然语言处理领域,具体涉及了一种基于对抗模仿学习的事件识别及分类方法、***、装置,旨在解决传统事件识别及分类方法语言处理工具存在错误累计导致事件识别准确率低的问题。本发明方法包括:获取不含标准标注信息的句子并输入;将每一个词特征化后的词向量集构成词向量特征矩阵;采用向量编码器对词向量特征矩阵进行编码,并采用注意力机制为每一个词分配权重,获得知识向量;采用事件类型分类器依据知识向量计算输入信息属于各事件类别的概率;概率值最高的事件类别作为输入信息的事件类别。本发明不依赖自然语言处理工具对信息进行抽取,避免错误积累,提高了事件识别的准确率。
Description
技术领域
本发明属于自然语言处理领域,具体涉及了一种基于对抗模仿学习的事件识别及分类方法、***、装置。
背景技术
互联网的蓬勃发展带来了信息的***式增长,人们每天都会接触各个领域的产生的信息,例如体育、娱乐等领域的新闻信息,科研领域的文献信息等等。如何从这些非结构,无序、杂乱的信息中发现感兴趣的事件是现今亟需解决的问题。事件识别(EventIdentification)技术正是解决这一问题的途径和手段。事件识别是信息抽取(Information Extraction)的一个独立子任务,主要研究如何从含有事件信息的非结构化文本中识别出用户感兴趣的事件并且对其类型进行划分。
在事件识别中,一个事件定义为由一个触发词(trigger)、一种特定的事件类型(event type)和若干事件的事件元素(argument)及其角色(roles)组成;其中事件的触发词是文本描述中最能指示事件发生的词。完整的事件抽取任务需要从描述事件的句子中抽取事件的上述各个成分,并以结构化的形式展现出来。ACE(Automatic ContextExtraction)评测比赛推动了这个领域的发展。该评测预定义了8个大类和33个小类的事件类型,每个类型的事件都有若干标注的实例。
目前的主流技术是将事件识别转化为词分类的问题,然后利用句法分析器等工具抽取句子中的可用信息构建特征向量,最后利用基于特征的分类器进行分类。但是,传统的方法采用自然语言处理工具对可用信息进行抽取,这些处理工具中往往都存在一些错误,错误累积现象通常会影响最终事件识别的效果。
发明内容
为了解决现有技术中的上述问题,即传统事件识别及分类方法语言处理工具存在错误累计导致事件识别准确率低的问题,本发明提供了一种基于对抗模仿学习的事件识别及分类方法,该方法包括:
步骤S10,获取不含标准标注信息的句子作为输入信息;
步骤S20,对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
步骤S30,采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
步骤S40,基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
步骤S50,以概率值最高的事件类别作为所述输入信息的事件类别。
在一些优选的实施例中,所述向量编码器,其训练方法为:
步骤B10,获取含有标签向量的文本集作为第一训练样本集;将所述第一训练样本集的标签信息去除,作为第二训练样本集;
步骤B20,采用权利要求1步骤S20方法获取所述第一训练样本集对应的第一词向量特征矩阵集、第二训练样本集对应的第二词向量特征矩阵集;
步骤B30,将所述第一词向量特征矩阵集与标签向量集合并为第一特征表示集,基于所述第一特征表示集、第二词向量特征矩阵集,采用权利要求1步骤S30方法获取对应的标准知识向量集、无标签信息标准知识向量集;
步骤B40,基于随机一组标准知识向量以及对应的无标签信息标准知识向量,采用判别器识别标准知识向量和无标签信息标准知识向量的差异值,并通过对抗模仿学习更新编码器参数;
步骤B50,重复执行步骤B40直至所述标准知识向量和无标签信息标准知识向量的差异值低于预设阈值,获得训练好的向量编码器。
在一些优选的实施例中,步骤S30中“采用编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量”,其方法为:
其中,代表获得的输入信息对应的知识向量,为第i个词的注意力权重,hi为第i个词的编码器隐层表示,N代表输入信息长度。
在一些优选的实施例中,所述注意力权重为:
其中,分别代表第i个、第j个词与候选触发词wt的语义相似度。
在一些优选的实施例中,步骤S40中“基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率”,其方法为:
其中,out代表输入信息属于各事件类别的概率,softmax是归一化指数函数,W0和b0为预先设定的事件类型分类器参数,wt为输入信息中的当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。
在一些优选的实施例中,步骤B10中“将所述第一训练样本集的标签信息去除,作为第二训练样本集”,其方法为:
对所述第一训练样本集进行标签去除操作,去除实体类别、事件元素类别信息。
在一些优选的实施例中,步骤B40中“采用判别器识别标准知识向量和无标签信息标准知识向量”,其方法为:
其中,Wh、bh、Wx、bx分别代表预先设定的判别器参数,σ代表logistic函数,wt代表当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。
本发明的另一方面,提出了一种基于对抗模仿学习的事件识别及分类***,包括输入模块、特征化模块、向量编码模块、事件类型分类模块、输出模块;
所述输入模块,配置为获取不含标准标注信息的句子作为输入信息并输入;
所述特征化模块,配置为对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
所述向量编码模块,配置为采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
所述事件类型分类模块,配置为基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
所述输出模块,配置为以概率值最高的事件类别作为所述输入信息的事件类别并输出。
本发明的第三方面,提出了一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于对抗模仿学习的事件识别及分类方法。
本发明的第四方面,提出了一种处理装置,包括处理器、存储装置;所述处理器,适于执行各条程序;所述存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于对抗模仿学习的事件识别及分类方法。
本发明的有益效果:
本发明基于对抗模仿学习的事件识别及分类方法,针对事件识别的问题,设计一种基于对抗模仿学习机制的事件识别模型,该模型不依赖自然语言处理工具对可用信息进行抽取,而是使用对抗机制直接集成标准标注知识,避免了错误累积现象,提高了事件识别的最终效果。
附图说明
通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:
图1是本发明基于对抗模仿学习的事件识别及分类方法的***结构示意图;
图2是本发明基于对抗模仿学习的事件识别及分类方法一种实施例的标准知识向量构建示意图;
图3是本发明基于对抗模仿学习的事件识别及分类方法一种实施例的向量编码器训练流程示意图。
具体实施方式
下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
本发明的一种基于对抗模仿学习的事件识别及分类方法,该方法包括:
步骤S10,获取不含标准标注信息的句子作为输入信息;
步骤S20,对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
步骤S30,采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
步骤S40,基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
步骤S50,以概率值最高的事件类别作为所述输入信息的事件类别。
为了更清晰地对本发明基于对抗模仿学习的事件识别及分类方法进行说明,下面结合图1对本发明方法实施例中各步骤展开详述。
本发明一种实施例的基于对抗模仿学习的事件识别及分类方法,包括步骤S10-步骤S50,各步骤详细描述如下:
步骤S10,获取不含标准标注信息的句子作为输入信息。
在事件识别中,一个事件被定义为由一个触发词(trigger)、一种特定的事件类型(event type)和若干事件元素(argument)及其对应角色(roles)组成,其中事件的触发词是文本描述中最能指示事件发生的词。完整的事件抽取任务需要从描述事件的句子中抽取事件的上述各个成分,并以结构化的形式展现出来。
例如,对于文本“He died in hospital.”,一个理想的事件抽取结果如表1所示:
表1
事件识别是事件抽取的子任务,只关注事件的触发词和事件类型的识别,并不关注事件参与者及其对应角色。例如,对于上述的例子,事件识别的任务是识别出该句子描述了一个事件,该事件的触发词是“died”,事件类型是“Die”。
步骤S20,对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵。
词向量,顾名思义,就是使用向量来表达词。词向量最常见的表达方式就是"one-hot",其向量维度为整个语料库中词的总数,每一维代表语料库中的一个词(出现为1,不出现为0)。此外,基于窗口的共现矩阵是对词与词相邻关系的最直接表达;基于词相邻关系的表达方式就是word2vec,其主题思想是通过每一个词本身来预测其相邻的词。词向量的获取方式有多种,在此不再一一赘述。
步骤S30,采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量,如式(1)所示:
其中,代表获得的输入信息对应的知识向量,为第i个词的注意力权重,hi为第i个词的编码器隐层表示,N代表输入信息长度。
注意力权重如式(2)所示:
其中,分别代表第i个、第j个词与候选触发词wt的语义相似度。
向量编码器训练方法为:
步骤B10,获取含有标签向量的文本集作为第一训练样本集;将所述第一训练样本集的标签信息去除,作为第二训练样本集。
“将所述第一训练样本集的标签信息去除,作为第二训练样本集”,其方法为:
对所述第一训练样本集进行标签去除操作,去除实体类别、事件元素类别信息。
步骤B20,采用权利要求1步骤S20方法获取所述第一训练样本集对应的第一词向量特征矩阵集、第二训练样本集对应的第二词向量特征矩阵集。
步骤B30,将所述第一词向量特征矩阵集与标签向量集合并为第一特征表示集,基于所述第一特征表示集、第二词向量特征矩阵集,采用权利要求1步骤S30方法获取对应的标准知识向量集、无标签信息标准知识向量集。
如图2所示,为本发明基于对抗模仿学习的事件识别及分类方法一种实施例的标准知识向量构建示意图,“…is set to release 20 million euros…”为第一训练样本集中一条样本数据,“标签向量”与“词向量”共同构成了样本数据的特征表示,通过向量编码器(BiGRU)对样本数据的特征表示进行编码,并通过注意力权重机制分配权重,最终获得样本数据对应的标准知识向量。
步骤B40,基于随机一组标准知识向量以及对应的无标签信息标准知识向量,采用判别器识别标准知识向量和无标签信息标准知识向量的差异值,并通过对抗模仿学习更新编码器参数。
“采用判别器识别标准知识向量和无标签信息标准知识向量”,如式(3)所示:
其中,Wh、bh、Wx、bx分别代表预先设定的判别器参数,σ代表logistic函数,wt代表当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。
步骤B50,重复执行步骤B40直至所述标准知识向量和无标签信息标准知识向量的差异值低于预设阈值,获得训练好的向量编码器。
如图3所示,为本发明基于对抗模仿学习的事件识别及分类方法一种实施例的向量编码器训练流程示意图,分别提取带有标准标注信息的句子和对应无标准标注信息的句子的知识向量,通过对抗模仿的方法训练向量编码器,使得向量编码器难以区分这两种向量,在这种情况下,使用无标准标注信息的知识向量可以得到与使用带标准标注信息的知识向量类似的结果,从而达到模仿学习的目的。
步骤S40,基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率,如式(4)所示:
其中,out代表输入信息属于各事件类别的概率,softmax是归一化指数函数,W0和b0为预先设定的事件类型分类器参数,wt为输入信息中的当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。本发明一个实施例中采用逻辑回归分类器作为事件类型分类器。
步骤S50,以概率值最高的事件类别作为所述输入信息的事件类别。
本发明第二实施例的基于对抗模仿学习的事件识别及分类***,包括输入模块、特征化模块、向量编码模块、事件类型分类模块、输出模块;
所述输入模块,配置为获取不含标准标注信息的句子作为输入信息并输入;
所述特征化模块,配置为对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
所述向量编码模块,配置为采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
所述事件类型分类模块,配置为基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
所述输出模块,配置为以概率值最高的事件类别作为所述输入信息的事件类别并输出。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的***的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
需要说明的是,上述实施例提供的基于对抗模仿学习的事件识别及分类***,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。
本发明第三实施例的一种存储装置,其中存储有多条程序,所述程序适于由处理器加载并执行以实现上述的基于对抗模仿学习的事件识别及分类方法。
本发明第四实施例的一种处理装置,包括处理器、存储装置;处理器,适于执行各条程序;存储装置,适于存储多条程序;所述程序适于由处理器加载并执行以实现上述的基于对抗模仿学习的事件识别及分类方法。
所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。
本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。
术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。
至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。
Claims (10)
1.一种基于对抗模仿学习的事件识别及分类方法,其特征在于,该识别方法包括:
步骤S10,获取不含标准标注信息的句子作为输入信息;
步骤S20,对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
步骤S30,采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
步骤S40,基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
步骤S50,以概率值最高的事件类别作为所述输入信息的事件类别。
2.根据权利要求1所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,所述向量编码器,其训练方法为:
步骤B10,获取含有标签向量的文本集作为第一训练样本集;将所述第一训练样本集的标签信息去除,作为第二训练样本集;
步骤B20,采用权利要求1步骤S20方法获取所述第一训练样本集对应的第一词向量特征矩阵集、第二训练样本集对应的第二词向量特征矩阵集;
步骤B30,将所述第一词向量特征矩阵集与标签向量集合并为第一特征表示集,基于所述第一特征表示集、第二词向量特征矩阵集,采用权利要求1步骤S30方法获取对应的标准知识向量集、无标签信息标准知识向量集;
步骤B40,基于随机一组标准知识向量以及对应的无标签信息标准知识向量,采用判别器识别标准知识向量和无标签信息标准知识向量的差异值,并通过对抗模仿学习更新编码器参数;
步骤B50,重复执行步骤B40直至所述标准知识向量和无标签信息标准知识向量的差异值低于预设阈值,获得训练好的向量编码器。
3.根据权利要求1所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤S30中“采用编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量”,其方法为:
其中,代表获得的输入信息对应的知识向量,为第i个词的注意力权重,hi为第i个词的编码器隐层表示,N代表输入信息长度。
4.根据权利要求3所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,所述注意力权重为:
其中,分别代表第i个、第j个词与候选触发词wt的语义相似度。
5.根据权利要求1所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤S40中“基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率”,其方法为:
其中,out代表输入信息属于各事件类别的概率,softmax是归一化指数函数,W0和b0为预先设定的事件类型分类器参数,wt为输入信息中的当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。
6.根据权利要求2所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤B10中“将所述第一训练样本集的标签信息去除,作为第二训练样本集”,其方法为:
对所述第一训练样本集进行标签去除操作,去除实体类别、事件元素类别信息。
7.根据权利要求2所述的基于对抗模仿学习的事件识别及分类方法,其特征在于,步骤B40中“采用判别器识别标准知识向量和无标签信息标准知识向量”,其方法为:
其中,Wh、bh、Wx、bx分别代表预先设定的判别器参数,σ代表logistic函数,wt代表当前候选触发词,代表wt的标准知识向量或无标签信息标准知识向量。
8.一种基于对抗模仿学习的事件识别及分类***,其特征在于,包括输入模块、特征化模块、向量编码模块、事件类型分类模块、输出模块;
所述输入模块,配置为获取不含标准标注信息的句子作为输入信息并输入;
所述特征化模块,配置为对所述输入信息中每一个词进行特征化操作,获得对应的词向量集构成词向量特征矩阵;
所述向量编码模块,配置为采用向量编码器对所述词向量特征矩阵进行编码,并使用注意力机制为所述输入信息的每一个词分配权重,获得输入信息对应的知识向量;
所述事件类型分类模块,配置为基于所述输入信息对应的知识向量,通过事件类型分类器计算所述输入信息属于各事件类别的概率;
所述输出模块,配置为以概率值最高的事件类别作为所述输入信息的事件类别并输出。
9.一种存储装置,其中存储有多条程序,其特征在于,所述程序适于由处理器加载并执行以实现权利要求1-7任一项所述的基于对抗模仿学习的事件识别及分类方法。
10.一种处理装置,包括
处理器,适于执行各条程序;以及
存储装置,适于存储多条程序;
其特征在于,所述程序适于由处理器加载并执行以实现:
权利要求1-7任一项所述的基于对抗模仿学习的事件识别及分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910440322.0A CN110209816B (zh) | 2019-05-24 | 2019-05-24 | 基于对抗模仿学习的事件识别及分类方法、***、装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910440322.0A CN110209816B (zh) | 2019-05-24 | 2019-05-24 | 基于对抗模仿学习的事件识别及分类方法、***、装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110209816A true CN110209816A (zh) | 2019-09-06 |
CN110209816B CN110209816B (zh) | 2021-06-08 |
Family
ID=67788396
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910440322.0A Active CN110209816B (zh) | 2019-05-24 | 2019-05-24 | 基于对抗模仿学习的事件识别及分类方法、***、装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110209816B (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597994A (zh) * | 2019-09-17 | 2019-12-20 | 北京百度网讯科技有限公司 | 事件元素识别方法和装置 |
CN110674303A (zh) * | 2019-09-30 | 2020-01-10 | 北京明略软件***有限公司 | 事件语句处理方法、装置、计算机设备和可读存储介质 |
CN110796199A (zh) * | 2019-10-30 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置以及电子医疗设备 |
CN110941955A (zh) * | 2019-11-25 | 2020-03-31 | 中国科学院自动化研究所 | 跨语言事件分类方法及装置 |
CN111858725A (zh) * | 2020-04-30 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种事件属性确定方法及*** |
CN112667826A (zh) * | 2019-09-30 | 2021-04-16 | 北京国双科技有限公司 | 一种篇章去噪方法、装置、***及存储介质 |
CN112818679A (zh) * | 2019-11-15 | 2021-05-18 | 阿里巴巴集团控股有限公司 | 事件类别确定方法、装置及电子设备 |
CN114863341A (zh) * | 2022-05-17 | 2022-08-05 | 济南大学 | 一种在线课程学习监督方法及*** |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9582739B2 (en) * | 2014-11-18 | 2017-02-28 | Harry Friedbert Padubrin | Learning contour identification system using portable contour metrics derived from contour mappings |
US20180240233A1 (en) * | 2017-02-22 | 2018-08-23 | Siemens Healthcare Gmbh | Deep Convolutional Encoder-Decoder for Prostate Cancer Detection and Classification |
CN108717439A (zh) * | 2018-05-16 | 2018-10-30 | 哈尔滨理工大学 | 一种基于注意力机制和特征强化融合的中文文本分类方法 |
CN108985330A (zh) * | 2018-06-13 | 2018-12-11 | 华中科技大学 | 一种自编码网络及其训练方法、异常用电检测方法和*** |
CN109472024A (zh) * | 2018-10-25 | 2019-03-15 | 安徽工业大学 | 一种基于双向循环注意力神经网络的文本分类方法 |
-
2019
- 2019-05-24 CN CN201910440322.0A patent/CN110209816B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9582739B2 (en) * | 2014-11-18 | 2017-02-28 | Harry Friedbert Padubrin | Learning contour identification system using portable contour metrics derived from contour mappings |
US20180240233A1 (en) * | 2017-02-22 | 2018-08-23 | Siemens Healthcare Gmbh | Deep Convolutional Encoder-Decoder for Prostate Cancer Detection and Classification |
CN108717439A (zh) * | 2018-05-16 | 2018-10-30 | 哈尔滨理工大学 | 一种基于注意力机制和特征强化融合的中文文本分类方法 |
CN108985330A (zh) * | 2018-06-13 | 2018-12-11 | 华中科技大学 | 一种自编码网络及其训练方法、异常用电检测方法和*** |
CN109472024A (zh) * | 2018-10-25 | 2019-03-15 | 安徽工业大学 | 一种基于双向循环注意力神经网络的文本分类方法 |
Cited By (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110597994A (zh) * | 2019-09-17 | 2019-12-20 | 北京百度网讯科技有限公司 | 事件元素识别方法和装置 |
CN110674303A (zh) * | 2019-09-30 | 2020-01-10 | 北京明略软件***有限公司 | 事件语句处理方法、装置、计算机设备和可读存储介质 |
CN112667826A (zh) * | 2019-09-30 | 2021-04-16 | 北京国双科技有限公司 | 一种篇章去噪方法、装置、***及存储介质 |
CN110674303B (zh) * | 2019-09-30 | 2022-03-01 | 北京明略软件***有限公司 | 事件语句处理方法、装置、计算机设备和可读存储介质 |
CN110796199A (zh) * | 2019-10-30 | 2020-02-14 | 腾讯科技(深圳)有限公司 | 一种图像处理方法、装置以及电子医疗设备 |
CN112818679A (zh) * | 2019-11-15 | 2021-05-18 | 阿里巴巴集团控股有限公司 | 事件类别确定方法、装置及电子设备 |
CN110941955A (zh) * | 2019-11-25 | 2020-03-31 | 中国科学院自动化研究所 | 跨语言事件分类方法及装置 |
CN111858725A (zh) * | 2020-04-30 | 2020-10-30 | 北京嘀嘀无限科技发展有限公司 | 一种事件属性确定方法及*** |
CN114863341A (zh) * | 2022-05-17 | 2022-08-05 | 济南大学 | 一种在线课程学习监督方法及*** |
CN114863341B (zh) * | 2022-05-17 | 2024-05-31 | 济南大学 | 一种在线课程学习监督方法及*** |
Also Published As
Publication number | Publication date |
---|---|
CN110209816B (zh) | 2021-06-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110209816A (zh) | 基于对抗模仿学习的事件识别及分类方法、***、装置 | |
CN110222160B (zh) | 智能语义文档推荐方法、装置及计算机可读存储介质 | |
Demir et al. | Improving named entity recognition for morphologically rich languages using word embeddings | |
CN111639171A (zh) | 一种知识图谱问答方法及装置 | |
CN113821605B (zh) | 一种事件抽取方法 | |
CN104484380A (zh) | 个性化搜索方法及装置 | |
CN106126619A (zh) | 一种基于视频内容的视频检索方法及*** | |
Moh et al. | On multi-tier sentiment analysis using supervised machine learning | |
Chrupała | Text segmentation with character-level text embeddings | |
CN109840532A (zh) | 一种基于k-means的法院类案推荐方法 | |
CN112328800A (zh) | 自动生成编程规范问题答案的***及方法 | |
CN112395395A (zh) | 文本关键词提取方法、装置、设备及存储介质 | |
CN110175334A (zh) | 基于自定义的知识槽结构的文本知识抽取***和方法 | |
Kozareva et al. | Combining data-driven systems for improving named entity recognition | |
CN113946677A (zh) | 基于双向循环神经网络和注意力机制的事件识别分类方法 | |
CN113111159A (zh) | 问答记录生成方法、装置、电子设备及存储介质 | |
Zhang et al. | Term recognition using conditional random fields | |
CN111091002A (zh) | 一种中文命名实体的识别方法 | |
Patel et al. | Approaches of anonymisation of an SMS corpus | |
CN108241609B (zh) | 排比句识别方法及*** | |
Long et al. | Joint learning for legal text retrieval and textual entailment: leveraging the relationship between relevancy and affirmation | |
Li et al. | Attention-based LSTM-CNNs for uncertainty identification on Chinese social media texts | |
CN105740359B (zh) | 个股识别的方法及装置 | |
Baradaran et al. | Event Extraction from Classical Arabic Texts. | |
Suta et al. | Matching question and answer using similarity: an experiment with stack overflow |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |