CN104881404A - 一种事件关系检测方法及*** - Google Patents

一种事件关系检测方法及*** Download PDF

Info

Publication number
CN104881404A
CN104881404A CN201510346311.8A CN201510346311A CN104881404A CN 104881404 A CN104881404 A CN 104881404A CN 201510346311 A CN201510346311 A CN 201510346311A CN 104881404 A CN104881404 A CN 104881404A
Authority
CN
China
Prior art keywords
test
vector
sentence
measured
rearmounted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201510346311.8A
Other languages
English (en)
Inventor
杨雪蓉
洪宇
姚建民
朱巧明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhangjiagang Institute of Industrial Technologies Soochow University
Original Assignee
Zhangjiagang Institute of Industrial Technologies Soochow University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhangjiagang Institute of Industrial Technologies Soochow University filed Critical Zhangjiagang Institute of Industrial Technologies Soochow University
Priority to CN201510346311.8A priority Critical patent/CN104881404A/zh
Publication of CN104881404A publication Critical patent/CN104881404A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

本发明公开了一种事件关系检测方法和***,包括:获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与其逻辑关系对应的测试连接词;确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;通过分析进行分词处理后的测试前置文本和测试后置文本的框架语义,构建测试前置向量及测试后置向量;确定每个测试句子的测试前置向量与测试后置向量组成其测试向量对;获取待测向量对,从全部测试向量对中确定出与待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为待测向量对对应的待测句子的逻辑关系。由此,不仅实现了通用性,获取的检测结果还具有较高准确度。

Description

一种事件关系检测方法及***
技术领域
本发明涉及自然语言处理技术领域,更具体地说,涉及一种事件关系检测方法及***。
背景技术
逻辑关系能将离散于文本中的事件相连接,而事件关系检测则是一项面向事件之间逻辑关系(包括因果关系、时序关系等)的自然语言处理技术,通常用于确定离散于文本中的事件的逻辑关系,其中,事件通常指文本中完整事件的语义单元,如事件句子等。
现有技术中用于检测离散于文本中的事件间的逻辑关系的事件关系检测方法仅仅着眼于某一特定的逻辑关系,如因果关系,即,仅仅能检测出具有某一特定逻辑关系的事件,因此,现有技术中的事件关系检测技术不具有通用性。
综上所述,现有技术中的事件关系检测技术不具有通用性。
发明内容
本发明的目的是提供一种事件关系检测方法及***,以解决现有技术中的事件关系检测技术不具有通用性的问题。
为了实现上述目的,本发明提供如下技术方案:
一种事件关系检测方法,包括:
获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词;
确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;
分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量;
确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试向量对;
获取待测向量对,从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为所述待测向量对对应的待测句子的逻辑关系。
优选的,所述分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量,包括:
对所述测试前置文本进行分词处理,得到分别与每个测试句子对应的测试前置词组;对所述测试后置文本进行分词处理,得到分别与每个测试句子对应的测试后置词组;
分析所述测试前置词组中的词语的框架语义,得到每个测试句子的前置框架语义集合;
分析所述测试后置词组中的词语的框架语义,得到每个测试句子的后置框架语义集合;
利用所述前置框架语义集合构建每个测试句子的测试前置向量,利用所述后置框架语义集合构建每个测试句子的测试后置向量。
优选的,所述获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词,包括:
获取指定文本信息;
将所述文本信息进行分句处理,得到第一句子;
确定所述第一句子中已提供逻辑关系的句子为第二句子;
获取每个第二句子所包含的连接词;
确定所述第二句子中其连接词指向该第二句子的逻辑关系的概率大于预设阈值的预设数量句子为测试句子。
优选的,所述获取待测向量对,包括:
获取待测句子;
确定该待测句子中的一个连接词为待测连接词;
确定所述待测句子中位于所述待测连接词之前的文本为待测前置文本,位于所述待测连接词之后的文本为待测后置文本;
分析进行分词处理后的待测前置文本的框架语义,以构建待测前置向量,分析进行分词处理后的待测后置文本的框架语义,以构建待测后置向量;
确定所述待测前置向量和所述待测后置向量组成待测向量对。
优选的,所述从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,包括:
确定所述待测向量对的待测前置向量和待测后置向量;
计算每个测试句子的测试前置向量与所述待测前置向量的第一相似度,以及该测试句子的测试后置向量与所述待测后置向量的第二相似度;
利用所述第一相似度和所述第二相似度确定所述待测向量对与每个测试句子的测试向量对的相似度;
确定出所述相似度中最高的相似度对应的测试向量对。
优选的,所述计算每个测试句子的测试前置向量与所述待测前置向量的第一相似度,以及该测试句子的测试后置向量与所述待测后置向量的第二相似度,包括:
计算每个测试句子的测试前置向量与所述待测前置向量的向量余弦值,并将该向量余弦值确定为第一相似度;
计算每个测试句子的测试后置向量与所述待测后置向量的向量余弦值,并将该向量余弦值确定为第二相似度。
优选的,所述利用所述第一相似度和所述第二相似度确定所述待测向量对与每个测试句子的测试向量对的相似度,包括:
按照下列公式计算所述相似度:
S i m = EveSim 1 + EveSim 2 2 · e | EveSim 1 - EveSim 2 |
其中,Sim为所述待测向量对与每个测试句子的测试向量对的相似度,EveSim1所述为第一相似度,EveSim2为所述第二相似度,e为自然常数。
一种事件关系检测***,包括:
获取模块,用于获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词;
第一确定模块,用于确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;
向量构建模块,用于分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量;
第二确定模块,用于确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试向量对;
第三确定模块,用于获取待测向量对,从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为所述待测向量对对应的待测句子的逻辑关系。
本发明提供的一种事件关系检测方法及***,通过已提供逻辑关系、且包括有与逻辑关系相对应的连接词的预设数量测试句子,建立与每个测试句子对应的测试向量对,并确定出与待测向量对相似度最高的测试向量对,该测试向量对对应的测试句子的逻辑关系即为待测向量对对应的待测句子的逻辑关系。即,确定相似度最高的两个向量对所对应的句子具有相同的逻辑关系。本申请提供的一种事件关系检测方法及***,不仅仅能检测出某一特定逻辑关系,而是可以根据需要获取与任意逻辑关系对应的测试句子及测试向量对,进而确定待测向量的逻辑关系,具有通用性;且实验证明,本发明提供的一种事件关系检测方法及***获得的检测结果具有较高的准确度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本发明实施例提供的一种事件关系检测方法的流程图;
图2为本发明实施例提供的一种事件关系检测方法中步骤S13的流程图;
图3为本发明实施例提供的一种事件关系检测方法中步骤S11的流程图;
图4为本发明实施例提供的一种事件关系检测方法中获取待测向量对的流程图;
图5为本发明实施例提供的一种事件关系检测方法中从全部测试句子的测试向量对中确定出与待测向量对相似度最高的测试向量对的流程图;
图6为本发明实施例提供的一种事件关系检测***的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参阅图1,其示出了本发明实施例提供的一种事件关系检测方法的流程图,可以包括以下步骤:
S11:获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词。
预设数量可由工作人员根据实际需要进行设定。
S12:确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本。
可认为每个句子的测试前置文本与测试后置文本构成该测试句子的事件对。
S13:分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量。
S14:确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试向量对。
可认为每个测试句子的测试向量对即为该测试句子的事件场景对。
S15:获取待测向量对,从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为所述待测向量对对应的待测句子的逻辑关系。
可认为待测向量对即为待测句子的事件场景对。
本发明实施例提供的一种事件关系检测方法,通过已提供逻辑关系、且包括有与逻辑关系相对应的连接词的预设数量测试句子,建立与每个测试句子对应的测试向量对,并确定出与待测向量对相似度最高的测试向量对,该测试向量对对应的测试句子的逻辑关系即为待测向量对对应的待测句子的逻辑关系。即确定相似度最高的两个向量对(事件场景对)所对应的句子具有相同的逻辑关系。本申请提供的一种事件关系检测方法及***,不仅仅能检测出某一特定逻辑关系,而是可以根据需要获取与任意逻辑关系对应的测试句子及测试向量对,进而确定待测向量的逻辑关系,具有通用性;且实验证明,本发明提供的一种事件关系检测方法及***获得的检测结果具有较高的准确度。
需要说明的是,每个测试句子可以用下面形式来表示:“PreGram+,connective+PostGram”。其中,“PreGram”为测试前置文本,“connective”为测试连接词,“PostGram”为测试后置文本。
请参阅图2,其示出了本发明实施例提供的一种事件关系检测方法中步骤S13的流程图,可以包括以下步骤:
S21:对测试前置文本进行分词处理,得到分别与每个测试句子对应的测试前置词组;对测试后置文本进行分词处理,得到分别与每个测试句子对应的测试后置词组。
S22:分析测试前置词组中的词语的框架语义,得到每个测试句子的前置框架语义集合;分析测试后置词组中的词语的框架语义,得到每个测试句子的后置框架语义集合。
基于FrameNet(框架语义),可利用SEMAFOR工具分析测试前置词组及测试后置词组中词语的框架语义。其中,FrameNet是基于框架语义学(Frame Semantics)的词汇资源,其为词语意义和句法结构的研究提供一种理论框架,主要通过框架描述单词的释义,即词语背后隐藏的概念结构和语义等信息。从而,框架语义能够形成特定的场景(包括事件、状态、关系或实体)的概念表述。在框架语义中,对句子的框架语义标注是一种类似于“谓词-论元”结构的“目标词-框架语义”结构。每个句子可能包含一个或多个“目标词-框架语义”结构,例如:原句为:艾琳利用混有麻醉的酒让夏洛克昏迷。对其进行分词处理,得到目标词:艾琳、利用、混有麻醉的酒、夏洛克、昏迷;通过框架语义分析,能够得到如下“目标词-框架语义”结构:“艾琳—人物”、“利用—行为”、“混有麻醉的酒—药物”、“夏洛克—人物”及“昏迷—状态”。
S23:利用前置框架语义集合构建每个测试句子的测试前置向量,利用后置框架语义集合构建每个测试句子的测试后置向量。
将前置框架语义集合和后置框架语义集合统称为框架语义集合,将每个框架语义集合中每个词语的框架语义表示成空间向量,各维度将作为该空间向量的组成成分。
另外,确定前置框架语义集合和后置框架语义集合构成框架语义集合对,为了实现框架语义集合对与逻辑关系的一一对应,通过对框架语义集合对进行极大似然的概率估计确定其是否是一一对应的。具体为:给定框架语义集合对及其在各个逻辑关系的概率分布P(r),选取分布概率最高的逻辑关系作为该框架语义集合对的极大似然关系,如下列公式所示:
E v e . M a x ( R ) = M a x n r N
其中,Eve.Max(R)为极大似然关系,nr为框架语义集合对指向逻辑关系r出现的次数,N为框架语义集合对指向所有逻辑关系出现的次数。通常认为Eve.Max(R)最大时的逻辑关系与该框架语义集合对相对应。
由此,可基于框架语义获取每个测试句子的测试前置向量和测试后置向量,保证后续步骤的顺利进行。
请参阅图3,其示出了本发明实施例提供的一种事件关系检测方法中步骤S11的流程图,可以包括以下步骤:
S31:获取指定文本信息。
预设量可由工作人员根据实际情况进行确定,指定文本信息可以是PDTB(Penn Discourse TreeBank,库宾话语)新闻语料库。
S32:将文本信息进行分句处理,得到第一句子。
对文本信息进行分句处理,即将文本信息中的每一个以句号、问号等结尾的句子进行切分。
S33:确定第一句子中已提供逻辑关系的句子为第二句子。
S34:获取每个第二句子所包含的连接词。
S35:确定第二句子中其连接词指向该第二句子的逻辑关系的概率大于预设阈值的预设数量句子为测试句子。
需要说明的是,预设阈值可由工作人员根据实际情况进行确定,可设置为80%。以使用PDTB新闻语料库作为指定文本信息举例说明:PDTB新闻语料库中共定义182个连接词,而这些连接词与逻辑关系并非一一对应,为了使本实施例提供的一种事件关系检测方法获取的关系更准确,本实施例仅仅选取PDTB新闻语料库中的连接词指向与之对应的逻辑关系的概率大于预设阈值的连接词。针对PDTB中连接词的分布,统计了各连接词指向某一逻辑关系的概率,如表1所示:
表1PDTB中连接词的分布
可见,各连接词在四种篇章关系类型中出现的概率,例如连接词“alternatively(选择地)”指向逻辑关系“Expansion(扩展)”的概率为100%,即连接词“alternatively(选择地)”与逻辑关系“Expansion(扩展)”是一一对应的,符合本实施例的要求。
由此获取的测试句子其测试连接指向其逻辑关系的概率大于预设阈值,能够使得检测获取的结果更加准确。
请参阅图4,其示出了本发明实施例提供的一种事件关系检测方法中获取待测向量对的流程图,可以包括以下步骤:
S41:获取待测句子。
S42:确定该待测句子中的一个连接词为待测连接词。
需要说明的是,选取的待测连接最好位于待测句子比较偏向中央的位置,由此获得的测试连接词前后的文本分别构成的事件更加完整,更有利于对待测句子的逻辑关系的分析。
S43:确定待测句子中位于待测连接词之前的文本为待测前置文本,位于待测连接词之后的文本为待测后置文本。
S44:分析进行分词处理后的待测前置文本的框架语义,以构建待测前置向量,分析进行分词处理后的待测后置文本的框架语义,以构建待测后置向量。
需要说明的是,步骤S44中基于框架语义获取待测前置向量和待测后置向量的步骤与获取测试前置向量和测试后置向量的步骤基本相同,具体请参见上文中对获取测试前置向量和测试后置向量的说明。
S45:确定待测前置向量和待测后置向量组成待测向量对。
由此,能够获取待测向量对,保证后续步骤的顺利实现。
请参阅图5,其示出了本发明实施例提供的一种事件关系检测方法中从全部测试句子的测试向量对中确定出与待测向量对相似度最高的测试向量对的流程图,可以包括以下步骤:
S51:确定待测向量对的待测前置向量和待测后置向量。
S52:计算每个测试句子的测试前置向量与待测前置向量的第一相似度,以及该测试句子的测试后置向量与待测后置向量的第二相似度。
S53:利用第一相似度和第二相似度确定待测向量对与每个测试句子的测试向量对的相似度。
S54:确定出所述相似度中最高的相似度对应的测试向量对。
其中,步骤S54可以按照下列公式计算相似度:
S i m = EveSim 1 + EveSim 2 2 · e | EveSim 1 - EveSim 2 |
其中,Sim为待测向量对与每个测试句子的测试向量对的相似度,EveSim1为第一相似度,EveSim2为第二相似度,e为自然常数。另外,将第一相似度和第二相似度之和除以两个相似度的差是为了平衡两个相似度的值,采用相似度差值的指数形式是为了确保分母的值不为0。
由此,分别通过测试前置向量与待测前置向量的第一相似度,及测试后置向量和待测后置向量的第二相似度,综合确定测试向量对与待测向量对的相似度,使得获得的结果更加准确可信。
其中,步骤S52可以包括:
计算每个测试句子的测试前置向量与待测前置向量的向量余弦值,并将该向量余弦值确定为第一相似度;
计算每个测试句子的测试后置向量与待测后置向量的向量余弦值,并将该向量余弦值确定为第二相似度。
实验证明,利用向量余弦值确定相似度不仅计算过程简单,且计算获得的准确度也更加准确。
与上述方法实施例相对应,本发明实施例还提供了一种事件关系检测***,如图6所述,可以包括:
获取模块61,用于获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词;
第一确定模块62,用于确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;
向量构建模块63,用于分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量;
第二确定模块64,用于确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试向量对;
第三确定模块65,用于获取待测向量对,从全部测试句子的测试向量对中确定出与待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为待测向量对对应的待测句子的逻辑关系。
由此,通过上述实施例提供的一种事件关系检测***,获取已提供逻辑关系、且包括有与逻辑关系相对应的连接词的预设数量测试句子,建立与每个测试句子对应的测试向量对,并确定出与待测向量对相似度最高的测试向量对,该测试向量对对应的测试句子的逻辑关系即为待测向量对对应的待测句子的逻辑关系。即,确定相似度最高的两个向量对所对应的句子具有相同的逻辑关系。本申请提供的一种事件关系检测方法及***,不仅仅能检测出某一特定逻辑关系,而是可以根据需要获取与任意逻辑关系对应的测试句子及测试向量对,进而确定待测向量的逻辑关系,具有通用性;且实验证明,本发明提供的一种事件关系检测方法及***获得的检测结果具有较高的准确度。
对所公开的实施例的上述说明,使本领域技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (8)

1.一种事件关系检测方法,其特征在于,包括:
获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词;
确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;
分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量;
确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试向量对;
获取待测向量对,从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为所述待测向量对对应的待测句子的逻辑关系。
2.根据权利要求1所述的方法,其特征在于,所述分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量,包括:
对所述测试前置文本进行分词处理,得到分别与每个测试句子对应的测试前置词组;对所述测试后置文本进行分词处理,得到分别与每个测试句子对应的测试后置词组;
分析所述测试前置词组中的词语的框架语义,得到每个测试句子的前置框架语义集合;
分析所述测试后置词组中的词语的框架语义,得到每个测试句子的后置框架语义集合;
利用所述前置框架语义集合构建每个测试句子的测试前置向量,利用所述后置框架语义集合构建每个测试句子的测试后置向量。
3.根据权利要求2所述的方法,其特征在于,所述获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词,包括:
获取指定文本信息;
将所述文本信息进行分句处理,得到第一句子;
确定所述第一句子中已提供逻辑关系的句子为第二句子;
获取每个第二句子所包含的连接词;
确定所述第二句子中其连接词指向该第二句子的逻辑关系的概率大于预设阈值的预设数量句子为测试句子。
4.根据权利要求1所述的方法,其特征在于,所述获取待测向量对,包括:
获取待测句子;
确定该待测句子中的一个连接词为待测连接词;
确定所述待测句子中位于所述待测连接词之前的文本为待测前置文本,位于所述待测连接词之后的文本为待测后置文本;
分析进行分词处理后的待测前置文本的框架语义,以构建待测前置向量,分析进行分词处理后的待测后置文本的框架语义,以构建待测后置向量;
确定所述待测前置向量和所述待测后置向量组成待测向量对。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,包括:
确定所述待测向量对的待测前置向量和待测后置向量;
计算每个测试句子的测试前置向量与所述待测前置向量的第一相似度,以及该测试句子的测试后置向量与所述待测后置向量的第二相似度;
利用所述第一相似度和所述第二相似度确定所述待测向量对与每个测试句子的测试向量对的相似度;
确定出所述相似度中最高的相似度对应的测试向量对。
6.根据权利要求5所述的方法,其特征在于,所述计算每个测试句子的测试前置向量与所述待测前置向量的第一相似度,以及该测试句子的测试后置向量与所述待测后置向量的第二相似度,包括:
计算每个测试句子的测试前置向量与所述待测前置向量的向量余弦值,并将该向量余弦值确定为第一相似度;
计算每个测试句子的测试后置向量与所述待测后置向量的向量余弦值,并将该向量余弦值确定为第二相似度。
7.根据权利要求6所述的方法,其特征在于,所述利用所述第一相似度和所述第二相似度确定所述待测向量对与每个测试句子的测试向量对的相似度,包括:
按照下列公式计算所述相似度:
S i m = EveSim 1 + EveSim 2 2 · e | EveSim 1 - EveSim 2 |
其中,Sim为所述待测向量对与每个测试句子的测试向量对的相似度,EveSim1所述为第一相似度,EveSim2为所述第二相似度,e为自然常数。
8.一种事件关系检测***,其特征在于,包括:
获取模块,用于获取预设数量已提供逻辑关系的测试句子,每个测试句子均包括一个与该测试句子的逻辑关系对应的测试连接词;
第一确定模块,用于确定每个测试句子中位于测试连接词之前的文本为测试前置文本,位于测试连接词之后的文本为测试后置文本;
向量构建模块,用于分析进行分词处理后的测试前置文本的框架语义,以构建分别与每个测试句子对应的测试前置向量,分析进行分词处理后的测试后置文本的框架语义,以构建分别与每个测试句子对应的测试后置向量;
第二确定模块,用于确定每个测试句子对应的测试前置向量与测试后置向量组成该测试句子的测试向量对;
第三确定模块,用于获取待测向量对,从全部测试句子的测试向量对中确定出与所述待测向量对相似度最高的测试向量对,确定该测试向量对对应的测试句子的逻辑关系为所述待测向量对对应的待测句子的逻辑关系。
CN201510346311.8A 2015-06-19 2015-06-19 一种事件关系检测方法及*** Pending CN104881404A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510346311.8A CN104881404A (zh) 2015-06-19 2015-06-19 一种事件关系检测方法及***

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510346311.8A CN104881404A (zh) 2015-06-19 2015-06-19 一种事件关系检测方法及***

Publications (1)

Publication Number Publication Date
CN104881404A true CN104881404A (zh) 2015-09-02

Family

ID=53948899

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510346311.8A Pending CN104881404A (zh) 2015-06-19 2015-06-19 一种事件关系检测方法及***

Country Status (1)

Country Link
CN (1) CN104881404A (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693219A (zh) * 2012-06-05 2012-09-26 苏州大学 一种中文事件的抽取方法及***
CN103617280A (zh) * 2013-12-09 2014-03-05 苏州大学 一种中文事件信息挖掘方法和***

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102693219A (zh) * 2012-06-05 2012-09-26 苏州大学 一种中文事件的抽取方法及***
CN103617280A (zh) * 2013-12-09 2014-03-05 苏州大学 一种中文事件信息挖掘方法和***

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
杨雪蓉 等: "基于跨场景推理的事件关系检测方法", 《中文信息学报》 *
马彬 等: "基于语义依存线索的事件关系识别方法研究", 《北京大学学报(自然科学版)》 *

Similar Documents

Publication Publication Date Title
CN106777275B (zh) 基于多粒度语义块的实体属性和属性值提取方法
De Felice et al. A classifier-based approach to preposition and determiner error correction in L2 English
US9336199B2 (en) Automatic sentence evaluation device using shallow parser to automatically evaluate sentence, and error detection apparatus and method of the same
US10824816B2 (en) Semantic parsing method and apparatus
CN104881402A (zh) 中文网络话题评论文本语义倾向分析的方法及装置
Nasr et al. Joint dependency parsing and multiword expression tokenization
CN106570180A (zh) 基于人工智能的语音搜索方法及装置
Kristianto et al. Extracting textual descriptions of mathematical expressions in scientific papers
KR101633556B1 (ko) 문법 오류 수정 장치 및 이를 이용한 문법 오류 수정 방법
KR101836996B1 (ko) 러프 셋을 이용한 형태소 품사 태깅 코퍼스 오류 자동 검출 장치 및 그 방법
Šnajder et al. Building and evaluating a distributional memory for Croatian
CN104699667A (zh) 改进的基于语义词典的词语相似度计算方法和装置
CN104346326A (zh) 一种情绪文本的情绪特征确定方法及装置
CN103294663A (zh) 一种文本连贯性检测方法和装置
SG194709A1 (en) Device, method and program for assessing synonymous expressions
Ogrodniczuk et al. End-to-end coreference resolution baseline system for Polish
Cahill Parsing learner text: to shoehorn or not to shoehorn
CN106528507B (zh) 一种中文文本相似度的检测方法及检测装置
CN108021595B (zh) 检验知识库三元组的方法及装置
Liu et al. Analyzing program readability based on WordNet
CN109344407B (zh) 基于语义的文档指纹构建方法、存储介质和计算机设备
CN104881404A (zh) 一种事件关系检测方法及***
Ingason et al. Context-sensitive spelling correction and rich morphology
CN110555304A (zh) 恶意包名检测方法、恶意应用检测方法及相应装置
Motlani et al. Developing part-of-speech tagger for a resource poor language: Sindhi

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
CB03 Change of inventor or designer information

Inventor after: Yang Haoping

Inventor after: Hong Yu

Inventor after: Yang Xuerong

Inventor after: Yao Jianmin

Inventor after: Zhu Qiaoming

Inventor before: Yang Xuerong

Inventor before: Hong Yu

Inventor before: Yao Jianmin

Inventor before: Zhu Qiaoming

CB03 Change of inventor or designer information
RJ01 Rejection of invention patent application after publication

Application publication date: 20150902

RJ01 Rejection of invention patent application after publication